時間:2023-08-02 09:26:19
緒論:在尋找寫作靈感嗎?愛發(fā)表網(wǎng)為您精選了8篇簡述云計算的關(guān)鍵技術(shù),愿這些內(nèi)容能夠啟迪您的思維,激發(fā)您的創(chuàng)作熱情,歡迎您的閱讀與分享!
關(guān)鍵詞 云計算過程;個人數(shù)字圖書館;動態(tài)資源供應(yīng)
中圖分類號G271 文獻(xiàn)標(biāo)識碼A 文章編號 1674-6708(2011)48-0038-02
在信息化時代,計算機技術(shù)得到長足的發(fā)展,各類信息管理技術(shù)與數(shù)據(jù)檢索系統(tǒng)的發(fā)展非常迅速。隨著時間的推移,包含海量應(yīng)用數(shù)據(jù)的數(shù)據(jù)庫系統(tǒng)在現(xiàn)代社會中發(fā)揮著越來越重要的作用。動輒數(shù)十萬的數(shù)據(jù)量使得數(shù)據(jù)庫檢索速度與查詢結(jié)果的可靠性越來越難以得到有效的保證,數(shù)據(jù)庫的優(yōu)化逐步成為數(shù)據(jù)庫系統(tǒng)管理的一個主要方面。針對優(yōu)化數(shù)據(jù)庫搜索查詢功能的瓶頸,云計算被大多數(shù)數(shù)據(jù)庫運用到系統(tǒng)個人數(shù)據(jù)的管理中,本文將對此做一個深入的探討。
1 當(dāng)前我國互聯(lián)網(wǎng)數(shù)據(jù)管理發(fā)展現(xiàn)狀及云計算的基本概況
眾所周知,數(shù)據(jù)庫系統(tǒng)的核心是信息管理,基本工作包括聯(lián)機的分析處理、聯(lián)機的事務(wù)處理、突發(fā)事件的應(yīng)對等,是計算機技術(shù)在具體的社會活動中得到運用的一個重要表現(xiàn)。大型的數(shù)據(jù)庫管理系統(tǒng)在對企事業(yè)單位、金融機構(gòu)、政府工作部門等進(jìn)行高速信息化管理的同時,高速的增長信息量影響數(shù)據(jù)庫系統(tǒng)的檢索速度和響應(yīng)效率,要提高系統(tǒng)的終端信息處理的管理性能與效率,云計算應(yīng)運而生。數(shù)據(jù)量處理要求與五年前的相比呈現(xiàn)出幾何級數(shù)的增長趨勢,這就對終端電腦提出非常高的要求,“云計算”對個人終端的處理能力有著劃時代的改革意義。云計算是一種分布式的處理、并行處理和網(wǎng)絡(luò)計算的綜合發(fā)展,當(dāng)你把個人信息上傳到互聯(lián)網(wǎng)相冊、在優(yōu)酷等視頻網(wǎng)站上看電影、將大量的數(shù)據(jù)保存在網(wǎng)絡(luò)郵箱時,就都是云計算的使用,可以說云計算正在不知不覺中影響著我們的生活。根據(jù)可靠數(shù)據(jù)顯示,五年之內(nèi),中國的互聯(lián)網(wǎng)用戶在數(shù)量上應(yīng)該會實現(xiàn)翻倍增長。規(guī)模如此大的用戶群,我們網(wǎng)絡(luò)的工作面臨的是一個以視頻流和電子商務(wù)等做處理的知識經(jīng)濟時代。
很明顯,在實際的數(shù)據(jù)應(yīng)用環(huán)境下,具體的個人數(shù)據(jù)應(yīng)用情況是我們選擇系統(tǒng)的設(shè)計與優(yōu)化方案最基本的根據(jù)。而且,考慮到很多優(yōu)化策略的實施有著非常大的制約作用,實際的應(yīng)用過程中還必須綜合地考慮到問題的不同方面。傳統(tǒng)的網(wǎng)絡(luò)數(shù)據(jù)管理系統(tǒng)的運用,大多是裝在個人用戶端,進(jìn)行獨立運行的。但是,我們今天則一般通過互聯(lián)網(wǎng)服務(wù)于大規(guī)模數(shù)據(jù)的集中來實現(xiàn)這個功能,而且不在再是只有大的企業(yè)才有條件使用數(shù)據(jù)中心,廣大的中小企業(yè)和個人消費者也開始應(yīng)用。
所謂的云計算就是一種利用規(guī)模較大的數(shù)據(jù)中心或者超級計算機的集群,再通過互聯(lián)網(wǎng)絡(luò)將計算資源以免費或者按需租用的方式為使用者提供方便的方式。云計算的應(yīng)用就是一種將網(wǎng)絡(luò)內(nèi)的力量集中起來,為網(wǎng)絡(luò)中的每一位成員來使用。從最基本的意義上來說,“云計算”就是應(yīng)用互聯(lián)網(wǎng)上已有的軟件與數(shù)據(jù)為個人用戶所用??梢哉f,我們要縮短個人數(shù)據(jù)管理所投入的時間、提高其管理效率、進(jìn)行數(shù)據(jù)庫的優(yōu)化,最重要的就是對系統(tǒng)的內(nèi)部資源進(jìn)行合理的優(yōu)化和分配,要取得數(shù)據(jù)庫執(zhí)行性能實質(zhì)性的提升和系統(tǒng)管理有效的簡化,關(guān)鍵在云計算的運用。只有這樣才能更加充分地利用到管理系統(tǒng)為我們提供的科學(xué)高效服務(wù)。
2 基于云計算的個人數(shù)字圖書館建設(shè)的優(yōu)勢和不足分析
個人數(shù)字圖書館信息系統(tǒng)的數(shù)據(jù)量極大,運行一段時間后會就會出現(xiàn)諸如系統(tǒng)速度太慢、管理系統(tǒng)死鎖等一系列問題。海量的個人數(shù)據(jù)集中導(dǎo)致網(wǎng)絡(luò)數(shù)據(jù)容量的不斷增大,但是運用云計算就可以實現(xiàn)個人數(shù)字檔案的在線文件夾和文件存儲的功能。云計算不僅可以為用戶提供安全可靠而又經(jīng)濟方便的數(shù)據(jù)存儲中心,而且云計算因為其對用戶端的設(shè)備沒有很高的要求,可以很好地避免數(shù)據(jù)丟失、系統(tǒng)病毒入侵等不必要的麻煩。
同時,云計算還可以在不同的設(shè)備間實現(xiàn)數(shù)據(jù)與應(yīng)用的共享,從而基本上將信息的孤島現(xiàn)象消除了,可以讓人們使用更加方便的網(wǎng)絡(luò)服務(wù)。云計算可以很好地彌補個人電子設(shè)備無法無限量地提供存儲空間與計算能力這個缺陷,它可以在另一端結(jié)集數(shù)千上萬臺服務(wù)器,組成一個龐大的集群為個人提供潛力無限量的存儲空間與計算能力。
然而,我們也應(yīng)該看到現(xiàn)階段的云計算還存在一定的不足。云計算設(shè)立的根本用意在于建構(gòu)一個供用戶來共享的資源池,以減少用戶的成本,提升使用的靈活性,但是在云計算的應(yīng)用中也會隨之伴隨著一定的安全風(fēng)險。這種風(fēng)險在當(dāng)前沒有出臺體系的安全模式構(gòu)架與統(tǒng)一標(biāo)準(zhǔn)時是不可避免的。而且云計算系統(tǒng)內(nèi)的用戶無法明確知道其私密數(shù)據(jù)在云上的存儲位置,其私密性與安全性有待加強,在個人的個性化服務(wù)方面也還難以盡如人意。
3 運用云計算建設(shè)個人數(shù)字圖書館
3.1 個人數(shù)字圖書館建設(shè)的基本概況
個人知識數(shù)據(jù)的管理包括5個基本的環(huán)節(jié):個人知識的創(chuàng)造與整合、個人的知識加工和編碼、個人知識轉(zhuǎn)移和擴散、個人知識共享和交流、個人組織知識的創(chuàng)新。不同的個人數(shù)據(jù)就會有其不盡相同的優(yōu)化過程,個人數(shù)字圖書館過程中差異性的把握往往依靠具體程序終端的操作經(jīng)驗,個人知識的增長過程就是在其長時間的記憶系統(tǒng)中存貯一定的信息內(nèi)容的增長過程,它是對社會個體在實踐中積累的一些具備個體的記憶價值與創(chuàng)新價值的信息資源進(jìn)行的管理。這就導(dǎo)致個人數(shù)字圖書館的建設(shè)在極大程度上取決于實際的操作。
3.2 基于云計算的個人數(shù)字圖書館的建立構(gòu)想
運用云計算在網(wǎng)絡(luò)中建立個人數(shù)字圖書館,對于我們建立民生檔案、集體檔案、平民檔案、集體檔案等個人者集體檔案有著至關(guān)重要的意義。我們可以針對網(wǎng)絡(luò)上個人形成的信息化檔案,配合使用傳統(tǒng)檔案組建起個人檔案系統(tǒng)。這類信息檔案的存儲信息與對象都是原始性的,其創(chuàng)建與維護(hù)的信息是具備多樣性、積極性和自覺性的。
4 結(jié)論
隨著現(xiàn)代信息技術(shù)的迅猛發(fā)展,信息在表現(xiàn)形式上越來越豐富,我們構(gòu)建個人數(shù)字圖書館已經(jīng)離不開圖像、文檔、音頻、視頻以及軟件等諸多多媒體的信息新形式。我們在個人數(shù)字圖書館應(yīng)用系統(tǒng)的優(yōu)化過程中,必須對云計算――一種全新型服務(wù)計算模式的積極運用做一個充分的分析,這些形式各異的信息可以對個人數(shù)字檔案實現(xiàn)安全而有效的利用與管理,建立起一個使用起來方便、內(nèi)容形式豐富、信息能共享的個人數(shù)字電子檔案。
參考文獻(xiàn)
[1]劉湘明,董大暉.云計算技術(shù)的分析與研究[M].北京:計算機知識與技術(shù)出版社,2006:146-250.
[關(guān)鍵詞] 云計算;數(shù)字圖書館;現(xiàn)狀;應(yīng)用;建議
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2016. 13. 103
[中圖分類號] G250.7 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1673 - 0194(2016)13- 0188- 03
1 云計算對數(shù)字化圖書館建設(shè)的應(yīng)用現(xiàn)狀
圖書館是人類文明的載體,是人類知識的寶庫,肩負(fù)著文化傳播和文化繼承與發(fā)展的重要使命。而在當(dāng)今社會,人們對于信息的需求越來越要求廣度和速度,因此圖書館的建設(shè)必須以需求為引導(dǎo),不斷加強自身職能建設(shè),如:加快構(gòu)建底層基礎(chǔ)設(shè)施建設(shè)等,以使自身充分履行資源共享、傳播知識、儲存文化的職能。而先進(jìn)技術(shù)的運用對于推動圖書館數(shù)字化各方面的建設(shè)作用舉足輕重。
國內(nèi)圖書館界對云計算應(yīng)用的最先嘗試,當(dāng)屬CALIS,CALIS技術(shù)。目前,根據(jù)云計算的運用成果分析以及未來的發(fā)展目標(biāo)定位,提出了基于云計算的CALIS數(shù)字圖書館服務(wù)戰(zhàn)略,主要包括兩個方面:①構(gòu)建CALIS數(shù)字圖書館云服務(wù)平臺(亦可稱為Nebula平臺);②建立全國、區(qū)域、高校的CALIS數(shù)字圖書館云服務(wù)中心。這樣就可以為用戶提供不同形式的數(shù)字圖書館云服務(wù),同時為本地數(shù)字圖書館云服務(wù)平臺的構(gòu)建提供有效方案。Nebula平臺的構(gòu)建將使圖書館軟件應(yīng)用能力進(jìn)一步提升,為數(shù)字圖書館的服務(wù)架構(gòu)模式的進(jìn)一步發(fā)展和完善提供了無限的可能性。Nebula平臺能夠?qū)崿F(xiàn)分布式數(shù)字圖書館服務(wù)的虛擬化,給圖書館信息資源更大程度的共建共享帶來機遇,使我國數(shù)字圖書館應(yīng)用進(jìn)入一個云計算時代。
基于云計算技術(shù)的數(shù)字化圖書館與傳統(tǒng)的數(shù)字圖書館相比,具有可控制、易管理、適應(yīng)力強等特點。用戶只要通過互聯(lián)網(wǎng),就可以隨時隨地享受云平臺提供的服務(wù)。學(xué)者劉煒認(rèn)為,云計算是一種利用計算機和互聯(lián)網(wǎng)的新技術(shù)和新方式,它將計算機應(yīng)用和文獻(xiàn)信息資源全部整合于網(wǎng)絡(luò)之中,可以為用戶提供隨時隨地訪問和共享的服務(wù)。目前,世界各大軟件公司,如Google、Microsoft、Yohoo、IBM等,都在為云計算的研究和應(yīng)用投入巨大努力。Google在2007年宣布實施能夠覆蓋全球的云計算計劃,為此Google與IBM開展了積極的合作,希望將更多全球資源和信息納入“云計算”網(wǎng)絡(luò)體系中。Google目前已經(jīng)建成Google Maps、Google Documents等云服務(wù);而計算機巨頭IBM公司也在同年退出“藍(lán)云”計劃,并已經(jīng)開發(fā)如EC2、S3等云服務(wù)功能。其他IT行業(yè)的巨頭如Yahoo、Microsoft也正在積極運籌和開展云服務(wù)方面的建設(shè)。各大網(wǎng)絡(luò)、IT巨頭對云服務(wù)的重視、開發(fā)和建設(shè),使其功能不斷得到拓展,存儲能力不斷提升,為圖書館提供了良好的信息儲存、信息共享、信息提取功能。云計算以其隨時獲取、超級計算能力、與平臺無關(guān)、易部署和擴展等優(yōu)點為圖書館的數(shù)字化建設(shè)提供游離的支撐。
2 在數(shù)字化圖書館建設(shè)中的必要性
云計算對于圖書館建設(shè)的作用主要體現(xiàn)在下面幾點。
2.1 解決資源存儲的技術(shù)難題
目前,數(shù)字化圖書館發(fā)展的最大障礙是信息資源的存儲問題。建立多語言檢索、跨庫檢索、人機交互技術(shù)、數(shù)據(jù)共享數(shù)據(jù)庫等搜索功能和技術(shù)有待于進(jìn)一步完善。數(shù)字圖書館在建設(shè)過程中所需要的工具和軟件等需要依靠先進(jìn)的技術(shù)發(fā)展。而目前用戶對海量信息資源的需求和對其檢索速度迫使數(shù)字圖書館對于自身建設(shè)面臨著前所未有的挑戰(zhàn),而云計算技術(shù)的應(yīng)用將會彌補它在技術(shù)方面的不足,為其解決了信息資源存儲的技術(shù)難題。云計算技術(shù)可以為圖書館提供強大的數(shù)據(jù)存儲和數(shù)據(jù)共享功能,可以解決數(shù)字圖書館技術(shù)上的異構(gòu)問題,為數(shù)字圖書館降低儲存空間的成本,解決存儲難題。
2.2 避免信息資源重復(fù)建設(shè)
在現(xiàn)階段,圖書館還不能夠完成對紙質(zhì)資源和數(shù)字資源的相互補充,也不能進(jìn)行數(shù)據(jù)。圖書館建設(shè)者在建設(shè)過程中,往往不會考慮自身特點和其他圖書館對數(shù)字資源的擁有和使用情況,不能夠做好資源存儲的規(guī)劃,盲目擴大和購進(jìn)本館的數(shù)字資源,將擁有更多的資源和信息作為建設(shè)的目標(biāo)和體現(xiàn)本館優(yōu)勢的標(biāo)志,從而使數(shù)字資源重復(fù)和浪費。既浪費了時間和金錢,也做了無效的工作。而云計算的出現(xiàn)能夠很好的解決圖書館在此方面存在的問題。云計算可以把分別存儲的數(shù)據(jù)和一站式檢索界面相聯(lián)系,對數(shù)字資源進(jìn)行了有效的整合和歸納,可以為圖書館解決資源重復(fù)和浪費的問題。
2.3 解決用戶信息需求,達(dá)到資源共享
云計算是圖書館服務(wù)避免了“信息孤島”現(xiàn)象的出現(xiàn),使傳統(tǒng)圖書館得到良好發(fā)展,滿足用戶對信息服務(wù)的各方面需求,如個性化服務(wù)的需求、海量信息的需求、信息獲取時效性的需求等。以往圖書館對服務(wù)器的最大服務(wù)響應(yīng)數(shù)量和接入終端數(shù)量有硬性要求,使終端用戶訪問受到限制。與此同時,圖書館的信息資源獲取只能限定在一些規(guī)模和類型相同的數(shù)據(jù)借口間達(dá)到共享,而不同規(guī)模不同類型的圖書館間信息資源的流通與共享是十分困難的。云計算技術(shù)的運用打破了這種資源封閉和受限的困境,促進(jìn)了館與館之間的合作及資源充分共享,極大地改善了圖書館的服務(wù)功能,滿足了用戶對于信息資源的更高需求,為用戶提供更加完善的服務(wù)。
3 將云計算運用于圖書館建設(shè)時應(yīng)注意的問題和相關(guān)建議
3.1 注意網(wǎng)絡(luò)依存性
云計算技術(shù)的運用依賴于計算機和互聯(lián)網(wǎng)技術(shù)的發(fā)展,然而當(dāng)前,我國互聯(lián)網(wǎng)建設(shè)依舊處于落后狀態(tài),目前云計算的應(yīng)用范圍主要還只限定于美國等一些發(fā)達(dá)地區(qū)。這在很大程度上制約了云計算的發(fā)展。雖然云計算技術(shù)的發(fā)展受制于互聯(lián)網(wǎng)技術(shù)的發(fā)展,但是,如果圖書館能夠構(gòu)建共有云模式,由云計算運營商統(tǒng)一管理云中節(jié)點平臺的操作系統(tǒng),就能夠有效解決數(shù)字圖書館對互聯(lián)網(wǎng)依存性的依存問題。
3.2 注意數(shù)據(jù)安全性
云計算技術(shù)的運用使數(shù)據(jù)能夠得到最大化的共享,有時會造成數(shù)據(jù)泄漏和信息侵權(quán)等問題,如果能夠建立完善的法律法規(guī),從法律上對云數(shù)據(jù)的安全性和可靠性進(jìn)行有效規(guī)范,并在法律的基礎(chǔ)上,完善監(jiān)管制度,如委托第三方機構(gòu)幫助監(jiān)督管理信息資源,那么數(shù)據(jù)的安全性問題就會得到很好的解決。
云計算的缺點對于圖書館的相關(guān)建設(shè)來說,并不造成特別嚴(yán)重的影響,如果解決妥善,將能揚長避短,充分發(fā)揮云計算技術(shù)在圖書館建設(shè)中的功能。
4 結(jié) 語
作為新生事物的云計算,其前景不可預(yù)測,云計算給圖書館的信息服務(wù)提供了重要的發(fā)展機遇和發(fā)展契機。但與此同時,在云計算技術(shù)的應(yīng)用過程中,圖書館的發(fā)展與建設(shè)也面臨著許多問題。一方面,政府尚未對構(gòu)建數(shù)字化圖書館云平臺服務(wù)提出專門的政策,并未提供大量的資金和資源支撐,因此構(gòu)建云計算平臺受到資金和規(guī)模等方面的限制。此外,由于圖書館購買云計算服務(wù)或圖書館云服務(wù)的過程中具有多方參與的特性,其服務(wù)質(zhì)量難有保障。而這些問題,正是今后非常值得我們深入研究的課題。
主要參考文獻(xiàn)
[1]高麗娜.大數(shù)據(jù)時代高校圖書館數(shù)字化建設(shè)的若干思考[J].沈陽航空航天大學(xué)學(xué)報,2013,30(z1):98-102.
關(guān)鍵詞:云計算;數(shù)字圖書館;應(yīng)用
數(shù)字圖書館在經(jīng)歷了互聯(lián)網(wǎng)時代、WEB時代、網(wǎng)格時代、WEB2.0時代后,正在悄然走進(jìn)云計算時代。云計算技術(shù)以其強大的功能已在全世界的一些商業(yè)領(lǐng)域得到了初步的應(yīng)用,也引起了圖書館界的廣泛關(guān)注。在不久的將來,會有越來越多的圖書館試水云計算,通過云計算來提升圖書館網(wǎng)絡(luò)信息管理與服務(wù)的水平,云計算將在數(shù)字圖書館中得到大規(guī)模的普及。
1 云計算的內(nèi)涵
云計算指的是一種全新的計算模式,它依靠的不是個人電腦,也不是獨立的服務(wù)器,而是一種用戶無需關(guān)心其內(nèi)部結(jié)構(gòu)的“云”。云計算集成了所有的信息資源,并由系統(tǒng)軟件對其進(jìn)行管理,用戶不用關(guān)注信息資源的安全性與可靠性等問題。在云計算的基本結(jié)構(gòu)中,主體部分是由服務(wù)器集群構(gòu)成的云,為了實現(xiàn)其計算能力的最大化,通常會使用虛擬化、集群化等技術(shù)。狹義的云計算是指信息技術(shù)基礎(chǔ)設(shè)施的交付和使用模式,指用戶通過互聯(lián)網(wǎng)以按需、易擴展的方式獲得所需的資源;廣義的云計算是指服務(wù)的交付和使用模式,指用戶通過互聯(lián)網(wǎng)以按需、易擴展的方式獲得所需的服務(wù)。這種服務(wù)可以是信息技術(shù)和應(yīng)用軟件、互聯(lián)網(wǎng)相關(guān)的,也可以是任意其他的服務(wù),它具有超大規(guī)模、虛擬化、可靠安全等優(yōu)勢。
云計算的特點主要表現(xiàn)在:(1)強大的計算能力。云計算為網(wǎng)絡(luò)應(yīng)用提供了強大的計算能力,完成普通計算難以達(dá)到的各種業(yè)務(wù)要求。(2)可靠的數(shù)據(jù)存儲。云計算提供了可靠的數(shù)據(jù)存儲中心,數(shù)據(jù)可以自動同步傳遞,并可通過Web在所有的設(shè)備上使用,避免了用戶將數(shù)據(jù)存放在個人電腦上而出現(xiàn)的數(shù)據(jù)丟失或感染病毒等問題。(3)方便、快捷的云服務(wù)。云計算時代,用戶不需要安裝和升級電腦上的各種應(yīng)用軟件,只需要具有網(wǎng)絡(luò)瀏覽器就可以方便、快捷地使用云計算提供的各種服務(wù)。(4)經(jīng)濟效益。云計算服務(wù)提供商的存儲成本、帶寬成本、計算處理成本等加起來也只有機構(gòu)自身運營數(shù)據(jù)中心成本的幾分之一,這將有助于一些機構(gòu)以比較低廉的架構(gòu)成本進(jìn)行運作。
2 基于云計算的數(shù)字圖書館功能優(yōu)勢
2.1 技術(shù)優(yōu)勢。對數(shù)字圖書館的所有成員館可以提供統(tǒng)一的訪問方式和一致基礎(chǔ)設(shè)施服務(wù)。這種統(tǒng)一的資源服務(wù)訪問方式,不僅能夠充分利用數(shù)字圖書館中現(xiàn)有的服務(wù)器資源、網(wǎng)絡(luò)資源、存儲資源,減少數(shù)字圖書館中的資源閑置問題,同時也避免了數(shù)字圖書館中各種硬件資源的重復(fù)購置。在這種統(tǒng)一的資源服務(wù)訪問方式下,數(shù)字圖書館不僅可以直接通過數(shù)字圖書館主服務(wù)器來請求資源的調(diào)用,而不用管數(shù)字圖書館主服務(wù)器是如何去分發(fā)自己的請求,以及調(diào)配哪一個虛擬服務(wù)器所對應(yīng)的物理服務(wù)器來處理自己的請求;也可以在知道內(nèi)部塊服務(wù)器訪問接口的情況下,直接指定要訪問的虛擬服務(wù)器所對應(yīng)的物理服務(wù)器來處理自己的請求。
2.2 硬件建設(shè)優(yōu)勢。與傳統(tǒng)的數(shù)字圖書館硬件建設(shè)相比,基于云計算的數(shù)字圖書館硬件建設(shè)具有一些優(yōu)勢。如對硬件的性能要求低,傳統(tǒng)的數(shù)字圖書館硬件建設(shè)需要性能完備且價格昂貴的硬件設(shè)備不同,基于云計算的數(shù)字圖書館利用多個廉價服務(wù)器集群來實現(xiàn)強大的數(shù)據(jù)處理和計算功能。雖然使用廉價的服務(wù)器集群,部分服務(wù)器可能出現(xiàn)故障,但云計算集群服務(wù)所支持的冗余性,也就是同一個服務(wù)請求可以在某個虛擬服務(wù)器上失效的情況下轉(zhuǎn)發(fā)給其他正常工作的虛擬服務(wù)器進(jìn)行處理,保證了數(shù)字圖書館云計算服務(wù)的高可用性。
2.3 資源整合優(yōu)勢。整合最豐富的數(shù)字圖書資源,實現(xiàn)資源的高度共享,是云計算時代數(shù)字圖書館的重要特征。在云計算技術(shù)對數(shù)字圖書館的有利支持下,可以更好、更充分地發(fā)揮互聯(lián)網(wǎng)的自身優(yōu)勢,最大限度的實現(xiàn)資源聚合。進(jìn)入云計算時代,數(shù)字圖書館不但可以聚合全國各地的數(shù)字圖書資源,甚至可以將全世界范圍內(nèi)的數(shù)字圖書資源都聚合到云端的存儲服務(wù)器中,供讀者查閱、使用。數(shù)字圖書館這些功能的實現(xiàn),既依賴于云處理技術(shù)和互聯(lián)網(wǎng)技術(shù)的不斷進(jìn)步,也展示了云計算時代信息處理和交流協(xié)作方面的優(yōu)勢。云計算環(huán)境下的數(shù)字圖書館幾乎完全消除信息孤島,不斷完善數(shù)字圖書館資源整合,真正實現(xiàn)信息資源共享。
2.4 用戶服務(wù)優(yōu)勢。云計算時代的數(shù)字圖書館服務(wù)更加關(guān)心用戶需求,致力于為讀者提供更加全面和更加優(yōu)質(zhì)的服務(wù)。提供數(shù)字圖書資源的過程中,一方面是數(shù)字圖書館將大大提高資源的共享效率,另一方面數(shù)字圖書館將隨讀者個人需求的不同將繼續(xù)向更加個性化、自由化、多元化的方向發(fā)展。讀者上數(shù)字圖書館平臺可能不是為了閱覽或者不僅僅是為了獲取圖書資料,讀者可能是為了進(jìn)行交流或者使用數(shù)字圖書館的其他方面功能,所以“讀者”稱為客戶或用戶更合適。云計算環(huán)境下的數(shù)字圖書館不僅在功能上有很大的擴展,而且可以為用戶提供更加快速、便捷、優(yōu)質(zhì)的服務(wù)。用戶只要接入“云”端,就可以不受時間和空間的限制進(jìn)行自我學(xué)習(xí),從而滿足用戶的個性化需求。
3 云計算在數(shù)字圖書館中的應(yīng)用
3.1 基于云存儲的數(shù)字圖書館服務(wù)。基于云計算的數(shù)字圖書館以云存儲為核心,圖書館所有的信息資源都將存放于“云”上,由“云”來管理和調(diào)度這些海量數(shù)據(jù),用戶通過網(wǎng)絡(luò)接入并動態(tài)部署虛擬硬件提供的存儲和計算能力。云計算通過分布式存儲實現(xiàn)對圖書館海量數(shù)據(jù)的存儲,冗余存儲的方式保證存儲數(shù)據(jù)的可靠性,與之相關(guān)的虛擬技術(shù)使得整合后的圖書館海量數(shù)據(jù)更加統(tǒng)一有序,最終實現(xiàn)對數(shù)字圖書館資源的完全整合。
云計算技術(shù)最大限度的降低了服務(wù)器的出錯概率,確保了海量數(shù)據(jù)存儲系統(tǒng)的可靠性和數(shù)據(jù)安全性。其次,基于云計算的圖書館海量數(shù)據(jù)存儲方式提高了信息資源的更新速度,只要“云”中的圖書館修改和添加新的信息資源,用戶就能在第一時間內(nèi)獲取。此外,云計算的出現(xiàn)使圖書館存儲系統(tǒng)的擴展能力得到大大的提高,“云”提供的近乎無限的空間和計算能力。而且,云計算模式的出現(xiàn)大大降低了海量數(shù)據(jù)存儲系統(tǒng)建設(shè)和維護(hù)成本,可以通過少量的費用讓圖書館獲得“云”中上百萬臺服務(wù)器提供的服務(wù)。
3.2 基于云計算的圖書館自動化。云計算環(huán)境下,圖書館自動化系統(tǒng)應(yīng)用的各項功能已進(jìn)行細(xì)化拆分,系統(tǒng)提供商按照標(biāo)準(zhǔn)協(xié)議提供功能包,圖書館用戶可按本館需求選擇理想的功能包,不同廠家的功能包數(shù)據(jù)標(biāo)準(zhǔn)統(tǒng)一、相互暢通。圖書館用戶可按照自身的需求將這些功能包整合為一個具有本館特色的自動化系統(tǒng)。對于計算機能力強的圖書館,可以采用云計算環(huán)境下的各種Open API,直接讀取互聯(lián)網(wǎng)上的特色數(shù)據(jù):如利用Google maps提供圖書館各館分布的地圖、根據(jù)豆瓣網(wǎng)中的圖書評論考察圖書質(zhì)量、在Amazon網(wǎng)上書店的直接訂購圖書資料等。云計算時代的數(shù)字圖書館自動化系統(tǒng),將圖書館的館藏資源與全球的其他相關(guān)數(shù)字資源整合,拓展了圖書館的讀者服務(wù)形式和內(nèi)容,構(gòu)建成更加貼近讀者服務(wù)的數(shù)字圖書館。
3.3 基于云服務(wù)的數(shù)字圖書館設(shè)施整合與建設(shè)。通過云服務(wù),對現(xiàn)有資源的整合,將數(shù)字圖書館分散的數(shù)據(jù)資源、IT資源進(jìn)行物理集中,形成了規(guī)?;臄?shù)據(jù)中心、虛擬服務(wù)器等基礎(chǔ)設(shè)施。尤其對于數(shù)圖書館聯(lián)盟,通過規(guī)劃、管理以標(biāo)準(zhǔn)化等措施,把分散在子圖書館的數(shù)據(jù)源進(jìn)行遷移、整合、集中,建立基于云計算的數(shù)據(jù)中心。在數(shù)據(jù)集中過程中不斷實施數(shù)據(jù)和業(yè)務(wù)的整合,使大多數(shù)圖書館的數(shù)據(jù)中心基本完成自身的標(biāo)準(zhǔn)化,既使原先信息服務(wù)得到擴展又將開發(fā)新項目的部署和實施。解決原先聯(lián)盟館數(shù)據(jù)業(yè)務(wù)分散時期的資源雜亂無序的問題。數(shù)字圖書館通過不斷的標(biāo)準(zhǔn)化體系建設(shè),將形成統(tǒng)一的信息平臺、統(tǒng)一的基礎(chǔ)數(shù)據(jù)、統(tǒng)一的信息服務(wù)規(guī)范,這樣數(shù)字圖書館的資源和服務(wù)進(jìn)行了整合和統(tǒng)一,將其演進(jìn)到“云”上使消滅信息孤島成為可能。
4 結(jié)語
云計算的發(fā)展使得云計算開始深入各個行業(yè),并給各個行業(yè)帶來了巨大的發(fā)展空間和商業(yè)空間,也使得各個行業(yè)向著網(wǎng)絡(luò)化方向迅速發(fā)展。云計算下的數(shù)字圖書館為行業(yè)提供了全新的潛在市場,將云計算技術(shù)充分應(yīng)用到數(shù)字圖書館中對數(shù)字圖書館的產(chǎn)業(yè)發(fā)展產(chǎn)生深遠(yuǎn)影響,相信云計算的應(yīng)用必將成為圖書館行業(yè)的里程碑。
參考文獻(xiàn)
云計算作為近年來研究與應(yīng)用領(lǐng)域的熱點話題,被大多數(shù)IT企業(yè)和業(yè)內(nèi)人士認(rèn)為是下一代計算機網(wǎng)絡(luò)技術(shù)應(yīng)用的核心架構(gòu)。云計算(Cloud Computing) 是一種全新的網(wǎng)絡(luò)應(yīng)用概念,是網(wǎng)格計算(Grid Computing)、并行處理(Parallel Comp)和分布式處理(Distributed Computing)、虛擬化(Virtualization)、網(wǎng)絡(luò)存儲(Network Storage Technologies)、效用計算(Utility Computing)、負(fù)載均衡(Load Balance)的發(fā)展結(jié)果。從業(yè)務(wù)形態(tài)來說,它是利用虛擬化等技術(shù)將服務(wù)和資源整合在一起,向用戶提供平臺、基礎(chǔ)設(shè)施和軟件的一種新的商業(yè)計算模式。
1 云計算給數(shù)字化圖書館帶來的機遇
1.1 實現(xiàn)資源共享
云計算機的應(yīng)用服務(wù)通常分為三種,SaaS(Software as a Service,云計算軟件服務(wù))、PaaS(Platform as a Service,云計算平臺服務(wù))、IaaS(Infrastructure as a Service,云計算設(shè)備服務(wù))[1]。云計算產(chǎn)業(yè)細(xì)分后,各類云計算服務(wù)商可以聚焦自己的核心領(lǐng)域,最終形成了強強聯(lián)合、協(xié)作共生的關(guān)系。這將加快全球化信息技術(shù)快速發(fā)展,從而真正實現(xiàn)全球化的信息共享。云計算為數(shù)字化圖書館提供了海量數(shù)據(jù)存貯的能力,使用者只要能接入互聯(lián)網(wǎng),就能享受到數(shù)字化圖書館,實現(xiàn)了網(wǎng)絡(luò)虛擬環(huán)境下最大化的資源共享。
1.2 實現(xiàn)使用便利
云計算在數(shù)字化圖書館的應(yīng)用使得數(shù)字化圖書館更加的便捷和方便,使用者既不需要受時間和空間上的限制,更不需要在個人終端上安裝任何軟件,甚至可以不用使用常規(guī)的計算機,由提供云計算的服務(wù)商為使用者提供一個虛擬的計算機,使用者只需要在任何一個云終端登錄到自己的云虛擬電腦上即可以獲得云時代的數(shù)字化信息。
1.3 低成本
針對“云”的特殊措施,數(shù)字圖書館技術(shù)采用極其廉價的節(jié)點來構(gòu)成云,“云”的自動化集中式管理使很多圖書館無需負(fù)擔(dān)日益高昂的數(shù)據(jù)中心管理成本,“云”的通用性使資源的利用率較之傳統(tǒng)系統(tǒng)大幅提升,因此用戶可以充分享受“云”的低成本優(yōu)勢,經(jīng)常只要花費很少的成本和時間、就能完成以前需要數(shù)萬元、數(shù)月時間才能完成的任務(wù)。云計算下的數(shù)字圖書館,也為行業(yè)提供了全新的潛在市場,將云計算技術(shù)充分應(yīng)用到數(shù)字圖書館中會對數(shù)字圖書館的產(chǎn)業(yè)發(fā)展產(chǎn)生深遠(yuǎn)影響,相信云計算的發(fā)展必將成為圖書館行業(yè)里程碑。
2 云計算的關(guān)鍵技術(shù)
2.1 數(shù)據(jù)存儲方式
云計算系統(tǒng)的主要組成部分是很多的計算機服務(wù)器,并且能夠為很多的用戶提供全方面的信息服務(wù),為了能夠為“云”用戶提供可靠的服務(wù),云計算系統(tǒng)中存儲數(shù)據(jù)采用的是分布式存儲以及冗余存儲方式。Google的GFS以及Hadoop團隊開發(fā)HDFS是云計算系統(tǒng)中應(yīng)用最為廣泛的數(shù)據(jù)存儲系統(tǒng)。
Google File System(GFS)是一個分布式文件系統(tǒng),它由Google設(shè)計并實現(xiàn),是指文件系統(tǒng)管理的物理存儲資源不一定直接連接在本地節(jié)點上,而是通過計算機網(wǎng)絡(luò)與節(jié)點相連。Hadoop是一個開源的分布式軟件平臺,Hadoop用于存儲的分布式文件系統(tǒng)Hadoop Distributed File System(HDFS)借鑒了GFS的設(shè)計理念。
首先在架構(gòu)上,GFS和HDFS是一致的,都是采用的拓?fù)涞慕Y(jié)構(gòu),所謂的拓?fù)浣Y(jié)構(gòu)是指系統(tǒng)中各個服務(wù)器之間的物理或邏輯的互聯(lián)關(guān)系,這兩者都被設(shè)計為一個中心控制服務(wù)器為中心的星形結(jié)構(gòu)的拓?fù)淠P?,這樣有利于服務(wù)器的動態(tài)分配和回收,在云計算系統(tǒng)中服務(wù)器資源有限的情況下,可以通過中心控制服務(wù)器控制和管理整個系統(tǒng)中其它節(jié)點的運行,從而保證系統(tǒng)運行正常以及資源的最大利用率。其次在塊大小、元數(shù)據(jù)等實現(xiàn)上,這兩者之間也是一致的。
在關(guān)鍵技術(shù)上這兩者之間還是存在很大的差異:首先,GFS最為復(fù)雜的部分是對多客戶端并發(fā)追加同一個文件,即多客戶端并發(fā)Append模型。GFS允許文件被多次或者多個客戶端同時打開以追加數(shù)據(jù),而HDFS文件只允許一次打開并追加數(shù)據(jù),客戶端先把所有數(shù)據(jù)寫入本地的臨時文件中,等到數(shù)據(jù)量達(dá)到一個Chunk的大小,一次性寫入HDFS文件系統(tǒng)。其次對快照的支持上兩這者之間存在差異,GFS通過內(nèi)部采用copy-on-write的數(shù)據(jù)結(jié)構(gòu)實現(xiàn)集群快照功能,而HDFS不提供快照功能,另外在文件的刪除上兩者也是存在差異的,GFS并不是在master上直接刪除文件,而是通過特殊標(biāo)識的方式標(biāo)識該文件,并控制該文件不再被普通用戶所訪問,同時master會定期對文件系統(tǒng)進(jìn)行檢查,刪除一段時間前所隱藏的文件。而HDFS則是采用直接刪除但是更加容易實現(xiàn)的方式來刪除文件。
2.2 安全性
云計算技術(shù)做為一種全新的服務(wù)模式,其安全性超過了任何常規(guī)服務(wù)模式,也是至關(guān)重要的[2]。一旦用戶把自己的個人數(shù)據(jù)提交到云服務(wù)平臺之后,用戶將無法對其安全性進(jìn)行保證和監(jiān)控,而是由云計算服務(wù)商提供安全保障策略。目前市場上云計算服務(wù)商數(shù)目巨多,都向用戶承諾數(shù)據(jù)的安全性,但目前看效果并不理想。云計算主要面臨著管理風(fēng)險和技術(shù)風(fēng)險,云計算面臨的管理風(fēng)險:鎖定風(fēng)險、失治風(fēng)險、合規(guī)挑戰(zhàn)風(fēng)險、商業(yè)信譽風(fēng)險、云服務(wù)終止或故障風(fēng)險、云提供商收購風(fēng)險、供應(yīng)鏈故障風(fēng)險;云計算面臨的技術(shù)風(fēng)險:資源耗盡、隔離故障、管理接口漏洞、傳輸中的數(shù)據(jù)截獲、數(shù)據(jù)泄露、密鑰丟失。這些安全性問題急需解決,這是關(guān)系到云計算技術(shù)能否普遍應(yīng)用的決定性因素。
2.3 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘技術(shù)主要是依賴人工智能、模式識別、機器學(xué)習(xí)、數(shù)據(jù)庫、統(tǒng)計學(xué)、可視化技術(shù)從大量的、不完全的、模糊的、有噪聲的、隨機的數(shù)據(jù)中,提取不易為人知的但是有巨大價值的關(guān)聯(lián)信息,是數(shù)據(jù)庫中的知識發(fā)現(xiàn)的核心。數(shù)據(jù)挖掘技術(shù)主要分為數(shù)據(jù)整理、數(shù)據(jù)集成、數(shù)據(jù)篩選、數(shù)據(jù)轉(zhuǎn)化、數(shù)據(jù)挖掘、模式評估和知識表達(dá)幾個步驟。該技術(shù)的目的是從大量的雜亂無序的數(shù)據(jù)中自動分析數(shù)據(jù),做出歸納統(tǒng)計,從中挖掘出潛在的模式,為用戶提供價值信息。數(shù)據(jù)挖掘技術(shù)在數(shù)字化圖書館中的應(yīng)用可以優(yōu)化圖書館期刊的布局,提高效率節(jié)省資源。也可以為讀者提供個性化服務(wù),通過對讀者借閱量的統(tǒng)計分析讀者的周期借閱習(xí)慣,結(jié)合現(xiàn)有資源向讀者推薦其喜好圖書,提高圖書館的服務(wù)質(zhì)量。
2.4 海量數(shù)據(jù)搜索
隨著云計算技術(shù)的不斷發(fā)展和使用性的普及,云服務(wù)器上的數(shù)據(jù)幾何級增長。云計算,它能處理的數(shù)據(jù)量已不再是MB、GB,而是成TB、PB的增加。并且會伴隨著大量的大數(shù)據(jù)出現(xiàn),大數(shù)據(jù)被認(rèn)為是未來發(fā)展的戰(zhàn)略走向。在云計算中如何快速的從這些大量的數(shù)據(jù)提取和搜索關(guān)鍵字快速找出用戶需要的數(shù)據(jù)是一個非常關(guān)鍵的技術(shù)。
2.5 用戶認(rèn)證
用戶和云之間的相互認(rèn)證是保證云數(shù)據(jù)被合法訪問的前提,云是一個廣闊的分布式系統(tǒng),擁有海量用戶,其動態(tài)性和不可預(yù)知性使得其違法行為不易被追蹤和管理。如果不對云用戶的身份認(rèn)證進(jìn)行嚴(yán)格的識別和管理,會給黑客和不法分子以可乘之機,危害到合法用戶的權(quán)益和云計算技術(shù)的普及。目前在云計算中最常用的認(rèn)證方式是口令的認(rèn)證方式和基于KPI數(shù)字證書認(rèn)證方式??诹钫J(rèn)證方式快捷簡單,但是這種認(rèn)證方式容易遭受網(wǎng)絡(luò)攻擊;基于KPI的認(rèn)證方式有較高的認(rèn)證強度,但是在云環(huán)境下證書的認(rèn)證基礎(chǔ)設(shè)施建立的難度比較大和復(fù)雜度比較高。文獻(xiàn)[3]提出一種基于橢圓曲線的3PAKE認(rèn)證方案,該算法能有效的防止口令攻擊且容易部署。
2.6 版權(quán)保護(hù)
云計算使得用戶可以通過某種協(xié)議進(jìn)行全球范圍的信息存取,給用戶帶來便捷的同時,也可能造成一些非法用戶對數(shù)字化信息進(jìn)行準(zhǔn)確無誤地復(fù)制、及快速傳遞散布等,這給著作權(quán)人希望擁有控制作品使用能力造成致命的傷害,也是阻止云計算技術(shù)普及的阻礙因素之一。有效保護(hù)著作人的權(quán)益要依賴于完善的法律法規(guī)、道德規(guī)范建立和版權(quán)保護(hù)技術(shù)。法律法規(guī)和道德規(guī)范需要政府和整個社會制定和建立長期的有效機制來實現(xiàn)。數(shù)字水印技術(shù)[4]在版權(quán)保護(hù)中的優(yōu)勢被越來越多人所關(guān)注,數(shù)字水印技術(shù)是通過在待保護(hù)的視頻、圖片和文本等數(shù)字化產(chǎn)品中不可感知的嵌入可認(rèn)證信息[5],并且保證不影響產(chǎn)品的可讀視性,非法的拷貝會損傷到事先嵌入的可認(rèn)證信息。一旦需要認(rèn)定產(chǎn)品的著作權(quán)時,可以從產(chǎn)品中提取事先嵌入的認(rèn)證信息,從而鑒別產(chǎn)品的合法性。
關(guān)鍵詞:云計算;電子文件管理;關(guān)鍵技術(shù)
云計算時代的來臨,且伴隨著運用力度的不斷加大,越來越受到人們的關(guān)注,一度成為業(yè)界人士相繼研究的重要課題之一。源于云計算的普及,顛覆了以往支撐電子文件管理實現(xiàn)的技術(shù)框架,也促使其電子文件管理朝向多元化方向發(fā)展,但其關(guān)鍵技術(shù)的研究并不多見。故而,對云計算環(huán)境下電子文件管理關(guān)進(jìn)技術(shù)的研究有著重要的現(xiàn)實意義。
1 云計算環(huán)境下電子文件管理技術(shù)框架
云計算環(huán)境下的電子文件包管理同時兼有資源虛擬化(SAAS層次上)與對云平臺提供商所提供云服務(wù)的優(yōu)先選擇和配置雙重特性,而隨著私有云的漸次成熟,終究會帶動公共云和混合云的發(fā)展。因此,其技術(shù)構(gòu)架涵蓋如下:
(1)固件或硬件層。交換機、硬件服務(wù)器等基礎(chǔ)設(shè)備,服務(wù)于軟件的內(nèi)核層的管理、操作及更新;內(nèi)核層經(jīng)操作系統(tǒng)內(nèi)核、集群中間件、虛擬機監(jiān)控器等,實現(xiàn)對固件或硬件層的管理。
(2)分布式數(shù)據(jù)(非結(jié)構(gòu)化)存儲。事先配置好存儲量大小,常以64MB為以組塊,以主服務(wù)器提供的形式,在各個組塊經(jīng)索引后,實現(xiàn)不同數(shù)據(jù)管理服務(wù)器的存儲,且云計算環(huán)境下的全部數(shù)據(jù)存儲,均由文件系統(tǒng)管理。
(3)分布式數(shù)據(jù)(結(jié)構(gòu)化)存儲。包含Bigtable、RDS及HBase等技術(shù),在云計算中,電子文件元數(shù)據(jù)的存儲通常都是在分布式結(jié)構(gòu)化表中,由其管理系統(tǒng)進(jìn)行統(tǒng)一管理。
(4)分布數(shù)據(jù)處理技術(shù)。在云計算中,電子文件管理系統(tǒng)采用以MapReduce為主的分布式數(shù)據(jù)處理技術(shù)對電子文件進(jìn)行處理。
(5)電子文件管理基礎(chǔ)。電子文件封包、憑證管理、文件完整性校驗、數(shù)據(jù)分布式存取、文件監(jiān)控等,提供出基礎(chǔ)與核心功能。
(6)電子文件管理業(yè)務(wù)服務(wù)。包括信息捕獲、系統(tǒng)管理、保管與處置、安全與監(jiān)控、檢索與再現(xiàn)及非電子管理等,負(fù)責(zé)虛擬化和電子文件管理數(shù)據(jù)庫的實現(xiàn)與形成。
2 云計算環(huán)境下電子文件管理關(guān)鍵技術(shù)
鑒于云計算環(huán)境較之于以往電子文件管理環(huán)境具有的特殊性,其技術(shù)突破(即關(guān)鍵技術(shù))應(yīng)圍繞數(shù)據(jù)信息建模技術(shù)、結(jié)構(gòu)與非結(jié)構(gòu)數(shù)據(jù)分布存取技術(shù)、電子文件數(shù)據(jù)溯源技術(shù)進(jìn)行。
1. 數(shù)據(jù)信息建模技術(shù)
要將不同電子文件封裝要求不盡相同這一點納入到數(shù)據(jù)信息建模技術(shù)中,如提交信息包(SIP)、存檔信息包(AIP)及信息包(DIP)的信息模型及實現(xiàn)不同信息包之間的轉(zhuǎn)換,同時要結(jié)合云計算技術(shù)特性,如大文件組塊管理、多副本管理、數(shù)據(jù)分布式管理等。
2.結(jié)構(gòu)與非結(jié)構(gòu)數(shù)據(jù)分布存取技術(shù)
云計算環(huán)境下的電子文件管理較之于傳統(tǒng)電子文件管理系統(tǒng),最大的區(qū)別在于數(shù)據(jù)分布呈現(xiàn)出結(jié)構(gòu)化與非結(jié)構(gòu)、且異構(gòu)電子文件海量,存取多具復(fù)雜性。如
Google文件系統(tǒng),采用中心服務(wù)器管理技術(shù),數(shù)據(jù)不支持緩存,只在用戶端備有專用的接口。云計算環(huán)境下的電子文件管理要實現(xiàn)文件分塊、多副本管理、MapReduce、加入結(jié)點動態(tài)等過程具有挑戰(zhàn)性。
3.電子文件數(shù)據(jù)溯源技術(shù)
在云環(huán)境中,其特殊性為電子文件與其元數(shù)據(jù)的溯源提供了技術(shù)支持。在云計算中,電子文件的回溯基本上可劃分為結(jié)構(gòu)化數(shù)據(jù)表與非結(jié)構(gòu)化數(shù)據(jù)。在Bigtable中,其數(shù)據(jù)模型的組成主要包括行、列及時間戳。而且,在云計算中,非結(jié)構(gòu)化數(shù)據(jù)的存儲通過采用多副本技術(shù),能有效地溯源文件實體對象。然而,并不是云計算中的所有技術(shù)都能操作電子文件與其元數(shù)據(jù)的回溯,因此,在云計算中,憑證性回溯技術(shù)的管理還需要進(jìn)行進(jìn)一步的突破。
3 云環(huán)境下電子文件管理相關(guān)關(guān)鍵技術(shù)實現(xiàn)方案
云環(huán)境下電子文件管理關(guān)鍵技術(shù)的實現(xiàn),要在對傳統(tǒng)電子文件管理環(huán)境進(jìn)行改觀的同時納入云計算這一因素,因而,要抓住和掌握相關(guān)實現(xiàn)要點,并在此基礎(chǔ)上,滲透到云計算的各個層次中,達(dá)到電子文件管理的最優(yōu)化。
1.實現(xiàn)要點
1.1底層技術(shù)與核心技術(shù)相平衡
云計算供應(yīng)商所提供的云服務(wù),應(yīng)將操作簡便性、實用性作為首要特征,電子文件管理關(guān)鍵技術(shù)的實現(xiàn)首先要考慮技術(shù)的可操作性。新技術(shù)的研發(fā)固然重要,首先要避免刻意追求新技術(shù)的復(fù)雜化,注重原有技術(shù)的重組,達(dá)到底層技術(shù)與核心技術(shù)相平衡,確保底層技術(shù)和核心技術(shù)二者之間的協(xié)調(diào)發(fā)展。
1.2經(jīng)濟性與穩(wěn)定性相平衡
云計算環(huán)境下電子文件管理系統(tǒng)必須要達(dá)到經(jīng)濟性與穩(wěn)定性相平衡目的,事實上,經(jīng)濟性通常會不利于系統(tǒng)的穩(wěn)定性,在容錯問題的處理上尤為多見,因其會涉及到Master、Sever、數(shù)據(jù)管服務(wù)器等部分。在計算與存儲能力均等的基礎(chǔ)上,搭建云端服務(wù)器集群的成本要遠(yuǎn)遠(yuǎn)低于對超級計算機購買的成本,而較低成本的云端部署與服務(wù)器硬件,避免了集機群更新?lián)Q代的煩惱,且用戶可采用瘦終端來實現(xiàn)加大云服務(wù)的功能。
1.3靈活性與安全性相平衡
靈活性涉及到多副本管理、節(jié)點動態(tài)管理、動態(tài)故障恢復(fù)、故障動態(tài)監(jiān)測等方面,可使電子文件管理系統(tǒng)管理方便化,在帶來方便的同時也帶來了可靠性、一致性及保密性等方面更高的管理要求。因此,在云環(huán)境下,必須要保證靈活性與安全性的平衡,以保證電子文件管理系統(tǒng)的方便性與安全性。
1.4針對性與可持續(xù)性相平衡
實現(xiàn)云計算中的電子文件管理系統(tǒng)并不是一步到位的,而是要通過統(tǒng)一的規(guī)劃,按照步驟一步一步實現(xiàn)的,并注重部門的協(xié)作及部門間的資源共享。而針對性是區(qū)別電子文件管理系統(tǒng)和各種業(yè)務(wù)應(yīng)用系統(tǒng)的主要特點之一,電子文件管理務(wù)必要遵循相關(guān)功能標(biāo)準(zhǔn),同時還要注意可持續(xù)性。
2.實現(xiàn)方法
在云計算中,實現(xiàn)電子文件管理系統(tǒng)的方案多種多樣,但可以劃分為兩大類:商業(yè)解決方案與開源解決方案。但由于考慮到文件管理的特殊性與未來不可知性,因此建議采用開源解決方案?,F(xiàn)階段,開源方案的主流方向主要有:Hadoop、Nimbus、Eucalyptus,而Hadoop與Eucalyptus則是通過模仿商業(yè)解決方案而來的。通過對現(xiàn)階段的實現(xiàn)技術(shù)的普及度、成熟度、技術(shù)公開性及未來的發(fā)展趨勢等方面進(jìn)行綜合考慮,建立在云計算中的電子文件管理系統(tǒng)應(yīng)采用Hadoop的編程模式。作為Apache開源組織所提供的分布式計算機框架,Hadoop包括多種編程技術(shù),且具有較大的可靠性與可可擴展性。因此,在現(xiàn)階段的通用技術(shù)框架中,可以采用HadoopHDFS技術(shù)實現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)的存儲、采用HBase技術(shù)實現(xiàn)結(jié)構(gòu)化數(shù)據(jù)的存儲、采用MapReduce技術(shù)實現(xiàn)分布式處理及采用ZooKeeper技術(shù)實現(xiàn)鎖服務(wù)。
4 結(jié)語
綜上所述,隨著關(guān)鍵技術(shù)的越來越成熟及應(yīng)用的越來越廣泛,電子文件管理的實現(xiàn)逐漸發(fā)展到采用公共云及混合云技術(shù),并滲透到云計算的各種層次中。因此,在未來的工作中,必須要對云計算進(jìn)行充分的分析,以研究出最好的實現(xiàn)技術(shù)。
參考文獻(xiàn)
[1]薛四新.云計算環(huán)境下電子文件管理的實現(xiàn)機理[J].檔案學(xué)通訊,2013,13(3):65-66.
[2]薛四新,黃萃.云計算環(huán)境下電子文件管理研究綜述[J].北京檔案,2011,12(9):25-27.
關(guān)鍵詞:電子文件云計算關(guān)鍵技術(shù)
云計算的應(yīng)用將導(dǎo)致支撐電子文件管理實現(xiàn)的技術(shù)框架發(fā)生本質(zhì)上的轉(zhuǎn)變。目前,國內(nèi)外學(xué)者在云計算對電子文件管理的影響和所帶來的新問題等方面進(jìn)行了一定研究①,但缺少對云環(huán)境下電子文件管理關(guān)鍵技術(shù)的系統(tǒng)研究。本文重點探討整合應(yīng)用這些技術(shù)的通用框架、關(guān)鍵技術(shù)、實現(xiàn)原則和建議方案,為云環(huán)境下電子文件管理系統(tǒng)的構(gòu)建提供技術(shù)基礎(chǔ)和實施依據(jù)。
1 云端電子文件管理系統(tǒng)的技術(shù)框架
云環(huán)境下的電子文件管理系統(tǒng)不僅需要實現(xiàn)SaaS層次上的資源虛擬化,而且還應(yīng)根據(jù)電子文件的特殊性,對其他云服務(wù)提供商提供的平臺層和設(shè)施層的云服務(wù)進(jìn)行選擇、配置和優(yōu)化使用。私有云的成功實踐和成熟推廣會進(jìn)一步推動云環(huán)境下的電子文件管理的研究、應(yīng)用與發(fā)展,并進(jìn)一步帶動相關(guān)管理部門和人員認(rèn)識水平的提升,最終將逐漸會被混合云或公共云替代。
基于云計算的技術(shù)框架和電子文件管理的系統(tǒng)建設(shè)和應(yīng)用需求,采用分層方法設(shè)計云環(huán)境下電子文件管理系統(tǒng)的技術(shù)框架是實現(xiàn)電子文件管理的首要任務(wù),圖1呈現(xiàn)了電子文件管理系統(tǒng)的技術(shù)框架
1.1固件/硬件層主要包含硬件服務(wù)器和交換機等物理基礎(chǔ)設(shè)施,為軟件內(nèi)核層提供硬件的操作、管理和更新服務(wù);軟件內(nèi)核層負(fù)責(zé)管理固件/硬件層的物理硬件設(shè)備,通常由操作系統(tǒng)內(nèi)核、虛擬機監(jiān)控器、集群中間件等工具和技術(shù)來實現(xiàn)。
1.2非結(jié)構(gòu)化數(shù)據(jù)的分布式存儲。電子文件通常是以非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)方式存在,云計算環(huán)境中非結(jié)構(gòu)化大數(shù)據(jù)的存儲通常采用分布式文件管理技術(shù)如Google的GFS、Hadoop的HDFS等。非結(jié)構(gòu)化大數(shù)據(jù)的存儲過程中,一般按照實現(xiàn)配置好的大?。J(rèn)為64MB)進(jìn)行分塊,并對每個分塊進(jìn)行唯一索引后存儲在不同的數(shù)據(jù)塊服務(wù)器上,所有數(shù)據(jù)塊服務(wù)器由主服務(wù)器統(tǒng)一管理,力求控制流和數(shù)據(jù)流的分離。在云環(huán)境下,電子文件特別是大數(shù)據(jù)對象的文件將被存放到分布式的非結(jié)構(gòu)化文件系統(tǒng)中,由文件系統(tǒng)統(tǒng)一管理。
1.3結(jié)構(gòu)化數(shù)據(jù)對象的分布式存儲。云環(huán)境下結(jié)構(gòu)化數(shù)據(jù)的存儲技術(shù)有Google的Bigtable、Amazon的RDS、Hadoop的HBase等技術(shù),與傳統(tǒng)關(guān)系數(shù)據(jù)庫不同的是,云環(huán)境下的結(jié)構(gòu)化數(shù)據(jù)模型一般由一個行關(guān)鍵字、列關(guān)鍵字和時間戳進(jìn)行索引,其數(shù)據(jù)訪問需要數(shù)據(jù)鎖服務(wù)。云環(huán)境下的結(jié)構(gòu)化數(shù)據(jù)的分布式存儲一般采用主服務(wù)器和子表服務(wù)器進(jìn)行分工管理,其中主服務(wù)器負(fù)責(zé)新子表的分配、子表服務(wù)器的監(jiān)控和負(fù)載均衡等問題。在云環(huán)境下,電子文件的元數(shù)據(jù)一般存儲在分布式結(jié)構(gòu)化表中,由分布式結(jié)構(gòu)化數(shù)據(jù)管理系統(tǒng)統(tǒng)一管理。
1.4分布式數(shù)據(jù)處理。與傳統(tǒng)電子文件管理系統(tǒng)不同的是,云環(huán)境下的電子文件管理系統(tǒng)中將會采用以MapReduce為代表的分布式數(shù)據(jù)處理技術(shù)來處理電子文件,需要對目前的電子文件管理系統(tǒng)中普遍采用的數(shù)據(jù)處理算法和技術(shù)實現(xiàn)工具進(jìn)行改進(jìn)或重新設(shè)計。
1.5電子文件管理基礎(chǔ)服務(wù)。該層為電子文件管理業(yè)務(wù)層提供一些共性的基礎(chǔ)和核心功能,包括電子文件封裝、電子憑證管理、完整性校驗、分布式存取、電子文件監(jiān)控和電子文件的溯源。
1.6電子文件管理業(yè)務(wù)服務(wù)。電子文件管理業(yè)務(wù)服務(wù)主要包括信息捕獲、安全與監(jiān)控、保管與處置、檢索與再現(xiàn)、系統(tǒng)管理、非電子文件管理,負(fù)責(zé)實現(xiàn)電子文件管理業(yè)務(wù)服務(wù)的虛擬化,形成電子文件管理的工具資源池。電子文件管理用戶可以通過系統(tǒng)提供的接口,包括人機交互界面(如Web界面)和程序編程接口(如Web服務(wù)、API等),以租用的方式享用電子文件管理基礎(chǔ)服務(wù)的各項功能。
除了上述組成部分之外,云環(huán)境下電子文件管理還需要系統(tǒng)管理、安全保障、容錯機制和服務(wù)質(zhì)量等技術(shù),它們貫穿于云環(huán)境下的電子文件管理系統(tǒng)的所有層次,需要統(tǒng)一設(shè)計和研發(fā)。
2 云端電子文件管理的關(guān)鍵技術(shù)
圖1所示的云環(huán)境下的電子文件管理的通用技術(shù)框架的應(yīng)用需要如下關(guān)鍵技術(shù)的突破:
2.1電子文件的對象建模技術(shù)
電子文件的對象建模是電子文件管理系統(tǒng)的關(guān)鍵步驟之一。在不同的電子文件管理標(biāo)準(zhǔn)中,對電子文件的封裝要求有所不同。如何構(gòu)建SIP ( Submission Information Package,提交信息包)、AIP ( Archival Information Package,存檔信息包)、DIP (Dissemination InformationPackage,信息包)的信息模型以及如何實現(xiàn)這些不同信息包之間的相互轉(zhuǎn)換是云端電子文件管理中需要解決的技術(shù)問題。此外,電子文件對象建模技術(shù)還需要考慮云計算環(huán)境本身的技術(shù)特殊性,如多副本管理、大文件分塊管理、分布式處理等特征。因此,電子文件對象的建模與封裝是云環(huán)境下的電子文件管理系統(tǒng)實現(xiàn)過程中需要解決的關(guān)鍵技術(shù)之一。
2.2海量異構(gòu)電子文件的分布式存取技術(shù)
海量異構(gòu)電子文件的分布式存取是云端電子文件管理系統(tǒng)與傳統(tǒng)電子文件管理系統(tǒng)的區(qū)別之一。以Google文件系統(tǒng)為例,主要技術(shù)特點是采用中心服務(wù)器模式,不緩存數(shù)據(jù),在用戶態(tài)下實現(xiàn)和只提供專用接口。目前的電子文件管理中采用的數(shù)據(jù)處理技術(shù)不能直接應(yīng)用于云環(huán)境下的分布式數(shù)據(jù)處理任務(wù)中。云環(huán)境下的電子文件管理需要進(jìn)行大文件的分塊、MapReduce、多副本管理、結(jié)點動態(tài)加入、用戶態(tài)下實現(xiàn)等特殊操作。因此,面向海量異構(gòu)電子文件的分布式存取技術(shù)是云端電子文件管理的重要課題之一。
2.3電子文件及其元數(shù)據(jù)的溯源技術(shù)
云計算技術(shù)本身的特殊性為電子文件及其元數(shù)據(jù)的溯源提供了良好的技術(shù)保障。云環(huán)境下電子文件回溯可分為兩類:結(jié)構(gòu)化數(shù)據(jù)表的溯源和非結(jié)構(gòu)化數(shù)據(jù)的溯源。以Bigtable為例,其數(shù)據(jù)模型由行、列、時間戳組成。與傳統(tǒng)數(shù)據(jù)庫不同的是,Bigtable中采用了關(guān)鍵字排序、列簇(ColumnFamily)存儲和時間戳,可以很容易在不同版本之間回溯。此外,云計算環(huán)境中的非結(jié)構(gòu)化數(shù)據(jù)的存儲中采用了多副本技術(shù),也較好地支持文件實體對象的溯源。但是,云計算中的這些技術(shù)并不能完全支持電子文件及其元數(shù)據(jù)的回溯操作,如證據(jù)保留和憑證生成等。因此,憑證性回溯技術(shù)是云端電子文件管理中需要突破的重要技術(shù)。
3 云端電子文件管理的實現(xiàn)方案
圖1所示的云環(huán)境下的電子文件管理通用技術(shù)框架和上述關(guān)鍵技術(shù)的實現(xiàn)需要以下基本原則和實現(xiàn)方法。
3.1實現(xiàn)原則
基于以上分析,可以歸納出,云環(huán)境下電子文件管理系統(tǒng)的構(gòu)建需要遵從以下基本原則:
3.1.1底層技術(shù)的簡單性與上層應(yīng)用的復(fù)雜性之間的平衡原則。簡單實用性是云計算服務(wù)模式的重要特征。其簡單實用性主要體現(xiàn)在兩個層面,一是在云計算的設(shè)計思想中,云計算的實現(xiàn)并不追求新技術(shù)的創(chuàng)造,而更加重視現(xiàn)有技術(shù)的重組;另一個是云計算的實現(xiàn)技術(shù)上,云計算一般采用簡單實用的實現(xiàn)技術(shù),不主張實現(xiàn)技術(shù)的復(fù)雜化。以Amazon提出的SDB(SimpleDB)為例,這種技術(shù)不需要實現(xiàn)定義模式信息,其屬性的修改添加以追加形式實現(xiàn),操作類型簡單(不支持像連接、排序等復(fù)雜操作)。然而,底層的簡單實用往往會增加上層應(yīng)用的復(fù)雜度。因此,在云環(huán)境下的電子文件管理系統(tǒng)的設(shè)計和實現(xiàn)中,不僅要考慮底層技術(shù)的簡單實用原則,而且還注重避免上層應(yīng)用的復(fù)雜性,力求在二者之間達(dá)到平衡。
3.1.2經(jīng)濟性與穩(wěn)定性之間的平衡。經(jīng)濟性也是云技術(shù)的重要特征之一,云計算的經(jīng)濟性體現(xiàn)云端和終端的經(jīng)濟性。云端的經(jīng)濟性體現(xiàn)在云端部署在成本相對較低的服務(wù)器硬件之上,不追求服務(wù)器集機群的實時更新?lián)Q代。在計算能力和存儲能力相等的情況下,搭建一個云端服務(wù)器集群的成本要低于購買一臺超級計算機作為服務(wù)器的成本;終端的經(jīng)濟性體現(xiàn)在云計算對終端的要求較低,用戶可以使用瘦終端就可以調(diào)用功能強大的云服務(wù),不需要購買昂貴的軟硬件設(shè)備和進(jìn)行繁瑣的軟硬件管理與維護(hù)工作②。因此,云環(huán)境下的電子文件管理系統(tǒng)的設(shè)計應(yīng)遵循經(jīng)濟性原則,可直接部署在配置較低的普通服務(wù)器硬件上,而且應(yīng)支持多種類型的終端設(shè)備。但是,經(jīng)濟性原則往往帶來穩(wěn)定性問題,尤其是容錯處理問題。經(jīng)濟性帶來的容錯處理是云計算的重要難題之一,涉及云計算中的Master服務(wù)器、Sever服務(wù)器、數(shù)據(jù)管理服務(wù)器等每個組成部分。因此,在經(jīng)濟性和穩(wěn)定性之間的平衡是云環(huán)境下電子文件管理的重要指導(dǎo)原則之一。
3.1.3靈活性與安全性的統(tǒng)一。靈活性(或彈性)作為云計算的重要特征,涉及節(jié)點動態(tài)管理、故障動態(tài)監(jiān)測、動態(tài)故障恢復(fù)、多副本管理、動態(tài)租約管理和彈組合。顯然,靈活性給電子文件管理系統(tǒng)的技術(shù)實現(xiàn)帶來了較大程度的方便性。但是,靈活性也給電子文件的一致性、可靠性和保密性提出了更復(fù)雜的管理要求。因此,保證靈活性與安全性之間的平衡是云環(huán)境下的電子文件管理系統(tǒng)的IT實現(xiàn)的重要指導(dǎo)原則之一。
3.1.4針對性和可持續(xù)性的統(tǒng)一。針對性強調(diào)的是電子文件管理系統(tǒng)與其他業(yè)務(wù)應(yīng)用系統(tǒng)的區(qū)別性,主要強調(diào)電子文件管理系統(tǒng)遵循相關(guān)的功能要求標(biāo)準(zhǔn)的符合程度。當(dāng)前國內(nèi)外關(guān)于與電子文件管理系統(tǒng)的功能要求標(biāo)準(zhǔn)有ISO15489、DoD5015.02、Moreq2、ICA、《電子文件歸檔與管理規(guī)范GB/T18894-2002》、《電子文件管理系統(tǒng)通用功能要求》等。因此,云環(huán)境下的電子文件管理系統(tǒng)的實現(xiàn)中必須遵循這些原則和要求,具備較強的針對性或?qū)I(yè)性。同時,針對性的實現(xiàn)也要支持和遵循可持續(xù)性。云環(huán)境下的電子文件管理系統(tǒng)的實現(xiàn)并不要求一步到位,應(yīng)統(tǒng)一規(guī)劃,分步驟實現(xiàn),重視部門協(xié)同和資源共享。因此,針對性和可持續(xù)性的統(tǒng)一是云環(huán)境下的電子文件管理系統(tǒng)的研發(fā)中必須遵循的原則之一。
3.2實現(xiàn)方法
云計算環(huán)境中的電子文件管理系統(tǒng)的實現(xiàn)技術(shù)方案有多種,可以分為兩大類,即商業(yè)解決方案和開源解決方案??紤]到電子文件管理需求的特殊性及未來應(yīng)用的可擴展性,建議采用開源解決方案。目前,主流的開源方案有Hadoop、Eucalyptus、Nimbus和Sectorand Sphere。其中,Hadoop和Eucalyptus分別模仿了兩個主流的商業(yè)解決方案,即Google和Amazon的云技術(shù)。綜合考慮實現(xiàn)技術(shù)的成熟度、普及程度、內(nèi)部技術(shù)的公開性和未來發(fā)展趨勢,建議在云環(huán)境下的電子文件管理中采用基于Hadoop的開源解決方案。
在云環(huán)境下的電子文件管理系統(tǒng)的開發(fā)中應(yīng)采用基于Hadoop的編程模式或類似于Hadoop的編程模式。Hadoop是Apache開源組織提供的一種具有高可靠性、高可擴展性的分布式計算機框架,包括Hadoop Common、Avro、Vhukwa、HBase、HDFS、Hive、MapReduce、Pig和ZooKeeper等編程技術(shù)③。其中,Hadoop HDFS、MapReduce、HBase、ZooKeeper、Pig分別對應(yīng)Google的GFS、MapReduce、Bigtable、Chubby和Sawzall。因此,在圖1所示的通用技術(shù)框架中,可以分別使用Hadoop HDFS、HBase、MapReduce和ZooKeeper技術(shù)實現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)的存儲、結(jié)構(gòu)化數(shù)據(jù)的存儲、分布式處理和鎖服務(wù)。
4 結(jié)語
以云計算為中心的新型信息生態(tài)環(huán)境為電子文件管理提供了新的計算模式和技術(shù)實現(xiàn)方案。在這種生態(tài)環(huán)境下,云端電子文件管理系統(tǒng)的初期建設(shè)往往定位于SaaS層的私有云。隨著關(guān)鍵技術(shù)和典型應(yīng)用的成熟與發(fā)展,電子文件管理將逐漸采用混合云或公共云技術(shù),并將滲透至云計算的不同層次。為此,本文將云端電子文件管理系統(tǒng)的通用技術(shù)劃分為七個層次,探討所需的四項關(guān)鍵技術(shù),并提出了研發(fā)電子文件管理系統(tǒng)的基本原則和實現(xiàn)方案。因此,本文研究對于云環(huán)境下的電子文件管理系統(tǒng)的研發(fā)活動具有重要的指導(dǎo)意義。在未來的工作中,我們將重點進(jìn)行實證分析,并進(jìn)一步完善本文研究成果。
本文是北京市科技計劃課題《基于異構(gòu)系統(tǒng)的電子檔案憑證性保障核心技術(shù)開發(fā)與應(yīng)用》(項目編號Z111100075011001)、國家自然科學(xué)基金項目“語義Web環(huán)境下的大規(guī)模協(xié)同知識處理模型研究”(項目編號71103020)和國家社科基金重大項目《云計算環(huán)境下的信息資源集成與服務(wù)研究》(項目編號:12&ZD220)的成果之一。
參考文獻(xiàn):
薛四新,黃萃.云計算環(huán)境下電子文件管理研究綜述[J].北京檔案,2011(09):25-27.
朝樂門,張勇,邢春曉.云端信息資源管理研究[J].情報資料工作,2010(4):44-49.
關(guān)鍵詞:云計算;數(shù)字圖書館;建設(shè)
云計算環(huán)境下的數(shù)字圖書館是信息時代的新興產(chǎn)物,是主要以信息技術(shù)的集成為核心,包括數(shù)字化技術(shù)、安全保密技術(shù)、數(shù)據(jù)倉庫與聯(lián)機分析處理技術(shù)、自然語言理解技術(shù)等手段的新時代圖書館。
1 云計算的概念
1.1 云計算的定義
云計算是由網(wǎng)絡(luò)計算、分布式計算、并行計算、網(wǎng)絡(luò)存儲、效用計算等傳統(tǒng)計算機技術(shù)和網(wǎng)絡(luò)技術(shù)所組成的新型計算方式,代表著計算機技術(shù)的又一次發(fā)展。狹義的云計算是指網(wǎng)絡(luò)上按需、易擴展的方式獲得硬件、平臺等領(lǐng)域的資源的形式。為用戶提供資源的網(wǎng)絡(luò)就是“云”。云計算可以整合所有的計算資源,并無需人為參與,由軟件自行管理。云計算需要不斷提高“云”的計算處理能力,以減小應(yīng)用提供者對繁瑣細(xì)節(jié)的處理,有利于創(chuàng)新和提高成本。
1.2 云計算的特點
云計算的特點有①云計算的規(guī)模宏大,如Google“云”的規(guī)模達(dá)到了100多萬臺服務(wù)器,Amazon、IBM、微軟、Yahoo等機構(gòu)的“云”也達(dá)到了幾十萬臺服務(wù)器的數(shù)量,甚至一家企業(yè)的私有云的服務(wù)器就達(dá)到數(shù)百上千臺;②云計算的用戶所需要的資源來自于虛擬的“云”,用戶只需要在計算機或手機上運用網(wǎng)絡(luò)服務(wù)就可以將需要的資源從“云”中提取出來;③由于“云”的技術(shù)措施包括數(shù)據(jù)多副本容錯、計算節(jié)點同構(gòu)可以互換等,所以對服務(wù)的可靠性有了高保障,甚至可靠性要遠(yuǎn)遠(yuǎn)高于本地計算機;④由于云計算不針對單一的應(yīng)用,所以在同一個“云”的支持下可以構(gòu)建出多個不同類型的應(yīng)用,可以支持不同應(yīng)用在各個終端運行;⑤“云”具有高度擴展性,它的規(guī)??梢噪S需要自動調(diào)整,能夠根據(jù)應(yīng)用和用戶數(shù)量的變化進(jìn)行動態(tài)伸縮;⑥云計算還具有按需購買的特性,用戶能夠根據(jù)自己的實際需要進(jìn)行計費。
2 數(shù)字圖書館的概念及發(fā)展
數(shù)字圖書館不僅是互聯(lián)網(wǎng)上的圖書館主頁,還包括了所有數(shù)字化圖書資源的,是一套完整的、分布式的、面向網(wǎng)絡(luò)用戶的、與現(xiàn)實載體無關(guān)的數(shù)字化資源的集合。1988年,美國科學(xué)家W.Wulf在國際合作白皮書中正式提出“數(shù)字圖書館”的概念,其后由美國國家科學(xué)基金會等機構(gòu)聯(lián)合發(fā)起了數(shù)字圖書館先導(dǎo)計劃,“數(shù)字圖書館”開始越來越廣泛地進(jìn)入到公眾視野中,對數(shù)字圖書館的研究也開始火熱起來。目前,數(shù)字圖書館的研究重心主要是信息、知識的集成服務(wù)和增值服務(wù)。
3 云計算環(huán)境下的數(shù)字圖書館建設(shè)
3.1 云計算環(huán)境下的數(shù)字圖書館的資源建設(shè)
云計算環(huán)境下數(shù)字圖書館的最大的優(yōu)點是資源豐富,形式多樣化。集成大量的信息資源,充分利用一切可用的資源和服務(wù),建成內(nèi)容豐富、服務(wù)多樣的數(shù)字圖書館是云計算環(huán)境下的數(shù)字圖書館的重要任務(wù)。云計算的PaaS平臺可以為數(shù)字圖書館的資源建設(shè)提供更大范圍。
3.2 云計算環(huán)境下的數(shù)字圖書館的資源儲存
浩如煙海的數(shù)據(jù)儲存是云計算的強大功能,“云”由成千上萬的服務(wù)器構(gòu)成,能夠幫助需求越來越多的數(shù)字圖書館用戶實現(xiàn)各種資源的搜索和分享。云計算環(huán)境下的數(shù)字圖書館的館藏資源不再只是儲存在自己的單一服務(wù)器上,而是可是儲存在任何一臺連接“云”的電腦上。
3.3 云計算環(huán)境下的數(shù)字圖書館的服務(wù)對象分析
與傳統(tǒng)圖書館不同,云計算環(huán)境下的數(shù)字圖書館的服務(wù)對象是虛擬用戶,這種虛擬用戶可能是真實的一個人,也可能是一個團體、機構(gòu),甚至可能是一種自動運行的程序。這些用戶范圍廣泛,數(shù)量眾多,幾乎涵蓋了社會各階層的人,或者只是一個客戶設(shè)置的自動搜索應(yīng)用程序。信息檢索是大多數(shù)使用數(shù)字圖書館的用戶最常用的功能,也是數(shù)字圖書館的基本目的。由于數(shù)字圖書館能將該專業(yè)的大量資源搜集匯合,所以在專業(yè)數(shù)字圖書館檢索是高效的方式。還有一部分是針對數(shù)字圖書館的學(xué)習(xí)娛樂的文獻(xiàn)和視頻在線點播的用戶。由于用戶類型不一,云計算環(huán)境下的數(shù)字圖書館所要提供的服務(wù)也應(yīng)隨之改進(jìn)。應(yīng)該努力擴充館藏信息資源,并提供多樣化的信息表現(xiàn)形式以方便不同類型的用戶使用。
3.4 云計算環(huán)境下的數(shù)字圖書館的服務(wù)模式
云計算環(huán)境下的數(shù)字圖書館服務(wù)模式主要分為兩種,一種是虛擬參考咨詢服務(wù),它的服務(wù)手段包括①通過用戶填寫DRS系統(tǒng)主頁上的Web表單,向系統(tǒng)發(fā)出搜索要求,然后系統(tǒng)采取將答案在Web頁面或通過E-mail的形式是用戶得到回答;②用戶和DRS系統(tǒng)專家都以E-mail的形式提問和解答,系統(tǒng)還可以通過對用戶的定期需求的記錄通過E-mail進(jìn)行自動服務(wù);③通過Chat、MSN、QQ等方式把傳統(tǒng)咨詢服務(wù)延伸到虛擬環(huán)境中的“面談”服務(wù),實現(xiàn)實時交互參考咨詢,使虛擬參考咨詢系統(tǒng)更加人性化;④FAQ方式是一種把用戶需要頻率較多的一般性問題加以整理,形成問題與答案的文檔或系統(tǒng)學(xué)科導(dǎo)航模式,放在Web主頁的顯著位置,以使一部分用戶的需要得到快速解決。第二種是主動推送服務(wù),是一種運用推送技術(shù)來主動對用戶提供服務(wù)的方式。
3.5 云計算環(huán)境下的數(shù)字圖書館基礎(chǔ)設(shè)施整合
云計算環(huán)境下的數(shù)字圖書館以云計算服務(wù)器為核心,通過動態(tài)部署的方式對虛擬的硬件服務(wù)器進(jìn)行有序安排。用戶的動態(tài)請求驅(qū)動云計算服務(wù)器,然后由動態(tài)部署硬件提供計算和存儲。大型的數(shù)字圖書館可以將實體資源轉(zhuǎn)化為靈活度高的巨量資源,為其他數(shù)字圖書館提供可更新的交互服務(wù)。通過云計算整合各數(shù)字圖書館的資源,為各數(shù)字圖書館間提供了一種合作之外的交流方式。在云計算的支撐下,圖書館公共聯(lián)機檢索不僅可以搜索館藏資源,還可以實現(xiàn)新型服務(wù)的重組,成為資源與讀者匹配的核心組織。
3.6 加強云計算環(huán)境下的數(shù)字圖書館的信息安全和知識產(chǎn)權(quán)保護(hù)
云計算環(huán)境下的數(shù)字圖書館最大的擔(dān)心是館藏數(shù)字資料、書目數(shù)據(jù)、讀者數(shù)據(jù)和流通數(shù)據(jù)的安全性,一旦這些數(shù)據(jù)丟失,將帶來嚴(yán)重的損失。為了確保數(shù)據(jù)的安全,云計算服務(wù)商采用先進(jìn)的海量虛擬化存儲技術(shù),利用數(shù)據(jù)副本的形式實現(xiàn)容錯,通過對各個虛擬盤創(chuàng)建多個副本的方式提高數(shù)據(jù)的可用性和訪問體驗。另外,云計算環(huán)境下的整個熟悉圖書館產(chǎn)業(yè)結(jié)構(gòu)都要對信息安全問題進(jìn)行研究,形成政策層面上的共識和行業(yè)規(guī)范。為了保護(hù)數(shù)據(jù)的知識產(chǎn)權(quán),應(yīng)引進(jìn)PKI公鑰基礎(chǔ)設(shè)施,在公鑰加密和數(shù)字簽名服務(wù)的系統(tǒng)平臺上,使云計算環(huán)境下的數(shù)字圖書館在網(wǎng)絡(luò)應(yīng)用中更加高效、便捷地使用加密和數(shù)字簽名技術(shù),使數(shù)據(jù)的保密性和完整性得到保障。
4 結(jié)束語
只要有一臺可以連入互聯(lián)網(wǎng)的設(shè)備就可以使用數(shù)字圖書館的資源,推動數(shù)字圖書館的建設(shè)有助于方便人們的生活,提高人們的綜合素質(zhì),云計算的出現(xiàn)數(shù)字圖書館建設(shè)創(chuàng)造了更好的環(huán)境。
參考文獻(xiàn)
[1] 毛丹. “云服務(wù)”環(huán)境下的圖書館數(shù)字資源共享平臺建設(shè)研究――以安徽省黨校圖書館為例[J]. 江西圖書館學(xué)刊. 2012,14(06):32-34
[2] 秦曉珠,張興旺,李晨暉. 移動云計算環(huán)境下的數(shù)字圖書館云服務(wù)模式構(gòu)建研究[J]. 情報理論與實踐. 2012,25(05):65-66
[3] 倪煜佳. 基于云計算的圖書館聯(lián)盟服務(wù)平臺構(gòu)建研究[D]. 東北師范大學(xué) 2012,13(42):11-13
[4] 周舒,張嵐嵐. 云計算改善數(shù)字圖書館用戶體驗初探[J]. 圖書館學(xué)研究. 2010,33(04):41-43
關(guān)鍵詞:云計算;Web;數(shù)據(jù)挖掘;互聯(lián)網(wǎng)
中圖分類號:TP393 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2016)16-0015-03
互聯(lián)網(wǎng)是一個革命性的產(chǎn)業(yè),它打破了人們的生活習(xí)慣和格局,同時隨著互聯(lián)網(wǎng)用戶的不斷增長,它的數(shù)據(jù)網(wǎng)絡(luò)和數(shù)據(jù)信息也越來越詳細(xì)和豐富。就如何在這樣大數(shù)據(jù)之中提取出來有用的數(shù)據(jù)信息就是Web要做的工作,在大量數(shù)據(jù)挖掘出來后數(shù)據(jù)本身之間的關(guān)聯(lián)性以及如何將這些挖掘的數(shù)據(jù)再次的運用到實際生活中這都是Web數(shù)據(jù)挖掘技術(shù)要突破和解決的問題。當(dāng)前,大規(guī)模的數(shù)據(jù)在一個計算機上幾乎無法操作了,科技發(fā)展和社會需求下的產(chǎn)物云計算應(yīng)運而生,它處理和存儲數(shù)據(jù)的能力非常強大,并具備對所存儲的數(shù)據(jù)進(jìn)行分析處理以及計算的超強能力。
1 云計算的應(yīng)用及技術(shù)特征
1.1 云計算的應(yīng)用現(xiàn)狀
Web也是經(jīng)歷了一個漫長的成長和發(fā)展的過程。它在互聯(lián)網(wǎng)技術(shù)和電子商務(wù)高速興起的基礎(chǔ)上,基于人們對網(wǎng)絡(luò)的應(yīng)用更加廣泛和頻繁,帶動了Web2.0的一場興起浪潮。數(shù)據(jù)的需求對互聯(lián)網(wǎng)企業(yè)來說成為了競爭的核心內(nèi)容,尤其是一些需要根據(jù)客戶目的性需求而開設(shè)的網(wǎng)站,例如看網(wǎng)絡(luò)視頻的網(wǎng)站就更加的需要數(shù)據(jù)化來分析和開發(fā)有客戶需求的產(chǎn)品。云計算的誕生解決了很多技術(shù)上的難題。我國的互聯(lián)網(wǎng)用戶非常龐大,且還處于增長的趨勢,這就使得很多的大型企業(yè)和公司都在使用云計算來進(jìn)行數(shù)據(jù)的分析和研究。
1.2 云計算技術(shù)分析
云計算主要就是對數(shù)據(jù)進(jìn)行管理,它所處理的核心也就是數(shù)據(jù),因此它和其他的計算機技術(shù)存在差異,具體如下:
一是,具有廣泛性,云計算技術(shù)它最重要的就是存儲技術(shù),采取了大量分布存儲的模式可以大大地提高存儲的速度和存儲的能力,同時也具備較高的性價比。它能夠很精準(zhǔn)的進(jìn)行存儲,非常實用。
二是,對數(shù)據(jù)的管理能力強,對大數(shù)據(jù)的跟蹤監(jiān)控具有時效性,并能夠隨時的處理數(shù)據(jù)分析數(shù)據(jù),效率極高,也可以對數(shù)據(jù)庫的信息和數(shù)據(jù)進(jìn)行有針對性的篩選和查找,管理技術(shù)非常先進(jìn)。
三是,應(yīng)用到先進(jìn)的編程技術(shù),技術(shù)因素是云計算能不能達(dá)到良好用戶體驗的重要因素,它是支撐整個云計算系統(tǒng)良性高速運行的核心,這就需要整個的編程技術(shù)能夠滿足用戶的需求和良好體驗。目前Map-Reduce編程模式用得較多,它開始是以一個樹枝的結(jié)構(gòu)呈現(xiàn)出來的,分支后還將使用其他的編程模式來執(zhí)行。
四是,虛擬化技術(shù)的靈活運用。云計算技術(shù)對虛擬化技術(shù)運用很廣泛,虛擬化技術(shù)能夠?qū)⒂嬎阗Y源進(jìn)行合理的分配,它可以獨立各個不同級別的系統(tǒng),將各個系統(tǒng)進(jìn)行獨立化也將數(shù)據(jù)分成若干獨立的部分,形成了一個動態(tài)的獨立的分工體系。它使得整個的系統(tǒng)具有很大的彈性,能夠很靈活的進(jìn)行動態(tài)虛擬資源的使用,節(jié)約成本,由于他的結(jié)構(gòu)的彈性和靈活性使得它能夠降低管理的風(fēng)險。
2 Web數(shù)據(jù)挖掘的發(fā)展現(xiàn)狀
2.1 Web數(shù)據(jù)挖掘的概念
所謂的Web數(shù)據(jù)挖掘,即是Web、數(shù)據(jù)挖掘、計算機語言與信息學(xué)等技術(shù)與方法的融合,數(shù)據(jù)挖掘與Web得到融合之后,便能夠體現(xiàn)出較好的綜合性。對挖掘?qū)ο笳归_較為全面的分析之后,Web數(shù)據(jù)挖掘還可以被分為結(jié)構(gòu)、內(nèi)容與使用等多方面內(nèi)容。其中,對于內(nèi)容來說,其是指通過人工化模式組建,在Web環(huán)境下,從對應(yīng)的文件夾當(dāng)中,完成應(yīng)用者信息的提??;對其結(jié)構(gòu)來說,其是指通過人工化模式組建,對各種類型的結(jié)構(gòu)實施挖掘,繼而利用不同方式完成信息的提??;對于使用挖掘來講,其是把被挖掘的對象集中在日志文件當(dāng)中,然后以此為突破口,將站點用戶量等數(shù)據(jù)展開挖掘。由此可見,數(shù)據(jù)挖掘也就是利用技術(shù)的手段來對Web文檔中的數(shù)據(jù)進(jìn)行提取,也就是根據(jù)現(xiàn)有的信息資源來進(jìn)行分析和預(yù)測它的發(fā)展前景。Web數(shù)據(jù)挖掘技術(shù)并不是單一的某項技術(shù)而是多個技術(shù)的共同作用。
2.2 Web數(shù)據(jù)挖掘的分類
Web數(shù)據(jù)挖掘的分類方式有很多種,從它的興趣類別來分可以分為下面三個部分,也就是Web數(shù)據(jù)挖掘的內(nèi)容、結(jié)構(gòu)和用法。從內(nèi)容上說,就是Web數(shù)據(jù)挖掘的對象,也就是我們數(shù)據(jù)信息的載體,包括我們所獲取的一些視頻圖片,音頻文字等等的一些實質(zhì)性的信息。內(nèi)容的挖掘也可以細(xì)分的,主要就是分為純文本的挖掘和多媒體的挖掘,這樣細(xì)分能夠更好的區(qū)別挖掘的對象。從Web數(shù)據(jù)挖掘的結(jié)構(gòu)來說,就是獲取這些內(nèi)容的所挖掘的結(jié)構(gòu)對象,主要就是區(qū)分挖掘內(nèi)容是屬于頁面結(jié)構(gòu)還是組織結(jié)構(gòu),同時還要對數(shù)據(jù)所形成的數(shù)據(jù)鏈也進(jìn)行分類,并對這個的數(shù)據(jù)挖掘工作的效率和準(zhǔn)確率進(jìn)行提高。從挖掘用法上,也即是對Web的文檔和網(wǎng)頁中的內(nèi)容和資料,進(jìn)行分析和研究,來通過原始的數(shù)據(jù)對信息資源的挖掘區(qū)別用戶的類型,將用戶的類別進(jìn)行分類,發(fā)現(xiàn)更多的潛在的客戶。
2.3 Web數(shù)據(jù)挖掘的流程
Web挖掘流程會受到很多因素影響,它因為本身的挖掘方式與對象和傳統(tǒng)的挖掘模式差別較大,因此流程也存在很大的差異,Web數(shù)據(jù)挖掘的流程有多個方面:將數(shù)據(jù)挖掘技術(shù)和Web網(wǎng)頁兩者進(jìn)行融合還是很困難的,因為Web數(shù)據(jù)挖掘技術(shù)并不是幾個技術(shù)的簡單疊加,它是一個整體,包含可以對信息進(jìn)行檢索、選擇需要的信息并對信息初步的處理、找到模式并進(jìn)行分析這一系列的過程。對信息的檢索也就是查找就是通過對文檔中的信息和各種網(wǎng)站的一些新聞、日志等等數(shù)據(jù)信息進(jìn)行分析。第二階段就是對第一階段所獲取的信息進(jìn)行甄別和篩選,剔除一些沒有價值的信息和數(shù)據(jù),并將有用的數(shù)據(jù)信息進(jìn)行簡單的處理。最后一階段就是對所預(yù)處理的數(shù)據(jù)和信息進(jìn)行進(jìn)一步的篩選和驗證,提取出有價值的信息。這個過程既需要機器的自動化來完成也需要通過人工的甄別來實現(xiàn)。
3 基于云計算的Web數(shù)據(jù)挖掘
3.1 基于云計算的Web數(shù)據(jù)挖掘體系架構(gòu)
Web數(shù)據(jù)的挖掘它是分為幾個點的,數(shù)據(jù)的挖掘體系也就是這幾個節(jié)點之間存在的一系統(tǒng)框架結(jié)構(gòu)的相關(guān)聯(lián),云計算使得Web數(shù)據(jù)挖掘的構(gòu)架的節(jié)點相互作用,相互影響,形成了一個較為成熟的架構(gòu)體系。結(jié)構(gòu)圖如下。第一個節(jié)點是主控節(jié)點,它主要是連接了客戶端到各個節(jié)點的紐帶也是一個中樞紐帶。第二個節(jié)點是算法節(jié)點,它的任務(wù)是保證在數(shù)據(jù)運行中有對應(yīng)的算法支持,相當(dāng)于一個算法的倉庫。第三個節(jié)點是數(shù)據(jù)節(jié)點,是一個龐大數(shù)據(jù)庫來存儲數(shù)據(jù)信息。第四個節(jié)點是服務(wù)節(jié)點,它主要的作用就是執(zhí)行主控的任務(wù)和反饋計算后的結(jié)果。
分析圖1我們可以發(fā)現(xiàn),根據(jù)對Web數(shù)據(jù)挖掘體系的功能進(jìn)行分析研究可以將該架構(gòu)分為若干個層面。
一是,服務(wù)層。服務(wù)層是一個將用戶的結(jié)果通過Web數(shù)據(jù)挖掘體系構(gòu)架實現(xiàn)數(shù)據(jù)的挖掘,并將結(jié)果呈現(xiàn)給用戶的一個過程。
二是,控制層??刂茖邮怯芍骺毓?jié)點來實施的通過對用戶所反饋的結(jié)果的分析,找出并提供最合適的算法,做到數(shù)據(jù)和算法的契合性。
三是,算法和數(shù)據(jù)存儲層。這個層面的主要作用是對提供的數(shù)據(jù)和反饋數(shù)據(jù)及所運用的算法進(jìn)行存儲。它不僅就所提供的原始數(shù)據(jù)進(jìn)行存儲對挖掘結(jié)果也會進(jìn)行存儲。算法和數(shù)據(jù)存儲區(qū)還加大了數(shù)據(jù)和算法丟失的概率,即便系統(tǒng)有問題也可以輕易地從存儲區(qū)里找到要的數(shù)據(jù)信息而恢復(fù)原本的數(shù)據(jù)。
四是,業(yè)務(wù)處理層。它是主控的數(shù)據(jù)在算法計算下的結(jié)果,將存儲層的數(shù)據(jù)進(jìn)行挖掘通過主控點來重新分配數(shù)據(jù),結(jié)果再由服務(wù)節(jié)點返回到主控節(jié)點的一個過程。
3.2 基于云計算的Web數(shù)據(jù)挖掘算法
基于云計算的Web數(shù)據(jù)挖掘算法步驟如下:
第一步,根據(jù)數(shù)據(jù)挖掘服務(wù)請求來對置信度闕值進(jìn)行確定,一般這種服務(wù)請求由Web瀏覽器提出的。
第二步,客戶端向主控節(jié)點發(fā)出的任務(wù),數(shù)據(jù)存儲的節(jié)點就會向主控節(jié)點申請數(shù)據(jù)并返回有服務(wù)節(jié)點處理過后的數(shù)據(jù)。
第三步,主控節(jié)點的數(shù)據(jù)將發(fā)給算法的存儲節(jié)點,算法節(jié)點會根據(jù)所存儲的大量算法,篩選出最佳的挖掘算法,并將這些算法應(yīng)用到每個服務(wù)節(jié)點。
第四步,每個服務(wù)節(jié)點都會有針對性地對各個數(shù)據(jù)進(jìn)行篩選,從而將數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行系統(tǒng)的分類和規(guī)整,用Apriori算法,得出不同數(shù)據(jù)庫的一部分頻集。
第五步,將服務(wù)節(jié)點處理的這些結(jié)果反饋主控節(jié)點上,得出整個數(shù)據(jù)庫全局的頻集。在將這些發(fā)送到每個服務(wù)節(jié)點之上就可以得到更加準(zhǔn)確的局部頻集。以此類推,再將服務(wù)節(jié)點處理的結(jié)果反饋到主控節(jié)點上,得到更加精準(zhǔn)的全局的頻集。
第六步,把第五步的過程重復(fù)操作,直到生成符合用戶定義的頻集,再根據(jù)置信度閾值生成關(guān)聯(lián)規(guī)則,而將關(guān)聯(lián)規(guī)則也發(fā)送給主控節(jié)點。
第七步,主控節(jié)點將得到的關(guān)聯(lián)規(guī)則返回給用戶。
3.3算法結(jié)果分析
算法的結(jié)果需要實驗數(shù)據(jù)的支撐,根據(jù)分析可以看到算法的效率和數(shù)據(jù)量之間的一個正相關(guān)關(guān)系。傳輸過程中的時間也存在差異,一般傳輸算法的時間要遠(yuǎn)短于傳輸數(shù)據(jù)的時間。Web數(shù)據(jù)挖掘算法和其他的算法有明顯的不同,但是它也可以通過對其他的算法的改進(jìn)來得到自己的全新的算法。Web數(shù)據(jù)挖掘算法是一個系統(tǒng)的算法,每個節(jié)點之間都有相關(guān)聯(lián)性,不會出現(xiàn)對有效關(guān)聯(lián)規(guī)則的遺漏現(xiàn)象。
4 總結(jié)
Web數(shù)據(jù)挖掘就是對我們的在Web文檔和互聯(lián)網(wǎng)其他途徑所獲取的大量的信息進(jìn)行篩選分析并加以利用。它可以根據(jù)人們的習(xí)慣、興趣、來了解人們的需求。現(xiàn)在在網(wǎng)絡(luò)上的信息量還在快速的增長,對計算的能力和存儲的能力都是考驗,如何很好的挖掘出有用的信息數(shù)據(jù),打破技術(shù)的局限性和瓶頸。就是要將云計算的存儲能力結(jié)合網(wǎng)絡(luò)平臺進(jìn)行快速推廣和運用。云計算下的Web數(shù)據(jù)挖掘可以通過網(wǎng)絡(luò)的優(yōu)勢方便統(tǒng)一的管理和調(diào)度,可以充分的利用云計算的存儲能力和空間,將多資源結(jié)合Web數(shù)據(jù)挖掘網(wǎng)絡(luò)體系進(jìn)行全面的開展。提高了對網(wǎng)絡(luò)資源和信息數(shù)據(jù)的利用率也提高了挖掘數(shù)據(jù)的效率和能力。
參考文獻(xiàn):
[1] 許艷丹,張前進(jìn),王志宏. 數(shù)據(jù)挖掘在物聯(lián)網(wǎng)中的應(yīng)用研究[J]. 周口師范學(xué)院學(xué)報,2016(2).
[2] 朱興榮. 數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)空間課堂教學(xué)評價中應(yīng)用[J]. 電子商務(wù),2016(4).