亚洲免费无码av|久久鸭精品视频网站|日韩人人人人人人人人操|97人妻免费祝频在找|成人在线无码小视频|亚洲黄片无码在线看免费看|成人伊人22网亚洲人人爱|在线91一区日韩无码第八页|日韩毛片精品av在线色婷婷|波多野主播在线激情婷婷网

歡迎訪問愛發(fā)表,線上期刊服務(wù)咨詢

網(wǎng)絡(luò)輿情分析系統(tǒng)8篇

時間:2023-03-15 14:58:30

緒論:在尋找寫作靈感嗎?愛發(fā)表網(wǎng)為您精選了8篇網(wǎng)絡(luò)輿情分析系統(tǒng),愿這些內(nèi)容能夠啟迪您的思維,激發(fā)您的創(chuàng)作熱情,歡迎您的閱讀與分享!

網(wǎng)絡(luò)輿情分析系統(tǒng)

篇1

關(guān)鍵詞:網(wǎng)絡(luò)英語學(xué)習(xí)生態(tài)系統(tǒng);計算機(jī)網(wǎng)絡(luò);情感交互

當(dāng)計算機(jī)播放某多媒體程序的時候,編程人員可以他的思想及情感發(fā)出指令控制該程序的運行,而不是程序單方面執(zhí)行下去,程序在接受到編程人員相應(yīng)的指令后而相應(yīng)的做出反應(yīng),這一過程及行為,我們稱之為情感交互

人與人之間的直接溝通一般是在雙向交互的情況下實現(xiàn)的,比方說學(xué)校的一些具體的管理行為、教學(xué)行為及其它種種交往行為。而借助傳統(tǒng)媒體實現(xiàn)的師生溝通大多數(shù)是章向交互的,是教師到學(xué)生的,學(xué)生的反饋行為一般并不通過傳統(tǒng)媒體來實現(xiàn)。在這個主面,網(wǎng)絡(luò)媒體的不同之處在于,借助它可以實現(xiàn)師生間的雙向交互,甚至可以方便地實現(xiàn)學(xué)生與校園圍墻以外世界的雙向交流。

在當(dāng)前的網(wǎng)絡(luò)教學(xué)嘗試中,師生之間的情感溝通被忽視。學(xué)生與教師遠(yuǎn)遠(yuǎn)相離,客觀上使師生之間的感情溝通比較困難,可是并不見有主動的工作去彌補這些缺陷。在這種情況下,學(xué)生很難與教師產(chǎn)生情感上的共鳴,很難產(chǎn)生對教師的喜歡、喜愛乃至不很過分的“崇拜”,無法指望得到這種感情對學(xué)習(xí)產(chǎn)生積極的影響,更不用說在學(xué)生的人格成長方面,沒有教師的行為作風(fēng)的潛移默化的影響。筆者認(rèn)為,這就是教師對學(xué)生可以產(chǎn)生意義的第三個方面。這種對教師的行為“導(dǎo)航”和情感溝通對于促進(jìn)學(xué)生學(xué)習(xí)的必要性的認(rèn)識缺陷,在近期的網(wǎng)絡(luò)教學(xué)試點工作中一直部分地存在著,直到2000年的長沙會議也沒有看到任何轉(zhuǎn)機(jī)。

在新的媒體群落條件下,教師除借助傳統(tǒng)媒體向?qū)W生遞送知識信息外,還增加了借助網(wǎng)絡(luò)媒體與學(xué)生進(jìn)一步溝通的機(jī)會。理論上,這些溝通作為通常面對面溝通的補充,也可以產(chǎn)生多方面的意義,比方說,可以指導(dǎo)學(xué)生的學(xué)習(xí),也可以進(jìn)一步溝通感情,增進(jìn)師生之間的了解,使教師對學(xué)生產(chǎn)生更多人格等方面的影響,促進(jìn)學(xué)生全面發(fā)展。夫子云:“師者,傳道、授業(yè)、解惑也”。這個道,即有為人之道與為學(xué)之道的雙重含義。在此作一個小結(jié),在教學(xué)活動中,教師與學(xué)生的溝通可以認(rèn)為在三個層面上實現(xiàn)意義:其一,情感溝通;其二、管理溝通;其三、知識導(dǎo)航與傳授溝通。

網(wǎng)絡(luò)教學(xué)發(fā)展的最終制約瓶頸是教師的注意力資源。當(dāng)前,一個不負(fù)責(zé)任的流行觀念就是簡單地將渠道的豐富與溝通的增進(jìn)對等起來,甚至混淆為一個概念。產(chǎn)生的觀點就是網(wǎng)絡(luò)媒體可以幾乎是無限制地擴(kuò)大招生人數(shù),提高教學(xué)效率。估我國,教育事業(yè)的相對落后使得我們急于尋找效率更高,受益面更大的教學(xué)模式。這種心情是可以理解。但是經(jīng)驗告訴我們,指望借助某種先進(jìn)媒體的作用使教育的質(zhì)量和數(shù)量在一夜之間“趕超英美”是不現(xiàn)實的,無疑是式的天真幻想。決定教學(xué)規(guī)模及教育水平的最終制約瓶頸是教師的注意力資源,是教師的質(zhì)量與數(shù)量,與之相對應(yīng)的是社會的教育投入。

教師已經(jīng)不能無視網(wǎng)絡(luò)媒體的沖擊,網(wǎng)絡(luò)上源源不斷的信息和源源不斷的新理念迫使教師必須有所改變,在這個改變過程中,教育思想的改變也自然而然地發(fā)生了。這正是技術(shù)進(jìn)步推動思想進(jìn)步的一個生動例子。所幸的是,網(wǎng)絡(luò)媒體并不僅僅是使教師陷入被動狀態(tài),它同樣為教師準(zhǔn)備了足夠的自我發(fā)展空間,為教師的繼續(xù)學(xué)習(xí)和提高業(yè)務(wù)水平提供了更充分的條件。網(wǎng)絡(luò)媒體呼喚教師在新的教育思想指導(dǎo)下進(jìn)行新的教學(xué)方法的嘗試,比方說,教師不僅僅作為知識的傳授者,更多地作為學(xué)習(xí)的導(dǎo)航者,也作為網(wǎng)絡(luò)海洋中知識的導(dǎo)航者。

教師作為知識的傳授者,并不僅僅是刻板地把知識灌輸給學(xué)生,而是在了解學(xué)生的基礎(chǔ)上將知識恰當(dāng)有序地傳授給學(xué)生。在新的教育理念下,教師更多地扮演引導(dǎo)者的角色,即以引導(dǎo)為軸線,以知識傳授為內(nèi)容。就是說,教師的作用在教學(xué)活動方面也可以分為兩個部分,一是作為知識的提供者和傳授者,二是作為知識的導(dǎo)航者。這第二個部分的作用正是當(dāng)前流行的教育思想所要強(qiáng)調(diào)的。

教師的另外一層管理意義是他在教學(xué)活動中同時在承擔(dān)著具體學(xué)習(xí)過程中的“管理”任務(wù)。在課堂上:教師對學(xué)生就是一個客觀的近在咫尺的行為約束,這個約束在規(guī)定著學(xué)生在課堂上可以干什么,不可以干什么;教師隨時對良好的主動積極的學(xué)習(xí)態(tài)度予以鼓勵,隨時對出現(xiàn)的異常現(xiàn)象進(jìn)行分析判斷,然后按照自己對教育思想及管理思想的理解予以處理。教師深入課堂的管理是整個學(xué)校管理活動的重要末梢,忽視這個末梢,管理活動將是不完善的和低效的,不能保證學(xué)習(xí)活動高效正常地進(jìn)行。這種觀念 在一般的教學(xué)理論中已經(jīng)是老生常談,但筆者注意到,在過去的有關(guān)網(wǎng)絡(luò)教學(xué)的討論中,這個問題談得太少且經(jīng)常被忽視。

總之,如上所述,教師資源所產(chǎn)生的意義中應(yīng)該包括有管理意義上的部分,還必然有教學(xué)意義上的部分。教師在教學(xué)方面的作用也因網(wǎng)絡(luò)的出現(xiàn)而受到?jīng)_擊。新的媒介帶來的新觀念首先對一些教師的陳舊教育思想和教學(xué)習(xí)慣形成沖擊,使教師對教學(xué)信息的壟斷地位受到威脅,近使教師不得不重新思考,重新為自己定位,調(diào)整自己的教育思想使之與新的條件相適應(yīng);另一方面,新的媒體群落也為教師提供了一個更為廣闊的學(xué)習(xí)和提高的空間,提供了更為豐富的教學(xué)信息的表達(dá)手段,使他的教學(xué)活動更能豐富多彩、引人入勝,更易于培養(yǎng)和激發(fā)學(xué)生的創(chuàng)造力。

參考文獻(xiàn):

篇2

【關(guān)鍵字】 無線傳感器網(wǎng)絡(luò) 節(jié)點 資源 能耗 帶寬 路由 路徑

一、無線傳感器網(wǎng)絡(luò)中基于無線節(jié)點資源的通信路由研究的技術(shù)分支詳述

筆者發(fā)現(xiàn)現(xiàn)有專利申請是基于傳統(tǒng)類型的協(xié)議進(jìn)行的多個分支的改進(jìn),經(jīng)過專利統(tǒng)計歸納,無線傳感器網(wǎng)絡(luò)中基于節(jié)點資源的通信路由研究主要分為以下四個技術(shù)分支,均衡網(wǎng)絡(luò)能耗的路由、分簇及簇首選擇的路由、降低時延的路由、安全可信的路由。

1.1.均衡網(wǎng)絡(luò)能耗的路由分支

由于我國關(guān)于無線傳感器網(wǎng)絡(luò)的研究起步在2009年左右,所以無線傳感網(wǎng)路由方面的研究也是如此,利爾達(dá)科技有限公司在2010年提出了一種基于連接的無線傳感器網(wǎng)絡(luò)擴(kuò)散路由算法,申請?zhí)枮镃N201010204302。

隨后高等院校也開始這方面的申請,比如有東南大學(xué)申請?zhí)枮镃N201210052390、南京大學(xué)申請?zhí)枮镃N201210398925的專利申請,并且南京大學(xué)的該申請是在分簇網(wǎng)絡(luò)的基礎(chǔ)之上考慮了能量均衡,有效地延長了網(wǎng)絡(luò)生存時間。

在大量的高等院校和公司的申請同時,也有踴躍的個人申請,比如賀靜個人在2012年提出了一種面向無線傳感網(wǎng)的能量高效洪泛方法,申請?zhí)枮镃N201210510337,具體涉及一種在無線傳感器網(wǎng)絡(luò)中利用局部范圍節(jié)點能量次序信息,實現(xiàn)廣播樹構(gòu)造方法,使得均衡使用節(jié)點能量。

1.2分簇及簇首選擇的路由分支

對于該分支,本領(lǐng)域技術(shù)人員關(guān)注如何在無線傳感器網(wǎng)絡(luò)中更合理的分簇以及利用選擇的簇首進(jìn)行高效的路由。在2012年,中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司就如何利用簇首節(jié)點進(jìn)行路由的建立,提出專利申請?zhí)枮镃N201210116856的申請。

隨后,國內(nèi)的科研院校陸續(xù)申請了關(guān)于更多兼顧網(wǎng)絡(luò)多種性能的簇首選擇路由算法,比如,中國科學(xué)院信息工程研究所,考慮了在進(jìn)行高效路由時如何更好的選擇簇首節(jié)點并兼顧均衡網(wǎng)絡(luò)能耗,提出了申請?zhí)枮镃N201210333412的申請。

對于后續(xù)的申請量,公司申請也在陸續(xù)增加,比如中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司又繼續(xù)針對兼顧網(wǎng)絡(luò)節(jié)點的狀態(tài)進(jìn)行基于簇首的路由算法進(jìn)行了研究并申請了專利,申請?zhí)枮镃N201310633716。

在2012年至2014年,出現(xiàn)了大量的分簇及簇首選擇的路由分支的專利申請,國內(nèi)主要申請人為高等院校與少數(shù)公司,比如北京郵電大學(xué)、南京郵電大學(xué)、上海交通大學(xué)以及華為技術(shù)有限公司、中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司,國外主要申請人為富士通株式會社、北電網(wǎng)絡(luò)有限公司、英特爾公司。

1.3 降低時延的路由分支

無線傳感器網(wǎng)絡(luò)的某些應(yīng)用通常對網(wǎng)絡(luò)的實時性都有較高的要求,因此,在降低時延的路由分支在2010年以來陸續(xù)出現(xiàn)了許多專利申請,但是較于分簇及簇首選擇的路由分支,該分支的申請量還是處于弱勢。

并且該分支的專利申請量較為集中在高等院校,比如寧波城市職業(yè)技術(shù)學(xué)院提出了申請?zhí)枮镃N 201010543262,發(fā)明名稱為“一種用于無線傳感器網(wǎng)絡(luò)的實時通信路由方法”的專利申請,并已經(jīng)授權(quán)。

分析該分支專利申請量較少的原因為,在其他分支的專利申請多少都涵蓋了時延的考慮,因此,通過去重之后的統(tǒng)計分析該技術(shù)分支的申請量表現(xiàn)較少,實際上,涉及到時延的路由專利申請量比較多,幾乎占據(jù)整個無線傳感器網(wǎng)絡(luò)路由的一半以上。

1.4 安全可信的路由分支

無線傳感器網(wǎng)絡(luò)建立安全可信的路由是本領(lǐng)域技術(shù)人員關(guān)注的重要分支,從2011年開始,逐漸有比較成熟的專利申請,并且大多數(shù)申請人涉及高等院校,比如在2012年,申請人重慶郵電大學(xué),提出了基于動態(tài)探測的無線傳感器網(wǎng)絡(luò)安全路由的方法,該發(fā)明采用逐點驗證的方式,顯著提高路由安全性,同時顯著減少能耗。

2013年山東大學(xué)提出一種基于拓?fù)浣Y(jié)構(gòu)的無線傳感網(wǎng)絡(luò)的新型信任管理系統(tǒng)的信任路由算法,申請?zhí)枮镃N201310148141,它考慮節(jié)點安全性對路由選擇的影響,依據(jù)節(jié)點的可信度是否滿足約束條件來形成有效路徑,更好地保證無線數(shù)據(jù)通信的安全。

在2013年至2014年涌現(xiàn)了大量的院校申請人,比如中國人民理工大學(xué)、西北工業(yè)大學(xué)等對該分支的路由申請了相關(guān)專利。

二、無線傳感器網(wǎng)絡(luò)中基于無線節(jié)點資源的通信路由研究的技術(shù)分支發(fā)展態(tài)勢

國內(nèi)無線傳感器網(wǎng)絡(luò)中基于無線節(jié)點資源的通信路由研究中上述4種技術(shù)分支的專利申請趨勢如圖1所示。

從圖1可以看到,對于均衡網(wǎng)絡(luò)能耗的路由分支在2008年開始至2014年,連續(xù)有較多的申請量,數(shù)量最多的集中在2010年至2014年,可見在隨著無線傳感器網(wǎng)絡(luò)研究的起步,該技術(shù)分支不斷得到技術(shù)人員的研究與申請。

分簇及簇首選擇的路由分支在整個無線傳感器網(wǎng)絡(luò)路由專利申請量中占有重要的比例,表明適合于無線傳感器網(wǎng)絡(luò)的分簇結(jié)構(gòu),是該技術(shù)領(lǐng)域較為常用的網(wǎng)絡(luò)結(jié)構(gòu),因此基于該網(wǎng)絡(luò)結(jié)構(gòu)的路由研發(fā)分支一直是本領(lǐng)域申請人較為關(guān)注和投入精力較多的技術(shù)分支。

降低時延的路由分支在2005年至2014年,每年都持續(xù)有申請量,表明該技術(shù)分支一直是本領(lǐng)域技術(shù)人員關(guān)注的領(lǐng)域,盡管每年的申請量不多,但是集中在2011年至2013年,申請人加大了該分支的研究與申請,表明該技術(shù)分支漸漸成為申請人的重點關(guān)注。

安全可信的路由分支在整體的申請量上還不是很多,技術(shù)還不夠成熟,但是申請量漸漸集中在2012至2013年,引起了申請人的注意,可能成為今后幾年的申請重點分支,可以作為后續(xù)專利申請分析的關(guān)注方向。

篇3

關(guān)鍵詞:流星余跡通信;網(wǎng)絡(luò)結(jié)構(gòu);混合自動請求重傳;時延模型;排隊論

中圖分類號:TP391.9

文獻(xiàn)標(biāo)志碼:A

文章編號:1001-9081(2016)11-3039-05

0 引言

流星余跡通信作為最低限度應(yīng)急通信保障的一種有效手段,在通信領(lǐng)域中占有重要地位。流星余跡信道突發(fā)性強(qiáng)、通信距離遠(yuǎn)、傳輸速率低,而且信道具有時變衰落特性[1],這使得數(shù)據(jù)傳輸變得不可靠。在對流星余跡通信系統(tǒng)進(jìn)行仿真的過程中,如何采用合適的傳輸機(jī)制以保證通信鏈路中的可靠傳輸,同時最大化傳輸效率,減少傳輸時延,是值得深入研究的一個問題。

自動請求重傳(Automatic Repeat Request, ARQ)機(jī)制是被廣泛應(yīng)用于無線通信領(lǐng)域的差錯控制技術(shù)[2]。近年來,將前向糾錯控制(Forward Error Correction, FEC)機(jī)制與ARQ結(jié)合起來的混合自動請求重傳(Hybrid Automatic Repeat Request, HARQ)技術(shù)得到了廣泛研究[3],并被應(yīng)用于流星余跡通信系統(tǒng),極大地提高了流星余跡通信的可靠性和傳輸效率。研究流星余跡通信系統(tǒng)的時延性能,一個重要的方面就是分析HARQ傳輸機(jī)制對時延性能的影響。

目前,國內(nèi)外對流星余跡通信中HARQ機(jī)制的研究[4-5]不夠充分,尤其是關(guān)于網(wǎng)絡(luò)時延性能的研究很少。文獻(xiàn)[6-7]分別對流星余跡通信中Ⅰ型HARQ和Ⅱ型HARQ的性能進(jìn)行了仿真研究,并從吞吐量、重傳率、重傳次數(shù)、信道利用率等方面進(jìn)行了對比分析,但沒有涉及兩種機(jī)制下的網(wǎng)絡(luò)時延性能。文獻(xiàn)[8]研究了基本ARQ技術(shù)的時延性能,并進(jìn)行了建模仿真,但研究結(jié)果未必適應(yīng)HARQ機(jī)制的特點,而且沒有在流星余跡通信的背景下進(jìn)行研究,缺乏適用性。

本文結(jié)合流星余跡通信系統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)以及HARQ傳輸機(jī)制的特點,提出了流星余跡通信中HARQ機(jī)制的網(wǎng)絡(luò)時延模型,立足于單條鏈路上的數(shù)據(jù)傳輸過程,利用排隊論的相關(guān)理論,建立了基于Ⅰ型HARQ的傳輸時延估算模型,并引入Ⅱ型HARQ的改進(jìn)機(jī)制,進(jìn)而提出了基于Ⅱ型HARQ的傳輸時延估算模型,最后通過仿真對兩種HARQ的傳輸時延性能進(jìn)行了對比分析。

1 流星余跡通信系統(tǒng)

1.1 流星余跡通信系統(tǒng)的網(wǎng)絡(luò)模型

一個最基本的流星余跡通信結(jié)構(gòu)由一個主站和一個從站組成,流星余跡通信網(wǎng)絡(luò)可由許多這樣點到點的通信結(jié)構(gòu)組成。主從站之間通信通常采用半雙工工作方式,而主站之間通信采用全雙工工作方式。根據(jù)國內(nèi)外研究現(xiàn)狀,流星余跡通信系統(tǒng)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)一般包括:單主站星型拓?fù)浣Y(jié)構(gòu)、多主站環(huán)型拓?fù)浣Y(jié)構(gòu)、樹形拓?fù)浣Y(jié)構(gòu)和混合型拓?fù)浣Y(jié)構(gòu)[9]。

單主站星型拓?fù)浣Y(jié)構(gòu)是流星余跡通信系統(tǒng)最常見的網(wǎng)絡(luò)結(jié)構(gòu),由一個中心節(jié)點和多個子節(jié)點構(gòu)成,中心節(jié)點是整個網(wǎng)路的核心,子節(jié)點只能與中心節(jié)點通信。多主站環(huán)型拓?fù)浣Y(jié)構(gòu)中,主站以環(huán)形結(jié)構(gòu)相聯(lián),各主站以星型結(jié)構(gòu)與若干從站相聯(lián),主站節(jié)點通過點到點的鏈路首尾相聯(lián)形成一個閉合的環(huán),子節(jié)點之間的信息傳遞必須先經(jīng)過環(huán)形結(jié)構(gòu)。樹型拓?fù)浣Y(jié)構(gòu)是一種層次結(jié)構(gòu),通常由一個控制級聯(lián)多個主站構(gòu)成主干網(wǎng),節(jié)點按層次聯(lián)接,信息交換主要在上下節(jié)點之間進(jìn)行,相鄰節(jié)點或同層節(jié)點之間一般不進(jìn)行數(shù)據(jù)交換。混合型拓?fù)浣Y(jié)構(gòu)則是兩種或兩種以上的拓?fù)浣Y(jié)構(gòu)同時使用。

綜合考慮各種流星余跡網(wǎng)絡(luò)拓?fù)洹⑼ㄐ欧绞降膬?yōu)缺點,同時結(jié)合項目要求,本文所涉及的流星余跡通信系統(tǒng)網(wǎng)絡(luò)模型設(shè)計如圖1所示。

本網(wǎng)絡(luò)結(jié)構(gòu)模型由4個星型網(wǎng)絡(luò)相互聯(lián)接構(gòu)成,每個星型網(wǎng)絡(luò)由1個主站和4個從站組成,主站與從站可以直接通信,從站之間不能直接通信,必須通過主站實現(xiàn)與其他從站之間的通信。主站與從站之間的通信方式為無線通信,通信信道采用流星余跡信道,主站之間的通信方式為有線通信。各星型網(wǎng)通過主站之間的互聯(lián)實現(xiàn)網(wǎng)間通信。

1.2 流星余跡通信網(wǎng)絡(luò)的差錯控制要求

首先簡要介紹一下流星余跡信道的典型特征。流星余跡信道依賴于流星的突發(fā)性而產(chǎn)生,具有明顯的間斷性和瞬時性[1]。以欠密類流星余跡為例,其發(fā)生過程時間極短,通常在幾百毫秒到1秒之間; 且信道信道時變性強(qiáng),變化規(guī)律呈指數(shù)衰減特征,如圖2所示[10]。

考慮到流星余跡信道的這些特點,為了保證數(shù)據(jù)的可靠傳輸,提高系統(tǒng)傳輸效率,流星余跡通信中的差錯控制協(xié)議應(yīng)當(dāng)適合突發(fā)、非對稱的信道特征,且綜合考慮糾錯與重傳的收益,同時還應(yīng)適當(dāng)引入變速率技術(shù)[1]。近年來,將FEC與ARQ結(jié)合起來的HARQ差錯控制協(xié)議由于對流星余跡信道具有很強(qiáng)的適用性,被廣泛應(yīng)用于流星余跡通信系統(tǒng)中。

2 HARQ傳輸機(jī)制和時延模型

HARQ傳輸機(jī)制的基本思想是,將ARQ和FEC有效結(jié)合起來,即在傳統(tǒng)ARQ系統(tǒng)中嵌入一個FEC子系統(tǒng),就得到了HARQ傳輸系統(tǒng)。它采用的碼同時具備糾錯功能和檢錯功能,其中FEC子系統(tǒng)利用糾錯碼來糾正經(jīng)常出現(xiàn)的錯誤,而ARQ系統(tǒng)只在檢測出少數(shù)不可糾的錯誤時才請求重傳,這樣既減少了重傳次數(shù),也確保了信息的可靠傳輸。實際應(yīng)用表明,HARQ系統(tǒng)的可靠性比FEC系統(tǒng)強(qiáng),傳輸效率也比ARQ系統(tǒng)高[11]。HARQ的系統(tǒng)原理如圖3。

2.1 Ⅰ型HARQ傳輸機(jī)制

流星突發(fā)通信中的Ⅰ型HARQ的基本原理如下:發(fā)送端在探測后,向接收端發(fā)送一個能糾錯同時能檢錯的碼字序列,接收端接收到碼組后首先進(jìn)行檢錯: 如果檢測沒有錯誤則向發(fā)送端反饋確認(rèn)(ACKnowledgement,ACK)信號,碼組傳輸成功;如果檢測到一個或多個錯誤,接收端嘗試確定錯誤位置并進(jìn)行糾錯,若錯誤在可糾正的范圍內(nèi),則通過譯碼器自動糾正后將碼組呈送上層,若無法糾錯(即譯碼失敗),則接收端向發(fā)送端反饋非確認(rèn)(Negative ACKnowledgment,NACK)信號并將碼組丟棄,發(fā)送端收到NACK后重新發(fā)送與第一次格式相同的碼組,接收端重復(fù)上述操作,直到接收端正確接收碼組為止。其工作原理如圖4[12]。

2.2 Ⅱ型HARQ傳輸機(jī)制

Ⅱ型HARQ機(jī)制的基本原理如下:通常采用將信息部分和校驗部分分開傳送的方式,發(fā)送端先將攜帶信息部分的碼組傳送給接收端,接收端對接收到的碼組進(jìn)行檢錯: 如果檢測沒有錯誤則向發(fā)送端反饋ACK信號,碼組傳輸成功;如果檢測出錯,則向發(fā)送端反饋NACK信號,發(fā)送端收到NACK信號后,將攜帶校驗部分的碼組傳送給接收端,接收端將校驗部分與之前收到的信息部分結(jié)合起來,并對新的碼組進(jìn)行檢錯糾錯。如果碼組沒有錯誤或錯誤在可糾正范圍內(nèi),則將正確碼組呈送上層;如果碼組出錯難以糾正,則向發(fā)送端反饋NACK信號。發(fā)送端第二次收到NACK信號以后,每次重傳逐漸增加校驗信息,從而使接收端合成的碼組糾錯能力不斷增強(qiáng),接收端則重復(fù)上述操作,直到正確接收碼組為止。其工作原理如圖5。

3.2 引入改進(jìn)機(jī)制的Ⅱ型HARQ傳輸時延估算模型

Ⅱ型HARQ機(jī)制相對于Ⅰ型HARQ機(jī)制主要有兩方面的改進(jìn)[16]:一是采用了自適應(yīng)變速率思想,二是增加了冗余機(jī)制。因此,3.1節(jié)所描述的延時估算模型不能完全適用于Ⅱ型HARQ機(jī)制。針對于此,本文在3.1節(jié)模型的基礎(chǔ)上進(jìn)行以下改進(jìn)。

首先討論自適應(yīng)變速率方法對模型的影響。流星余跡通信中常用的自適應(yīng)變速率方法主要有兩種:一種是自適應(yīng)編碼,根據(jù)信道特性自適應(yīng)地改變糾錯編碼的速率,即通過改變前向糾錯碼的冗余度改變信息的傳輸速率,一般保持調(diào)制方式和碼元速率不變;另一種是自適應(yīng)調(diào)制,保持碼元傳輸速率不變而改變調(diào)制方式,即通過改變碼元中的比特數(shù)目來改變信息的傳輸速率。以上兩種方法中,碼元傳輸速率均保持不變,在模型中的表現(xiàn)為:分組一次正確傳輸時間tl和分組重傳時間tn保持不變,這一點與3.1節(jié)模型相同。由此可知,若分組重傳n次,則等效服務(wù)時延仍與3.1節(jié)模型中相同,可參考式(3)。

4 仿真與分析

為了驗證流星余跡通信中HARQ的時延性能,本文在C++仿真環(huán)境下分別對不同分組正確傳輸概率和分組時間長度下的兩種HARQ機(jī)制延時性能進(jìn)行了仿真,并作了對比分析。

4.1 仿真場景設(shè)置

仿真場景設(shè)置為流星余跡通信網(wǎng)絡(luò)中主站到從站通信過程,鏈路采用欠密類流星余跡信道,余跡持續(xù)時間1s,信道中的噪聲類型采用高斯白噪聲,Ⅰ型HARQ采用固定速率,Ⅱ型HARQ自適應(yīng)方式采用三檔變速率,調(diào)制方式分別采用BPSK、4QAM和16QAM,依據(jù)文獻(xiàn)[1],上述仿真場景對應(yīng)的主要實驗參數(shù)設(shè)置如表1。

4.2 仿真結(jié)果分析

通過仿真分別得到了兩種HARQ傳輸時延隨分組傳輸正確率和分組時間長度的變化規(guī)律,如圖6和圖7所示。

圖6比較了Ⅰ型HARQ和Ⅱ型HARQ在不同分組傳輸正確率下的傳輸時延。從圖6中可以看出,隨著分組傳輸正確率的提高,Ⅰ型HARQ和Ⅱ型HARQ的傳輸時延均呈現(xiàn)下降的趨勢。Ⅱ型HARQ的整體時延均比相同條件下Ⅰ型HARQ的小,當(dāng)分組傳輸正確率較小時,Ⅱ型HARQ的傳輸時延比Ⅰ型HARQ小得多,隨著分組傳輸正確率的不斷提高,兩者差距才逐漸縮小。這是因為Ⅱ型HARQ的冗余機(jī)制能使傳輸碼組的糾錯能力不斷增強(qiáng),在鏈路條件不好的條件下仍能保持較高的傳輸效率,說明在分組傳輸正確率較低的情況下,Ⅱ型HARQ的優(yōu)勢比Ⅰ型HARQ更突出。

圖7通過改變分組時間長度,得到Ⅰ型HARQ和Ⅱ型HARQ傳輸時延的比較結(jié)果。兩種傳輸機(jī)制的時延均與分組時間長度呈正相關(guān)。在分組時間長度較小時,Ⅱ型HARQ的強(qiáng)糾錯能力不能得以體現(xiàn),兩者的分組傳輸時延相差不大。隨著分組時間長度的增加,由于Ⅱ型HARQ能有效提高傳輸正確率,從而提高傳輸效率,其傳輸時延比Ⅰ型HARQ有了很大改善。

通過分析可知,在流星余跡通信中,Ⅱ型HARQ的傳輸時延性能比Ⅰ型HARQ有明顯優(yōu)勢,Ⅱ型HARQ對流星余跡通信系統(tǒng)具有更好的適用性。

5 結(jié)語

本文以流星余跡通信為背景,針對HARQ傳輸機(jī)制下的網(wǎng)絡(luò)時延性能,主要做了以下幾個方面的工作:

1)結(jié)合流星余跡通信系統(tǒng)的特點,分析了HARQ傳輸機(jī)制的工作原理,并建立了網(wǎng)絡(luò)時延的構(gòu)成模型。

2)從排隊論的角度出發(fā),提出了流星余跡通信中Ⅰ型HARQ的傳輸時延估算模型。模型充分考慮了流星余跡通信的特殊性和HARQ傳輸機(jī)制的特點,對流星余跡通信理論的研究具有一定的參考價值。

3)以Ⅰ型HARQ傳輸時延估算模型為基礎(chǔ),引入自適應(yīng)傳輸與冗余機(jī)制的優(yōu)化特征,改進(jìn)建立了Ⅱ型HARQ的傳輸時延估算模型。

4)對兩種HARQ的傳輸時延性能進(jìn)行了仿真,對比分析了Ⅰ型HARQ和Ⅱ型HARQ的傳輸時延隨不同參數(shù)的變化規(guī)律。仿真結(jié)果表明,在流星余跡通信系統(tǒng)中,Ⅱ型HARQ的時延性能優(yōu)于Ⅰ型HARQ。

下一步的工作將是把本文的結(jié)論應(yīng)用于更復(fù)雜的流星余跡通信網(wǎng)絡(luò)中,提出更有效的延時估算方法。

參考文獻(xiàn):

[1] 李贊,劉增基,沈健.流星余跡通信理論與應(yīng)用[M].北京:電子工業(yè)出版社,2011:24-28.(LI Z, LIU Z J, SHEN J. Theory and Application of Meteor Burst Communication[M]. Beijing: Publishing House of Electronics Industry, 2011: 24-28.)

[2] 何先剛,夏萬林,聶永萍,等.OFDM系統(tǒng)中的混合ARQ結(jié)構(gòu)及性能仿真[J]. 重慶大學(xué)學(xué)報(自然科學(xué)版),2003,26(8):56-59.(HE X G, XIA W L, NIE Y P, et al. Hybrid ARQ structure and performance simulation for OFDM systems[J]. Journal of Chongqing University (Natural Science Edition), 2003, 26(8): 56-59.)

[3] 李旭虹,劉燕,王安義.LTE系統(tǒng)下行鏈路中HARQ技術(shù)的研究與仿真[J].工礦自動化,2012,38(1):62-65.(LI X H, LIU Y, WANG A Y. Research of HARQ technology in LTE system downlink and its simulation[J]. Industry and Mine Automation, 2012, 38(1): 62-65.)

[4] 馬志強(qiáng),王建剛,鄭振華.流星突發(fā)通信中的混合ARQ技術(shù)研究[J].通信技術(shù),2011,44(10):4-6.(MA Z Q, WANG J G, ZHENG Z H. Research on hybrid ARQ technology in meteor burst communication[J]. Communication Technology, 2011, 44(10): 4-6.)

[5] MICHAEL B P, STUART D S. Variable-rate hybrid ARQ for meteor-burst communications[J]. IEEE Transactions on Communications, 1992, 40(1):60-73.

[6] 石會芳.流星余跡通信系統(tǒng)自適應(yīng)鏈路傳輸技術(shù)研究[D].西安:西安電子科技大學(xué),2013: 43-63.(SHI H F. Research on the technology of adaptive link in meteor burst communication system[D]. Xian: Xidian University, 2013: 43-63.)

[7] 吳妍.流星突發(fā)通信中基于位圖反饋的HARQⅡ型鏈路傳輸協(xié)議研究[D].西安:西安電子科技大學(xué),2014: 33-50.(WU Y. Research on the HARQⅡ link transmission protocol based on bitmap feedback in meteor burst communication system[D]. Xian: Xidian University,2014: 33-50.)

[8] 黎鎖平,劉存明,何志鵬.無線數(shù)據(jù)傳輸?shù)腉BN-ARQ和SR-ARQ系統(tǒng)時延性能研究[J].信號處理,2009,25(3):384-388.(LI S P, LIU C M, HE Z P. Research on the delay performance of GBN-ARQ and SR-ARQ systems in wireless data transmission[J]. Signal Processing, 2009, 25(3):384-388.)

[9] 商英俊.流星余跡信道特征與組網(wǎng)技術(shù)仿真研究[D].西安:西安電子科技大學(xué),2009: 5-8.(SHANG Y J. Simulation studies of meteor burst channel characteristics and networking technology[D]. Xian: Xidian University, 2009: 5-8.)

[10] 張金平,韓娟娟,金力軍.流星余跡通信信道建模與性能仿真[J].無線電通信技術(shù),2002,28(5):41-44.(ZHANG J P, HAN J J, JIN L J. Modeling and performance simulation of meteor burst communication channel[J]. Radio Communications Technology, 2002;28(5):41-44.)

[11] 李允利.流星余跡通信系統(tǒng)鏈路傳輸技術(shù)研究[D].西安:西安電子科技大學(xué),2009: 33-48.(LI Y L. Research on link transmission technology in meteor burst communication[D]. Xian: Xidian University, 2009: 33-48.)

[12] 盧世軍.時變信道中自適應(yīng)多狀態(tài)ARQ系統(tǒng)時延性能建模研究[D].蘭州:蘭州理工大學(xué),2009: 27-29.(LU S J. Delay performance analysis of the adaptive multi-state automatic repeat request system model in time-varying channel[D]. Lanzhou: Lanzhou University of Technology,2009: 27-29.)

[13] 唐應(yīng)輝,唐小我.排隊論――基礎(chǔ)與分析技術(shù)[M].北京:科學(xué)出版社,2006:137-142.(TANG Y H, TANG X W. Queuing Theory-Foundation and Analysis Technology[M]. Beijing: Science Press, 2006:137-142.)

[14] 周曉波,周健,盧漢成,等.DTN網(wǎng)絡(luò)的延時模型分析[J].計算機(jī)研究與發(fā)展,2008,46(5):960-966.(ZHOU X B, ZHOU J, LU H C, et al. Analysis of delay model in DTN[J]. Journal of Computer Research and Development, 2008, 46(5): 960-966.)

篇4

關(guān)鍵詞:大數(shù)據(jù) 網(wǎng)絡(luò)輿情 數(shù)據(jù)抓取 數(shù)據(jù)存儲 輿情分析

中圖分類號:G206 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-098X(2017)01(c)-0108-02

S著新興媒體的發(fā)展,互聯(lián)網(wǎng)輿情已經(jīng)在社會發(fā)展中扮演著重要的角色,它已不僅僅局限于個別范圍的使用和拓展,而是演變?yōu)槿窕有偷膮⑴c和討論,所以如何在眾多信息中獲取最全面的輿情數(shù)據(jù),并將輿情數(shù)據(jù)以最快的速度和最靈活的方式展現(xiàn)出來,使輿情在可控的范圍內(nèi)實現(xiàn)最大的社會和商業(yè)價值,顯得尤為重要。

1 網(wǎng)絡(luò)輿情

網(wǎng)絡(luò)輿情不同于傳統(tǒng)輿情,傳統(tǒng)輿情是民意理論中的一個概念,是民意的一種綜合反映。該文所提到的網(wǎng)絡(luò)輿情,是未經(jīng)任何中介包裝和驗證,直接于網(wǎng)上的社會輿情,并以互聯(lián)網(wǎng)為載體,以輿論事件為核心,集民眾情感、態(tài)度、意見、建議、傳播互動和影響力于一身的集合。

因為網(wǎng)絡(luò)輿情的傳播介質(zhì)是網(wǎng)絡(luò),網(wǎng)絡(luò)既具有公開性又具有隱蔽性,同時需要事件、網(wǎng)民、網(wǎng)民情感,以及通過網(wǎng)絡(luò)介質(zhì)的傳播和互動,所以在既公開又隱蔽的環(huán)境中,從眾多的信息中捕獲并抽取出復(fù)雜的網(wǎng)民情緒和態(tài)度非常重要。

2 輿情捕獲

由于輿情具有自由性、交互性、多元性、偏差性和突發(fā)性,所以如何從眾多輿情中獲取實時數(shù)據(jù)并服務(wù)于大眾,是新興媒體所面臨的嚴(yán)峻挑戰(zhàn)和考驗。

2.1 關(guān)鍵詞確定

在互聯(lián)網(wǎng)上傳播的信息可以用海量來形容,如果針對輿情盲目進(jìn)行檢索,猶如大海撈針,不僅得不到我們想要的數(shù)據(jù),還會浪費大量的人力、物力和財力來投入到數(shù)據(jù)的分析中。所以如何在海量的信息中獲取用戶想要的數(shù)據(jù),“關(guān)鍵詞”就顯得非常重要,它不僅可以讓我們精確地捕獲到想要的數(shù)據(jù),而且還可以減少臟數(shù)據(jù)的捕獲,大大縮短了輿情分析的時間,提升了輿情分析的反應(yīng)速率,下面就介紹幾種關(guān)鍵詞確定的方法。

(1)定制關(guān)鍵詞。關(guān)鍵詞的確定可以從輿情分析的發(fā)出者來反向提出,輿情分析的發(fā)出者一定是希望從網(wǎng)絡(luò)輿情中得到某種相關(guān)信息,那么我們可以從需求提出者和需求分析者的角度來確定關(guān)鍵詞,即關(guān)鍵詞由用戶提出,并通過需求分析將用戶的表述發(fā)展為定制詞語,并將其定義為用戶定制關(guān)鍵詞。根據(jù)用戶定制的關(guān)鍵詞來捕獲數(shù)據(jù),是最直接明了的數(shù)據(jù)捕獲方式。

(2)熱門輿情關(guān)鍵詞。很多網(wǎng)站如百度、搜狐、Facebook、新浪等幾乎所有的交互網(wǎng)站都會有熱門指數(shù),我們可以借助這些網(wǎng)站自身攜帶的熱門指數(shù),來確定關(guān)鍵詞。因為通過熱門輿情關(guān)鍵詞來捕獲數(shù)據(jù),一定是網(wǎng)站熱門數(shù)據(jù),這樣不僅可以節(jié)省我們分析確定關(guān)鍵詞的時間,而且還可以用最短的時間獲取最多的分析數(shù)據(jù),提高大數(shù)據(jù)在輿情分析中的反應(yīng)速率。

(3)熱搜輿情關(guān)鍵詞。熱搜輿情關(guān)鍵詞不同于熱門關(guān)鍵詞,由于輿情具有廣泛傳播性,很多人參與到輿情探討中,都是通過網(wǎng)絡(luò)搜索并定位的,所以熱搜關(guān)鍵詞就是根據(jù)搜索引擎的熱搜排行榜,來確定輿情關(guān)鍵詞,通過熱搜排行榜,我們可以第一時間知道并了解網(wǎng)民想要了解的輿論事件。

(4)參考輿情網(wǎng)站。想要找到網(wǎng)絡(luò)事件的發(fā)展?fàn)顩r和原由,最簡單也是最直接的方式,就是找到輿情的網(wǎng)站,很多網(wǎng)站就是網(wǎng)絡(luò)輿情事件的源泉。

2.2 數(shù)據(jù)抓取

當(dāng)我們通過各種方式獲取并確定了關(guān)鍵詞之后,如何把關(guān)鍵詞變成我們想要的精確數(shù)據(jù),就顯得非常重要。我們可以通過網(wǎng)絡(luò)爬蟲技術(shù)來獲取輿情數(shù)據(jù)。

當(dāng)前主流的數(shù)據(jù)抓取模式主要包含4個主要部分:網(wǎng)絡(luò)爬蟲技術(shù)(Spider)、數(shù)據(jù)處理技術(shù)(Data Process)、爬取URL隊列(URL Queue)和數(shù)據(jù)。爬蟲主要是從互聯(lián)網(wǎng)上捕捉網(wǎng)頁內(nèi)容,并從中抽取出需要的內(nèi)容。數(shù)據(jù)處理:對爬蟲抓取的內(nèi)容進(jìn)行處理。URL隊列:為爬蟲提供需要抓取數(shù)據(jù)網(wǎng)站的URL。數(shù)據(jù)包含3個方面:(1)Site URL:需要抓取數(shù)據(jù)網(wǎng)站的URL信息;(2)Spider Data:爬蟲從網(wǎng)頁中抽取出來的數(shù)據(jù);(3)Dp Data:經(jīng)過dp處理之后的數(shù)據(jù)。

2.3 數(shù)據(jù)存儲

因為網(wǎng)絡(luò)輿情具有及時更新和海量的特性,所以我們?nèi)绾螌⒆ト〉降臄?shù)據(jù)實時保存起來,是非常關(guān)鍵的,它決定了最后輿情分析的全面性和精確性。一般通過IT技術(shù)可以將數(shù)據(jù)存儲到數(shù)據(jù)庫中,下面介紹一下當(dāng)前主流的3種數(shù)據(jù)庫及其區(qū)別。

Oracle數(shù)據(jù)文件都是采用二進(jìn)制編碼的文件,而且它可以對SQL在執(zhí)行過程中的解析和優(yōu)化指定統(tǒng)一標(biāo)準(zhǔn),其中包括RBO、CBO以及HTNT規(guī)則,這些都會使在Oracle數(shù)據(jù)庫中執(zhí)行的SQL擁有極大的優(yōu)化自由,同時也對CPU、內(nèi)存、IO資源方面進(jìn)行優(yōu)化。

MySQL最大的特點應(yīng)該屬自由選擇存儲引擎。它的每一個表都是一個文件,都可以選擇合適的存儲引擎。但由于它的存儲引擎是開放式的插件引擎,所以文件的一致性大大降低,并且在SQL優(yōu)化方面,也會有一些不可避免的瓶頸,例如多表關(guān)聯(lián)、子查詢優(yōu)化、統(tǒng)計函數(shù)等都是它的弱項,并且MySQL只支持極簡單的HINT。

SQL Server的數(shù)據(jù)架構(gòu)基本是縱向劃分,分為:Protocol Layer、Relational Engine、Storage Engine、SQLOS。SQL執(zhí)行都是逐層,其中Relational Engine中的優(yōu)化器,是基于成本的,其工作過程跟Oracle是非常相似的。同時它也支持豐富的HINT,包括:連接提示、查詢提示、表提示。

雖然,這3個數(shù)據(jù)庫各具特色,但是,如果對數(shù)據(jù)安全、存儲等特性沒有特殊要求,通常我們會選取MySQL數(shù)據(jù)庫,因為開源而且操作相對簡單。

3 輿情分析

如果說輿情數(shù)據(jù)的抓取和存儲目的是在數(shù)據(jù)獲取方面下工夫,那么輿情分析就是通過比較、論證等方法把數(shù)據(jù)通過圖形報表等更加簡潔的方式呈獻(xiàn)給用戶。

每一個輿情事件的本身都有自己的特點,分析設(shè)計人員可以根據(jù)不同的特點選擇輿情分析的方法或報表。通常輿情分析方法有連續(xù)接近法、舉例說明法、比較分析法和流程圖法等。通常圖形報表也有很多種,如趨勢圖、比例餅圖、百分比柱圖、流程圖、表格等,分析設(shè)計人員根據(jù)輿情的特點選擇合適的圖形呈獻(xiàn)給用戶。

4 結(jié)語

通過大數(shù)據(jù)相關(guān)技術(shù)對輿情進(jìn)行全方位收集、存儲和分析的過程中,我們既不修飾、篡改輿情事件的真實性,也不隱藏輿情事件的丑陋性,大數(shù)據(jù)的智能捕獲分析,只是將網(wǎng)絡(luò)輿情更加清晰形象地呈現(xiàn)給用戶,使用戶在第一時間獲取民眾態(tài)度,掌握民眾意見或建議,并根據(jù)輿情報告的精準(zhǔn)分析反饋,及時對輿情事件做出相應(yīng)的政策,調(diào)整相關(guān)的策略,實現(xiàn)商業(yè)和政治利益最大化,創(chuàng)造更多的社會價值,并使網(wǎng)絡(luò)輿情健康良性發(fā)展。

參考文獻(xiàn)

[1] 王博.大數(shù)據(jù)時代網(wǎng)絡(luò)輿情與社會治理研究[D].云南財經(jīng)大學(xué),2016.

[2] 楊旭東.網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)關(guān)鍵技術(shù)研究[J].信息網(wǎng)絡(luò)安全,2016(9):251-256.

篇5

他是一位網(wǎng)絡(luò)輿情分析師,輿情分析師作為一種新職業(yè),近期被《人民日報》撰文評為“朝陽職業(yè)”,從業(yè)者大多不敢自言資深或?qū)<遥S多人恐怕還不知曉輿情分析是何物。

網(wǎng)絡(luò)上的情報收集者?

關(guān)于網(wǎng)絡(luò)輿情,比較權(quán)威的解釋是:“通過互聯(lián)網(wǎng)傳播的人們對于各種事件的所有認(rèn)知、態(tài)度、情感和行為傾向的集合。”與“輿論”一詞不同,輿情是網(wǎng)絡(luò)上媒體和網(wǎng)民意見的原始表露,可以是多種不同意見的簡單集合,而輿論則是傾向于一致的看法和意見。

輿情可能轉(zhuǎn)化為輿論,自然而然地,網(wǎng)絡(luò)輿情分析師的重要工作即分析輿情、預(yù)測走勢,在一定程度上防止負(fù)面輿論的產(chǎn)生。

對趙嘉和同事們來說,上網(wǎng)閱讀新聞便是他們每天工作的開端。他們幾乎對網(wǎng)上所有熱點事件都有所了解,同時每個人又要著重關(guān)注一兩個領(lǐng)域,成為半個行家。例如學(xué)法語出身的趙嘉就曾硬著頭皮研究了經(jīng)濟(jì)學(xué)知識,因為他服務(wù)的客戶是貿(mào)易部門,在能夠基本完成該行業(yè)輿情報告的撰寫之后,他又“被迫轉(zhuǎn)行”學(xué)習(xí)了科技知識。

許多媒體對這個行業(yè)的介紹中都有這樣的描述――專多能的“雜家”。

輿情分析師聽起來有點像收集情報者,似乎也能和公關(guān)扯上些許關(guān)系。為什么一定要冠以“網(wǎng)絡(luò)”二字?

根據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心的最新報告顯示,截至20lO年12月底,我國網(wǎng)民規(guī)模突破達(dá)到4.57億,互聯(lián)網(wǎng)普及率攀升至34.3%。在大城市中,主流人群基本上都已經(jīng)是“網(wǎng)民”。龐大的用戶群體和網(wǎng)絡(luò)迅速的普及速度,使得網(wǎng)絡(luò)輿論在輿情系統(tǒng)中的地位不斷提升。

比較普遍的認(rèn)識是,國內(nèi)網(wǎng)絡(luò)輿情監(jiān)測與研究機(jī)構(gòu)出現(xiàn)于2008年,網(wǎng)格輿情分析師也隨之誕生――之前的2007年,山西爆發(fā)“黑磚窯”事件,網(wǎng)絡(luò)熱點的沸騰程度讓各方開始重視網(wǎng)絡(luò)輿情。

如今,一條負(fù)面信息從出現(xiàn)到形成熱點的周期,已經(jīng)從原來的24小時縮短到了4小時,相關(guān)部門如果不能快速做出反饋、制定應(yīng)對策略,就可能出現(xiàn)輿論一邊倒的局面。

輿情分析師的“網(wǎng)絡(luò)輿情”

按照分析師的工作思路,《世界博覽》記者在搜索引擎中輸入了“網(wǎng)絡(luò)輿情分析師”的關(guān)鍵詞,結(jié)果是:6月10日,百度找到相關(guān)結(jié)果約6.42萬個,谷歌找到約45.2萬條結(jié)果。

在中國,人民網(wǎng)輿情監(jiān)測室、新華網(wǎng)、外文局、國際廣播電臺、《中國日報》等均提供較為專業(yè)的輿情服務(wù),而在國外,“Buzzlogic”、“尼爾森(Nielsen)”、“ReputationDefender”等輿情監(jiān)控機(jī)構(gòu)早已名聲鵲起。

一些經(jīng)濟(jì)刊物將“輿情分析”描述為“擁有百萬億潛在市場的大生意”;許多知名大學(xué),例如人民大學(xué)成立了專門的研究院;越來越“智能”的搜索引擎還提供了從事輿情分析的專業(yè)公司和軟件的廣告,此類軟件系統(tǒng)已成為中國各大部委、省、市、縣等各級政府的重要采購對象。

但這并不意味著網(wǎng)絡(luò)輿情分析師可以被軟件取代,相反,分析師在形成輿情報告過程中的作用愈發(fā)重要。本質(zhì)上,機(jī)器擔(dān)當(dāng)?shù)娜允禽o助角色。

趙嘉對《世界博覽》記者說,自己每天的工作確實會用到監(jiān)測軟件,但不能依賴,主要使用的工具是百度、谷歌、雅虎等搜索引擎,新聞則來自國內(nèi)外主流媒體和網(wǎng)站,如西方四大通訊社、各國主流媒體、新華社、《人民日報》等,還有一些專門的數(shù)據(jù)庫搜索和站內(nèi)搜索,和他所在公司的客戶一樣,“屬于商業(yè)機(jī)密,無可奉告”。他們的客戶以國家機(jī)關(guān)為主,也有少量的企業(yè)和私人客戶。

輿情分析師通常需要通過搜索工具和監(jiān)測平臺,反復(fù)設(shè)置不同的關(guān)鍵詞,收集媒體評論和網(wǎng)友言論,最終經(jīng)過選取、概括和分析形成完備的輿情報告。一些客戶還要求歸類和制作圖表。

趙嘉每天完成的輿情日報,長度一般在八九頁左右,一些周報和月報以及重大事件的輿情會更復(fù)雜,因為這樣的報告是從上百甚至上千篇報道中提煉而成的。

趙嘉同事許欣的報告主要面向國家機(jī)關(guān):“有的部門經(jīng)常提出反饋,有的反饋則較少,但總體來看均屬比較重視。他們或是了解境內(nèi)外動態(tài),或是預(yù)警,或是報送領(lǐng)導(dǎo)或上級。”

應(yīng)該說,客戶們越來越重視輿情報告,特別是曾在輿情方面“吃過虧”的客戶。近期,輿情關(guān)注度較高且應(yīng)對不力的應(yīng)屬故宮,相繼經(jīng)歷了“失竊門”、“錯字門”、“會所門”、“解雇門”等負(fù)面事件,缺乏信息透明和公關(guān)技巧的故宮深陷輿論漩渦。

亟需人手的高負(fù)荷工作

和寫字樓里壓力頗高的白領(lǐng)們差不多,網(wǎng)絡(luò)輿情分析師也常常抱怨身體“亞健康”,鼠標(biāo)手、頸椎病、視力下降等職場常見病經(jīng)常會找上門來。

既然需要關(guān)注每天的新聞熱點,所以,網(wǎng)絡(luò)輿情分析師在假期也難有“斷網(wǎng)”的日子,有時碰到一些項目,客戶規(guī)定要在短時間內(nèi)完成,經(jīng)常需要加班加點。

許欣對《世界博覽》記者說,她做過的最復(fù)雜的輿情報告匯編超出2000頁,幾個人加班到很晚才完成。“最忙的時候連喝水都忘了。”對于每天要瀏覽的網(wǎng)頁數(shù)量,趙嘉和同事都算不過來:“大概幾百頁吧?要想做得好必須不停更換關(guān)鍵詞,網(wǎng)頁也要盡可能多看?!?/p>

在人民網(wǎng)輿情監(jiān)測窒,“醉駕入刑”的輿情報告需要幾位輿情分析師研討協(xié)作,因為僅新浪和騰訊微博上就有近18萬條評論,需要多人監(jiān)測。該監(jiān)測室主任分析師龐胡瑞說:“輿情分析是腦力活,也是體力活,加班加點、每天瀏覽成百上千條網(wǎng)頁是家常便飯?!庇捎谳浨闃I(yè)務(wù)增長,這里一直在擴(kuò)大輿情分析師的編制。

雖然面對著繁重的任務(wù)和較高的壓力,分析師們也覺得,在不斷獲取、整理、推論信息的過程中,自己也收獲不小――“對新聞的敏感度和捕捉能力,對重點信息的宏觀把握和提取,邏輯思維和綜合分析的能力”。

篇6

關(guān)鍵詞:Web挖掘;文本分類;糧食輿情;輿情分析

中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2013)10-2426-03

糧食是人類生存之本,糧食安全問題已經(jīng)成為世界范圍內(nèi)關(guān)注的最重要的問題之一。糧食信息數(shù)據(jù)量大、市場供求信息不明確、技術(shù)保障不到位等因素對我國糧食安全敲響了警鐘。2009年初中國爆發(fā)了幾十年來最嚴(yán)重的一場旱災(zāi),國內(nèi)市場充斥著糧食供應(yīng)可能趨緊并有可能大量進(jìn)口糧油產(chǎn)品,以及全球糧油價格將由中國的大量進(jìn)口而出現(xiàn)暴漲等網(wǎng)絡(luò)言論并造成了一定的影響。

因此如何引入新的技術(shù)手段對糧食情報信息實現(xiàn)有效監(jiān)管,如何在海量的糧食網(wǎng)絡(luò)資源信息中,快速有效地挖掘蘊含有巨大潛在價值的糧情知識和信息,同時過濾掉大量無用的或不相關(guān)的糧情內(nèi)容,準(zhǔn)確地定位所需要的信息并自動分類,以保證糧食安全,已成為一項重要而迫切的研究課題。該文就基于Web挖掘在糧食情報分析中的應(yīng)用進(jìn)行了一些討論,并提出了一個基于Web挖掘的糧食輿情分析系統(tǒng)的框架。

1 糧食輿情系統(tǒng)模型設(shè)計

1.1 Web挖掘簡介和糧食輿情分析難點

Web挖掘是從大量Web文檔集D中發(fā)現(xiàn)隱含的模式W。如果將D看作輸入,P看作輸出,則Web文本挖掘的過程可看作從輸入到輸出的映射,即F:CP。網(wǎng)絡(luò)輿情是公眾利用互聯(lián)網(wǎng)表達(dá)或傳播的對熱點事件和問題的看法和所持觀點的較有社會影響力的態(tài)度。利用Web挖掘技術(shù)進(jìn)行主題追蹤的輿情分析成為近年研究的熱點。任海果研究了主題事件的追蹤技術(shù),實現(xiàn)了對熱點事件的發(fā)現(xiàn)、演化和趨勢分析[1]。Federico Neri等研究了1000個關(guān)于意大利公共廣播服務(wù)意見的Facebook網(wǎng)貼,得到了觀眾關(guān)注度和興趣度,并在開源情報信息和Web挖掘中得到應(yīng)用[2]。Wang等利用垂直搜索技術(shù)收集互聯(lián)網(wǎng)上關(guān)于食品質(zhì)量和安全的網(wǎng)絡(luò)信息,搭建了食品安全的網(wǎng)絡(luò)輿情分析系統(tǒng),滿足了對食品安全網(wǎng)絡(luò)輿情的有效監(jiān)管[3]。但由于糧食信息的特殊性和復(fù)雜性[4],使得糧食輿情信息的采集不夠全面,現(xiàn)有分析系統(tǒng)的分析不夠深入,總體來說糧食網(wǎng)絡(luò)輿情挖掘扔存在著一下難點:

1) 糧食輿情影響因素復(fù)雜。糧食輿情受多種因數(shù)的影響,和糧食直接相關(guān)的有糧食產(chǎn)量、銷售價格、產(chǎn)地、供求關(guān)系等因數(shù),此外還有氣象條件、病蟲害的等間接影響著糧食安全,目前對糧食安全因素的挖掘不夠全面。

2) 糧食輿情信息的存儲位置和方式復(fù)雜,沒有統(tǒng)一的系統(tǒng)來采集各種形式的糧食信息。如糧食產(chǎn)業(yè)信息資源,如災(zāi)害史、產(chǎn)量信息、氣象條件等,并發(fā)存儲在各家統(tǒng)計機(jī)構(gòu)、管理機(jī)構(gòu)、經(jīng)營機(jī)構(gòu)的網(wǎng)絡(luò)環(huán)境中,并且沒有統(tǒng)一的數(shù)據(jù)表示形式,沒有開發(fā)出聯(lián)合采集各家機(jī)構(gòu)和組織中糧食數(shù)據(jù)的采集或者存儲方法和策略,不利于糧食輿情信息的整合和關(guān)聯(lián)分析。

3) 糧食輿情信息牽涉面廣,沒有融合各方面信息處理方面的優(yōu)勢。在糧食信息處理方面,沒有實現(xiàn)統(tǒng)計學(xué)、模式識別、人工智能以及人工神經(jīng)網(wǎng)絡(luò)等多種分析方法融合的決策策略。

4) 沒有提出預(yù)測和預(yù)防模型?,F(xiàn)在的網(wǎng)絡(luò)輿情分析往往注重于熱點的發(fā)現(xiàn),沒有為熱點事件建立等級級別區(qū)分管理和提供預(yù)防,同時對于發(fā)現(xiàn)的災(zāi)難事件,沒有定量的分析災(zāi)害危害的嚴(yán)重程度和預(yù)警級別。

利于輿情分析技術(shù)實現(xiàn)對糧食輿情信息的監(jiān)控和管理成為一項緊迫的課題。為了解決以上問題,該文設(shè)計了一個糧食輿情分析架構(gòu)模型。

1.2.2 輿情信息預(yù)處理模塊

輿情信息預(yù)處理模塊的主要功能是:對采集到的相關(guān)網(wǎng)頁進(jìn)行去噪處理,如對廣告、注釋等噪聲數(shù)據(jù)進(jìn)行清理,然后用統(tǒng)一的結(jié)構(gòu)化的格式進(jìn)行文本表示,然后利用分詞技術(shù)、特征提取技術(shù)、權(quán)重計算技術(shù)等進(jìn)行特征選擇,構(gòu)建糧食數(shù)據(jù)倉庫,利用分類器實現(xiàn)文本的分類。文本分類技術(shù)是整個預(yù)處理模塊的核心,其步驟描述如下:

本模型主要包括以下三個方面功能:

第一、通過對糧食輿情主題檢測進(jìn)行熱點、敏感信息的發(fā)現(xiàn),并針對特定的糧食安全主體,如糧食價格、供求關(guān)系、氣象條件等各個主題跟蹤技術(shù)處理,同時設(shè)計融合各方面因素的分析策略,及時發(fā)現(xiàn)安全隱患,并提供預(yù)警信息。

第二、對特定糧食安全事件的公眾所持觀點和關(guān)注度的分析,掌握事件發(fā)生、發(fā)展和加強(qiáng)的可視化時間序列,開發(fā)基于區(qū)域性輿情的分別匯總,提供實時的空間和時間的網(wǎng)絡(luò)輿情趨勢信息保障,有利于決策者實施適當(dāng)?shù)拇胧?/p>

第三、利用災(zāi)害預(yù)測、分析和預(yù)防的決策系統(tǒng),對多發(fā)性的、危害嚴(yán)重的災(zāi)害構(gòu)建主動分析、及早預(yù)測和及時預(yù)警的機(jī)制,提供相關(guān)、相近主題的預(yù)防措施經(jīng)驗。同時針對災(zāi)害引起的其他方面的問題進(jìn)行關(guān)聯(lián)分析,比如旱災(zāi)有可能引起局部供求關(guān)系失衡,災(zāi)害的嚴(yán)重性導(dǎo)致價格波動的范圍等建立定量的數(shù)據(jù)分析方法發(fā)現(xiàn)彼此存在的聯(lián)系。

2 結(jié)論

利用Web挖掘技術(shù)實現(xiàn)對糧食信息的監(jiān)測,有利于充分海量的糧食網(wǎng)絡(luò)信息資源,能夠及時發(fā)現(xiàn)糧食熱點事件,為糧食安全提供預(yù)警服務(wù)。該文著重分析了當(dāng)前糧食方面輿情分析系統(tǒng)存在的不足,提出了解決方案,構(gòu)造了一個較完善的糧食輿情分析架構(gòu)。通過各種算法的編碼和改進(jìn),實現(xiàn)本文所構(gòu)建的系統(tǒng)是進(jìn)一步研究的方向。

參考文獻(xiàn):

[1] 任海果. 基于主題事件的輿情分析系統(tǒng)的設(shè)計與實現(xiàn)[D].北京:北京郵電大學(xué),2012.

[2 ] Neri F, Aliprandi C,Capeci F,et al. Sentiment Analysis on Social Media[C]. Istanbul, Turke:Advances in Social Networks Analysis and Mining,2012:919-926.

[3]Wang Su, Liang Meiyu, Gao Tian and Du Junping. Realization of Product Quality and Food Security Internet Public Opinion Supervision System[C]. Jinan, China:Proceedings of the 8th World Congress on Intelligent Control and Automation, 2010:2736-2739.

[4] 龍方. 新世紀(jì)中國糧食安全問題研究[J]. 湖南農(nóng)業(yè)大學(xué)學(xué)報:社會科學(xué)版,2007 (3):7-14.

[5] 孫立偉,何國輝,吳禮發(fā). 網(wǎng)絡(luò)爬蟲技術(shù)的研究[J]. 電腦知識與技術(shù),2010(15):4112-4115.

篇7

摘要:本文以基于數(shù)據(jù)挖掘的決策支持系統(tǒng)方法整合網(wǎng)絡(luò)輿情信息,建立網(wǎng)絡(luò)輿情信息倉庫,對非結(jié)構(gòu)化的模糊復(fù)雜的信息,運用數(shù)據(jù)挖掘中文本挖掘技術(shù)有效分析網(wǎng)絡(luò)熱點事件的輿情,及時發(fā)現(xiàn)重大突發(fā)事件,減少危機(jī)損失,提高政府管理和監(jiān)控輿情危機(jī)的能力。

關(guān)鍵詞:網(wǎng)絡(luò)輿情 數(shù)據(jù)挖掘 決策支持系統(tǒng)

1、引 言

近幾年,隨著Web2. 0的興起與普及,互聯(lián)網(wǎng)已成為一個開放的、個性化的社會環(huán)境形態(tài),對社會穩(wěn)定和國家安全的維護(hù)帶來了嚴(yán)峻挑戰(zhàn)。但是現(xiàn)在我們政府情報機(jī)構(gòu)網(wǎng)絡(luò)安全管理和監(jiān)控能力比較薄弱,難以適應(yīng)復(fù)雜的環(huán)境。因此,建立基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情預(yù)警決策支持系統(tǒng),對非結(jié)構(gòu)化的模糊復(fù)雜的信息,運用文本挖掘技術(shù)有效分析網(wǎng)絡(luò)輿情事件,及時發(fā)現(xiàn)重大突發(fā)事件,減少危機(jī)損失,提高政府管理和監(jiān)控能力勢在必行。

2、基于數(shù)據(jù)挖掘的決策支持系統(tǒng)

決策支持系統(tǒng)(DSS) [1]是利用大量信息,數(shù)據(jù)結(jié)合眾多模型,通過人機(jī)交互,輔助各級決策者實現(xiàn)科學(xué)決策的系統(tǒng)。它是融計算機(jī)技術(shù)、信息、技術(shù)、人工智能、管理科學(xué)、決策科學(xué)等學(xué)科和技術(shù)于一體的技術(shù)繼承系統(tǒng),包括數(shù)據(jù)倉庫和數(shù)據(jù)挖掘分析系統(tǒng),由以下三個主體[2]組成:

(1)模型庫系統(tǒng)和數(shù)據(jù)庫系統(tǒng)結(jié)合,作為該系統(tǒng)的基礎(chǔ),為決策問題進(jìn)行模型計算和定量分析,提供輔助決策信息。

(2)知識庫系統(tǒng)和數(shù)據(jù)挖掘的結(jié)合,從數(shù)據(jù)庫和數(shù)據(jù)倉庫中挖掘知識放入專家系統(tǒng)的知識庫中,通過知識推理定性分析,輔助決策。

(3)數(shù)據(jù)倉庫和OLAP,從數(shù)據(jù)倉庫中提取綜合數(shù)據(jù)和信息來反映了其內(nèi)在本質(zhì)。

3、基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情預(yù)警決策支持系統(tǒng)的定位

從網(wǎng)絡(luò)輿情預(yù)警決策支持系統(tǒng)的功能和實現(xiàn)方式對其定義:基于決策支持系統(tǒng)技術(shù),將聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘模型(文本挖掘模型)、數(shù)據(jù)倉庫、知識庫、方法庫等相結(jié)合,應(yīng)用于情報機(jī)構(gòu)的網(wǎng)絡(luò)輿情預(yù)警中的人機(jī)結(jié)合系統(tǒng)。

3.1數(shù)據(jù)倉庫

數(shù)據(jù)倉庫[3]的設(shè)計要滿足決策支持系統(tǒng)的要求,即數(shù)據(jù)要具備概括性、抽象性、統(tǒng)一性三個特點。所以圖1中數(shù)據(jù)倉庫和部門數(shù)據(jù)庫加上一個虛擬層,實現(xiàn)數(shù)據(jù)挖掘的數(shù)據(jù)清洗,為數(shù)據(jù)倉庫提取有用數(shù)據(jù)。

3.2數(shù)據(jù)挖掘方法

數(shù)據(jù)挖掘[4],簡單點說,就是從大量數(shù)據(jù)中尋找規(guī)律的技術(shù),通過處理海量的、不完全的、隨機(jī)的、結(jié)構(gòu)復(fù)雜的數(shù)據(jù)選擇有用數(shù)據(jù),建立知識模型。網(wǎng)絡(luò)輿情預(yù)警決策支持系統(tǒng)運用數(shù)據(jù)挖掘中文本挖掘技術(shù),包括自動分類技術(shù)、自動關(guān)聯(lián)技術(shù)、觀點挖掘技術(shù)、自動分詞技術(shù)、結(jié)構(gòu)化抽取技術(shù)以及自動摘要、關(guān)鍵詞技術(shù)等。

圖1 決策支持結(jié)構(gòu)系統(tǒng)

4、基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情預(yù)警決策支持系統(tǒng)的構(gòu)建

基于數(shù)據(jù)挖掘的決策支持系統(tǒng)采集網(wǎng)絡(luò)中的新聞網(wǎng)頁、論壇、博客、新聞評論,貼吧等網(wǎng)絡(luò)資源,發(fā)現(xiàn)突發(fā)性熱點事件,進(jìn)行熱點跟蹤定位和實時輿情預(yù)警,幫助政府及時掌握輿情動向,準(zhǔn)確捕捉預(yù)警信息,對有較大影響的重要事件快速發(fā)現(xiàn)、快速處理,為政府決策提供信息依據(jù)[5]。

4.1數(shù)據(jù)準(zhǔn)備

網(wǎng)絡(luò)輿情預(yù)警需要多樣化的信息,在整理信息的時候,需要做到全面、準(zhǔn)確、及時。本系統(tǒng)涉及的信息有:

文本信息:新聞、博客、產(chǎn)品評論、論壇帖子等文本信息,包括主題、關(guān)鍵詞、時間、URL等。

詞匯信息:包括現(xiàn)在詞典中的字或詞和現(xiàn)在網(wǎng)絡(luò)用語的語義、適用的語境和是否帶有情感等。

圖像信息:主要是新聞、博客、產(chǎn)品評論、論壇帖子等上的圖片,包括主題、內(nèi)容、時間、URL、瀏覽數(shù)量等。

視頻音頻信息:主要是新聞、博客、產(chǎn)品評論、論壇帖子等上的視頻音頻,包括主題、內(nèi)容、時間、、URL、瀏覽數(shù)量等。

這些來自互聯(lián)網(wǎng)的大量信息,通過收集、整理、存儲、預(yù)處理在數(shù)據(jù)庫中作為原始數(shù)據(jù),這些數(shù)據(jù)是離散的、模糊的。

4.2系統(tǒng)功能模塊

根據(jù)網(wǎng)絡(luò)輿情預(yù)警的規(guī)劃,如輿情分類、情感分類與趨勢預(yù)測、輿情檢索以及統(tǒng)計分析等,本系統(tǒng)建立了輿情信息采集管理系統(tǒng)、輿情分類管理系統(tǒng)[6]、輿情來源管理系統(tǒng)、輿情情感分類管理系統(tǒng)和用戶管理系統(tǒng)。

①輿情分類管理系統(tǒng):輿情分類即對海量信息的自動(文本語義分析)分類。通過關(guān)鍵字樣本、文件樣本、自定義等把原始信息分類,形成分類別(危害國家安全、危害社會治安、擾亂社會秩序等)的分類庫,分類管理可以對分類的類別數(shù)據(jù)進(jìn)行增加、刪除、修改等操作。

②輿情信息采集管理系統(tǒng):輿情信息采集管理系統(tǒng)對文本信息、圖像信息、視頻音頻信息的來源,如新聞、博客、產(chǎn)品評論、論壇帖子、網(wǎng)站及其網(wǎng)站的權(quán)威性進(jìn)行分析統(tǒng)計。

③輿情來源管理系統(tǒng):輿情來源管理部門對文本信息、圖像信息、視頻音頻信息的來源,如新聞、博客、產(chǎn)品評論、論壇帖子、網(wǎng)站及其網(wǎng)站的權(quán)威性進(jìn)行分析統(tǒng)計。

④輿情情感分類管理系統(tǒng):輿情分類管理部門從根據(jù)新聞、博客、產(chǎn)品評論、論壇帖子等收集的文本信息、圖像信息、視頻音頻信息,經(jīng)過預(yù)處理之后,通過觀點挖掘方法對輿情信息的情感傾向進(jìn)行分析,及時發(fā)現(xiàn)消極情感的信息,以便迅速做出反應(yīng)。

⑤輿情統(tǒng)計系統(tǒng):統(tǒng)計輿情分類管理系統(tǒng)和輿情情感分類管理系統(tǒng)的信息,為政府提供報表或報文,供政府決策使用。

5、結(jié) 論

基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情預(yù)警決策支持系統(tǒng)可以有效解決現(xiàn)在網(wǎng)絡(luò)輿情預(yù)警系統(tǒng)中存在的問題,通過文本挖掘技術(shù)對非結(jié)構(gòu)化的模糊復(fù)雜的信息分析處理,及時發(fā)現(xiàn)重大突發(fā)事件,減少危機(jī)損失,提高政府管理和控制輿情的能力。

參考文獻(xiàn):

篇8

我國的網(wǎng)絡(luò)輿情研究還是處于初級階段,一方面,政府投入資金鼓勵研究,建立了基礎(chǔ)性的理論知識;另一方面,輿情的采集和分析缺乏相應(yīng)的制度,同時輿情的應(yīng)用也面臨著很大的挑戰(zhàn)。目前只有人民網(wǎng)的輿情監(jiān)測室和一些企業(yè)開發(fā)系統(tǒng)研究,在農(nóng)業(yè)方面則更加缺乏。在國外,網(wǎng)絡(luò)輿情研究比較早。剛開始的研究都與政府有關(guān),特別是與政治生活密切相關(guān)的大型選舉活動的選情分析和研究。此外,針對輿情規(guī)范部分國家已經(jīng)上升到行政制度層面,提出和采取了一系列的措施。伴隨互聯(lián)網(wǎng)的快速發(fā)展,農(nóng)業(yè)網(wǎng)絡(luò)輿情研究已經(jīng)廣泛發(fā)展,政府研究機(jī)構(gòu)和企業(yè)對輿情的研究技術(shù)相當(dāng)成熟。

2模型設(shè)計

云環(huán)境下的農(nóng)業(yè)網(wǎng)絡(luò)輿情監(jiān)測模型由三部分構(gòu)成,即輿情信息采集層、輿情分析層和輿情服務(wù)層(圖1)。為了對主流媒體、門戶網(wǎng)站、資訊平臺、知名論壇、搜索引擎、博客、貼吧等網(wǎng)絡(luò)載體的監(jiān)測,全面掌控互聯(lián)網(wǎng)上與農(nóng)業(yè)相關(guān)的人、地、物、事、組織,不漏掉有價值的輿情信息,通過收集相關(guān)網(wǎng)頁信息,并對其過濾、分類;對已經(jīng)處理與農(nóng)業(yè)相關(guān)的輿情信息進(jìn)行動態(tài)分類采集、智能化分析,及時發(fā)現(xiàn)隱藏?zé)狳c輿情、突發(fā)事件和重大公共事件信息。在整個過程中,農(nóng)業(yè)網(wǎng)絡(luò)輿情監(jiān)測的信息都在云數(shù)據(jù)中心計算和存儲。

3系統(tǒng)功能模塊

3.1輿情信息采集

輿情信息采集模塊是整個系統(tǒng)數(shù)據(jù)處理分析的信息源[6]。輿情信息采集主要是由網(wǎng)絡(luò)爬蟲來實現(xiàn),系統(tǒng)采用NUTCH采集信息,從給定的一個初始集URLs出發(fā),依次按順序出去URL,獲取該URL指向的網(wǎng)頁,同時將頁面中的新鏈接加入到URLs中,不斷重復(fù)上述過程,直至所有的URLs全部被采集完終止。為了提高網(wǎng)頁的采集速度,系統(tǒng)設(shè)計了多個采集器并行采集,同時在將采集到頁面中的鏈接進(jìn)行過濾,除去重復(fù)的、過時的URL(圖2)。上述流程的輸入是給定的URL,URL過濾規(guī)則和頁面過時判定值,而輸出的是網(wǎng)頁的正文內(nèi)容。當(dāng)進(jìn)行信息采集時,由于整個互聯(lián)網(wǎng)包含的信息量太大,在消耗系統(tǒng)資源和網(wǎng)絡(luò)寬帶的情況下,采集有效的頁面率卻不高。系統(tǒng)對輿情主題進(jìn)行規(guī)劃,使用主題網(wǎng)絡(luò)爬蟲,提高系統(tǒng)資源利用率(圖3)。將采集得到的信息存入云數(shù)據(jù)中心,進(jìn)行輿情信息預(yù)處理。信息預(yù)處理主要實現(xiàn)的功能是解析網(wǎng)頁正文內(nèi)容、進(jìn)行中文分詞、特征提取和關(guān)鍵詞提取、刪除停用詞[7]。

3.2輿情分析模塊

輿情分析模塊是系統(tǒng)中最核心的處理模塊,利用信息技術(shù)對預(yù)處理后的輿情信息進(jìn)行分析挖掘,實現(xiàn)輿情信息的熱點發(fā)現(xiàn)和話題追蹤等(圖4)。本體是通過某領(lǐng)域內(nèi)諸多知名專家協(xié)作共同構(gòu)建該領(lǐng)域概念體系、公理和體系關(guān)系集合體,以計算機(jī)所能理解的語言和形式描述、表示和組織知識,促進(jìn)知識重用、知識共享和知識服務(wù)。而農(nóng)業(yè)本體是通過農(nóng)業(yè)與其他領(lǐng)域(如農(nóng)產(chǎn)品加工、經(jīng)濟(jì)管理等領(lǐng)域)專家的積極參與和通力協(xié)作,從而構(gòu)建的以機(jī)器能理解的形式化語言表示和組織的農(nóng)業(yè)知識和模型[8]。構(gòu)建農(nóng)業(yè)領(lǐng)域本體,能夠更好的發(fā)現(xiàn)輿情信息,提高預(yù)警能力。敏感話題識別主要是分析在不同時間內(nèi)的某一主題關(guān)注程度。隨時間的變化,話題關(guān)注度也會出現(xiàn)一定的波動。敏感話題不等同于熱點話題,涉及范圍比較廣。敏感話題主要處理過程包括對網(wǎng)絡(luò)輿論內(nèi)容進(jìn)行分詞,并針對當(dāng)前社會形勢,總結(jié)出目前較為敏感的詞匯,建立農(nóng)業(yè)敏感詞庫。其具體實現(xiàn)是將根據(jù)分詞后的結(jié)果與敏感詞庫中的敏感詞匹配來完成,從而實現(xiàn)當(dāng)前網(wǎng)絡(luò)中敏感話題自動發(fā)現(xiàn)。熱點話題是文本聚類分析的結(jié)果。其主要流程是將預(yù)處理的文本信息歸入相關(guān)的話題中,文本聚類就是將話題按照文檔進(jìn)行聚類,從而發(fā)現(xiàn)新的熱點。話題追蹤是得到的熱點話題與用戶感興趣的進(jìn)行比較,若判斷是用戶感興趣的則交給用戶,這里還可以通過機(jī)器學(xué)習(xí)不斷地向用戶興趣進(jìn)行修正,使得系統(tǒng)能夠更好地滿足用戶的需求。此外,熱點發(fā)現(xiàn)還可以通過對用戶的訪問日志信息挖掘。用戶在瀏覽網(wǎng)頁時,網(wǎng)頁日志中會記載相應(yīng)的IP地址、瀏覽時間和URL地址等信息,通過統(tǒng)計分析日志得到某地區(qū)某時某刻的熱點信息。另外,還可以通過統(tǒng)計用戶在某段時間內(nèi)搜索的關(guān)鍵詞量,來描述網(wǎng)民關(guān)注點的產(chǎn)生和變化過程,甚至可以追蹤到輿情產(chǎn)生和變換的源頭。

3.3輿情服務(wù)平臺

輿情服務(wù)平臺是系統(tǒng)和用戶的交互界面。系統(tǒng)在經(jīng)過輿情分析之后,將產(chǎn)生的結(jié)果結(jié)合可視化技術(shù)呈現(xiàn)給用戶。同時也可以進(jìn)行個性化的定制將農(nóng)業(yè)輿情報告提供給輿情監(jiān)管部門或者決策者,決策者或者監(jiān)管部門在進(jìn)行輿情報告評估基礎(chǔ)上產(chǎn)生新的輿情需求,進(jìn)行輿情采集主題規(guī)劃。輿情服務(wù)還包括敏感話題的趨勢分析、熱點話題排行榜等,當(dāng)這些超過了系統(tǒng)預(yù)先設(shè)定好的閥值,系統(tǒng)將發(fā)出預(yù)警信息,提前采取措施應(yīng)對。

4結(jié)束語

推薦期刊