全國服務熱線:400-6966-109 總部總機號碼:010-62220090
概述
隨著互聯網的普及,中國網民超過3.38億人,成為世界第一大網民國家,網絡的重要性凸顯,而網絡輿論熱點也層出不窮,上海市戶籍新政、陜西神木縣全民免費醫療……都是通過網絡進行第一時間傳播,互聯網已經成為政府了解民情的直接渠道,也是新形勢下政府的重要輿論陣地。因此,網絡輿論一旦被錯誤地控制和引導,將成為影響社會穩定的重大隱患。如何應對網絡輿情,目前正在考驗著我國各級政府。
網絡輿論復雜化,互聯網言論空間在2010年繼續擴大,特別是“微博”的崛起,網絡議題得到傳統媒體的響應和深入挖掘,而傳統媒體的報道也經常在網上被迅速發酵、放大成全國性輿論。部分網民開始以一些溫和的網下行動干預現實。政府對網絡民意的應答提速,并把網絡舉報列為黨紀、政紀和司法監督新渠道,追究激起民怨的官員責任。同時,由于一些突發事件中對抗性增加,某些地方容易把限制網絡信息流動作為控制局勢的優先選擇,而另一些地方政府則大膽探索輿論應對和突發事件處理的新機制
多數據源采集融合問題,目前新聞、論壇、博客、微博客、視頻網站等多種輿情信息傳播渠道,同一個輿情信息可散布在不同傳播渠道中,造成了數據監測系統對不同來源數據的處理不一致、標準不統一的問題,為了保證監管的效率,需要對監管系統的元信息進行數據標準化和數據集成,形成一個統一的互聯網輿情信息基礎數據庫
多維度監測問題,輿情監測要求對多數據源進行多維度分析,根據不同用戶的需要進行不同的維度的分析與展現。
分析結果關聯與融合問題,現有監測系統對輿情信息傳播的分析功能的實現還比較少,只有簡單的輿情信息文本內容分析,因此對于多種傳播渠道新聞、論壇、博客、微博客傳播方式和相關信息的綜合分析目前還沒有相應的系統和技術,導致分析關聯能力不足,對潛在熱點發現能力不足,需要有效的解決方案
海量數據處理問題,互聯網數據數以億計,每天都產生TB以上規模的數據,如何對海量的數據進行存儲,如何對海量數據及時有效的處理,如何使系統的架構能夠隨著數據規模增大而自動擴展,都是海量數據處理面臨的挑戰性問題。
系統特點
一是采集靈活性,網頁探索器作為全球領先的網頁分析工具,可以按照網頁視覺特征精確定位并分析網頁任意一部分的源碼結構,節點結構,CSS 特性;對任何復雜的頁面布局都可以靈活處理,內置幾十種數據處理方式,輕松支持從任意半結構化數據中抽取結構化數據;
二是采集時效性,分布式搜索、元搜索、垂直搜索互為補充,搜索引擎采用分布式、并行負載平衡技術,當服務器出現運行負載失衡的狀態,系統可根據事先設定的調節機制,自動調節服務器和網絡設備的負載,充分利用既有資源,確保系統穩定運行,提高運行效率,從而達到我們快速搜索數據采集目標;
三是可定制性,即能夠根據用戶的自定義需求,對重點對象、話題進行聚焦監測;
四是持續性,即能追蹤已知話題的后續各類互聯網媒體相關報道、轉載、評論數,掌握其發展范圍、動態、趨勢;
五是全面性,對于針對不同技術形態建立的系統數據進行整合、分析處理,確保管轄范圍內數據的全面性。
Copyright ? 北京天大清源通信科技股份有限公司版權所有