互聯(lián)網(wǎng)信息監(jiān)測系統(tǒng)研究
定 價:22 元
- 作者:周輝
- 出版時間:2015/9/21
- ISBN:9787513022545
- 出 版 社:知識產(chǎn)權出版社
- 中圖法分類:TP393.407.1
- 頁碼:97
- 紙張:
- 版次:1
- 開本:小16開
互聯(lián)網(wǎng)是現(xiàn)代社會信息發(fā)布、交換和獲取的重要渠道,各類對企業(yè)發(fā)展有重大影響的信息,也大量通過互聯(lián)網(wǎng)發(fā)布、交換和獲取。對互聯(lián)網(wǎng)上的上述信息進行檢測和分析,及時發(fā)現(xiàn)與企業(yè)相關的重要新聞或敏感事件,并連接到企業(yè)接口人的業(yè)務工作中,進而形成面向互聯(lián)網(wǎng)的服務支撐業(yè)務體系。 互聯(lián)網(wǎng)服務支撐信息監(jiān)測系統(tǒng)的是一整套完整嚴密的軟硬件系統(tǒng),它需要從每秒都有海量新增內(nèi)容的互聯(lián)網(wǎng)上,掃描目標媒體站點,并綜合采納搜索引擎的實時搜索結果,將獲取到的原始網(wǎng)頁信息,解析并轉(zhuǎn)化為結構化文檔,并執(zhí)行轉(zhuǎn)載統(tǒng)計、熱點統(tǒng)計、預警、聚類、分類等文檔挖掘算法,從而在此基礎上為用戶提供有價值的、有針對性的咨詢分析,并支持用戶在Web界面上執(zhí)行流程規(guī)范的編輯、批閱、分析、預警。
目錄
**章 引言
1.1互聯(lián)網(wǎng)信息
1.2互聯(lián)網(wǎng)信息監(jiān)測
1.3手工監(jiān)測的不足
1.4互聯(lián)網(wǎng)信息監(jiān)測系統(tǒng)
1.5全文組織結構
第二章 常見企業(yè)用戶需求
2.1 業(yè)務功能需求
2.2 非功能性需求
第三章 系統(tǒng)設計
3.1 系統(tǒng)結構
3.2 分布式網(wǎng)絡信息采集子系統(tǒng)
3.3 海量信息管理與檢索子系統(tǒng)
3.4 多維分析與機器學習子系統(tǒng)
3.5 權限與接口管理子系統(tǒng)
3.6 交互子系統(tǒng)
3.7 系統(tǒng)部署方案
第四章 數(shù)據(jù)處理流程
4.1 結構化解析
4.2 多語言支持
4.3 網(wǎng)頁正文提取
4.4 網(wǎng)頁信息抽取
4.5 命名實體識別
4.6 數(shù)據(jù)規(guī)模估算
第五章 關鍵技術解析
5.1 文本聚類
5.2 文本分類
5.3 高可用HA
5.4 全文檢索
5.5數(shù)據(jù)模型NoSQL
5.6詞語統(tǒng)計與分析
5.7元搜索
5.8網(wǎng)絡協(xié)議Robots
第六章 相關廠商和產(chǎn)品
6.1 中科新天
6.2 谷尼國際
6.3 方正智思
6.4 北京本果
6.5 維思比
6.6 樂思軟件
6.7 中科點擊
第七章 相關開源軟件
7.1全文索引框架 Apache Lucene
7.2搜索引擎 Apache Nutch
7.3全文檢索平臺 Apache Solr
7.4分布式計算基礎平臺 Apache Hadoop
7.5應用服務器 Apache Tomcat
7.6數(shù)據(jù)庫服務器 MySQL
7.7中文分詞工具 IKAnalyzer
7.8消息中間件Apache ActiveMQ
第八章 總結