互聯(lián)網(wǎng)信息監(jiān)測系統(tǒng)研究
定 價(jià):22 元
- 作者:周輝
- 出版時(shí)間:2015/9/21
- ISBN:9787513022545
- 出 版 社:知識(shí)產(chǎn)權(quán)出版社
- 中圖法分類:TP393.407.1
- 頁碼:97
- 紙張:
- 版次:1
- 開本:小16開
互聯(lián)網(wǎng)是現(xiàn)代社會(huì)信息發(fā)布、交換和獲取的重要渠道,各類對(duì)企業(yè)發(fā)展有重大影響的信息,也大量通過互聯(lián)網(wǎng)發(fā)布、交換和獲取。對(duì)互聯(lián)網(wǎng)上的上述信息進(jìn)行檢測和分析,及時(shí)發(fā)現(xiàn)與企業(yè)相關(guān)的重要新聞或敏感事件,并連接到企業(yè)接口人的業(yè)務(wù)工作中,進(jìn)而形成面向互聯(lián)網(wǎng)的服務(wù)支撐業(yè)務(wù)體系。 互聯(lián)網(wǎng)服務(wù)支撐信息監(jiān)測系統(tǒng)的是一整套完整嚴(yán)密的軟硬件系統(tǒng),它需要從每秒都有海量新增內(nèi)容的互聯(lián)網(wǎng)上,掃描目標(biāo)媒體站點(diǎn),并綜合采納搜索引擎的實(shí)時(shí)搜索結(jié)果,將獲取到的原始網(wǎng)頁信息,解析并轉(zhuǎn)化為結(jié)構(gòu)化文檔,并執(zhí)行轉(zhuǎn)載統(tǒng)計(jì)、熱點(diǎn)統(tǒng)計(jì)、預(yù)警、聚類、分類等文檔挖掘算法,從而在此基礎(chǔ)上為用戶提供有價(jià)值的、有針對(duì)性的咨詢分析,并支持用戶在Web界面上執(zhí)行流程規(guī)范的編輯、批閱、分析、預(yù)警。
目錄
**章 引言
1.1互聯(lián)網(wǎng)信息
1.2互聯(lián)網(wǎng)信息監(jiān)測
1.3手工監(jiān)測的不足
1.4互聯(lián)網(wǎng)信息監(jiān)測系統(tǒng)
1.5全文組織結(jié)構(gòu)
第二章 常見企業(yè)用戶需求
2.1 業(yè)務(wù)功能需求
2.2 非功能性需求
第三章 系統(tǒng)設(shè)計(jì)
3.1 系統(tǒng)結(jié)構(gòu)
3.2 分布式網(wǎng)絡(luò)信息采集子系統(tǒng)
3.3 海量信息管理與檢索子系統(tǒng)
3.4 多維分析與機(jī)器學(xué)習(xí)子系統(tǒng)
3.5 權(quán)限與接口管理子系統(tǒng)
3.6 交互子系統(tǒng)
3.7 系統(tǒng)部署方案
第四章 數(shù)據(jù)處理流程
4.1 結(jié)構(gòu)化解析
4.2 多語言支持
4.3 網(wǎng)頁正文提取
4.4 網(wǎng)頁信息抽取
4.5 命名實(shí)體識(shí)別
4.6 數(shù)據(jù)規(guī)模估算
第五章 關(guān)鍵技術(shù)解析
5.1 文本聚類
5.2 文本分類
5.3 高可用HA
5.4 全文檢索
5.5數(shù)據(jù)模型NoSQL
5.6詞語統(tǒng)計(jì)與分析
5.7元搜索
5.8網(wǎng)絡(luò)協(xié)議Robots
第六章 相關(guān)廠商和產(chǎn)品
6.1 中科新天
6.2 谷尼國際
6.3 方正智思
6.4 北京本果
6.5 維思比
6.6 樂思軟件
6.7 中科點(diǎn)擊
第七章 相關(guān)開源軟件
7.1全文索引框架 Apache Lucene
7.2搜索引擎 Apache Nutch
7.3全文檢索平臺(tái) Apache Solr
7.4分布式計(jì)算基礎(chǔ)平臺(tái) Apache Hadoop
7.5應(yīng)用服務(wù)器 Apache Tomcat
7.6數(shù)據(jù)庫服務(wù)器 MySQL
7.7中文分詞工具 IKAnalyzer
7.8消息中間件Apache ActiveMQ
第八章 總結(jié)