国产日韩亚洲欧美看国产视频,精品久久久久88久久久,午夜福利A∨无码一区二区

本書(shū)闡述文本數(shù)據(jù)挖掘的理論模型、實(shí)現(xiàn)算法和相關(guān)應(yīng)用，主要內(nèi)容包括：信息抽取和知識(shí)庫(kù)構(gòu)建、文本聚類、情感文本分析、熱點(diǎn)發(fā)現(xiàn)、生物醫(yī)學(xué)文本挖掘和多文檔自動(dòng)摘要等。寫(xiě)作風(fēng)格力求言簡(jiǎn)意賅，深入淺出，通過(guò)實(shí)例說(shuō)明實(shí)現(xiàn)相關(guān)任務(wù)的理論方法和技術(shù)思路，而不過(guò)多地涉及實(shí)現(xiàn)細(xì)節(jié)。本書(shū)可作為大學(xué)高年級(jí)本科生或研究生從事相關(guān)研究的入門文獻(xiàn)，也可作為從事相關(guān)技術(shù)研發(fā)的開(kāi)發(fā)人員的參考資料。

隨著互聯(lián)網(wǎng)和移動(dòng)通信技術(shù)的快速發(fā)展和普及應(yīng)用，文本數(shù)據(jù)挖掘技術(shù)備受關(guān)注，尤其隨著云計(jì)算、大數(shù)據(jù)和深度學(xué)習(xí)等一系列新技術(shù)的廣泛使用，文本挖掘技術(shù)已經(jīng)在眾多領(lǐng)域（如輿情分析、醫(yī)療和金融數(shù)據(jù)分析等）發(fā)揮了重要作用，表現(xiàn)出廣闊的應(yīng)用前景。
雖然十多年前我就指導(dǎo)博士生開(kāi)展文本分類和自動(dòng)文摘等相關(guān)技術(shù)的研究，但對(duì)文本數(shù)據(jù)挖掘的整體概念并沒(méi)有一個(gè)清晰的認(rèn)識(shí)，只是將研究的單項(xiàng)技術(shù)視為自然語(yǔ)言處理的具體應(yīng)用。韓家煒教授主筆的《數(shù)據(jù)挖掘概念與技術(shù)》和劉兵教授撰寫(xiě)的Web Data Mining等專著曾讓我大獲裨益，每次聆聽(tīng)他們的學(xué)術(shù)報(bào)告和與他們當(dāng)面交談也都受益匪淺。促使我萌生撰寫(xiě)這部專著念頭的是中國(guó)科學(xué)院大學(xué)讓我開(kāi)設(shè)的文本數(shù)據(jù)挖掘課程。 2015年底我接受中國(guó)科學(xué)院大學(xué)計(jì)算機(jī)與控制學(xué)院的邀請(qǐng)，開(kāi)始準(zhǔn)備文本數(shù)據(jù)挖掘課程的內(nèi)容設(shè)計(jì)和課件編寫(xiě)工作，我不得不靜下心來(lái)查閱大量的文獻(xiàn)資料，認(rèn)真思考這一術(shù)語(yǔ)所蘊(yùn)藏的豐富內(nèi)涵和外延，經(jīng)過(guò)幾年的學(xué)習(xí)、思考和教學(xué)實(shí)踐，文本數(shù)據(jù)挖掘的概念輪廓漸漸清晰起來(lái)。
夏睿和張家俊兩位青年才俊的加盟讓我萌生的寫(xiě)作計(jì)劃得以實(shí)現(xiàn)。夏睿于 2007年碩士畢業(yè)，以優(yōu)異成績(jī)考入中科院自動(dòng)化所跟隨我攻讀博士學(xué)位，從事情感文本分析研究，在情感分析和觀點(diǎn)挖掘領(lǐng)域以第一作者身份在國(guó)際一流學(xué)術(shù)期刊和會(huì)議上發(fā)表了一系列有影響力的論文，其中兩篇論文入選 ESI高被引論文，攻讀博士學(xué)位期間完成的關(guān)于情感分類特征發(fā)現(xiàn)與集成學(xué)習(xí)的論文被引 400余次。此外，他在文本分類與聚類、主題模型、話題檢測(cè)與跟蹤等多個(gè)領(lǐng)域都頗有見(jiàn)地。張家俊于 2006年本科畢業(yè)后被免試推薦到中科院自動(dòng)化所跟隨我攻讀博士學(xué)位，主要從事機(jī)器翻譯研究，之后在多語(yǔ)言自動(dòng)摘要、信息獲取和人機(jī)對(duì)話等多個(gè)研究方向都有出色的表現(xiàn)。自 2016年起他同我一道在中國(guó)科學(xué)院大學(xué)講授自然語(yǔ)言處理課程的機(jī)器翻譯、自動(dòng)文摘和文本分類等部分內(nèi)容，頗受學(xué)生的歡迎。仰仗兩位弟子扎實(shí)的理論功底和敏銳的科研悟性，很多最新的技術(shù)方法和研究成果能夠得到及時(shí)的驗(yàn)證和實(shí)踐，并被收入本書(shū)，使我倍感欣慰。
自 2016年初動(dòng)筆，到此時(shí)收官，全書(shū)耗時(shí)兩年多，當(dāng)然大部分寫(xiě)作都是在節(jié)假日、周末和其他本該休息的時(shí)間里完成的，其間進(jìn)行了無(wú)數(shù)次的修改、補(bǔ)充和調(diào)整，所花費(fèi)的時(shí)間和精力及其感受到的快樂(lè)和煩惱難以言表，正所謂痛并快樂(lè)著。在寫(xiě)作過(guò)程中和初稿完成之后，得到了很多同行專家的大力支持和幫助，他們是（以姓氏拼音順序排列）：韓先培、洪宇、李壽山、劉康、萬(wàn)小軍、徐康、章成志、趙鑫、周玉。他們分別審閱了部分章節(jié)的內(nèi)容，提出了寶貴的修改意見(jiàn)和建議。另外，部分研究生和博士生也為本
文本數(shù)據(jù)挖掘
書(shū)的寫(xiě)作提供了力所能及的幫助，他們是：白赫、蔡鴻杰、丁子祥、何燴燴、金曉、李俊杰、馬聰、王樂(lè)義、向露、鄭士梁、朱軍楠。他們幫助作者收集整理了部分文獻(xiàn)資料，繪制了書(shū)中的部分圖表，為作者節(jié)省了寶貴的時(shí)間。在此一并向他們表示衷心的感謝！
由衷地感謝韓家煒教授對(duì)本書(shū)提出的指導(dǎo)性意見(jiàn)和建議！他能夠在百忙之中為本書(shū)撰序，是我們的榮幸，不勝感激！本書(shū)的撰寫(xiě)工作得到了中國(guó)科學(xué)院大學(xué)教材出版中心的資助和國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目的資助（項(xiàng)目編號(hào)： 61333018）。另外，不得不說(shuō)的是，由于作者的水平和能力所限，加之時(shí)間和精力的不足，書(shū)中一定存在疏漏或錯(cuò)誤，衷心地歡迎讀者給予批評(píng)指正！
宗成慶 2018年國(guó)慶節(jié)期間

你還可能感興趣

我要評(píng)論