數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫?/p>
定 價(jià):69 元
- 作者:陳封能 ,斯坦巴赫 ,庫(kù)瑪爾 著 范明 譯
- 出版時(shí)間:2011/1/1
- ISBN:9787115241009
- 出 版 社:人民郵電出版社
- 中圖法分類(lèi):TP311.13
- 頁(yè)碼:463
- 紙張:膠版紙
- 版次:2
- 開(kāi)本:16開(kāi)
《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫啡娼榻B了數(shù)據(jù)挖掘的理論和方法,旨在為讀者提供將數(shù)據(jù)挖掘應(yīng)用于實(shí)際問(wèn)題所必需的知識(shí)。《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫泛w五個(gè)主題:數(shù)據(jù)、分類(lèi)、關(guān)聯(lián)分析、聚類(lèi)和異常檢測(cè)。除異常檢測(cè)外,每個(gè)主題都包含兩章:前面一章講述基本概念、代表性算法和評(píng)估技術(shù),后面一章較深入地討論高級(jí)概念和算法。目的是使讀者在透徹地理解數(shù)據(jù)挖掘基礎(chǔ)的同時(shí),還能了解更多重要的高級(jí)主題。此外,書(shū)中還提供了大量示例、圖表和習(xí)題。
《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫愤m合作為相關(guān)專(zhuān)業(yè)高年級(jí)本科生和研究生數(shù)據(jù)挖掘課程的教材,同時(shí)也可作為數(shù)據(jù)挖掘研究和應(yīng)用開(kāi)發(fā)人員的參考書(shū)。
《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫啡娼榻B了數(shù)據(jù)挖掘,涵蓋了五個(gè)主題:數(shù)據(jù)、分類(lèi)、關(guān)聯(lián)分析、聚類(lèi)和異常檢測(cè)。除異常檢測(cè)外,每個(gè)主題都有兩章。前一章涵蓋基本概念、代表性算法和評(píng)估技術(shù),而后一章討論高級(jí)概念和算法。這樣讀者在透徹地理解數(shù)據(jù)挖掘的基礎(chǔ)的同時(shí),還能夠了解更多重要的高級(jí)主題。《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫肥敲髂崽K達(dá)大學(xué)和密歇根州立大學(xué)數(shù)據(jù)挖掘課程的教材,由于獨(dú)具特色,正式出版之前就已經(jīng)被斯坦福大學(xué)、得克薩斯大學(xué)奧斯汀分校等眾多名校采用!稊(shù)據(jù)挖掘?qū)д摚ㄍ暾妫诽厣c許多其他同類(lèi)圖書(shū)不同,《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫穼⒅攸c(diǎn)放在如何用數(shù)據(jù)挖掘知識(shí)解決各種實(shí)際問(wèn)題。 只要求具備很少的預(yù)備知識(shí)——不需要數(shù)據(jù)庫(kù)背景,只需要很少的統(tǒng)計(jì)學(xué)或數(shù)學(xué)背景知識(shí)。 書(shū)中包含大量的圖表、綜合示例和豐富的習(xí)題,并且使用示例、關(guān)鍵算法的簡(jiǎn)潔描述和習(xí)題,盡可能直接聚焦于數(shù)據(jù)挖掘的主要概念。 教輔內(nèi)容極為豐富,包括課程幻燈片、學(xué)生課題建議、數(shù)據(jù)挖掘資源(如數(shù)據(jù)挖掘算法和數(shù)據(jù)集)、聯(lián)機(jī)指南(使用實(shí)際的數(shù)據(jù)集和數(shù)據(jù)分析軟件,《數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫方榻B的部分?jǐn)?shù)據(jù)挖掘技術(shù)提供例子講解)。
陳封能(Pang-Ning Tan)現(xiàn)為密歇根州立大學(xué)計(jì)算機(jī)與工程系助理教授,主要教授數(shù)據(jù)挖掘、數(shù)據(jù)庫(kù)系統(tǒng)等課程。此前,他曾是明尼蘇達(dá)大學(xué)美國(guó)陸軍高性能計(jì)算研究中心副研究員(2002-2003)。 斯坦巴赫(Michael Steinbach)明尼蘇達(dá)大學(xué)計(jì)算機(jī)與工程系研究員,在讀博士。 庫(kù)瑪爾(Vipin Kumar)明尼蘇達(dá)大學(xué)計(jì)算機(jī)科學(xué)與工程系主任,曾任美國(guó)陸軍高性能計(jì)算研究中心主任。他擁有馬里蘭大學(xué)博士學(xué)位,是數(shù)據(jù)挖掘和高性能計(jì)算方面的國(guó)際權(quán)威,IEEE會(huì)士。 范明,鄭州大學(xué)信息工程學(xué)院教授,中國(guó)計(jì)算機(jī)學(xué)會(huì)數(shù)據(jù)庫(kù)專(zhuān)業(yè)委員會(huì)委員、人工智能與模式識(shí)別專(zhuān)業(yè)委員會(huì)委員,長(zhǎng)期從事計(jì)算機(jī)軟件與理論教學(xué)和研究。先后發(fā)表論史40余篇。 范宏建 澳大利亞墨爾本大學(xué)計(jì)算機(jī)科學(xué)博士。先后在WWW、PAKDD、RSFDGrC、IEEE GrC和Australian AI等國(guó)際學(xué)術(shù)會(huì)議和IEEE Transactions on Knowledge and Data Engineering發(fā)表論文10余篇。目前是澳大利亞AUSTRAC的高級(jí)分析師。
第1章 緒論
1.1 什么是數(shù)據(jù)挖掘
1.2 數(shù)據(jù)挖掘要解決的問(wèn)題
1.3 數(shù)據(jù)挖掘的起源
1.4 數(shù)據(jù)挖掘任務(wù)
1.5 本書(shū)的內(nèi)容與組織
文獻(xiàn)注釋
參考文獻(xiàn)
習(xí)題
第2章 數(shù)據(jù)
2.1 數(shù)據(jù)類(lèi)型
2.1.1 屬性與度量
2.1.2 數(shù)據(jù)集的類(lèi)型
2.2 數(shù)據(jù)質(zhì)量
2.2.1 測(cè)量和數(shù)據(jù)收集問(wèn)題
2.2.2 關(guān)于應(yīng)用的問(wèn)題
2.3 數(shù)據(jù)預(yù)處理
2.3.1 聚集
2.3.2 抽樣
2.3.3 維歸約
2.3.4 特征子集選擇
2.3.5 特征創(chuàng)建
2.3.6 離散化和二元化
2.3.7 變量變換
2.4 相似性和相異性的度量
2.4.1 基礎(chǔ)
2.4.2 簡(jiǎn)單屬性之間的相似度和相異度
2.4.3 數(shù)據(jù)對(duì)象之間的相異度
2.4.4 數(shù)據(jù)對(duì)象之間的相似度
2.4.5 鄰近性度量的例子
2.4.6 鄰近度計(jì)算問(wèn)題
2.4.7 選取正確的鄰近性度量
文獻(xiàn)注釋
參考文獻(xiàn)
習(xí)題
第3章 探索數(shù)據(jù)
第4章 分類(lèi):基本概念、決策樹(shù)與模型評(píng)估
第5章 分類(lèi):其他技術(shù)
第6章 關(guān)聯(lián)分析:基本概念和算法
第7章 關(guān)聯(lián)分析:高級(jí)概念
第8章 聚類(lèi)分析:基本概念和算法
第9章 聚類(lèi)分析:其他問(wèn)題與算法
第10章 異常檢測(cè)
文獻(xiàn)注釋
參考文獻(xiàn)
習(xí)題
附錄a 線(xiàn)性代數(shù)
附錄b 維歸約
附錄c 概率統(tǒng)計(jì)
附錄d 回歸
附錄e 優(yōu)化