數(shù)據(jù)清洗基礎(chǔ)與實踐
定 價:22 元
叢書名:人工智能與大數(shù)據(jù)系列叢書
數(shù)據(jù)的清洗是在大數(shù)據(jù)的挖掘與分析過程中的一個重要環(huán)節(jié),由于數(shù)據(jù)類型的復(fù)雜性,采用傳統(tǒng)的清洗臟數(shù)據(jù)的工作會辛苦和乏味。但是如果能利用好的清洗工具和適當(dāng)?shù)姆椒▌t可以讓數(shù)據(jù)的清洗工作變得有趣并能達到事半功倍的效果。本書從文件格式、數(shù)據(jù)類型、字符編碼等基本概念入手,通過實例,探討了如何提取和清洗關(guān)系型數(shù)據(jù)、網(wǎng)頁數(shù)據(jù),以及如何實現(xiàn)數(shù)據(jù)的轉(zhuǎn)換與加載。每個知識點都附有案例供讀者學(xué)習(xí),通過實踐讓讀者掌握所有的數(shù)據(jù)清洗技術(shù)。如果您是一位數(shù)據(jù)科學(xué)家,或者從事數(shù)據(jù)科學(xué)工作,哪怕是一個對數(shù)據(jù)科學(xué)感興趣的新手,那么很高興本書適合您閱讀。
生于1980年1月,講師/項目監(jiān)理師,碩士,重慶工程學(xué)院人工智能與大數(shù)據(jù)系教師,主要從事人工智能與醫(yī)療大數(shù)據(jù)的研究。自2015年以來主持商業(yè)醫(yī)療大數(shù)據(jù)項目3項,產(chǎn)值千萬元以上。公開發(fā)表論文7篇(EI檢索1篇)、主持、參與校級自然科學(xué)基金項目1項 、主持、參與建設(shè)校級重點課程1門 、主編、參與出版教材(教學(xué)講義)3部