本書從解決工作中的實際問題出發(fā),以漫畫形式講解數(shù)據分析知識,并提煉、總結工作中常用的Python 數(shù)據處理、數(shù)據分析實戰(zhàn)方法與技巧。本書力求通俗易懂地介紹相關知識,在不影響學習、理解效果的前提下,盡可能地避免使用晦澀難懂的Python 編程、統(tǒng)計術語或模型公式,如需了解相關的知識,可查閱相關的圖書或資料。本書定位是帶領Python 數(shù)據分析初學者入門,并能在學習和工作中解決大部分問題,或滿足大部分需求。入門后,讀者如需進一步學習進階技能,可自行擴展閱讀相關圖書或資料。學習是永無止境的,正所謂“師傅領進門,修行在個人”。
張文霖,新浪博客“小蚊子數(shù)據分析”博主,“誰說菜鳥不會數(shù)據分析“系列圖書作者,具有多年移動互聯(lián)網數(shù)據分析經驗,略懂Excel、PPT、SPSS、Python、SQL等工具。
第1 章 數(shù)據分析概況
1.1 數(shù)據分析定義
1.2 數(shù)據分析作用
1.3 數(shù)據分析步驟
1.3.1 明確分析目的和思路
1.3.2 數(shù)據收集
1.3.3 數(shù)據處理
1.3.4 分析數(shù)據
1.3.5 數(shù)據展現(xiàn)
1.3.6 報告撰寫
1.4 常用的數(shù)據分析工具
第2 章 Python 概況
2.1 Anaconda 安裝與使用
2.1.1 Anaconda 簡介
2.1.2 安裝Anaconda
2.1.3 使用Spyder
2.2 變量
2.2.1 變量定義
2.2.2 變量賦值
2.2.3 變量命名
2.3 數(shù)據類型
2.3.1 數(shù)值型
2.3.2 字符型
2.3.3 邏輯型
2.4 數(shù)據結構
2.4.1 列表
2.4.2 元組
2.4.3 字典
2.4.4 序列
2.4.5 數(shù)據框
2.5 函數(shù)
2.5.1 函數(shù)簡介
2.5.2 Python 內置函數(shù)
2.5.3 使用函數(shù)
2.6 模塊
2.6.1 模塊簡介
2.6.2 Python 標準模塊
2.6.3 使用模塊
2.7 Python 編程注意事項
第3 章 數(shù)據處理
3.1 數(shù)據導入導出
3.1.1 數(shù)據導入
3.1.2 數(shù)據訪問
3.1.3 數(shù)據導出
3.2 數(shù)據清洗
3.2.1 數(shù)據排序
3.2.2 重復數(shù)據處理
3.2.3 空格數(shù)據處理
3.3 數(shù)據轉換
3.3.1 數(shù)據類型查看
3.3.2 數(shù)值轉字符
3.3.3 字符轉數(shù)值
3.3.4 字符轉時間
3.3.5 時間轉字符
3.4 數(shù)據抽取
3.4.1 字段拆分
3.4.2 記錄抽取
3.5 數(shù)據合并
3.5.1 記錄合并
3.5.2 字段合并
3.5.3 字段匹配
3.6 數(shù)據計算
3.6.1 簡單計算
3.6.2 時間計算
3.6.3 數(shù)據分組
第4 章 數(shù)據分析
4.1 對比分析
4.2 描述性分析
4.3 分組分析
4.4 結構分析
4.5 分布分析
4.6 交叉分析
4.7 矩陣分析
4.8 轉化分析
4.9 RFM 分析
4.10 留存分析
4.11 生命周期價值分析
4.12 簡單線性回歸
第5 章 數(shù)據可視化
5.1 數(shù)據可視化簡介
5.1.1 什么是數(shù)據可視化
5.1.2 數(shù)據可視化常用圖表
5.1.3 通過關系選擇圖表
5.1.4 Python 可視化模塊
5.2 matplotlib 入門
5.3 餅圖
5.4 柱形圖
5.5 條形圖
5.6 折線圖
5.7 面積圖
5.8 散點圖
5.9 矩陣圖