在大數(shù)據(jù)時代的背景下,商業(yè)分析能力顯得尤為重要,具有商業(yè)分析能力的人才供不應(yīng)求。不同于其他經(jīng)典的統(tǒng)計學(xué)教科書,本書是一本非常實用的數(shù)據(jù)分析實戰(zhàn)指導(dǎo)手冊。
本書的靈感來源于狗熊會人才計劃,全書框架也沿用人才計劃,以一系列TASK的形式構(gòu)建。全書涵蓋數(shù)據(jù)分析的選題與背景、數(shù)據(jù)的獲取與描述、模型的建立、表達(dá)與溝通和實戰(zhàn)案例收錄五大核心模塊,具體內(nèi)容為:第1章主要介紹數(shù)據(jù)分析中選題的確定方法,以及數(shù)據(jù)分析報告中背景介紹部分的撰寫思路;第2章主要介紹數(shù)據(jù)的獲取方式,以及數(shù)據(jù)介紹與描述分析部分的撰寫、展示方法;第3章主要介紹數(shù)據(jù)建模的基本思路,以及常用模型方法;第4章主要介紹數(shù)據(jù)分析報告的撰寫及展示分享時的表達(dá)與溝通技巧,以及代碼規(guī)范的一系列問題;第5章主要分享一些優(yōu)秀的數(shù)據(jù)分析報告案例,供讀者學(xué)習(xí)參考。
本書適合數(shù)據(jù)分析入門者、對商業(yè)分析感興趣的或正在從事相關(guān)工作的讀者,可以幫助讀者建立系統(tǒng)的數(shù)據(jù)分析框架,提高利用數(shù)據(jù)分析工具進(jìn)行業(yè)務(wù)分析的能力,從而成為一位具有商業(yè)分析能力的數(shù)據(jù)科學(xué)人才。
|
(1) 實戰(zhàn)。完全跳脫理論層面,重點在于提高數(shù)據(jù)分析實戰(zhàn)能力。
(2) TASK。獨創(chuàng)的TASK驅(qū)動人才培養(yǎng)模式,以一個個TASK(任務(wù))促使讀者主動學(xué)習(xí)和思考。
(3) 方向。匯聚狗熊會團隊?wèi)?yīng)用型數(shù)據(jù)科學(xué)人才培養(yǎng)的成果,大大拉近高校與產(chǎn)業(yè)的距離,為數(shù)據(jù)科學(xué)教育指明方向。
潘蕊
中央財經(jīng)大學(xué)統(tǒng)計與數(shù)學(xué)學(xué)院副教授,碩士生導(dǎo)師。北京大學(xué)光華管理學(xué)院商務(wù)統(tǒng)計與經(jīng)濟計量系博士。狗熊會聯(lián)合創(chuàng)始人,狗熊會人才計劃項目發(fā)起人。研究興趣為高維數(shù)據(jù)分析、社交網(wǎng)絡(luò)統(tǒng)計建模等。在JASA、Annals等統(tǒng)計學(xué)期刊發(fā)表論文十余篇,主持國家自然科學(xué)基金1項。
狗熊會,數(shù)據(jù)產(chǎn)業(yè)高端智庫,使命是聚數(shù)據(jù)英才,助產(chǎn)業(yè)振興!關(guān)注數(shù)據(jù)科學(xué)基礎(chǔ)教育,希望通過生產(chǎn)優(yōu)質(zhì)的數(shù)據(jù)科學(xué)教學(xué)內(nèi)容,提供卓越的研究、實踐和就業(yè)機會,幫助相關(guān)專業(yè)教師、學(xué)生及從業(yè)者充分享受數(shù)據(jù)分析的快樂,促進(jìn)個人職業(yè)的發(fā)展。本書的其他作者均為狗熊會的核心團隊成員,名單如下。
北京大學(xué)王漢生教授
西安交通大學(xué)常象宇副教授
廈門大學(xué)劉婧媛副教授
中央財經(jīng)大學(xué)關(guān)蓉講師
中國人民大學(xué)周靜講師
中國人民大學(xué)王菲菲講師
|
北京大學(xué)陳昱博士
目 錄
第1章選題與背景
1.1TASK概述
1.2確定選題
1.2.1選題的思考路徑
1.2.2可能的選題方向
1.2.3補充材料
1.2.4課后作業(yè)
1.3學(xué)寫背景介紹
1.3.1如何寫背景介紹
1.3.2背景介紹經(jīng)常出現(xiàn)的問題
1.3.3課后作業(yè)
1.4范例與點評
1.4.1范例一
1.4.2范例二
1.4.3范例三
第2章數(shù)據(jù)的獲取與描述
2.1數(shù)據(jù)的獲取
2.1.1搭建框架
2.1.2確定問題形式
2.1.3選措辭、排結(jié)構(gòu)
2.1.4評估、預(yù)測試
2.1.5課后作業(yè)
2.2數(shù)據(jù)介紹與說明
2.2.1數(shù)據(jù)變量說明表
2.2.2用PPT介紹數(shù)據(jù)
2.2.3常見的問題
2.2.4課后作業(yè)
2.3數(shù)據(jù)的描述外表美
2.3.1描述分析簡介
2.3.2描述分析的整體規(guī)范
2.3.3統(tǒng)計圖的規(guī)范
2.3.4課后作業(yè)
2.4數(shù)據(jù)的描述內(nèi)在美
2.4.1準(zhǔn)確使用統(tǒng)計圖
2.4.2寫好描述性文字
2.4.3擴展閱讀材料
2.4.4課后作業(yè)
2.5范例與點評
2.5.1范例一
2.5.2范例二
2.5.3范例三
第3章模型的建立
3.1建模的流程
3.1.1建模前的準(zhǔn)備
3.1.2模型的選擇與建立
3.1.3模型的解讀與評價
3.1.4課后作業(yè)
3.2無監(jiān)督學(xué)習(xí):數(shù)據(jù)降維
3.2.1主成分分析
3.2.2因子分析
3.2.3課后作業(yè)
3.3無監(jiān)督學(xué)習(xí):聚類分析
3.3.1聚類分析概述
3.3.2層次聚類法
3.3.3K均值聚類法
3.3.4課后作業(yè)
3.4有監(jiān)督的學(xué)習(xí):連續(xù)型因變量
3.4.1模型的建立與估計
3.4.2結(jié)果的整理與解讀
3.4.3模型診斷與改進(jìn)技巧
3.4.4模型選擇:準(zhǔn)則和步驟
3.4.5課后作業(yè)
3.5有監(jiān)督的學(xué)習(xí):離散型因變量
3.5.1邏輯回歸模型
3.5.2模型的評價
3.5.3決策樹
3.5.4課后作業(yè)
3.6文本分析
3.6.1文本分析可以干什么
3.6.2文本分析的主要內(nèi)容
3.6.3文本分析基本流程
3.6.4文本分析示例
3.6.5課后作業(yè)
第4章表達(dá)與溝通
4.1報告的撰寫
4.1.1報告概述
4.1.2報告的核心要素
4.1.3如何撰寫優(yōu)秀的報告
4.1.4課后作業(yè)
4.2PPT的制作
4.2.1PPT的特點
4.2.2制作PPT的步驟
4.2.3示范與點評
4.2.4課后作業(yè)
4.3以PPT為核心的表達(dá)與溝通
4.3.1從表達(dá)與溝通的角度看PPT制作的問題
4.3.2表達(dá)與溝通的注意事項
4.3.3課后作業(yè)
4.4代碼規(guī)范
4.4.1代碼注釋
4.4.2代碼命名規(guī)則
4.4.3代碼模塊化
4.4.4代碼調(diào)試
4.4.5代碼效率優(yōu)化
4.4.6課后作業(yè)
第5章實戰(zhàn)案例
5.1案例一
5.2案例二
5.3案例三
5.4案例四
5.5案例五
5.6案例六
參考文獻(xiàn)