《數(shù)據(jù)素養(yǎng):數(shù)據(jù)使用者指南》是一本實(shí)用的數(shù)據(jù)分析和數(shù)據(jù)素養(yǎng)指南。我們?cè)跀?shù)據(jù)的海洋中遨游,這本書(shū)教會(huì)我們洞悉數(shù)據(jù)的意義,識(shí)別數(shù)據(jù)中的陷阱,而非被數(shù)據(jù)淹沒(méi)。本書(shū)面向那些沒(méi)有數(shù)據(jù)分析或者統(tǒng)計(jì)學(xué)背景的數(shù)據(jù)領(lǐng)域初學(xué)者,使用面向公眾開(kāi)放的數(shù)據(jù)源來(lái)練習(xí)Excel軟件的各項(xiàng)分析模塊,并借此展現(xiàn)如何從數(shù)據(jù)中洞察有用的信息。在本書(shū)的不同章節(jié)中,作者借用大量插圖、帶有詳細(xì)操作步驟的各式案例來(lái)幫助讀者學(xué)習(xí)如何識(shí)別、獲取、評(píng)估、清洗、分析和可視化數(shù)據(jù)。在此基礎(chǔ)上,作者提及數(shù)據(jù)庫(kù)管理軟件Microsoft Access和MYSQL,數(shù)據(jù)分析軟件SPSS、SAS和R等更復(fù)雜的工具,供讀者進(jìn)一步學(xué)習(xí)參考。
作者簡(jiǎn)介
戴維·赫佐格,美國(guó)密蘇里新聞學(xué)院副教授,全美調(diào)查性新聞協(xié)會(huì)資深數(shù)據(jù)編輯兼培訓(xùn)師,同時(shí)也是美國(guó)計(jì)算機(jī)輔助報(bào)道協(xié)會(huì)的學(xué)術(shù)顧問(wèn)。美國(guó)計(jì)算機(jī)輔助報(bào)道協(xié)會(huì)是密蘇里新聞學(xué)院與美國(guó)調(diào)查記者編輯協(xié)會(huì)合作建立的一個(gè)全球性記者組織。作為擁有十多年數(shù)據(jù)分析經(jīng)驗(yàn)的記者,戴維·赫佐格擅長(zhǎng)從數(shù)據(jù)中提煉信息融入敘事。
序言:數(shù)據(jù)素養(yǎng)的贊歌/1
致謝/4
第1部分 歡迎來(lái)到數(shù)據(jù)世界/1
第1章 定義數(shù)據(jù)/3
第2部分 識(shí)別并獲取數(shù)據(jù)/15
第2章 尋找數(shù)據(jù)線索/17
第3章 在線數(shù)據(jù)庫(kù)/32
第4章 發(fā)現(xiàn)和申請(qǐng)離線數(shù)據(jù)/55
第3部分 評(píng)估和清洗數(shù)據(jù)/73
第5章 數(shù)據(jù)污染無(wú)處不在/75
第6章 數(shù)據(jù)完整性校驗(yàn)/84
第7章 讓數(shù)據(jù)變?yōu)榭捎眯螒B(tài)/106
第4部分 分析數(shù)據(jù)/127
第8章 數(shù)字概括與對(duì)比/129
第9章 計(jì)算匯總統(tǒng)計(jì)和數(shù)字對(duì)比/135
第10章 用電子表格管理數(shù)據(jù)庫(kù)/146
第5部分 數(shù)據(jù)可視化/159
第11章 將你的數(shù)據(jù)可視化/161
第12章 選擇圖表/165
第13章 用EXCEL制作圖表/174
第14章 用網(wǎng)絡(luò)工具制作圖表/187
第15章 更高級(jí)的分析方式/199
附錄:數(shù)據(jù)工具包/205
術(shù)語(yǔ)表/208
參考文獻(xiàn)/215
索引/219
譯后記/230
本書(shū)的結(jié)構(gòu)簡(jiǎn)明清晰,首先介紹了如何定義“數(shù)據(jù)”,它和“信息”“知識(shí)”乃至“智慧”之間有什么樣的結(jié)構(gòu)關(guān)系。厘清這幾者的區(qū)別和聯(lián)系,是我們認(rèn)識(shí)數(shù)據(jù)、理解數(shù)據(jù)是如何產(chǎn)生價(jià)值的基礎(chǔ)。我在《數(shù)據(jù)新聞:現(xiàn)代視角下的歷史圖景》一文中曾經(jīng)提到:數(shù)據(jù)新聞,相對(duì)于它的前輩計(jì)算機(jī)輔助新聞報(bào)道,或者精確新聞,對(duì)于新聞?lì)I(lǐng)域的變革更為劇烈深刻。精確新聞與數(shù)據(jù)新聞?dòng)兄举|(zhì)不同,無(wú)論是在方法論還是在社會(huì)地位層面皆如此。精確新聞的底色是傳統(tǒng)實(shí)證研究,分析的數(shù)據(jù)是小樣本,解釋力相對(duì)有限;數(shù)據(jù)新聞?wù)Q生在完整意義的“信息社會(huì)”中,它不僅依賴數(shù)據(jù)分析與挖掘能力,更是一種新聞思維和觀念的轉(zhuǎn)變。數(shù)據(jù)新聞立足于對(duì)新近發(fā)生的事件予以數(shù)據(jù)支持,或者從大量數(shù)據(jù)中提取出可供報(bào)道的事實(shí)性信息。這一描述既適用于新聞?lì)I(lǐng)域,也適用于其他學(xué)科,對(duì)數(shù)據(jù)的大量使用,乃至自然科學(xué)的研究范式的引入,具有一定的解釋效應(yīng)。簡(jiǎn)言之,數(shù)據(jù)是提煉信息的基礎(chǔ),我們能夠從數(shù)據(jù)中提取信息,從信息中提煉知識(shí)。反過(guò)來(lái)講,一個(gè)學(xué)科成熟的標(biāo)志,正是其能夠被數(shù)據(jù)化解構(gòu),被數(shù)據(jù)描述。對(duì)于數(shù)據(jù)的理論構(gòu)建甚至爭(zhēng)議也是近年來(lái)學(xué)界熱門(mén)的話題。拋開(kāi)這些深層次的學(xué)術(shù)探討,對(duì)本書(shū)的讀者,或者數(shù)據(jù)領(lǐng)域的初學(xué)者來(lái)說(shuō),正確認(rèn)識(shí)數(shù)據(jù)在認(rèn)知體系中的位置和角色,是培養(yǎng)數(shù)據(jù)素養(yǎng)的第一步。接下來(lái)本書(shū)將對(duì)數(shù)據(jù)的認(rèn)知過(guò)程進(jìn)行分解。這一過(guò)程大致包括:獲取數(shù)據(jù)—評(píng)估和清洗數(shù)據(jù)—分析數(shù)據(jù)—可視化數(shù)據(jù)。也許有時(shí)候因?yàn)榉止さ募?xì)致,我們的工作會(huì)局限于其中的某個(gè)部分,但是對(duì)于希望習(xí)得數(shù)據(jù)素養(yǎng)的初學(xué)者而言,需要明確的是,上述步驟共同構(gòu)建了我們與數(shù)據(jù)打交道的全過(guò)程,培養(yǎng)數(shù)據(jù)素養(yǎng),上述流程的學(xué)習(xí)缺一不可。
……