本書介紹了針對社會科學(xué)研究中經(jīng)常遇到的樣本數(shù)據(jù)缺失的處理方法。樣本數(shù)據(jù)缺失是指樣本中出現(xiàn)各種統(tǒng)計變量的缺失,以往研究者喜歡將這種缺失認定為符合完全隨機缺失的特性,但實際上這一假設(shè)并不一定能完全符合,往往只能符合隨機缺失的特性,在對這種數(shù)據(jù)缺失進行處理時,往往會出現(xiàn)刪除大量數(shù)據(jù)導(dǎo)致影響統(tǒng)計結(jié)果的問題。本書的主要內(nèi)容在于介紹了在有缺失數(shù)據(jù)時如何進行*似然估計的方法。除此之外,本書還對插補的EM算法、多重插補法等方法進行了介紹。并討論了不可忽略的缺失數(shù)據(jù)。
1.《缺失數(shù)據(jù)》從美國大專院校畢業(yè)率的數(shù)據(jù)為例,深入淺出地闡述了缺失數(shù)據(jù)這一主題。
2.《缺失數(shù)據(jù)》介紹了多種*的解決缺失數(shù)據(jù)問題的方法,有很強的實用性。
保羅 D. 阿利森(Paul D. ALLISON) 美國賓州大學(xué)社會學(xué)教授。于1976年由威斯康辛大學(xué)獲得博士學(xué)位,之后在芝加哥大學(xué)及賓州大學(xué)作統(tǒng)計學(xué)的博士后研究。關(guān)于社會科學(xué)中的統(tǒng)計方法,他已出版5本書及超過25篇文章。這些作品處理廣泛多樣的方法,包含線性回歸、對數(shù)線性分析、logit分析、probit分析、測量誤差、不平等測量、缺失數(shù)據(jù)、Markov processes及事件史分析。
序
第1章 導(dǎo)論
第2章 假設(shè)
第1節(jié) 完全隨機缺失的
第2節(jié) 隨機缺失的
第3節(jié) 可忽略的
第4節(jié) 不可忽略的
第3章 傳統(tǒng)的方法
第1節(jié) 成列刪除
第2節(jié) 成對刪除
第3節(jié) 虛擬變量調(diào)整
第4節(jié) 插補
第5節(jié) 總結(jié)
第4章 最大似然
第1節(jié) 回顧最大似然估計法
第2節(jié) 有缺失數(shù)據(jù)的ML
第3節(jié) 列聯(lián)表數(shù)據(jù)
第4節(jié) 具正態(tài)分布數(shù)據(jù)的線性模型
第5節(jié) EM算法
第6節(jié) EM實例
第7節(jié) 直接ML
第8節(jié) 直接ML實例
第9節(jié) 結(jié)論
第5章 多重插補:基本原理
第1節(jié) 單一隨機插補
第2節(jié) 多元隨機插補
第3節(jié) 在參數(shù)估計值中考慮隨機變異
第4節(jié) 在多變量正態(tài)模型下的多重插補
第5節(jié) 多變量正態(tài)模型的數(shù)據(jù)擴增法
第6節(jié) 在數(shù)據(jù)擴增法中收斂
第7節(jié) 連續(xù)的數(shù)據(jù)擴增法相對平行的數(shù)據(jù)擴增法
第8節(jié) 對非正態(tài)或類別數(shù)據(jù)使用正態(tài)模型
第9節(jié) 探索分析
第10節(jié) MI實例1
第6章 多重插補:復(fù)雜化
第1節(jié) MI中的交互作用和非線性
第2節(jié) 插補模型和分析模型之適合性
第3節(jié) 插補中因變量所扮演的角色
第4節(jié) 在插補過程中使用額外的變量
第5節(jié) 多重插補的其他參數(shù)方法
第6節(jié) 無參數(shù)及部分參數(shù)方法
第7節(jié) 連續(xù)的廣義回歸模型
第8節(jié) 線性假設(shè)檢驗和最大似然比檢驗
第9節(jié) MI實例2
第10節(jié) 長期的及其他集群數(shù)據(jù)的MI
第11節(jié) MI實例3
第7章 不可忽略的缺失數(shù)據(jù)
第1節(jié) 兩種模型
第2節(jié) Heckman的樣本選擇誤差模型
第3節(jié) 形態(tài)混合模型的ML估計
第4節(jié) 形態(tài)混合模型的多重插補
第8章 總結(jié)與結(jié)論
注釋
參考文獻
譯名對照表