本書介紹了指數(shù)*圖模型的基本概念和原理,展示了該模型的建模和使用方法以及在實踐中應(yīng)當(dāng)如何運用該模型。指數(shù)*圖模型主要用于社會網(wǎng)絡(luò)分析。相比傳統(tǒng)的描述性方法,指數(shù)*圖模型作為一種統(tǒng)計方法能夠更好地構(gòu)建社會網(wǎng)絡(luò)結(jié)構(gòu)模型。雖然指數(shù)*圖模型是為了應(yīng)對網(wǎng)絡(luò)數(shù)據(jù)中內(nèi)在的非獨立性,但是該模型的結(jié)果通常都以類似于邏輯回歸的方式進行展示和闡釋,從而使其成為檢驗社會系統(tǒng)的有用方法。近年來統(tǒng)計軟件的開發(fā)和進步幫助社會科學(xué)家也能輕松地使用指數(shù)*圖模型,但關(guān)于該模型的使用卻還沒有一個簡明清晰的指導(dǎo)。因此,本書旨在填補這一空缺,帶領(lǐng)讀者通過使用R統(tǒng)計軟件和statnet軟件包,學(xué)習(xí)指數(shù)*圖模型的建模和使用操作。
本書介紹了指數(shù)*圖模型(ERGM)的發(fā)展歷程、基本概念和原理,展示了該模型的建模和使用方法以及在實踐中應(yīng)當(dāng)如何運用該模型,有助于讀者了解和初步掌握社會網(wǎng)絡(luò)分析方法和統(tǒng)計網(wǎng)絡(luò)模型。在模型建構(gòu)部分,本書從R軟件和statnet軟件包的獲取與準備、數(shù)據(jù)獲取與探索、模型建構(gòu)和曲線指數(shù)族模型等幾個步驟入手,詳細解說了指數(shù)*圖模型的建模方法。本書作為指數(shù)*圖模型建構(gòu)和使用方法的指導(dǎo)書籍,不僅填補了此前沒有該模型系統(tǒng)的建構(gòu)和使用指南的空缺,而且也具有很高的可操作性,幫助讀者學(xué)習(xí)指數(shù)*圖模型。
自20世紀初喬治·齊美爾(GeorgSimmel)首次論述社會網(wǎng)絡(luò)相關(guān)問題以來(Simmel&Wolff,1950),社會科學(xué)家對于個體之間、組織之間以及其他實體之間相互關(guān)聯(lián)的網(wǎng)絡(luò)問題一直保持高度的關(guān)注(參見例如Fienberg,2012)。20世紀30年代,心理醫(yī)生雅各布·莫雷諾(JacobMoreno,1934)的工作為社會網(wǎng)絡(luò)研究奠定了基礎(chǔ),并將此領(lǐng)域命名為社會計量學(xué)(sociometry)。在莫雷諾的諸多重要成果中,核心成果便是發(fā)明了社群圖(sociogram)方法,通過將個體圖形化表示為節(jié)點,個體之間聯(lián)系圖形化表示為連線的形式,社群圖方法就能夠用來解釋社會結(jié)構(gòu)問題。
在社會網(wǎng)絡(luò)分析發(fā)展的歷程中,社群圖方法被證明是十分重要的,原因之一是社群圖方法將圖論的基礎(chǔ)理論引入到了社會網(wǎng)絡(luò)分析中來。圖論是一個專門處理由節(jié)點(點)以及相連的邊(連線)所組成的數(shù)學(xué)分支,其中,網(wǎng)絡(luò)圖既可以是有向的,即網(wǎng)絡(luò)中的邊通常由從一個節(jié)點到另一個節(jié)點的箭頭所表示,從而展現(xiàn)節(jié)點之間潛在的非對稱聯(lián)系;網(wǎng)絡(luò)圖也可以是無向的,直接用線段來表示網(wǎng)絡(luò)中的邊。大多數(shù)研究社會網(wǎng)絡(luò)的傳統(tǒng)方法都是來源于圖論的,社會科學(xué)中的定量研究方法應(yīng)用系列叢書(QASS)中,有一本較早的著作,是由諾克和楊(Knoke&Yang,2008)撰寫的《社會網(wǎng)絡(luò)分析》,該書就主要是采用這種(傳統(tǒng))方法。
傳統(tǒng)的網(wǎng)絡(luò)分析方法主要是描述性的,并不采用具有統(tǒng)計學(xué)意義上的隨機變量模型構(gòu)建方法。明確提出以網(wǎng)絡(luò)結(jié)構(gòu)為中心建立概率模型的思想可以追溯到20世紀中葉,即吉爾伯特、艾多斯以及瑞尼(Gilbert,1959;Erdos&Renyi,1959)解釋了網(wǎng)絡(luò)結(jié)構(gòu)中最為基礎(chǔ)的零模型(nullmodel)。在零模型中,所有的節(jié)點對都是以同等的概率建立連線,無論是在有向網(wǎng)絡(luò)還是無向網(wǎng)絡(luò)中,簡單圖模型都是被最廣泛采用的模型。
20年之后,霍蘭德和萊因哈特(Holland&Leindardt,1981)引入了一種針對有向圖的Gilbert-Erdos-Renyi零模型的變種。其中,關(guān)系形成(tieformation)的概率受到個體的群集性(gregariousness,個體對外與他人建立聯(lián)系的屬性)以及受歡迎程度(popularity,他人與該個體建立聯(lián)系的屬性)的影響。在此之后不久,1981年,芬博格和沃瑟曼(Fienberg&Wasserman,1981)將霍蘭德和萊因哈特的p1模型改造為對數(shù)線性模型,對數(shù)線性模型是一種為統(tǒng)計學(xué)家和社會科學(xué)家所熟知的模型,這樣一來,學(xué)者們就可以方便對模型的參數(shù)進行最大似然估計了。此外,芬博格和沃瑟曼還對p1模型進行了擴展,將網(wǎng)絡(luò)的互惠性(reciprocity)特征納入到模型中來,并以互惠性特征作為網(wǎng)絡(luò)連線概率增強的機制例如,在一個朋友網(wǎng)絡(luò)中,如果A選擇B,那么,B選擇A的概率就會提升。
正如詹寧·哈瑞斯(JenineHarris)在本書中所解釋的,吉爾伯特等人的零模型,霍蘭德和萊因哈特的p1模型,以及芬博格和沃瑟曼(1981)的擴展模型都是指數(shù)隨機圖模型(exponentialrandomgraphmodels,EGRMs)家族的成員。過去30年里,指數(shù)隨機圖模型的研究取得了長足的進展,而且已經(jīng)成為了目前社會網(wǎng)絡(luò)分析中最重要的統(tǒng)計工具。在這個進程中,指數(shù)隨機圖模型不斷彰顯著自己在展現(xiàn)社會網(wǎng)絡(luò)結(jié)構(gòu)特征分析方面的洞察力,例如對聚類或聚簇的分析。
近年來,面對大數(shù)據(jù)分析所帶來的挑戰(zhàn)與激勵,計算機科學(xué)家和統(tǒng)計物理學(xué)家,與統(tǒng)計學(xué)家、社會科學(xué)家并肩作戰(zhàn),對社會網(wǎng)絡(luò)分析的發(fā)展起到了直接推動作用。源于社會生活中的大型網(wǎng)絡(luò)數(shù)據(jù)尤為龐大與復(fù)雜,如Facebook的數(shù)據(jù),這也促使研究人員必須不斷研究更為復(fù)雜的網(wǎng)絡(luò)模型,不斷改進統(tǒng)計軟件的計算能力,以確保研究的模型能夠適應(yīng)大數(shù)據(jù)的環(huán)境。哈瑞斯在其書中介紹了由statnet團隊所研發(fā)的最先進的網(wǎng)絡(luò)分析軟件(Handcocketal.,2003),該軟件是針對R的統(tǒng)計計算環(huán)境而開發(fā)的(RCoreTeam,2013),是一款廣泛使用的、免費且開源的統(tǒng)計分析平臺。
本書介紹了如何建立指數(shù)隨機圖模型,并解釋了如何在實踐中使用該模型,詹寧·哈瑞斯的工作對于采用社會網(wǎng)絡(luò)分析的社會學(xué)家而言十分重要。我希望她的這本著作將會有較廣泛的讀者群,同時,期待該書能夠?qū)ι鐣茖W(xué)中社會網(wǎng)絡(luò)分析質(zhì)量的提升產(chǎn)生實質(zhì)性的影響。
約翰·福克斯(JohnFox)
詹寧·K.哈瑞斯(Jenine K. Harris),美國圣路易斯華盛頓大學(xué)布朗學(xué)院副教授,教授公共衛(wèi)生和社會工作研究生課程。主要研究領(lǐng)域為公共衛(wèi)生和社會工作。目前的研究主要采用復(fù)雜統(tǒng)計網(wǎng)絡(luò)模型,以更好地理解和解釋美國地方衛(wèi)生部門的溝通網(wǎng)絡(luò)聯(lián)系,尤其是社交媒體聯(lián)系。
序
第1章 網(wǎng)絡(luò)分析方法的希望與挑戰(zhàn)
第1節(jié) 歷史與概念
第2節(jié) 網(wǎng)絡(luò)術(shù)語
第2章 統(tǒng)計網(wǎng)絡(luò)模型
第1節(jié) 簡單隨機圖
第2節(jié) ERGM的發(fā)展
第3節(jié) 本章小結(jié)
第3章 建立一個有效的指數(shù)隨機圖模型
第1節(jié) 軟件獲取與準備
第2節(jié) 數(shù)據(jù)獲取
第3節(jié) 數(shù)據(jù)探索
第4節(jié) 模型構(gòu)建
第5節(jié) 曲線指數(shù)族模型
第4章 面向有向網(wǎng)絡(luò)及二元組屬性的應(yīng)用
第1節(jié) 針對有向網(wǎng)絡(luò)的研究
第2節(jié) 將二元組和網(wǎng)絡(luò)協(xié)變量作為預(yù)測變量
第5章 結(jié)論與建議
附錄
參考文獻
譯名對照表
譯后記