關(guān)于我們
書(shū)單推薦
新書(shū)推薦
|
合作的進(jìn)化(修訂版)
本書(shū)是博弈論的經(jīng)典之作,作者的一個(gè)重要結(jié)論就是人們相互作用越頻繁,合作的可能性就越大。關(guān)于書(shū)名,所謂合作的進(jìn)化,也就是說(shuō),合作不是自然產(chǎn)生的,而是要經(jīng)過(guò)一個(gè)過(guò)程的“進(jìn)化”才能達(dá)成。在這個(gè)進(jìn)化過(guò)程中,人們通過(guò)學(xué)習(xí)、試錯(cuò)逐步向合作演化。書(shū)中對(duì)于合作提出了幾點(diǎn)建議:不要嫉妒,不要首先背叛,對(duì)合作和背叛都要給以回報(bào),不要耍小聰明,并積極參與社會(huì)的各種合作,促進(jìn)合作的進(jìn)化,通過(guò)進(jìn)化而逐步成熟,最后達(dá)到“合作”與“和諧”。這也正是本書(shū)的意義所在。
本書(shū)是行為領(lǐng)域的經(jīng)典之作,主題是合作的產(chǎn)生和進(jìn)化。作者以組織的兩輪“重復(fù)囚徒困境”競(jìng)賽為研究對(duì)象,結(jié)果發(fā)現(xiàn)在兩輪競(jìng)賽中勝出的都說(shuō)較簡(jiǎn)單的策略“一報(bào)還一報(bào)”。這一策略簡(jiǎn)介明晰,具有善良性、寬容性、可激怒性和策略性,其出色的競(jìng)賽表現(xiàn)為我們了解個(gè)人、組織和國(guó)家間合作產(chǎn)生和進(jìn)化提供了積極的前景,其結(jié)論在社會(huì)科學(xué)的諸領(lǐng)域產(chǎn)生了廣泛深刻的影響,被廣泛征引。
這是一本樂(lè)觀的書(shū),但這種樂(lè)觀是可信的,它不是天上掉餡餅式的、不切實(shí)際的天真愿望(或者革命的狂熱)。
為了可信,一個(gè)樂(lè)觀主義者首先必須承認(rèn)基本的現(xiàn)實(shí),它既包括人性的現(xiàn)實(shí),也包括所有生命本性的現(xiàn)實(shí)。這里所說(shuō)的生命是達(dá)爾文意義上的生命,它涵蓋宇宙里的所有生命。在適者生存的達(dá)爾文世界里,充滿(mǎn)著那些使得生存者生存下來(lái)的特質(zhì)。按照達(dá)爾文的說(shuō)法,我們悲觀地假設(shè)生命在自然選擇這一層面是極端自私的,對(duì)苦難無(wú)情地冷漠,殘忍地?fù)p人利己。然而從這個(gè)被扭曲的起點(diǎn)開(kāi)始,即使不必是刻意的,類(lèi)似于友善的兄弟姐妹般的伙伴關(guān)系也會(huì)出現(xiàn)。這就是羅伯特?阿克塞爾羅德這本不平凡的書(shū)要傳遞的令人振奮的信息。 我寫(xiě)這個(gè)前言費(fèi)了不少周折。20世紀(jì)70年代后期,在我的第一本書(shū),也就是闡釋了上述悲觀原理的《自私的基因》出版之后幾年,我意外地收到我原本不認(rèn)識(shí)的美國(guó)政治學(xué)家羅伯特?阿克塞爾羅德寄來(lái)的信件,他發(fā)起了一個(gè)“重復(fù)囚徒困境”的計(jì)算機(jī)游戲競(jìng)賽,并邀請(qǐng)我參加競(jìng)賽。更準(zhǔn)確地說(shuō),他邀請(qǐng)我提交一個(gè)計(jì)算機(jī)程序去參賽,這也表明了人和計(jì)算機(jī)的最重要差別是計(jì)算機(jī)程序沒(méi)有有意識(shí)的遠(yuǎn)見(jiàn)。其實(shí),那時(shí)我并不想?yún)①,但我深深被這個(gè)主意所吸引,即使是被動(dòng)的,我也為這件事做了點(diǎn)有價(jià)值的貢獻(xiàn)。阿克塞爾羅德是一位政治學(xué)教授,依我之見(jiàn),他需要和進(jìn)化生物學(xué)家合作。我寫(xiě)了一封信給他,推薦了W.D.漢密爾頓,一位可以說(shuō)是當(dāng)時(shí)最杰出的達(dá)爾文主義者。很可惜,他后來(lái)在2000年一次不幸的剛果叢林探險(xiǎn)之后死去了。在70年代,漢密爾頓是阿克塞爾羅德所在的密歇根大學(xué)的同事,但在不同的系,他們互相不認(rèn)識(shí)。收到我的信之后阿克塞爾羅德立即與漢密爾頓聯(lián)系,他們合寫(xiě)的論文是這本書(shū)的基礎(chǔ),并縮寫(xiě)為本書(shū)的第五章。這篇論文與本書(shū)的題目一樣,發(fā)表在1981年的《科學(xué)》雜志上,并獲得美國(guó)科學(xué)促進(jìn)協(xié)會(huì)的紐康伯?克利夫蘭獎(jiǎng)。 《合作的進(jìn)化》的第一版于1984年出版,我立即懷著極大的熱情閱讀它,并以傳福音的熱情向我遇見(jiàn)的所有人推薦。在這本書(shū)出版后的幾年中,牛津大學(xué)的我所教授的大學(xué)生都被要求寫(xiě)與阿克塞爾羅德這本書(shū)有關(guān)的論文,這是大家最愿意寫(xiě)的論文之一。但是這本書(shū)沒(méi)有在英國(guó)出版,一般情況下,書(shū)面的東西不像電視那樣容易受歡迎。于是,1985年,當(dāng)英國(guó)廣播公司(BBC)的杰里米?泰勒邀請(qǐng)我作為《地平線》節(jié)目的演講嘉賓時(shí),我非常高興地接受了,這個(gè)節(jié)目就是以阿克塞爾羅德的工作為基礎(chǔ)的。我們稱(chēng)這個(gè)節(jié)目為“好人先成功”。我不得不在一些我不習(xí)慣的地方做節(jié)目,在足球場(chǎng)、英國(guó)工業(yè)區(qū)的學(xué)校、廢棄的中世紀(jì)修道院、百日咳接種疫苗的診所和第一次世界大戰(zhàn)戰(zhàn)壕的復(fù)制品前。節(jié)目在1986年春天開(kāi)播,雖然我不知道是否是因?yàn)槲夷请y聽(tīng)的英格蘭口音,這個(gè)節(jié)目一直沒(méi)有在美國(guó)播出,但它還是取得了很大成功。它還使我在一段時(shí)間里成為“寬容的”、“不嫉妒的”和“善良的”公眾代表,至少減輕了我由于《自私的基因》而得到的所謂自私自利的布道士的惡名。我的節(jié)目被稱(chēng)為“好人先成功”,我被廣稱(chēng)為“好好先生”。如此贊譽(yù)并非來(lái)自書(shū)或節(jié)目的內(nèi)容。不過(guò),在節(jié)目播出幾周之后,我就被一些工業(yè)企業(yè)家請(qǐng)去吃飯,請(qǐng)教有關(guān)善良性的問(wèn)題。大不列顛一家領(lǐng)先的服裝連鎖店的老板請(qǐng)我吃午飯,專(zhuān)門(mén)解釋他的公司是如何善待他的員工的。一個(gè)大的糖果公司的女發(fā)言人也請(qǐng)我吃午飯,同樣是為了說(shuō)明在她的公司里銷(xiāo)售巧克力的內(nèi)在動(dòng)機(jī)不是為了賺錢(qián)而是為了在民眾中傳播甜蜜和幸福。我擔(dān)心這兩位都有些說(shuō)不到點(diǎn)子上。 我被一家世界上最大的計(jì)算機(jī)公司請(qǐng)去組織他們的高管進(jìn)行一個(gè)一整天的策略游戲,目的是讓他們一起友善地合作。他們被分成紅、藍(lán)、綠三組,游戲和本書(shū)的主題“囚徒困境”游戲差不多。不幸的是,這個(gè)公司想達(dá)到的合作目標(biāo)并沒(méi)有實(shí)現(xiàn)。就像羅伯特?阿克塞爾羅德預(yù)言的一樣,雖然宣布游戲在下午4點(diǎn)結(jié)束,但紅方和綠方很快在這個(gè)時(shí)間點(diǎn)前就陷入一連串的背叛之中。在我引導(dǎo)的討論會(huì)上,對(duì)于突然打破先前一天的好愿望大家都感覺(jué)很糟。這些高管要想被說(shuō)服再在一起工作之前必須接受咨詢(xún)。 1989年,我應(yīng)牛津大學(xué)出版社的要求出《自私的基因》的第二版。其中的兩章包含了這十幾年來(lái)最讓我興奮的兩本書(shū)的內(nèi)容,當(dāng)然其中首先是阿克塞爾羅德的研究,還是叫“好人先成功”。當(dāng)時(shí)我還是覺(jué)得阿克塞爾羅德的書(shū)應(yīng)該在我的國(guó)家出版,于是我主動(dòng)找了企鵝出版社,很高興他們接受了我的推薦,決定出版并請(qǐng)我為他們的英國(guó)平裝版寫(xiě)序。今天,我更高興的是羅伯特?阿克塞爾羅德自己邀請(qǐng)我為他的新版書(shū)更新這個(gè)序。 毫不夸張地說(shuō),在《合作的進(jìn)化》出版20年來(lái),它已經(jīng)形成一個(gè)新的研究領(lǐng)域。1988年,阿克塞爾羅德和他的同事道格拉斯?戴恩編輯了一個(gè)和《合作的進(jìn)化》有關(guān)的研究出版物的注釋文獻(xiàn),他們列出了到當(dāng)時(shí)為止的250多個(gè)在“政治與法律”、“經(jīng)濟(jì)學(xué)”、“社會(huì)學(xué)和人類(lèi)學(xué)”、“生物學(xué)應(yīng)用”、“進(jìn)化論”、“自動(dòng)理論(計(jì)算機(jī)科學(xué))”、“新的競(jìng)賽”及“其他”條目下的研究論文。阿克塞爾羅德和戴恩還合作在《科學(xué)》(1988年,第242卷,第1385—1390頁(yè))雜志上發(fā)表了題為《合作進(jìn)化的進(jìn)展》的論文,總結(jié)了1984年以來(lái)在這個(gè)領(lǐng)域的進(jìn)展。從那篇綜述以來(lái),大約二十年過(guò)去了,被這本書(shū)激發(fā)出來(lái)的研究結(jié)果還在繼續(xù)增加。下圖是每年引用羅伯特?阿克塞爾羅德研究的科學(xué)論文的數(shù)量,圖形曲線在《合作的進(jìn)化》這本書(shū)出版的1984年后,變得向上陡峭起來(lái),它清楚地說(shuō)明一本有影響力的書(shū)對(duì)這個(gè)領(lǐng)域的發(fā)展所具有的作用。合作理論的進(jìn)展出現(xiàn)在關(guān)于預(yù)防戰(zhàn)爭(zhēng)(Huth1988)、社會(huì)進(jìn)化(Trivers 1985)、動(dòng)物之間的合作(Dugatkin 1997)、人類(lèi)歷史(Wright 2000)、進(jìn)化對(duì)策論(Gintis 2000)、建立社會(huì)資本的信任和回報(bào)的網(wǎng)絡(luò)(Putnam 2000)、微觀經(jīng)濟(jì)學(xué)(Bowles 2004)、科幻小說(shuō)(Anthony 1986)的書(shū)籍中和羅伯特?阿克塞爾羅德自己的書(shū)中(1997和2001)。每年引用羅伯特?阿克塞爾羅德研究的論文數(shù)量但在認(rèn)真思考這一大堆新的研究之時(shí),我留下的最主要的印象是這本書(shū)的基本結(jié)論并不需要改變。這幾年我堅(jiān)持不懈地向?qū)W生、同事和見(jiàn)到的熟人介紹這些結(jié)論。我確實(shí)認(rèn)為,如果每一個(gè)人都學(xué)習(xí)和理解它,這個(gè)星球就會(huì)更美好。世界的領(lǐng)袖們將陷入這本書(shū)所說(shuō)的困境,直到他們讀了這本書(shū)之后才能解脫。這對(duì)他們來(lái)說(shuō)是件好事,而對(duì)我們其他人來(lái)說(shuō)是福音!逗献鞯倪M(jìn)化》值得取代圣經(jīng)。 理查德·道金斯2006年6月于牛津
羅伯特·阿克塞爾羅德,密歇根大學(xué)政治學(xué)與公共政策教授,美國(guó)科學(xué)院院士,著名的行為分析與博弈論專(zhuān)家。除本書(shū)外,還著有《合作的復(fù)雜性》等著作。
序 理查德·道金斯/1
中文版前言/1 英文版前言/1 第一部分 導(dǎo)論 第一章 合作的問(wèn)題/3 第二部分 合作的出現(xiàn) 第二章 “一報(bào)還一報(bào)”在計(jì)算機(jī)競(jìng)賽中的勝利/19 第三章 合作的建立/38 第三部分 沒(méi)有友誼和預(yù)見(jiàn)的合作 第四章 第一次世界大戰(zhàn)塹壕戰(zhàn)中的“自己活也讓別人活”的系統(tǒng)/51 第五章 生物系統(tǒng)中的合作進(jìn)化(與威廉·D.漢密爾頓合著)/62 第四部分 對(duì)參與者和改革者的建議 第六章 如何有效地選擇/77 第七章 如何促進(jìn)合作/88第五部分結(jié)論 第八章 合作的社會(huì)結(jié)構(gòu)/101 第九章 回報(bào)的魯棒性/118 附錄A 競(jìng)賽結(jié)果/132 附錄B 理論命題的證明/145 參考文獻(xiàn)/153 譯后記/167
第六章如何有效地選擇第六章如何有效地選擇
雖然預(yù)見(jiàn)對(duì)于合作的進(jìn)化不是必要的,但它卻對(duì)我們很有幫助。因此這一章和下一章將分別對(duì)參與者和改革者提供建議。 這一章為那些處于“囚徒困境”的人提供建議。從個(gè)體的眼光看,目標(biāo)是在與對(duì)手的一系列對(duì)局中盡可能地得高分。由于這個(gè)游戲是“囚徒困境”,參與者會(huì)受到背叛的短期誘惑,但是通過(guò)與對(duì)方建立雙方合作的模式可以得到更多的長(zhǎng)期好處。對(duì)計(jì)算機(jī)競(jìng)賽的分析和理論研究的結(jié)果,為我們提供了一些有用的信息,即在不同的條件下什么樣的策略會(huì)起作用和為什么這些策略能表現(xiàn)得好。這一章就是把這些發(fā)現(xiàn)轉(zhuǎn)化成對(duì)參與者的建議。 在持續(xù)的“重復(fù)囚徒困境”中應(yīng)如何表現(xiàn),下面是四個(gè)簡(jiǎn)單的建議: 1.不要嫉妒; 2.不要首先背叛; 3.對(duì)合作與背叛都要給以回報(bào); 4.不要耍小聰明。 不要嫉妒 人們習(xí)慣于考慮零和博弈,在這種情況下,一個(gè)人贏,另一個(gè)就輸。一個(gè)很好的例子就是下棋比賽。為了能贏,一個(gè)參賽者必須在大部分時(shí)間里比對(duì)手做得更好。白棋贏黑棋就輸。 然而生活中的大多數(shù)情況都是非零和的。一般來(lái)說(shuō),雙方可以都做得很好,也可以都做得很差。雙方的合作是可能的,但并不是總能實(shí)現(xiàn)。這就是為什么“囚徒困境”是各種各樣的日常情形的有用模型。 在我的課堂中,我經(jīng)常讓幾對(duì)學(xué)生玩幾十步“囚徒困境”游戲。我告訴他們目標(biāo)是他們自己得分,就像每一分就是一美元一樣。我還告訴他們不要理會(huì)他們的得分是比對(duì)手好一些或差一些。只要他們能得到盡可能多的“美元”。 但是,這些指導(dǎo)一點(diǎn)也不起作用,學(xué)生們總是要找一個(gè)相對(duì)的標(biāo)準(zhǔn)來(lái)衡量他們是做得好還是做得差。他們通常使用的標(biāo)準(zhǔn)是把他們的得分與對(duì)手的得分相比較。遲早,一個(gè)學(xué)生為了領(lǐng)先或?yàn)榱丝纯磿?huì)發(fā)生什么而背叛,另一個(gè)學(xué)生也不甘落后而背叛。因此,情況由于雙方的相互報(bào)復(fù)而惡化了。不久雙方便會(huì)認(rèn)識(shí)到他們做得不夠好,其中一人試圖恢復(fù)雙方的合作,但另一個(gè)人不能肯定這是否是對(duì)方的一個(gè)花招,擔(dān)心一旦合作開(kāi)始后又要被占便宜。 人們傾向于采用相對(duì)的標(biāo)準(zhǔn),這個(gè)標(biāo)準(zhǔn)經(jīng)常把對(duì)方的成功與自己的成功聯(lián)系起來(lái)。這種標(biāo)準(zhǔn)導(dǎo)致了嫉妒,嫉妒又導(dǎo)致企圖抵消對(duì)方已經(jīng)得到的優(yōu)勢(shì)。在“囚徒困境”的形式下,抵消對(duì)方的優(yōu)勢(shì)只能通過(guò)背叛來(lái)實(shí)現(xiàn)。但是背叛導(dǎo)致更多的背叛和對(duì)雙方的懲罰。因此嫉妒是自我毀滅。 要求自己比對(duì)方做得好不是一個(gè)很好的標(biāo)準(zhǔn),除非你的目的是消滅對(duì)方。在大多數(shù)情況下,這個(gè)目的是不可能實(shí)現(xiàn)的,或者追求這個(gè)目的有可能導(dǎo)致危險(xiǎn)的沖突。如果你并不想消滅對(duì)方,比較你的得分與對(duì)方的得分就可能產(chǎn)生自我毀滅的嫉妒。一個(gè)更好的相對(duì)標(biāo)準(zhǔn)是把你所做的與處在相同情況下的其他人所做的做比較。對(duì)于一個(gè)給定的對(duì)方策略,你是否做得最好?其他人在這種情況下能做得更好嗎?這就是檢驗(yàn)表現(xiàn)是否成功的一個(gè)很好的標(biāo)準(zhǔn)。 “一報(bào)還一報(bào)”由于與其他多種多樣策略相處得很好而贏得了競(jìng)賽。平均來(lái)說(shuō),它比競(jìng)賽中的其他任何策略都做得更好。但是“一報(bào)還一報(bào)”從來(lái)沒(méi)有一次在游戲中比對(duì)方得更多的分!事實(shí)上,它不可能比對(duì)方多得分。它總是讓對(duì)方先背叛,并且它的背叛次數(shù)絕不比對(duì)方的多。因此“一報(bào)還一報(bào)”不是得到和對(duì)方一樣多的分,就是比對(duì)方略少。“一報(bào)還一報(bào)”贏得競(jìng)賽不是靠打擊對(duì)方,而是靠從對(duì)方引出使雙方有好處的行為!耙粓(bào)還一報(bào)”如此堅(jiān)持引出雙方有利的結(jié)果,從而使它獲得比其他任何策略更高的總分。 因此在一個(gè)非零和的世界里,為了你自己做得好,你沒(méi)有必要非得比對(duì)方做得更好。特別當(dāng)你要和許多不同的對(duì)手打交道時(shí)更是這樣。只要你自己能做得更好就讓他們每個(gè)人做得和你一樣或略好些。沒(méi)有理由去嫉妒對(duì)方的成功。因?yàn)樵陂L(zhǎng)時(shí)間的“重復(fù)囚徒困境”中,其他人的成功是你自己成功的前提。 國(guó)會(huì)是一個(gè)很好的例子。國(guó)會(huì)議員可以相互合作而不威脅到各自在選區(qū)的名望。對(duì)于一個(gè)議員的主要威脅不是另一個(gè)來(lái)自這個(gè)國(guó)家其他地區(qū)的議員的相對(duì)成功,而是來(lái)自可能在選區(qū)進(jìn)行挑戰(zhàn)的人。因此妒忌其他議員從雙方合作得來(lái)的成功是沒(méi)有多大意義的。 在生意場(chǎng)中也是這樣,一個(gè)從供應(yīng)商那兒買(mǎi)來(lái)東西的公司期望有一個(gè)供方和買(mǎi)方都有好處的成功的關(guān)系。妒忌供方的利潤(rùn)是完全沒(méi)有意義的。任何通過(guò)不合作行為(如不按時(shí)付賬)來(lái)減少這種利潤(rùn)的企圖,都將激起供方的報(bào)復(fù)行動(dòng),報(bào)復(fù)行為可以采用多種形式,經(jīng)常以不明顯懲罰形式,諸如拖延發(fā)貨,較低的質(zhì)量保證,不愿意打折扣,或者不交換市場(chǎng)條件變化的信息(Macaulay 1963)。這種報(bào)復(fù)使得嫉妒代價(jià)很大。買(mǎi)者不要擔(dān)心賣(mài)方的相對(duì)利潤(rùn),而可以考慮是否有其他更好的購(gòu)買(mǎi)策略。 不要首先背叛 競(jìng)賽和理論分析的結(jié)果都表明,只要對(duì)方合作,你合作就會(huì)有好處。第二章中的競(jìng)賽結(jié)果是很令人吃驚的。決定一個(gè)規(guī)則表現(xiàn)如何的唯一最好的特征是這個(gè)規(guī)則是否善良,也就是說(shuō)這個(gè)規(guī)則是否不首先背叛。在第一輪競(jìng)賽中,前8名規(guī)則都是善良的,在后7名規(guī)則中沒(méi)有一個(gè)是善良的。在第二輪競(jìng)賽中,前15名規(guī)則中只有一個(gè)是非善良的(它名列第8),而后15名規(guī)則中只有一個(gè)是善良的。 有些不善良的規(guī)則,使用相當(dāng)復(fù)雜的方法來(lái)試探它是否能逃脫懲罰。例如“檢驗(yàn)者”嘗試在第一步背叛,如果對(duì)方報(bào)復(fù)的話,它就馬上撤回。在另一例子中“鎮(zhèn)定者”傾向于在背叛前等待十幾步,看看對(duì)方是否能被哄騙和被偶爾占便宜。如果是的話,“鎮(zhèn)定者”就更頻繁地增加背叛,直到對(duì)方反擊而被迫撤回。但是這些嘗試首先背叛的策略都表現(xiàn)得不怎么好。因?yàn)榇嬖谠S多由于愿意報(bào)復(fù)而不被占便宜的策略,所以導(dǎo)致沖突的代價(jià)有時(shí)是很高的。 甚至許多專(zhuān)家也沒(méi)有意識(shí)到善良性對(duì)避免不必要的沖突的價(jià)值。在第一輪競(jìng)賽中,由對(duì)策專(zhuān)家送來(lái)的規(guī)則中幾乎有一半是不善良的。參考了第一輪的明顯結(jié)果,第二輪比賽中大約有1/3的規(guī)則采用不善良的策略,但是,它們都沒(méi)有占到便宜。 第三章的理論結(jié)果提供了另一個(gè)方式來(lái)說(shuō)明為什么善良的規(guī)則能表現(xiàn)得如此好。由于善良的規(guī)則相互之間相處得很好,因此善良規(guī)則的群體是很難被侵入的。而且能夠阻止單個(gè)變異個(gè)體侵入的善良規(guī)則的群體也能阻止這個(gè)變異規(guī)則的任何小群體的侵入。 理論的結(jié)果給善良策略的優(yōu)勢(shì)帶來(lái)了一個(gè)很大的限制,即當(dāng)未來(lái)的相遇相對(duì)于從背叛得到的直接好處不足夠重要時(shí),單等對(duì)方背叛就不是一個(gè)好主意。必須記住只有當(dāng)折扣系數(shù)w相對(duì)于收益參數(shù)R、S、T和P足夠大時(shí),“一報(bào)還一報(bào)”才是一個(gè)穩(wěn)定的策略。特別是命題2表明,如果折扣系數(shù)不足夠大,當(dāng)對(duì)方采用“一報(bào)還一報(bào)”時(shí),你最好采用“背叛”和“合作”交替的策略或甚至總是背叛。因此,如果對(duì)方似乎不再見(jiàn)面,馬上背叛比善良要好。 這個(gè)事實(shí)對(duì)于那些大家都知道的從一個(gè)地方遷移到另一個(gè)地方的群體有一個(gè)不幸的含義。一位人類(lèi)學(xué)家發(fā)現(xiàn)當(dāng)吉普賽人接近非吉普賽人時(shí),總怕惹上麻煩,非吉普賽人接近吉普賽人時(shí)總懷疑會(huì)被騙。 例如,一個(gè)醫(yī)生被叫去看一個(gè)病得很厲害的吉普賽小孩。他不是第一個(gè)被叫的醫(yī)生,但他是第一個(gè)愿意來(lái)的醫(yī)生。我們擁著他走向后臥室,但他在病人屋門(mén)前停下說(shuō):“這次上門(mén)是15美元,上次還欠我5美元,在我看病人之前付我20美元!薄靶,行,你會(huì)得到的,先看孩子吧,”吉普賽人懇求道。爭(zhēng)執(zhí)了幾個(gè)回合后我出面調(diào)停,付10美元后醫(yī)生查看了病人?床≈螅野l(fā)現(xiàn)這個(gè)吉普賽人出于報(bào)復(fù),根本就不想付那另外的10美元。(Gropper1975,pp.106—107) 在加利福尼亞社區(qū),時(shí)有發(fā)現(xiàn)吉普賽人不付醫(yī)生賬單,但是市政罰款卻都是馬上就付(Sutherland1975,p.70)。這些罰款大都是由于違反垃圾管理。這些吉普賽人每年冬天都回到同一城市?梢酝茰y(cè)這些吉普賽人知道他們必須繼續(xù)與這個(gè)城市的垃圾站打交道而不能換另一個(gè)。相反,在這個(gè)地區(qū)有足夠的醫(yī)生,得罪一個(gè)醫(yī)生,在需要時(shí)可以再找另一個(gè)。 短暫的接觸不是使首先背叛有好處的唯一條件,另一個(gè)可能性是合作得不到回報(bào)。如果其他人都采用“總是背叛”的策略。那么一個(gè)單一的個(gè)體就不可能做得比使用“總是背叛”更好。但是,如第三章所示,即使回報(bào)性策略(如“一報(bào)還一報(bào)”)之間相互作用的比例很小,采用“一報(bào)還一報(bào)”也比采用群體中大多數(shù)采用的“總是背叛”的策略好。第三章的數(shù)值例子說(shuō)明,只要5%的比例與類(lèi)似“一報(bào)還一報(bào)”的策略打交道就能使這個(gè)小群體的成員比大多數(shù)背叛的成員做得更好。 那么是否有人會(huì)回報(bào)某人最初的合作呢?在某些情形下是很難預(yù)測(cè)的。但是如果有足夠的時(shí)間嘗試各種不同的策略,并且在某種方式下,更成功的策略能變得更普遍,那么你就完全可以相信,會(huì)有人回報(bào)合作的。理由是,即使是一個(gè)相當(dāng)小的善良策略的群體也能侵入到“小人”的群體,并且在它們自己相互之間所得的高分的基礎(chǔ)上成長(zhǎng)起來(lái)。一旦善良的策略站穩(wěn)腳跟它們就能抵制“小人”的反侵入。 當(dāng)然,你可以嘗試更保險(xiǎn)的方式,即先背叛直到對(duì)方合作,才開(kāi)始合作。然而,競(jìng)賽的結(jié)果表明,這實(shí)際上是一個(gè)很有風(fēng)險(xiǎn)的策略,因?yàn)槟阕畛醯谋撑丫涂赡芤饘?duì)方的報(bào)復(fù)。并使你處于要么被占便宜要么雙方背叛的兩難境地。如果你懲罰對(duì)方的報(bào)復(fù),這種反應(yīng)就會(huì)一直延續(xù)下去。如果你寬恕了對(duì)方,你就得冒被欺負(fù)的風(fēng)險(xiǎn)。即使你能避免這些長(zhǎng)遠(yuǎn)問(wèn)題,對(duì)你的最初背叛的當(dāng)下報(bào)復(fù)會(huì)使你希望自己從一開(kāi)始就應(yīng)該是善良的。 對(duì)競(jìng)賽的生態(tài)分析揭示了另一個(gè)為什么首先背叛是很冒險(xiǎn)的道理。第二輪競(jìng)賽中前15名規(guī)則中唯一的非善良策略是名列第8的“哈林頓”。這個(gè)規(guī)則表現(xiàn)得很好。因?yàn)樗c競(jìng)賽中的名次較低的規(guī)則相遇時(shí)得分都很高。在假想的未來(lái)生態(tài)競(jìng)賽中,名次較低的規(guī)則在群體中的比例越來(lái)越小。最終能被這個(gè)最初挺成功的非善良策略占便宜的策略就越來(lái)越少,接著它自己也消亡了。因此生態(tài)分析說(shuō)明,與那些自己本身得分并不高的策略相遇你表現(xiàn)得很好是沒(méi)有用的,它只不過(guò)是一個(gè)自我毀滅的過(guò)程。這個(gè)教訓(xùn)說(shuō)明,雖然不善良在最初看來(lái)似乎是很有希望的,但長(zhǎng)期下去它將毀壞使自己成功所必需的環(huán)境。 對(duì)合作與背叛都要給予回報(bào) “一報(bào)還一報(bào)”超常的成功給出了一個(gè)簡(jiǎn)單的但又是很有力的建議:要回報(bào)。在第一步合作之后,“一報(bào)還一報(bào)”只是簡(jiǎn)單地回報(bào)對(duì)方在上一步的所為。這個(gè)簡(jiǎn)單的規(guī)則具有驚人的魯棒性。它贏得了第一輪“囚徒困境”計(jì)算機(jī)競(jìng)賽,并取得比任何其他由對(duì)策專(zhuān)家們送來(lái)的規(guī)則更高的平均得分。每一個(gè)第二輪競(jìng)賽的參加者都知道這個(gè)結(jié)果,但“一報(bào)還一報(bào)”又贏了第二輪競(jìng)賽。這個(gè)勝利顯然是令人驚訝的。因?yàn)槊恳粋(gè)參賽者是在考慮了“一報(bào)還一報(bào)”在第一輪競(jìng)賽中的勝利結(jié)果之后,才提交他們的參賽規(guī)則的。顯然人們都希望他們能干得更好,但是他們錯(cuò)了。 “一報(bào)還一報(bào)”不僅贏得競(jìng)賽本身,而且在假設(shè)的繼續(xù)比賽中比其他任何規(guī)則表現(xiàn)得都好。這表明“一報(bào)還一報(bào)”不僅與最初的各種規(guī)則相處得很好,而且能與那些可能在未來(lái)群體中占較大份額的成功的規(guī)則也相處得很好。它不毀壞自己成功的基礎(chǔ),相反,它在與其他成功的規(guī)則相互交往中繁榮起來(lái)。 “一報(bào)還一報(bào)”所體現(xiàn)的回報(bào)在理論上也是很重要的。當(dāng)未來(lái)相對(duì)于現(xiàn)在是足夠重要的時(shí)候,“一報(bào)還一報(bào)”是集體穩(wěn)定的。這就意味著,如果每個(gè)人都使用“一報(bào)還一報(bào)”策略,那么對(duì)一個(gè)特定的個(gè)體的最好建議就是也采用“一報(bào)還一報(bào)”策略;蛘哌@么說(shuō),如果你能肯定對(duì)方是采用“一報(bào)還一報(bào)”,并且這種交道將持續(xù)足夠長(zhǎng)時(shí)間,那么,你最好也采用相同的策略!耙粓(bào)還一報(bào)”的回報(bào)性的精彩之處在于它能在很大范圍的環(huán)境中表現(xiàn)出色。 事實(shí)上,“一報(bào)還一報(bào)”很善于區(qū)分哪些規(guī)則會(huì)回報(bào)它的最初合作而哪些則不會(huì)。從第三章引入的概念看,它是有最大識(shí)別力的。如命題6所示,這就使得它能夠以一種小群體的形式侵入“小人”的世界。并且,它回報(bào)背叛也回報(bào)合作。這使得它是可激怒的。命題4證明了,像“一報(bào)還一報(bào)”這樣的善良策略要阻止被侵入,就必須是可激怒的。 在反應(yīng)對(duì)方的背叛時(shí),“一報(bào)還一報(bào)”保持了懲罰和寬恕的平衡!耙粓(bào)還一報(bào)”總是在對(duì)方每次背叛之后只背叛一次。這樣它在競(jìng)賽中取得了成功。那么,是否總是嚴(yán)格的一對(duì)一回報(bào)才是最有效的平衡?這就很難說(shuō)了,因?yàn)樯杂胁煌胶獾囊?guī)則并沒(méi)有被提送參賽。但有一點(diǎn)是清楚的,即用多于一次背叛來(lái)回報(bào)對(duì)方的背叛將有可能使沖突升級(jí)。另一方面,少于一對(duì)一的回報(bào)將有被占便宜的危險(xiǎn)。 “兩報(bào)還一報(bào)”是一個(gè)只有當(dāng)對(duì)方在前兩步連續(xù)背叛時(shí),它才背叛的規(guī)則。因此它是一對(duì)二回報(bào)。這個(gè)相對(duì)寬容的規(guī)則如果被提送就會(huì)贏得第一輪競(jìng)賽。它能做得如此好是因?yàn)樗鼙苊馀c某些甚至引起“一報(bào)還一報(bào)”麻煩的其他規(guī)則陷入雙方報(bào)復(fù)的境地,但是當(dāng)它真的被送交參加第二輪競(jìng)賽時(shí),它甚至沒(méi)有進(jìn)入前1/3名次。原因是在第二輪競(jìng)賽中有些規(guī)則利用它對(duì)單一背叛的寬恕而占它的便宜。 以上分析的啟示是,最優(yōu)的寬恕水平與環(huán)境有關(guān)。特別是如果主要的危險(xiǎn)是來(lái)自那些善于占“好說(shuō)話”規(guī)則便宜的策略,那么,太多的寬恕就要付出代價(jià)。對(duì)一個(gè)給定的環(huán)境,準(zhǔn)確的平衡是很難確定的,但是,競(jìng)賽的結(jié)果證明,對(duì)背叛類(lèi)似一對(duì)一的反應(yīng)可能在大多數(shù)情況下都是相當(dāng)有效的。因此,對(duì)參與者的一個(gè)很好的建議是對(duì)合作和背叛都要給予回報(bào)。 不要耍小聰明 競(jìng)賽結(jié)果表明,在“囚徒困境”的情況下人們?nèi)菀姿P÷斆鳎欢鴱?fù)雜的規(guī)則并不比簡(jiǎn)單的規(guī)則做得更好。事實(shí)上,所謂最大化規(guī)則表現(xiàn)很差就是因?yàn)樗鼈兘?jīng)常陷入雙方背叛。這些規(guī)則的共同問(wèn)題是,使用一些復(fù)雜的方法來(lái)推斷對(duì)方。而這些推斷常常是錯(cuò)誤的。一部分問(wèn)題是對(duì)方經(jīng)常用試探性的背叛來(lái)表明它不會(huì)被引誘而合作,但是問(wèn)題的關(guān)鍵是這些最大化規(guī)則沒(méi)有考慮到它自己的行為會(huì)引起對(duì)方的變化。 在決定是否帶傘時(shí),我們并不需要擔(dān)心老天會(huì)考慮我們的行為。我們可以根據(jù)以往的經(jīng)驗(yàn),判斷下雨的可能性。在零和博弈中,如下棋,我們可以放心地假設(shè)對(duì)手將走他所能發(fā)現(xiàn)的最危險(xiǎn)的一步棋。并且我們可以依此去行動(dòng)。因此,在我們的分析中盡可能地精明和復(fù)雜是有好處的。 非零和博弈——像“囚徒困境”——并不是這樣。不像老天下雨,對(duì)方對(duì)你的行為是有反應(yīng)的,也不像下棋的對(duì)手,在“囚徒困境”中的對(duì)方不應(yīng)該被認(rèn)為是一心想背叛你的。對(duì)方將把你的行為看作你是否回報(bào)合作的信號(hào)。因此,你自己的行為將會(huì)反射到你的身上。 試圖使得分最大化的規(guī)則把對(duì)方看作環(huán)境的一個(gè)不變的部分而忽略了相互的作用,不管他們?cè)谟邢薜募僭O(shè)下所做的計(jì)算是多么的聰明。如果你離開(kāi)對(duì)方適應(yīng)你、你適應(yīng)對(duì)方、對(duì)方又適應(yīng)于你的適應(yīng)這樣一直下去的反應(yīng)過(guò)程去模擬你的對(duì)方,那么你的聰明是不會(huì)有好結(jié)果的。這是一條充滿(mǎn)成功希望的艱難之路,顯然在兩次競(jìng)賽中沒(méi)有一個(gè)復(fù)雜的規(guī)則精于此道。 另一個(gè)太聰明的方式是使用“永久報(bào)復(fù)”的策略。這個(gè)策略只要對(duì)方合作它就合作,但是一旦對(duì)方背叛一次,它就決不合作。由于這個(gè)策略是善良的,它與其他善良的策略相處得很好。并且它與那些不怎么反應(yīng)的規(guī)則(如完全隨機(jī)的規(guī)則)相遇時(shí),干得也不錯(cuò)。但它與許多其他規(guī)則相遇就干得很差,因?yàn)閷?duì)于那些偶爾背叛但準(zhǔn)備一旦受懲罰就撤回的規(guī)則來(lái)說(shuō),它太快放棄合作了。“永久報(bào)復(fù)”看起來(lái)似乎很聰明,因?yàn)樗鼮楸苊獗撑烟峁┝俗畲蟮募?lì),但是它為了自己的利益顯得太嚴(yán)厲了。 參加競(jìng)賽的規(guī)則中還有第三種太聰明的形式是,它們采用的概率策略是如此復(fù)雜以至于其他策略不能把它們與純粹的隨機(jī)選擇區(qū)分開(kāi)來(lái)。換句話說(shuō),就是太多的復(fù)雜性就顯得是完全雜亂無(wú)章。如果你采用一個(gè)看起來(lái)是隨機(jī)的策略,那么你也就顯得對(duì)對(duì)方不反應(yīng),如果你是不反應(yīng)的,對(duì)方就受不到與你合作的激勵(lì)。因此復(fù)雜到不可理解是非常危險(xiǎn)的。 當(dāng)然,在許多人類(lèi)事務(wù)中一個(gè)使用復(fù)雜規(guī)則的人可以向?qū)Ψ浇忉屆恳粋(gè)選擇的理由。然而,問(wèn)題出現(xiàn)了。對(duì)方可能懷疑所提供的這些理由,因?yàn)樗鼈兪侨绱藦?fù)雜顯得好像是專(zhuān)門(mén)為這個(gè)場(chǎng)合設(shè)計(jì)的。在這個(gè)情況下對(duì)方將認(rèn)為不值得有任何反應(yīng)。因此,對(duì)方會(huì)把一個(gè)顯得不可預(yù)測(cè)的規(guī)則看作是不可改造的。結(jié)果自然是導(dǎo)致背叛。 “一報(bào)還一報(bào)”在競(jìng)賽中得到巨大成功的原因之一是它具有很大的清晰性,即它非常容易被對(duì)方理解。當(dāng)你使用“一報(bào)還一報(bào)”策略時(shí),對(duì)方有很好的機(jī)會(huì)去理解你在干什么。你對(duì)任何背叛的一對(duì)一的反應(yīng)是一個(gè)很容易被意識(shí)到的模式。而且你的未來(lái)行為是能被預(yù)測(cè)的。一旦這些情況發(fā)生了,對(duì)方能容易地發(fā)現(xiàn)應(yīng)付“一報(bào)還一報(bào)”的最好方式就是與它合作。假設(shè)這個(gè)游戲有足夠的可能繼續(xù)下去,至少還有下一步相遇。那么當(dāng)你遇到“一報(bào)還一報(bào)”策略時(shí)只有馬上和它合作是最好的,這樣你將可以在下一步得到一個(gè)合作。 另外,在零和博弈(如下棋)和非零和博弈(如“重復(fù)囚徒困境”)之間有一個(gè)重要的不同。在下棋時(shí),讓你的對(duì)手猜疑你的企圖是很有用的,你的對(duì)手越是懷疑,他(或她)的策略就越?jīng)]效果。在對(duì)手的任何無(wú)效行為就是你的利益的零和博弈中,隱瞞你的企圖是很有用的。但是在非零和情況下,如此聰明不總是有好處的。在“重復(fù)囚徒困境”中,你要從對(duì)方的合作中得到好處。訣竅在于鼓勵(lì)合作,一個(gè)好的方式就是清楚地表明你愿意回報(bào),言語(yǔ)在這里是有幫助的。但大家都知道行動(dòng)比言語(yǔ)更響亮。這就是“一報(bào)還一報(bào)”之所以如此有效的原因。 ……
你還可能感興趣
我要評(píng)論
|