關于我們
書單推薦
新書推薦
|
超級智能:路徑、危險性與我們的戰(zhàn)略
當機器智能超越了人類智能時會發(fā)生什么?人工智能會拯救人類還是毀滅人類?
作者提到,我們不是這個星球上速度最快的生物,但我們發(fā)明了汽車、火車和飛機。我們雖然不是最強壯的,但我們發(fā)明了推土機。我們的牙齒不是最鋒利的,但我們可以發(fā)明比任何動物的牙齒更堅硬的**。我們之所以能控制地球,是因為我們的大腦比即使最聰明的動物的大腦都要復雜得多。如果機器比人類聰明,那么我們將不再是這個星球的主宰。當這一切發(fā)生的時候,機器的運轉將超越人類。 人類大腦擁有一些其他動物大腦沒有的功能。正是這些獨特的功能使我們的種族得以擁有主導地位。如果機器大腦在一般智能方面超越了人類,那么這種新興的超級智能可能會極其強大,并且有可能無法控制。正如現(xiàn)在大猩猩的命運更多的掌握在人類手中而不是自己手中一樣,人類未來的命運也會取決于機器超級智能的行為。 但是,我們有一項優(yōu)勢:我們有機會率先采取行動。是否有可能建造一個種子人工智能,創(chuàng)造特定的初始條件,使得智能爆發(fā)的結果能夠允許人類的生存?我們如何實現(xiàn)這種可控的引爆? 作者相信,超級智能對我們人類將是一個巨大的威脅。在這本書中,作者談到了超級智能的優(yōu)勢所帶來的風險,也談到了人類如何解決這種風險。作者認為,他的這本書提到的問題將是我們人類所面臨的最大風險。 這本書目標宏大,且有獨創(chuàng)性,開辟了人工智能領域的新道路。本書會帶你開啟一段引人入勝的旅程,把你帶到對人類狀況和智慧生命未來思索的最前沿。尼克?波斯特洛姆的新書為理解人類和智慧生命的未來奠定了基礎,不愧是對我們時代根本任務的一次重新定義。
亞馬遜總榜、《紐約時報》超級暢銷書 特斯拉汽車和PayPal聯(lián)合創(chuàng)始人伊隆·馬斯克隆重推薦 《超智能時代》一書值得一讀,我們需要十分小心人工智能,它可能比核武器更危險。——伊隆·馬斯克 如果機器比人類聰明,那么我們將不再是這個星球的主宰 當這一切發(fā)生的時候,機器的運轉將超越人類,“智能大爆發(fā)”出現(xiàn)了
天算論
常言說,人算不如天算。 如果將來計算機的計算能力超過人的計算能力,那么人算不如天算,人被計算機所算計,這會成為一個關系人類命運的頭號問題。 尼克?波斯特洛姆的《超級智能》討論的就是怎么解決“人算不如天算”的問題。所以我稱之為天算論。 你為什么應該關注這本書呢? 如果說天演論告訴人們的是,物競天擇,適者生存,至少人還是贏家;那么天算論就沒那么簡單了,將來人與計算機競爭,人還會是贏家嗎? 《超級智能》討論的是我們這個時代的優(yōu)先事項。 “智能爆發(fā)的威力會擊落整個蒼穹”,在計算機時代,悠悠萬事,唯此為大。 這個時代的優(yōu)先事項 為什么要設置“超級智能”這個議題?有什么理由,值得讓你為了它而放下手邊雜事,屏息凝神? 天算論 常言說,人算不如天算。 如果將來計算機的計算能力超過人的計算能力,那么人算不如天算,人被計算機所算計,這會成為一個關系人類命運的頭號問題。 尼克?波斯特洛姆的《超級智能》討論的就是怎么解決“人算不如天算”的問題。所以我稱之為天算論。 你為什么應該關注這本書呢? 如果說天演論告訴人們的是,物競天擇,適者生存,至少人還是贏家;那么天算論就沒那么簡單了,將來人與計算機競爭,人還會是贏家嗎? 《超級智能》討論的是我們這個時代的優(yōu)先事項。 “智能爆發(fā)的威力會擊落整個蒼穹”,在計算機時代,悠悠萬事,唯此為大。 這個時代的優(yōu)先事項 為什么要設置“超級智能”這個議題?有什么理由,值得讓你為了它而放下手邊雜事,屏息凝神? 讓我們先從本書的最后一句讀起。作者談到這本書的立意:“透過日常瑣事的迷霧,我們能夠(模糊地)看到這個時代的核心任務。在這本書中,我們嘗試著在相對模糊不清的視野中辨別更多的特征。我們看到,降低存在性風險,并且實現(xiàn)導向合理使用人類宇宙資源的文明進步,是我們道德上的主要優(yōu)先事項! 讓我解釋一下“這個時代的核心任務”,“道德上的主要優(yōu)先事項”。 人生最大的喜樂,無非“久旱逢甘露,他鄉(xiāng)遇故知。洞房花燭夜,金榜題名時”。而人生最大的悲哀,恐怕不是被槍斃,而是于槍斃前被要求自己給自己挖坑。 但人類經(jīng)常干這種事: 在農業(yè)社會,土地本來是人類發(fā)展的工具,但結果卻演變成,人為了土地,而失去了自我。托爾斯泰的《戰(zhàn)爭與和平》,講的就是人類為了土地而打殺,死了都不知道是為了什么。 在工業(yè)社會,資本本來是人類發(fā)展的工具,但最后演變成,人為了資本,而失去了自我。馬克思的《1844年經(jīng)濟學哲學手稿》,講的就是人類為了資本而爭斗,為了手段而忘記目的。 在信息社會,智能本來是人類發(fā)展的工具,但最后演變成,人為了智能,而失去了自我!冻壷悄堋分v的是,人把計算機造成了超級自我,但自我該如何做,才能保證人本身才是目的,而不被自己發(fā)明的手段所打敗呢? 這就是“這個時代的核心任務”,“道德上的主要優(yōu)先事項”。 所以,農業(yè)社會的人,應該看看《戰(zhàn)爭與和平》中那些活得明白的人;工業(yè)社會的人,應該了解《1844年經(jīng)濟學哲學手稿》中那些克服異化的思想。中國的工業(yè)化到2020年將基本完成,那時中國人將進入信息社會,但如果不關注《超級智能》講的“時代核心”與“道德優(yōu)先”,活著也是渾渾噩噩,在火葬場里邊和外邊,雖說有一些區(qū)別,但區(qū)別也不像想象的那么大。 人類經(jīng)歷了土地的挑戰(zhàn)、資本的挑戰(zhàn),今天來到了信息時代,智能的挑戰(zhàn)是“我們將要面對的最后一個挑戰(zhàn)”。 正如波斯特洛姆點明的: 如果有一天我們發(fā)明了超越人類大腦一般智能的機器大腦,那么這種超級智能將會非常強大。并且,正如現(xiàn)在大猩猩的命運更多地取決于人類而不是它們自身一樣,人類的命運將取決于超級智能機器的行為。 在本書中,我將努力詮釋可能出現(xiàn)的超級智能帶來的挑戰(zhàn),以及我們如何最好地應對。這很可能是人類面對的最重要和最可怕的挑戰(zhàn)。而且,不管我們成功還是失敗,這大概都是我們將要面對的最后一個挑戰(zhàn)。 與許多相信機器最后將戰(zhàn)勝人類的業(yè)界專家相比,波斯特洛姆的心態(tài)總的來說是積極的,他的樂觀來自一個判斷:“我們擁有一項優(yōu)勢,即我們清楚地知道如何制造超級智能機器! 波斯特洛姆認為,原則上,我們能夠制造一種保護人類價值的超級智能,當然,我們也有足夠的理由這么做。實際上,控制問題—也就是如何控制超級智能,似乎非常困難,而且我們似乎也只有一次機會。一旦不友好的超級智能出現(xiàn),它就會阻止我們將其替換或者更改其偏好設置,那時我們的命運就被鎖定了。 智能大爆發(fā)的動力學 一、什么是智能爆發(fā)? 簡單地說,智能爆發(fā)就是電腦超過人腦?梢詮募夹g和社會兩個方面理解其含義:技術性的理解是超級智能,即電腦比人腦更聰明;社會性的理解是智能異化,即作為手段的智能不再順從作為目的的人類。 1. 超級智能 超級智能是指“在許多普遍的認知領域中,表現(xiàn)遠遠超越目前最聰明的人類頭腦的智能”。 作者將超級智能分為三種形式:高速超級智能、集體超級智能和素質超級智能。 —高速超級智能是指和人腦相似,但速度快于人腦的智能。 —集體超級智能是指一種通過將總數(shù)龐大的小型智能集中起來,從而達到卓越性能的系統(tǒng)智能。 —素質超級智能是指一個至少和人類大腦一樣快,并且從素質上來說更加聰明的智能。 作者說的這三種能力,令人想到大數(shù)據(jù)的“3V”(不算“數(shù)據(jù)大”的Volume)。高速超級智能對應Velocity,集體超級智能對應Variety,素質超級智能對應Value。一言以蔽之,“3V”講的都是復雜性,分別是量的復雜性(Velocity是時間量,Variety是空間量)和質的復雜性(素質)。 作者的意思是,電腦超過人腦,一定是表現(xiàn)在處理復雜性的量的能力與質的能力上。換句話說,當復雜性達到一定量和質的程度時,人算算不清,而天算算得清,人算可能不如天算。 2. 智能異化 人算一旦不如天算,會出現(xiàn)什么情況呢? 作者有一個形象生動的比喻:人好比孩子,超級智能好比孩子玩的炸彈。一旦人算不如天算,智能就會像炸彈那樣爆炸。 讓我們來看作者生動的描述: 在智能爆發(fā)的前景之下,我們人類就像拿著炸彈玩的孩子。玩具的威力和我們行為的成熟度是如此的不匹配。超級智能是一個我們現(xiàn)在還沒有準備好應對的挑戰(zhàn),而且很長時間之內都不會準備好。盡管我們把炸彈放到耳邊能夠聽到微弱的滴答聲,但是我們也完全不知道爆炸會在何時發(fā)生。 對于一個手拿著尚未引爆的炸彈的孩子來說,明智的做法是輕輕地將炸彈放下,快速跑出屋子,并告訴距離最近的大人。然而,我們現(xiàn)在面對的不是一個孩子,而是很多孩子,而且每個人都帶著獨立的引爆裝置。我們所有人都意識到放下這個危險玩意兒的可能性幾乎為零?倳心硞蠢孩子因為想要知道會發(fā)生什么,而按下引爆按鈕。 我們也不可能通過逃離的方法獲得安全,因為智能爆發(fā)的威力會擊落整個蒼穹。而且,我們也看不到任何成年人。 在這種情況下,任何“哎呀,太棒了!”的高興情緒都是不合適的。驚愕和恐懼會稍微合適一些,但是最適當?shù)膽B(tài)度是:下定決心,發(fā)揮我們最好的實力,就像準備一場很難的考試一樣,考試通過了夢想就會實現(xiàn),考試失敗了夢想就會破滅。 映射到社會,人類曾至少在兩類情況下引爆過這種超級“炸彈”。一類是“土地炸彈”。據(jù)說成吉思汗把四川人從2 000萬殺到只剩下80萬,主要是因為他們影響了馬吃草。人類開發(fā)出土地,本來是為了滿足衣食之需;而在成吉思汗看來,人(至少是四川人)不重要,重要的是馬。所以用土地種農作物有“罪”,必須從生存角度加以徹底否定。另一類是“資本炸彈”。兩次世界大戰(zhàn)本質上都是因為資本而引發(fā)的殺人游戲,納粹對猶太人的迫害是人類的一種道德破產。 人類玩過“土地炸彈”、“資本炸彈”,下一步必然會玩“智能炸彈”。“智能爆發(fā)的威力會擊落整個蒼穹”,那時人會怎么樣呢?記得18年前“網(wǎng)絡文化叢書”組織者在小湯山開過一個未來討論會,一位今天已變得家喻戶曉的專家當時曾說(大意):“如果不考慮道德因素,計算機一旦統(tǒng)治人,從機器角度講,人體除了腦袋,別的器官都沒什么用,還浪費資源(按:成吉思汗如果管理互聯(lián)網(wǎng),肯定也會這么想)。所以最好的辦法是把人的腦袋擰下來,像電燈泡一樣安在工作臺上,接好營養(yǎng)液,然后工作到死。為了減少人的痛苦,可以利用虛擬現(xiàn)實技術(按:現(xiàn)在已經(jīng)快實現(xiàn)了),按照大腦的偏好,分別配一輩子的三級片或戰(zhàn)爭片,讓他以為是真的,從而快快樂樂地度過一生! 這就是我們和作者都要面對的問題。 如果你覺得這些都無所謂—什么電腦超過人腦,什么電腦統(tǒng)治人腦,包括你或你的后代哪天下午被莫名其妙地捉去當成燈泡,那你不需要讀這本書,你趕緊忙你那更重要的事情去吧。 二、天算的動力學公式 本書在前幾章討論超級智能出現(xiàn)的可能性以及之后會發(fā)生什么后,接下來開始討論智能爆發(fā)的原理,即“智能大爆發(fā)的動力學”。 這里補充一下,人生最大的悲哀,除了自己挖坑埋了自己(比喻為了手段而忘記目的),還在于死了都不知為什么而死,就像托爾斯泰筆下那些搞不懂決定戰(zhàn)爭與和平的原因的人們。不管將來出現(xiàn)什么情況,至少我們應該搞清人算不如天算的原因。 作者構建了一個公式,將超級智能的發(fā)展作為最優(yōu)化力和系統(tǒng)反抗度的函數(shù),來分析天算超過人算這個過程的動力學。 先假設一個系統(tǒng)的智能增長率為兩個變量—最優(yōu)化力(主要用于提高系統(tǒng)智能水平)和系統(tǒng)智能對這種最優(yōu)化力的反應度的單調遞增函數(shù)。用反抗度表示反應度的倒數(shù),公式如下: 最優(yōu)化力 智能變化率= — 反抗度 作者在這里用了兩個新造的概念—最優(yōu)化力和反抗度。最優(yōu)化力指提高系統(tǒng)智能水平的能力,可以理解為計算效率,相當于聰明程度。反抗度則相當于阻力,作者曾說“邊際效益開始遞減(即反抗度遞增)”,由此可以推論出,反抗度相當于智能提高的邊際成本。 作者指出,提高系統(tǒng)效率過程中的反抗度很高,需要人類花費大量精力來應對。不過,即便這樣,人類的綜合能力每年也僅能提高幾個百分點。此外,由于內外部環(huán)境不斷變化,即便系統(tǒng)某一刻實現(xiàn)了效率最優(yōu),它也將無法很快適應新的環(huán)境。 用我的話解釋,這是一個效能公式。效能就是效率(相對復雜性)的變化率,因此智能變化率就是智能效率(最優(yōu)化力)的微分。智能的效能取決于效率(所謂的最優(yōu)化力)與邊際成本變化(所謂的反抗度)的比率。 其中作者沒有直接點出的條件是,邊際成本是相對于復雜度而變化的(遞增或遞減)。越復雜,決策成本越低,就叫靈活(SMART,正的智慧);越復雜,決策成本越高,就叫遲鈍(負的智慧)。智能變化率相當于張瑞敏說的打移動靶,最優(yōu)化力相當于他說的打固定靶。反抗度指的就是目標轉變時,要求槍口隨目標移動轉換所需付出的成本。 因此,智能變化率就是《周易》所說的那個“易”,也就是輕輕松松化解復雜性,表現(xiàn)為太極的“隨物宛轉,與心徘徊”。舉例來說,表現(xiàn)在中華民族,就是5 000年來對復雜變化的適應(近期如快速適應世界貿易組織);表現(xiàn)在個人能力上,如打乒乓球的靈活。超級智能,就是把這個中國人人無師自通的東西變成電腦的能力。 據(jù)我考證,人類的第一篇“天算論”,是微積分(也就是變化率之學)的發(fā)明者萊布尼茨1703年發(fā)表于核心期刊《皇家科學院紀錄》上的《論中國伏羲二進位制級數(shù)》。萊布尼茨在論文中說:“讓我感到自豪的是,若我未發(fā)現(xiàn)二進位制數(shù)學,這個六十四卦的體系,即伏羲易圖,再耗費許多時間也不會被搞明白的!彪娔X的二進制就主要是從這里來的,只不過當年萊布尼茨送給康熙的二進制計算器(帕斯卡爾二代機)不是電的,而是手搖的。2004年中國還拿它到凡爾賽宮展覽過—它是超級智能在500年前的祖先。 人算控制天算 當人算不如天算時,以往人類典型的解決方案是像“霸王別姬”那樣抹脖子。項羽認為是天要亡他,人算不如天算,趕緊讓腦袋像燈泡那樣掉下來就完了。 波斯特洛姆的方案比項羽的方案要積極一些,至少先別認輸,還要看看天算會有哪些規(guī)律,人算能有哪些辦法。這就是本書第5章以后的主要內容。 雖然不敢說作者的這些辦法從根上是否管用,但想總比不想好,況且有許多想法還確實開闊了我們的思路。讀過本書以后的第一感覺是,項羽算白死了。 讀者讀到這里時,應該把自己想象成被別人追到烏江了,正想抹脖子,轉念一想,辦法也許會有,并且“萬一實現(xiàn)了呢”? 作者首先討論了超級智能的形式和能量,以及具有決定性優(yōu)勢的超級智能體有哪些戰(zhàn)略選擇。之后探討的重點轉向控制問題,并提出為了獲得可生存并且有利的結果,如何塑造初始條件的問題。最后指出為了增加成功概率,現(xiàn)在可以做些什么。我們分別進行介紹。 一、戰(zhàn)略分析與控制 1. 決定性戰(zhàn)略優(yōu)勢:分析形勢 提出正確問題,是解決問題的第一步。而第一個問題應該是什么? 作者建議這樣提出問題:將會有一個還是多個超級智能?是否會有一次智能爆發(fā)能夠推動某一個項目,使其遠遠超越其他所有項目,從而主宰未來?或者進展會比較一致,在廣闊的范圍里同時展開,包含很多個項目,但是沒有一個能夠長期擁有壓倒性的領先地位? 這話說得比較繞,讓我用大白話翻譯吧:項羽轉念一想,將來是劉邦一家獨大呢,還是劉邦與其他人(如韓信、臧荼、張耳、彭越……)相爭呢? 2. 超級認知能力:分析霸主的戰(zhàn)略 第二步分析,假設出現(xiàn)了一個數(shù)字超級智能體,而且出于某種原因,它想要統(tǒng)治全球,那么它能夠成功嗎?作者進一步探討超級智能會擁有哪些能力,以及這些能力能用來做什么。 相當于如果判斷未來是劉邦一家獨大,就要進一步分析他會有哪些能力,用于何處。 3. 超級智能的意愿:分析戰(zhàn)略目標與手段之間的關系 第三步分析,超級智能可以擁有極大的根據(jù)自己的目標塑造未來的能力。但是,它的目標會是怎樣的?一個人工智能體的智能與動機之間是什么關系? 作者設想了兩種情況。一是目標導向(正交性論點),智能和最終目標是獨立變量,任何水平的智能都可以搭配任何最終目標。二是工具導向(工具性趨同論點),不管超級智能具有一系列最終目標中的哪種,都將選擇相似的中間目標,因為它們有這么做的共同工具性理由。通過這兩種論點,就可以思考一個超級智能體想要做什么的問題了。 相當于分析劉邦想要做什么,是目標導向的呢,還是手段導向的(為了手段而忘記目標型的)? 4. 結局注定是厄運嗎?不同路徑具有不同后果 作者發(fā)現(xiàn):當人工智能本來愚蠢時,變聰明是更安全的;但是當它本來就聰明時,變得更聰明則是更危險的。就像有一個軸心點,到這個點上,原來很有效的策略會突然開始逆反。我們可以把這個現(xiàn)象叫作“背叛轉折”。 作者舉了個例子:假設人工智能的最終目標是“讓項目的贊助者高興”,于是它使在贊助者大腦的快樂中樞植入電極,這樣就能夠保證贊助者感受到極大快樂。當然,贊助者可能并不想被改造成整天咧著嘴笑的傻子,但是如果這樣能最大限度地實現(xiàn)人工智能的最終目標,那么人工智能也會去實施這個方案。 相當于如果劉邦太強大,無法被搞定,但如果他像洪秀全那樣沉溺于酒色,以為天下已經(jīng)搞定,這時便仍有機會。 5. 控制問題 作者認為,如果智能爆發(fā)的默認后果是導致存在性災難的發(fā)生,那么面對這樣的威脅,我們的思路必須立刻轉向尋求應對方法。有沒有辦法可以避免這樣的默認結局?有沒有可能設計出受控制的智能爆發(fā)? 作者將對策集中于委托-代理問題,并把方法分為兩大類:能力控制和動機選擇。 相當于是選擇把文章做在韓信等將軍身上以使其造反,還是把文章做在劉邦身上以使其喪志。 6. 多極情景:諸侯割據(jù) 這是與上面第2點并列的分岔。相當于分析不是劉邦獨大,而是陷入諸侯割據(jù)的情況。 作者對這一情景的關注包含兩個層面。首先,社會融合可能會成為控制問題的一種解決方式。其次,即使沒有人著手去創(chuàng)造出多極條件來解決控制問題,多極結局也可能發(fā)生。那么,這種結局看起來可能是什么樣的呢?最終的競爭社會不一定會吸引人,也不一定能長久持續(xù)。 相當于項羽如果分析到劉邦集團會自亂陣腳,陷入內亂,那就沒必要著急抹脖子了—畢竟先三十年河東,再三十年河西。 二、獲取價值觀 《獲取價值觀》一章及以后的《確定選擇標準》各章是本書的精華,具有超越本書的普世的閱讀價值。 1. “目標系統(tǒng)工程” 作者的本意,是提出一種叫“目標系統(tǒng)工程”的東西,來避免出現(xiàn)天算超過人算后,電腦把自己當作目的,而讓人成為電腦的手段這種異化局面。為此,主張人要先發(fā)制人(準確地說是先發(fā)制“機”),把目標的控制權掌握在人手中。用作者的話說:“對能力的控制最多是一個暫時、輔助的手段。除非要永久地限制超級智能,否則我們都需要掌握動機選擇機制! 我覺得最有意思的是“價值觀加載技術的總結”這張表(見本書第259頁)。它對于治理各類目標與手段不符的問題都有借鑒意義。它至少讓我們知道,除了搞運動,人類還可以通過未來幾百年的建設來讓做事符合宗旨這件事,被專業(yè)化地完成。 作者關于“目標系統(tǒng)工程”的具體設想,如管理效用函數(shù)、價值評估等,并不重要。將來會有人對其不斷改進,使之成熟。這本書最大的貢獻在于提出了一個非常正點(“思無邪”)的問題:“怎樣才能將一些價值觀加載到人工代理內部,使該價值觀成為其追求的最終目標呢?”這是人類一萬年來的夢想,但從來沒有實現(xiàn)過!澳繕讼到y(tǒng)工程”是關于魂的工程,離開了魂,夢便只不過停留在做夢階段。 正如作者指出的:“這個價值觀加載的問題很棘手,但一定要面對!币驗槌嘶甑脑颍有現(xiàn)實而緊迫的原因:“如果這個代理不是智能的,那么它就會缺乏理解和再現(xiàn)那些對人類有意義的價值觀的能力。但是如果我們推遲進程,直到代理變成超級智能之后才行動,就可以抑制住我們在其動機系統(tǒng)中插手的企圖!比祟悓ν恋、資本都沒有把握好,導致死傷幾千萬甚至幾億人以后,才想到提出正確的問題。希望這次不會再犯同樣的錯誤。 2. 意義建設 提出以“獲取價值觀”為核心的“目標系統(tǒng)工程”,還具有更大意義。 我一直認為,與農業(yè)文明、工業(yè)文明并列的,是意義文明。信息只不過是意義的鏡子。談信息不談意義,好比只有鏡子,空無內容。未來的互聯(lián)網(wǎng)是意義互聯(lián)網(wǎng)。意義就是這里說的“目標”(準確的說法是目的、宗旨),獲取價值觀則是指獲取對意義的把握權力(如果慎用“控制權力”這個字眼的話)。 工業(yè)文明有一個根本特點,它是一個異化社會(資本主義、社會主義只是程度不同),異化社會的特點是系統(tǒng)地為了手段而忘記目的(例如,為了國內生產總值而忘記幸福,為了貪污而忘記服務,為了浪費而忘記委托),這決定了工業(yè)社會整體來說,是把專業(yè)化的重點放在手段上,但必然的弱點是在目的上十分業(yè)余(表現(xiàn)在總是努力向東走,最后發(fā)現(xiàn)來到的是西邊)。 智能革命只是一種技術性的說法,映射到人文上應是意義革命,也就是讓意義從不專業(yè)走向專業(yè)的這樣一場革命。如果超越作者局限于自然科學的一般見識,順著“目標系統(tǒng)工程”這一卓越思想,就可以發(fā)現(xiàn),作者所談的實際涉及的是信息文明的核心使命和實事(所謂“工程”)。 讀這本書,如果要有更大收獲,就要超越單純技術思維,從如何變一種類型的技術(異化的技術)為另一種類型的技術(可“獲取價值觀”的技術),舉一反三地悟到如何讓整個技術作為手段服務于人的目的。 人算在技術上可能將來有不如天算的一天,但人因為具有意義(再加上“清楚地知道如何制造超級智能機器”)而可以達到“人定”,于是順理成章可以“勝天”,或天人合一。 基于此,我說句題外話—超級智能,需要超級意義。 姜奇平 中國社會科學院信息化研究中心秘書長、《互聯(lián)網(wǎng)周刊》主編 天算論 常言說,人算不如天算。 如果將來計算機的計算能力超過人的計算能力,那么人算不如天算,人被計算機所算計,這會成為一個關系人類命運的頭號問題。 尼克?波斯特洛姆的《超級智能》討論的就是怎么解決“人算不如天算”的問題。所以我稱之為天算論。 你為什么應該關注這本書呢? 如果說天演論告訴人們的是,物競天擇,適者生存,至少人還是贏家;那么天算論就沒那么簡單了,將來人與計算機競爭,人還會是贏家嗎? 《超級智能》討論的是我們這個時代的優(yōu)先事項。 “智能爆發(fā)的威力會擊落整個蒼穹”,在計算機時代,悠悠萬事,唯此為大。 這個時代的優(yōu)先事項 為什么要設置“超級智能”這個議題?有什么理由,值得讓你為了它而放下手邊雜事,屏息凝神? 讓我們先從本書的最后一句讀起。作者談到這本書的立意:“透過日,嵤碌拿造F,我們能夠(模糊地)看到這個時代的核心任務。在這本書中,我們嘗試著在相對模糊不清的視野中辨別更多的特征。我們看到,降低存在性風險,并且實現(xiàn)導向合理使用人類宇宙資源的文明進步,是我們道德上的主要優(yōu)先事項! 讓我解釋一下“這個時代的核心任務”,“道德上的主要優(yōu)先事項”。 人生最大的喜樂,無非“久旱逢甘露,他鄉(xiāng)遇故知。洞房花燭夜,金榜題名時”。而人生最大的悲哀,恐怕不是被槍斃,而是于槍斃前被要求自己給自己挖坑。 但人類經(jīng)常干這種事: 在農業(yè)社會,土地本來是人類發(fā)展的工具,但結果卻演變成,人為了土地,而失去了自我。托爾斯泰的《戰(zhàn)爭與和平》,講的就是人類為了土地而打殺,死了都不知道是為了什么。 在工業(yè)社會,資本本來是人類發(fā)展的工具,但最后演變成,人為了資本,而失去了自我。馬克思的《1844年經(jīng)濟學哲學手稿》,講的就是人類為了資本而爭斗,為了手段而忘記目的。 在信息社會,智能本來是人類發(fā)展的工具,但最后演變成,人為了智能,而失去了自我!冻壷悄堋分v的是,人把計算機造成了超級自我,但自我該如何做,才能保證人本身才是目的,而不被自己發(fā)明的手段所打敗呢? 這就是“這個時代的核心任務”,“道德上的主要優(yōu)先事項”。 所以,農業(yè)社會的人,應該看看《戰(zhàn)爭與和平》中那些活得明白的人;工業(yè)社會的人,應該了解《1844年經(jīng)濟學哲學手稿》中那些克服異化的思想。中國的工業(yè)化到2020年將基本完成,那時中國人將進入信息社會,但如果不關注《超級智能》講的“時代核心”與“道德優(yōu)先”,活著也是渾渾噩噩,在火葬場里邊和外邊,雖說有一些區(qū)別,但區(qū)別也不像想象的那么大。 人類經(jīng)歷了土地的挑戰(zhàn)、資本的挑戰(zhàn),今天來到了信息時代,智能的挑戰(zhàn)是“我們將要面對的最后一個挑戰(zhàn)”。 正如波斯特洛姆點明的: 如果有一天我們發(fā)明了超越人類大腦一般智能的機器大腦,那么這種超級智能將會非常強大。并且,正如現(xiàn)在大猩猩的命運更多地取決于人類而不是它們自身一樣,人類的命運將取決于超級智能機器的行為。 在本書中,我將努力詮釋可能出現(xiàn)的超級智能帶來的挑戰(zhàn),以及我們如何最好地應對。這很可能是人類面對的最重要和最可怕的挑戰(zhàn)。而且,不管我們成功還是失敗,這大概都是我們將要面對的最后一個挑戰(zhàn)。 與許多相信機器最后將戰(zhàn)勝人類的業(yè)界專家相比,波斯特洛姆的心態(tài)總的來說是積極的,他的樂觀來自一個判斷:“我們擁有一項優(yōu)勢,即我們清楚地知道如何制造超級智能機器! 波斯特洛姆認為,原則上,我們能夠制造一種保護人類價值的超級智能,當然,我們也有足夠的理由這么做。實際上,控制問題—也就是如何控制超級智能,似乎非常困難,而且我們似乎也只有一次機會。一旦不友好的超級智能出現(xiàn),它就會阻止我們將其替換或者更改其偏好設置,那時我們的命運就被鎖定了。 智能大爆發(fā)的動力學 一、什么是智能爆發(fā)? 簡單地說,智能爆發(fā)就是電腦超過人腦?梢詮募夹g和社會兩個方面理解其含義:技術性的理解是超級智能,即電腦比人腦更聰明;社會性的理解是智能異化,即作為手段的智能不再順從作為目的的人類。 1. 超級智能 超級智能是指“在許多普遍的認知領域中,表現(xiàn)遠遠超越目前最聰明的人類頭腦的智能”。 作者將超級智能分為三種形式:高速超級智能、集體超級智能和素質超級智能。 —高速超級智能是指和人腦相似,但速度快于人腦的智能。 —集體超級智能是指一種通過將總數(shù)龐大的小型智能集中起來,從而達到卓越性能的系統(tǒng)智能。 —素質超級智能是指一個至少和人類大腦一樣快,并且從素質上來說更加聰明的智能。 作者說的這三種能力,令人想到大數(shù)據(jù)的“3V”(不算“數(shù)據(jù)大”的Volume)。高速超級智能對應Velocity,集體超級智能對應Variety,素質超級智能對應Value。一言以蔽之,“3V”講的都是復雜性,分別是量的復雜性(Velocity是時間量,Variety是空間量)和質的復雜性(素質)。 作者的意思是,電腦超過人腦,一定是表現(xiàn)在處理復雜性的量的能力與質的能力上。換句話說,當復雜性達到一定量和質的程度時,人算算不清,而天算算得清,人算可能不如天算。 2. 智能異化 人算一旦不如天算,會出現(xiàn)什么情況呢? 作者有一個形象生動的比喻:人好比孩子,超級智能好比孩子玩的炸彈。一旦人算不如天算,智能就會像炸彈那樣爆炸。 讓我們來看作者生動的描述: 在智能爆發(fā)的前景之下,我們人類就像拿著炸彈玩的孩子。玩具的威力和我們行為的成熟度是如此的不匹配。超級智能是一個我們現(xiàn)在還沒有準備好應對的挑戰(zhàn),而且很長時間之內都不會準備好。盡管我們把炸彈放到耳邊能夠聽到微弱的滴答聲,但是我們也完全不知道爆炸會在何時發(fā)生。 對于一個手拿著尚未引爆的炸彈的孩子來說,明智的做法是輕輕地將炸彈放下,快速跑出屋子,并告訴距離最近的大人。然而,我們現(xiàn)在面對的不是一個孩子,而是很多孩子,而且每個人都帶著獨立的引爆裝置。我們所有人都意識到放下這個危險玩意兒的可能性幾乎為零?倳心硞蠢孩子因為想要知道會發(fā)生什么,而按下引爆按鈕。 我們也不可能通過逃離的方法獲得安全,因為智能爆發(fā)的威力會擊落整個蒼穹。而且,我們也看不到任何成年人。 在這種情況下,任何“哎呀,太棒了!”的高興情緒都是不合適的。驚愕和恐懼會稍微合適一些,但是最適當?shù)膽B(tài)度是:下定決心,發(fā)揮我們最好的實力,就像準備一場很難的考試一樣,考試通過了夢想就會實現(xiàn),考試失敗了夢想就會破滅。 映射到社會,人類曾至少在兩類情況下引爆過這種超級“炸彈”。一類是“土地炸彈”。據(jù)說成吉思汗把四川人從2 000萬殺到只剩下80萬,主要是因為他們影響了馬吃草。人類開發(fā)出土地,本來是為了滿足衣食之需;而在成吉思汗看來,人(至少是四川人)不重要,重要的是馬。所以用土地種農作物有“罪”,必須從生存角度加以徹底否定。另一類是“資本炸彈”。兩次世界大戰(zhàn)本質上都是因為資本而引發(fā)的殺人游戲,納粹對猶太人的迫害是人類的一種道德破產。 人類玩過“土地炸彈”、“資本炸彈”,下一步必然會玩“智能炸彈”!爸悄鼙l(fā)的威力會擊落整個蒼穹”,那時人會怎么樣呢?記得18年前“網(wǎng)絡文化叢書”組織者在小湯山開過一個未來討論會,一位今天已變得家喻戶曉的專家當時曾說(大意):“如果不考慮道德因素,計算機一旦統(tǒng)治人,從機器角度講,人體除了腦袋,別的器官都沒什么用,還浪費資源(按:成吉思汗如果管理互聯(lián)網(wǎng),肯定也會這么想)。所以最好的辦法是把人的腦袋擰下來,像電燈泡一樣安在工作臺上,接好營養(yǎng)液,然后工作到死。為了減少人的痛苦,可以利用虛擬現(xiàn)實技術(按:現(xiàn)在已經(jīng)快實現(xiàn)了),按照大腦的偏好,分別配一輩子的三級片或戰(zhàn)爭片,讓他以為是真的,從而快快樂樂地度過一生。” 這就是我們和作者都要面對的問題。 如果你覺得這些都無所謂—什么電腦超過人腦,什么電腦統(tǒng)治人腦,包括你或你的后代哪天下午被莫名其妙地捉去當成燈泡,那你不需要讀這本書,你趕緊忙你那更重要的事情去吧。 二、天算的動力學公式 本書在前幾章討論超級智能出現(xiàn)的可能性以及之后會發(fā)生什么后,接下來開始討論智能爆發(fā)的原理,即“智能大爆發(fā)的動力學”。 這里補充一下,人生最大的悲哀,除了自己挖坑埋了自己(比喻為了手段而忘記目的),還在于死了都不知為什么而死,就像托爾斯泰筆下那些搞不懂決定戰(zhàn)爭與和平的原因的人們。不管將來出現(xiàn)什么情況,至少我們應該搞清人算不如天算的原因。 作者構建了一個公式,將超級智能的發(fā)展作為最優(yōu)化力和系統(tǒng)反抗度的函數(shù),來分析天算超過人算這個過程的動力學。 先假設一個系統(tǒng)的智能增長率為兩個變量—最優(yōu)化力(主要用于提高系統(tǒng)智能水平)和系統(tǒng)智能對這種最優(yōu)化力的反應度的單調遞增函數(shù)。用反抗度表示反應度的倒數(shù),公式如下: 最優(yōu)化力 智能變化率= — 反抗度 作者在這里用了兩個新造的概念—最優(yōu)化力和反抗度。最優(yōu)化力指提高系統(tǒng)智能水平的能力,可以理解為計算效率,相當于聰明程度。反抗度則相當于阻力,作者曾說“邊際效益開始遞減(即反抗度遞增)”,由此可以推論出,反抗度相當于智能提高的邊際成本。 作者指出,提高系統(tǒng)效率過程中的反抗度很高,需要人類花費大量精力來應對。不過,即便這樣,人類的綜合能力每年也僅能提高幾個百分點。此外,由于內外部環(huán)境不斷變化,即便系統(tǒng)某一刻實現(xiàn)了效率最優(yōu),它也將無法很快適應新的環(huán)境。 用我的話解釋,這是一個效能公式。效能就是效率(相對復雜性)的變化率,因此智能變化率就是智能效率(最優(yōu)化力)的微分。智能的效能取決于效率(所謂的最優(yōu)化力)與邊際成本變化(所謂的反抗度)的比率。 其中作者沒有直接點出的條件是,邊際成本是相對于復雜度而變化的(遞增或遞減)。越復雜,決策成本越低,就叫靈活(SMART,正的智慧);越復雜,決策成本越高,就叫遲鈍(負的智慧)。智能變化率相當于張瑞敏說的打移動靶,最優(yōu)化力相當于他說的打固定靶。反抗度指的就是目標轉變時,要求槍口隨目標移動轉換所需付出的成本。 因此,智能變化率就是《周易》所說的那個“易”,也就是輕輕松松化解復雜性,表現(xiàn)為太極的“隨物宛轉,與心徘徊”。舉例來說,表現(xiàn)在中華民族,就是5 000年來對復雜變化的適應(近期如快速適應世界貿易組織);表現(xiàn)在個人能力上,如打乒乓球的靈活。超級智能,就是把這個中國人人無師自通的東西變成電腦的能力。 據(jù)我考證,人類的第一篇“天算論”,是微積分(也就是變化率之學)的發(fā)明者萊布尼茨1703年發(fā)表于核心期刊《皇家科學院紀錄》上的《論中國伏羲二進位制級數(shù)》。萊布尼茨在論文中說:“讓我感到自豪的是,若我未發(fā)現(xiàn)二進位制數(shù)學,這個六十四卦的體系,即伏羲易圖,再耗費許多時間也不會被搞明白的!彪娔X的二進制就主要是從這里來的,只不過當年萊布尼茨送給康熙的二進制計算器(帕斯卡爾二代機)不是電的,而是手搖的。2004年中國還拿它到凡爾賽宮展覽過—它是超級智能在500年前的祖先。 人算控制天算 當人算不如天算時,以往人類典型的解決方案是像“霸王別姬”那樣抹脖子。項羽認為是天要亡他,人算不如天算,趕緊讓腦袋像燈泡那樣掉下來就完了。 波斯特洛姆的方案比項羽的方案要積極一些,至少先別認輸,還要看看天算會有哪些規(guī)律,人算能有哪些辦法。這就是本書第5章以后的主要內容。 雖然不敢說作者的這些辦法從根上是否管用,但想總比不想好,況且有許多想法還確實開闊了我們的思路。讀過本書以后的第一感覺是,項羽算白死了。 讀者讀到這里時,應該把自己想象成被別人追到烏江了,正想抹脖子,轉念一想,辦法也許會有,并且“萬一實現(xiàn)了呢”? 作者首先討論了超級智能的形式和能量,以及具有決定性優(yōu)勢的超級智能體有哪些戰(zhàn)略選擇。之后探討的重點轉向控制問題,并提出為了獲得可生存并且有利的結果,如何塑造初始條件的問題。最后指出為了增加成功概率,現(xiàn)在可以做些什么。我們分別進行介紹。 一、戰(zhàn)略分析與控制 1. 決定性戰(zhàn)略優(yōu)勢:分析形勢 提出正確問題,是解決問題的第一步。而第一個問題應該是什么? 作者建議這樣提出問題:將會有一個還是多個超級智能?是否會有一次智能爆發(fā)能夠推動某一個項目,使其遠遠超越其他所有項目,從而主宰未來?或者進展會比較一致,在廣闊的范圍里同時展開,包含很多個項目,但是沒有一個能夠長期擁有壓倒性的領先地位? 這話說得比較繞,讓我用大白話翻譯吧:項羽轉念一想,將來是劉邦一家獨大呢,還是劉邦與其他人(如韓信、臧荼、張耳、彭越……)相爭呢? 2. 超級認知能力:分析霸主的戰(zhàn)略 第二步分析,假設出現(xiàn)了一個數(shù)字超級智能體,而且出于某種原因,它想要統(tǒng)治全球,那么它能夠成功嗎?作者進一步探討超級智能會擁有哪些能力,以及這些能力能用來做什么。 相當于如果判斷未來是劉邦一家獨大,就要進一步分析他會有哪些能力,用于何處。 3. 超級智能的意愿:分析戰(zhàn)略目標與手段之間的關系 第三步分析,超級智能可以擁有極大的根據(jù)自己的目標塑造未來的能力。但是,它的目標會是怎樣的?一個人工智能體的智能與動機之間是什么關系? 作者設想了兩種情況。一是目標導向(正交性論點),智能和最終目標是獨立變量,任何水平的智能都可以搭配任何最終目標。二是工具導向(工具性趨同論點),不管超級智能具有一系列最終目標中的哪種,都將選擇相似的中間目標,因為它們有這么做的共同工具性理由。通過這兩種論點,就可以思考一個超級智能體想要做什么的問題了。 相當于分析劉邦想要做什么,是目標導向的呢,還是手段導向的(為了手段而忘記目標型的)? 4. 結局注定是厄運嗎?不同路徑具有不同后果 作者發(fā)現(xiàn):當人工智能本來愚蠢時,變聰明是更安全的;但是當它本來就聰明時,變得更聰明則是更危險的。就像有一個軸心點,到這個點上,原來很有效的策略會突然開始逆反。我們可以把這個現(xiàn)象叫作“背叛轉折”。 作者舉了個例子:假設人工智能的最終目標是“讓項目的贊助者高興”,于是它使在贊助者大腦的快樂中樞植入電極,這樣就能夠保證贊助者感受到極大快樂。當然,贊助者可能并不想被改造成整天咧著嘴笑的傻子,但是如果這樣能最大限度地實現(xiàn)人工智能的最終目標,那么人工智能也會去實施這個方案。 相當于如果劉邦太強大,無法被搞定,但如果他像洪秀全那樣沉溺于酒色,以為天下已經(jīng)搞定,這時便仍有機會。 5. 控制問題 作者認為,如果智能爆發(fā)的默認后果是導致存在性災難的發(fā)生,那么面對這樣的威脅,我們的思路必須立刻轉向尋求應對方法。有沒有辦法可以避免這樣的默認結局?有沒有可能設計出受控制的智能爆發(fā)? 作者將對策集中于委托-代理問題,并把方法分為兩大類:能力控制和動機選擇。 相當于是選擇把文章做在韓信等將軍身上以使其造反,還是把文章做在劉邦身上以使其喪志。 6. 多極情景:諸侯割據(jù) 這是與上面第2點并列的分岔。相當于分析不是劉邦獨大,而是陷入諸侯割據(jù)的情況。 作者對這一情景的關注包含兩個層面。首先,社會融合可能會成為控制問題的一種解決方式。其次,即使沒有人著手去創(chuàng)造出多極條件來解決控制問題,多極結局也可能發(fā)生。那么,這種結局看起來可能是什么樣的呢?最終的競爭社會不一定會吸引人,也不一定能長久持續(xù)。 相當于項羽如果分析到劉邦集團會自亂陣腳,陷入內亂,那就沒必要著急抹脖子了—畢竟先三十年河東,再三十年河西。 二、獲取價值觀 《獲取價值觀》一章及以后的《確定選擇標準》各章是本書的精華,具有超越本書的普世的閱讀價值。 1. “目標系統(tǒng)工程” 作者的本意,是提出一種叫“目標系統(tǒng)工程”的東西,來避免出現(xiàn)天算超過人算后,電腦把自己當作目的,而讓人成為電腦的手段這種異化局面。為此,主張人要先發(fā)制人(準確地說是先發(fā)制“機”),把目標的控制權掌握在人手中。用作者的話說:“對能力的控制最多是一個暫時、輔助的手段。除非要永久地限制超級智能,否則我們都需要掌握動機選擇機制! 我覺得最有意思的是“價值觀加載技術的總結”這張表(見本書第259頁)。它對于治理各類目標與手段不符的問題都有借鑒意義。它至少讓我們知道,除了搞運動,人類還可以通過未來幾百年的建設來讓做事符合宗旨這件事,被專業(yè)化地完成。 作者關于“目標系統(tǒng)工程”的具體設想,如管理效用函數(shù)、價值評估等,并不重要。將來會有人對其不斷改進,使之成熟。這本書最大的貢獻在于提出了一個非常正點(“思無邪”)的問題:“怎樣才能將一些價值觀加載到人工代理內部,使該價值觀成為其追求的最終目標呢?”這是人類一萬年來的夢想,但從來沒有實現(xiàn)過!澳繕讼到y(tǒng)工程”是關于魂的工程,離開了魂,夢便只不過停留在做夢階段。
尼克·波斯特洛姆,全球著名思想家,牛津大學人類未來研究院的院長,哲學家和超人類主義學家。 其學術背景包括物理、計算機科學、數(shù)理邏輯以及哲學,著有大約200種出版物,已經(jīng)被翻譯成22種語言。 曾獲得尤金·甘農(Eugene R. Gannon)獎(該獎項的獲得者每年只有一名,他們來自哲學、數(shù)學、藝術和其他人文學科與自然科學領域)。
序言 // XXV
第一章.人工智能:昨日成就與今日現(xiàn)狀 增長模式和宏大歷史 // 003 大預期 // 006 希望與絕望并存 // 008 技術發(fā)展水平 // 016 對未來機器智能的看法 // 022 第二章.通往超級智能之路 人工智能 // 030 全腦仿真(whole brain emulation) // 037 生物認知 // 043 人腦—計算機交互界面 // 052 網(wǎng)絡和組織 // 056 總結 // 058 第三章.超級智能的形式 序言 // XXV 在你的顱腔里,有個器官能夠閱讀。這個器官就是人的大腦,它具有其他動物大腦沒有的一些能力,而我們在地球上的主宰地位便歸功于這些獨特的能力。其他動物有更強壯的肌肉或更銳利的爪子,但是我們有更聰明的大腦。我們在一般智能方面的些許優(yōu)勢使我們創(chuàng)造了語言,發(fā)展了科技,并建立了復雜的社會組織。這種優(yōu)勢隨著時間的延續(xù)而不斷提高,因為每一代人的成就都建立在前人的成就之上。 如果有一天我們發(fā)明了超越人類大腦一般智能的機器大腦,那么這種超級智能將會非常強大。并且,正如現(xiàn)在大猩猩的命運更多地取決于人類而不是它們自身一樣,人類的命運將取決于超級智能機器。 然而我們擁有一項優(yōu)勢:我們清楚地知道如何制造超級智能機器。原則上,我們能夠制造一種保護人類價值的超級智能,當然,我們也有足夠的理由這么做。實際上,控制問題—也就是如何控制超級智能,似乎非常困難,而且我們似乎也只有一次機會。一旦不友好的超級智能出現(xiàn),它就會阻止我們將其替換或者更改其偏好設置,而我們的命運就因此被鎖定了。 在本書中,我將努力詮釋可能出現(xiàn)的超級智能帶來的挑戰(zhàn),以及我們如何更好地應對。這很可能是人類面對的最重要和最可怕的挑戰(zhàn)。而且,不管我們成功還是失敗,這大概都是我們將要面對的最后一個挑戰(zhàn)。 本書并不認為,我們即將在人工智能方面取得重大突破,或者能夠準確預測突破會在何時發(fā)生。突破有可能會在21世紀的某些時候實現(xiàn),但是我們并不能確定。本書的前幾章討論了取得突破的可能途徑,并談論了何時能夠突破的問題。然而,本書的主要部分討論的是智能爆發(fā)以后會發(fā)生什么。我們會研究智能大爆發(fā)的動力學,超級智能的形式和能量,以及具有決定性優(yōu)勢的超級智能體有哪些戰(zhàn)略選擇。然后,我們探討的重點轉向控制問題,并提出為了讓我們生存并且獲得有利的結果,我們如何選擇初始數(shù)據(jù)的問題。在本書的結尾,我們將畫面拉遠,思考我們的研究所呈現(xiàn)的更大的圖景。最后提出了一些建議,指出為了增加避免存在性災難的概率,我們現(xiàn)在可以做些什么。 我希望本書可以開辟出一條道路,以使其他研究者能夠更加快速和便捷地到達這個領域的前沿,從而以全新的視角加入這項研究,進一步擴展我們的認識。(如果我鋪的這條道路有點崎嶇不平,那么我希望評論家們在評判結果時,不要低估原來地勢的險惡情況。 這本書寫起來并不容易。我努力使其讀起來容易,但是我覺得可能并沒有做到。寫作時,我把早前時間切片(time-slice)里的自己當作目標讀者,并盡量把書寫成自己喜歡閱讀的類型。雖然這可能會導致讀者群較窄,但我還是認為書中的內容對很多人來說都是能夠理解的,前提是他們對書中的內容進行一些思考,同時拒絕盲目地將任何一個新觀點誤解為他們文化中相似而陳舊的觀點。非科技專業(yè)的讀者不必因為書中偶爾出現(xiàn)的數(shù)學知識或專業(yè)術語感到氣餒,因為往往可以通過上下文的解釋看懂主要觀點。 本書提出的很多觀點可能是不恰當?shù)模行┓浅V匾挠^點我可能也沒有考慮到,從而削弱了我的某些或者所有結論的有效性。我已經(jīng)盡可能地在全書中指明細微差別和不確定性—書中遍布著太多的“可能”、“或許”、“也許”、“也有可能”、“看起來”、“大概”、“非常可能”、“幾乎肯定”這樣的詞。每個限定詞的使用都是經(jīng)過深思熟慮的。然而,這些字眼所體現(xiàn)出的認識方面的謙虛謹慎依然是不夠的,還必須要補充對不確定性和易錯性的整體說明。這不是虛偽的謙虛,因為雖然我相信我的書中可能有一些較嚴重的問題和誤導性,但是我認為目前書中提到的其他觀點更加糟糕,包括默認觀點或者所謂的“零假設”,這些觀點認為我們可以暫時安全地或合理地忽略超級智能出現(xiàn)的可能性。
第一章 人工智能:昨日成就與今日現(xiàn)狀 首先,我們回顧過去。在最長的時間范圍里,歷史似乎呈現(xiàn)出一系列不同的增長模式,每個新模式都比前一個模式增長更快。根據(jù)這個規(guī)律推測,可能會出現(xiàn)另一種(甚至更快速的)增長模式。然而,我們并不特別強調這個觀點,因為這并不是一本關于“科技加速”、“極速增長”,或者集合在“奇點”標題下的各種觀點的書。然后,我們要回顧人工智能的歷史,之后再探索目前人工智能的能力。最后,我們簡要地介紹一些專家近期的觀點和調查,并且思考一下我們對于未來發(fā)展之時間表的空白領域。 增長模式和宏大歷史 僅在幾百萬年前,我們的祖先還在非洲森林中穿梭。以地質或進化的時間尺度來看,從與類人猿共同擁有的最后一代祖先向智人的進化是非?焖俚。我們進化出直立的姿勢和對生拇指,而最重要的是,我們的大腦體積和神經(jīng)組織發(fā)生了相對微小的變化,但正是這些變化引起了人類認知能力的巨大進步。因此,人類可以進行抽象思維,交流復雜的思想,可以比地球上任何其他物種更好地積累和傳承文化信息。 這些能力使人類創(chuàng)造出越來越高效的生產技術,從而使我們的祖先從熱帶雨林和草原向遠方的遷徙成為可能。尤其是進行農耕之后,人口總數(shù)和人口密度都在增加。更多的人口意味著更多的想法;更大的人口密度則意味著想法更容易傳播,并且更多的個體可以專注于發(fā)展專門的技能。這些發(fā)展提高了經(jīng)濟生產力和技術實力的增長率。后來與工業(yè)革命相關的發(fā)展則帶來了第二次與此相當?shù)脑鲩L率的劇增。 這些增長率的變化有著重要的影響。幾十萬年前,在早期人類(或原始人類)史前時代,增長非常緩慢,要使人類生產能力增長到能夠維持另外100萬人基本生存的水平,需要大約100萬年的時間。到了公元前5000年,經(jīng)過了農業(yè)革命,增長率已經(jīng)提高到只需要兩個世紀就能實現(xiàn)同樣的增長。今天,經(jīng)過了工業(yè)革命,世界經(jīng)濟平均每90分鐘就能夠增長相同的量。 即使是現(xiàn)在的增長率,如果持續(xù)一定時間,也會產生可觀的結果。如果世界經(jīng)濟繼續(xù)以過去50年的速度增長,那么到2050年,全球財富將是現(xiàn)在的約5.8倍,到2100年則是約35倍。 然而,當前這種依指數(shù)增長實現(xiàn)穩(wěn)定繁榮的方式仍舊是不夠的,如果世界再經(jīng)歷一次農業(yè)革命或工業(yè)革命那樣的飛躍式增長,世界將會呈現(xiàn)出完全不同的面貌。經(jīng)濟學家羅賓·漢森通過研究歷史上的經(jīng)濟和人口數(shù)據(jù),推測出過去社會中經(jīng)濟呈倍數(shù)增長所要經(jīng)歷的時間:在洪積世狩獵采集社會下,經(jīng)濟增長翻倍需要224 000年,在農業(yè)社會需要909年,在工業(yè)社會則需要6.3年。(在漢森的模型中,當今時代是農業(yè)社會和工業(yè)社會發(fā)展模式的混合體,世界經(jīng)濟實現(xiàn)倍數(shù)增長的速度還不能達到6.3年這個平均時長。)但如果出現(xiàn)另外一種完全不同的經(jīng)濟增長模式,類似于農業(yè)革命和工業(yè)革命時期的飛躍式發(fā)展,那么世界經(jīng)濟便會以每兩周的時間實現(xiàn)翻倍增長。 以當今形勢看,要實現(xiàn)這種增長速度無異于癡人說夢。觀察家們可能已經(jīng)發(fā) 洪積世(Pleistocene),又譯更新世,地質時代第4紀的早期!g者注現(xiàn),對于以往的歷史時期而言,世界經(jīng)濟很難在某一段時期中實現(xiàn)好幾次翻倍增長。然而,我們現(xiàn)在就要學著對這種不尋常的情況習以為常。 弗諾·文奇(VernorVinge)開創(chuàng)性的文章以及雷·庫茲韋爾(Ray Kurzweil)等人的著述所揭示的那種即將到來的技術性奇點已經(jīng)受到了廣泛關注。然而,“奇點”這一術語在很多不同領域被混亂地使用,并催生出一種不合理的技術烏托邦氛圍,就好像我們會就此迎來太平盛世了?紤]到“奇點”這個詞所指的大部分涵義與本文的論述不甚相關,我們可以去掉這個詞并代替以更精確的術語,以便闡述得更清晰。 我們更感興趣的一個與“奇點”相關的術語是智能爆發(fā),尤其是機器超級智能的前景?隙〞腥艘庾R到圖1–1所顯示的增長模式是比農業(yè)革命和工業(yè)革命還要激烈的另一種可能的飛躍式增長模式。這些人也會意識到,要想讓世界經(jīng)濟實現(xiàn)在僅僅數(shù)周內翻倍的增長速度,就需要創(chuàng)造出一種比人類的生物性思維更快、更有效的思維方式。但是我們很難通過分析經(jīng)濟增長曲線以及推斷過往經(jīng)濟增長模式來認真嚴肅地了解機器智能變革的前景。我們將看到,更加強有力的理由會讓我們認真考慮這一問題。 大預期 自20世紀40年代計算機被發(fā)明出來之后,機器就一直被寄予厚望,人們希望機器能夠具備人的一般智能,更確切地說,就是機器要具備普通判斷力和有效的學習、推理能力,并且要能夠制訂計劃以應對復雜信息處理過程帶來的挑戰(zhàn),這種挑戰(zhàn)可能來自自然和抽象領域的各個方面。在計算機剛面世時,人們就期望能夠在未來20年之內賦予計算機人工智能。但一年又一年過去了,實現(xiàn)讓機器具備人工智能的日期卻一拖再拖;以至于今天,關心人工智能的未來學家們依舊普遍認為智能機器的出現(xiàn)還需要20多年。 在談到徹底變革所需要的時間時,預言家們總喜歡用20年這個時間跨度:這個時間跨度既抓眼球,又足夠長,長到可以讓一個目前看起來還是模糊想象的突破成為現(xiàn)實。為什么不是更短的時間跨度呢?因為大多數(shù)在未來5~10年內可能對世界產生重大影響的技術目前已經(jīng)在小范圍內被應用了,而全新的技術在不到15年之內就能讓世界煥然一新,當然這也只是一個理論假設。另外,之所以喜歡說20年,還有可能是因為一個預言家的職業(yè)生命大概就是這么長,這樣一來他在做出大膽假設時也不用承擔名聲受損的風險。 然而,即便一些人在過去對人工智能的預言不準確,這也并不意味著人工智能就是不可能或者永遠無法實現(xiàn)的。那么,為什么人工智能的發(fā)展總是落后于預期呢?這主要是因為創(chuàng)造人工智能機器所遭遇的技術困難遠遠超過了先驅者們認為的程度。但這也只是說明我們遇到了多大的技術難題以及我們離解決這些難題還有多遠。很多時候,一個最初看起來復雜得不可救藥的難題往往在后來都會意外地被非常簡單的手段所解決,當然,用復雜的手段解決難題更為常見。 在下一章,我們將會看到那些可能實現(xiàn)與人類相同智能的人工智能的具體路徑。但我們在一開始就需要注意一點,那就是如果我們將實現(xiàn)人工智能視為一輛火車所要到達的站臺,那么不管我們現(xiàn)在與將要到達的站臺之間有多少臨時停靠站,實現(xiàn)與人類智能相同的機器智能也并不是終點站。順著這條道路再往前走,下一個站臺就是機器智能超越人類智能。這列火車不會在達到人類智能水平這一站就停滯不前或者減速行駛,它很有可能會飛速而過。 第二次世界大戰(zhàn)時期,阿蘭·圖靈密碼破譯小組的首席統(tǒng)計師兼數(shù)學家I. J. 古德大概是清晰闡述人工智能未來圖景的第一人。在那段寫于1965年、后來被經(jīng)常引用的名言中,他這樣寫道: 我們把超智能機器定義為具備超越所有聰慧人類智能活動的機器?紤]到設計機器是智能活動的一部分,那么超智能機器甚至能夠設計出更好的機器。毫無疑問,肯定會出現(xiàn)諸如“智能爆發(fā)”這樣的局面,人類智能會被遠遠地甩在后面。因此,第一臺超智能機器將是人類創(chuàng)造的最后一臺機器,當然前提條件是這臺機器足夠聽話并告訴我們要怎樣才能控制它。 目前存在的顯著風險便與這個智能爆發(fā)相關,我們必須以最嚴肅的態(tài)度審視這一風險,即使我們知道(實際上我們并不知道)出現(xiàn)這一風險的可能性非常小。但是盡管人工智能的先驅者們相信與人類智能水平相當?shù)娜斯ぶ悄芩嬖诘奈:,大多?shù)人也并不認為人工智能會有超越人類智能的可能。他們腦海里存在著這樣的固有觀念,即就算是機器能夠達到人類的智能水平,也不能因此就推斷出機器最終會發(fā)展成超越人類智能的超智能機器。 人工智能的先驅者們大多數(shù)時候都不認為他們的事業(yè)可能會存在風險。至于創(chuàng)造人工智能以及具備人工智能的計算機霸主是否會存在任何安全隱患或者倫理風險,先驅者們才不會在這些問題上面多費唇舌,更別說去嚴肅思考了。即便是在當今這個不怎么批判技術使用過程中所存風險的社會背景下,這種缺失也讓人備感詫異。我們當然希望這些先驅者們的事業(yè)最終能夠成功,但我們要的不僅僅是嫻熟的技術以引燃智能爆炸,我們還要能在更高水平上掌握控制權,以免我們在爆炸中身首異處。 而在瞻望未來之前,對于機器智能歷史的飛速一瞥對我們而言還是頗有助益的。 希望與絕望并存 1956年夏天,10名研究神經(jīng)網(wǎng)絡、自動化理論以及智能的科學家們在達特茅斯學院組成了一個為期6周的工作組。這個達特茅斯夏季項目經(jīng)常被認為是人工智能研究的第一縷曙光。大多數(shù)參與者后來都成了這一領域的開創(chuàng)性人物。項目組成員的樂觀預期在給項目資助方洛克菲勒基金會提交的一份報告書中展現(xiàn)得淋漓盡致: 現(xiàn)報告我們10人團隊經(jīng)過兩個月針對人工智能的研究成果……這項研究建立在這樣一個設想的基礎上,即智能所能實現(xiàn)的學習或者任何其他方面的特征在理論上都能夠被機器精確地模擬出來。該研究嘗試去發(fā)現(xiàn)機器是如何使用語言、形成抽象思維與概念、解決人類所面臨的問題以及學會自我改良的。我們認為由這些精心遴選出來的科學家們組成的團隊在經(jīng)過一個夏天的研究后,能夠在其中一個或者幾個問題上實現(xiàn)突破性進展。 距離這一大膽的開創(chuàng)性研究已經(jīng)過去了60年,人工智能在這60年中跌宕起伏,既經(jīng)歷過大肆宣傳、野心勃勃的高潮期,也遭遇過挫折滿滿、令人失望的低潮期。 達特茅斯會議激發(fā)了人工智能的第一次研究熱潮,該項目的主要組織者約翰·麥卡錫說這一時期是一個“看,我能辦到!”的時代。在這一人工智能發(fā)展的早期時代,研究者們建立起各種系統(tǒng)以批駁那些認為“機器不能做‘某事’”的懷疑論。這類懷疑論在當時非常流行。為了對抗這種懷疑論,人工智能研究者們在某些微觀領域創(chuàng)造了小型系統(tǒng)去實現(xiàn)具體的“某事”,以便證明機器是能夠做“某事”的。這些微觀領域往往被完全限制在某個非常具體的范圍內,使得演示簡單的機器性能成為可能。比是早期的邏輯思想家的這類系統(tǒng)便可以證明懷特海和羅素那本《數(shù)學原理》(Principia Mathematica)第二章中的大多數(shù)定理,而邏輯思想家的證明過程甚至比原來的證明更加簡潔,這駁斥了那種認為機器“只會數(shù)數(shù)”的想法并顯示出機器也能夠進行推理和邏輯證明。在這之后又出現(xiàn)了通用問題解算程序,這種程序在原理上能夠解決很大范圍內的專業(yè)問題:既有能夠解決大學一年級課本里微積分問題的程序,也有能應用于某些智商測驗中解決圖像類比問題的程序,還有能寫出簡單代數(shù)語言的程序。Shakey(意思為搖擺)機器人的出現(xiàn)顯示出邏輯推理能夠與知覺結合在一起,并可以應用于設置和控制肢體動作,其之所以被叫作shakey,是因為這種機器人在演示時總是不停抖動。ELIZA程序則展示了一臺計算機是如何模仿羅杰斯這類心理治療師的。在20世紀70年代中期,SHRDLU系統(tǒng)演示了一只模仿人類的機器人手臂是如何在擺放著幾何物體的世界中,遵循使用者用英文打出的指令行事并且回答其輸入的問題的。在之后的10年中,相繼出現(xiàn)了各式各樣的系統(tǒng)程序:能夠以多個古典音樂作曲家的風格創(chuàng)作曲子的系統(tǒng),在特定的臨床診斷中表現(xiàn)得比初級醫(yī)師還要好的系統(tǒng),能夠自動駕駛汽車的系統(tǒng),以及能夠發(fā)明專利的系統(tǒng)。有的系統(tǒng)甚至還會說笑話。 但在早期的演示系統(tǒng)中取得成功的這種方式卻被證明很難向更廣泛的領域延伸,也很難解決更難的問題。原因之一在于常用的窮舉法很難解決可能的“組合爆炸”的問題。窮舉法可以解決簡單問題,但是只要問題變得稍微復雜一些,這種方法就沒有用了。例如要證明一個有5步推理、一個推理規(guī)則以及5條公理的定律,便可以簡單列舉出3 125種可能的組合方式,然后挨個試驗并尋找那個能夠推出預期結果的組合。窮舉法也可以運算6步或者7步的推理。但是隨著任務變得越來越復雜,這種窮舉法便很快遇到了瓶頸。要證明一個有50步推理的定律,工作量可并不是證明5步推理定律工作量的10倍,如果用窮舉法的話,就可能需要550≈8.9×1034種可能的組合,即使是對于最快速的超級計算機來說,這也是不可能實現(xiàn)的計算。 要克服“組合爆炸”帶來的問題,就需要有能夠開發(fā)目標領域結構的算法,并且要能通過啟發(fā)式搜索、計劃以及靈活的抽象信息處理方式有效利用已有知識,而這些都是早期人工智能系統(tǒng)所欠缺的地方。其早期系統(tǒng)性能還有一個缺陷,就是過多依賴脆弱且無根據(jù)的符號化的表達方式,再加上數(shù)據(jù)稀缺以及硬盤條件嚴重限制了計算機的存儲容量和加工速度,這些都使早期系統(tǒng)沒有很好的方法來控制不確定性。到了20世紀70年代中期,這些問題變得越發(fā)突出。在意識到多數(shù)人工智能項目無法成功實現(xiàn)我們最初的設想后,人工智能的研究迎來了第一個寒冬:項目被砍,資金縮水,懷疑論甚囂塵上,人工智能備受冷落。 20世紀80年代早期,人工智能迎來了春天。當時日本發(fā)起了第5代計算機系統(tǒng)工程,并專門為該工程建立起良好的公私合作伙伴關系,以確保充足的項目資金。該工程的主要目的在于超越當時的技術發(fā)展水平,通過發(fā)展大規(guī)模并行計算結構為人工智能的實現(xiàn)搭建平臺。該工程與日本的“戰(zhàn)后經(jīng)濟奇跡”一起受到關注,這一時期,西方國家政府以及商業(yè)精英們焦急地尋找能夠揭示日本經(jīng)濟成功的規(guī)律,以期在其國內復制日本的這種繁榮。當日本決定在人工智能領域大手筆投入時,其他國家都緊隨其后。 接下來的幾年見證了專家系統(tǒng)的繁榮。專家系統(tǒng)的設計理念是為決策者提供支持工具,該系統(tǒng)是一些基于從一系列由實際知識構建的知識庫中得到簡單推論的程序,而這些實際知識則是由某一領域的人類專家們提供并被精心編成以代碼表達的形式語言。當時有大約幾百個類似的專家系統(tǒng)被建立起來。然而專家系統(tǒng)也同樣存在著缺陷:小規(guī)模系統(tǒng)沒什么太大價值,大規(guī)模系統(tǒng)則需要在開發(fā)、確認和數(shù)據(jù)更新上耗費大量成本,在運用時往往也會非常麻煩。為了運行一個單一程序,就設置一臺獨立計算機,這不太現(xiàn)實。所以到了20世紀80年代末期,人工智能的這一繁榮時期也變得黯淡起來。 第5代計算機系統(tǒng)工程并沒能實現(xiàn)它的目標,而在美國和歐洲開展的類似項目也面臨著同樣的尷尬局面。第二次人工智能寒潮不期而至。這時,批評家的悲嘆甚囂塵上:“人工智能研究發(fā)展到今天,呈現(xiàn)出來的狀態(tài)往往是在特定領域取得了極其有限的成功之后,便立刻會在實現(xiàn)更宏大目標的過程中遭遇挫折,而這種挫折往往都是被早期的成功所揭示的!彼饺送顿Y者們開始回避任何與人工智能相關的風險。甚至對于學術界人士以及學術資助人來說,“人工智能”一詞都讓人感到厭煩。 但技術依舊飛快地向前發(fā)展,到了20世紀90年代,第二次人工智能寒冬的冰雪開始消融。樂觀主義者重燃激情,因為新技術似乎提供了一種有別于傳統(tǒng)邏輯范式(經(jīng)常被稱為GOFAI,意為“出色的老式人工智能”)的替代路徑,它聚焦于高水平符號處理,并且被20世紀80年代的專家系統(tǒng)發(fā)揮到了極致。神經(jīng)網(wǎng)絡和遺傳算法等新流行的技術有望在某種程度上克服GOFAI路徑的缺陷,尤其有可能會在傳統(tǒng)人工智能路徑的脆弱性上實現(xiàn)突破。這種脆弱性的主要體現(xiàn)是,只要系統(tǒng)存在一個微小的錯誤假設,整個結果便會變得毫無意義。讓新技術引以為傲的是,它具備了更多的生物有機體屬性。以神經(jīng)網(wǎng)絡為例,它具備了“故障弱化”的特性:神經(jīng)網(wǎng)絡的微小損壞通常只會導致整體性能的微小弱化而不會造成系統(tǒng)完全崩潰。更重要的是,神經(jīng)網(wǎng)絡能夠從經(jīng)驗中學習,也可以從樣本中找到最自然的概括路徑以及所輸入數(shù)據(jù)隱含的統(tǒng)計規(guī)律。這使得神經(jīng)網(wǎng)絡能夠有效解決模式識別和歸類的問題。比如,經(jīng)過聲吶信號訓練的神經(jīng)網(wǎng)絡能夠學會分辨潛水艇、水雷、海洋生物等不同的聲音特征,比人類專家還要精確。而神經(jīng)網(wǎng)絡在實現(xiàn)識別不同的聲音特征前,也不需要人類事先對聲音類別進行定義,或者事先總結出這些聲音的不同特點。 簡單的神經(jīng)網(wǎng)絡模型自20世紀50年代后期開始被人們熟知,在引入能夠訓練多層神經(jīng)網(wǎng)絡的反向傳播算法之后,人工智能領域又迎來了一陣復蘇。多層神經(jīng)網(wǎng)絡在輸入層和輸出層之間有一個或多個神經(jīng)元隱含層,能夠比之前的簡單系統(tǒng)具備更強大的功能。輔之以日益強大的計算機,工程師們便可以用改進的算法建立起能夠被很好地應用到許多領域中的神經(jīng)系統(tǒng)網(wǎng)絡。 基于傳統(tǒng)算法規(guī)則的GOFAI系統(tǒng)雖然邏輯嚴密,但是性能很差,而神經(jīng)網(wǎng)絡具備類似于人類大腦的特質,比之前的GOFAI系統(tǒng)要好出許多。神經(jīng)網(wǎng)絡還催生出了新的“機制”論,即所謂的“連接機制”,這種連接機制聚焦于大規(guī)模平行的精粒度亞符號數(shù)據(jù)處理的重要性。自那時起,以人工神經(jīng)系統(tǒng)為主題的學術文獻已超過150 000篇,并且人工神經(jīng)系統(tǒng)目前依舊是機器學習的重要路徑。 以進化為基礎的算法,比如遺傳算法和遺傳編程,構建了另一條引領人們走出第二次人工智能寒冬的新路徑。這類方法在學術領域產生的影響或許并沒有神經(jīng)網(wǎng)絡系統(tǒng)那么大,卻受到了廣泛的歡迎。進化模型能夠維系一個備選方案群(方案群本身可以通過數(shù)據(jù)結構和程序來實現(xiàn)),并通過改變或重組現(xiàn)有方案群中的變量來生成新的備選群。通過應用選擇標準(適應度函數(shù))可以讓備選群周期性地減少,并且只讓其中那些更好的方案群進入下一代。經(jīng)過數(shù)千代重復之后,備選方案池中解決方案的平均素質就會慢慢提高。這種算法能夠在運行中生成有效的解決方案來解決范圍很廣的問題,而這類解決方案可能是完全讓人耳目一新且非直觀的,比任何一個人類工程師設計出來的東西都更像自然結構。從原理上講,這個過程可以在不太需要人工初始輸入具體而簡單的適應度函數(shù)的情況下發(fā)生。但在實際操作中,要讓進化方法得以順利運行,還是需要一定的技巧和獨特設計的,特別是要能設計出一個優(yōu)秀的表達形式。如果不能對可能的解決方案進行有效編碼(也就是將其轉換成一種基因語言以匹配目標領域的潛在結構),關于進化的研究道路就會變得蜿蜒曲折且沒有盡頭,它會迷失在一個宏大的研究空間中或者卡在某個局部環(huán)節(jié)上停滯不前。不過即便是有了好的表達格式,進化算法也需要極大的計算量,并且常常會被“組合爆炸”擊垮。 20世紀90年代,神經(jīng)網(wǎng)絡和遺傳算法等研究方法激起了人們廣泛的興趣,為GOFAI范式提供了可替代的路徑。但本文在此并不是要為這兩個方法唱贊歌,也不是要拔高這類方法在機器學習技術領域中的地位。實際上,過去20年間一個主要的理論進展便是人們更清醒地意識到,目前表面上完全不同的各類技術,是可以被理解為存在于一個共同數(shù)學框架中的特殊案例的。舉個例子,許多類型的人工神經(jīng)網(wǎng)絡系統(tǒng)都可以被視為對特定類別統(tǒng)計計算的展示(是一種最大似然估計)。這其實是將神經(jīng)系統(tǒng)視為從實例中學習分類的更大一類算法中的一種,比如:決策樹、邏輯回歸模型、支持向量機、樸素貝葉斯、KNN算法等。在一定程度上,遺傳算法可以被視為一種隨機爬山法的演示,是尋找最優(yōu)化算法大類中的一種。每一類這種算法在建立分類和尋找解決空間上都有自己的優(yōu)缺點,而這些優(yōu)缺點都是能夠借助計算揭示出來的。不同的算法對處理時間和存儲空間的要求都有所不同,從而帶來了兩個問題:一個問題是算法的預先假設存在歸納偏置,不過這個問題可以通過納入外部內容來得到緩解;另一個問題就是,如何把算法的內在運行機制向人類分析家們解釋清楚。 在機器學習以及創(chuàng)造性的問題解決模式之喧囂炫目的背后,是一系列特定的計算權衡。理想的狀態(tài)是實現(xiàn)完美的貝葉斯代理程序(Bayesian agent),即在可獲得的信息中尋找出概率最優(yōu)。當然,這種理想狀態(tài)是無法實現(xiàn)的,因為沒有一臺物理計算機能支持它所需要的宏大計算量(延伸閱讀1)。但我們仍舊能夠將人工智能視為尋找捷徑的一種探索:借助人工智能手段,我們可以通過在將其引入特定現(xiàn)實領域并維持其性能的同時犧牲一些最優(yōu)解或者普遍性,進而逐步靠近貝葉斯理想狀態(tài)。 回顧一下我們在過去的20多年間,在像是貝葉斯網(wǎng)絡這類概率模型的發(fā)展中取得了什么樣的成果。貝葉斯網(wǎng)絡提供了一個在特定領域中表達的概率以及獨立條件之間關系的簡潔方法。(探索這種關系對于我們克服“組合爆炸”帶來的困難至關重要,因為“組合爆炸”本身從邏輯上看就是概率推理中遇到的一個問題。)貝葉斯網(wǎng)絡還有助于我們更深刻地理解因果概念。 將特定領域的學習問題與貝葉斯推理中的普遍問題聯(lián)系在一起的一個好處是,新的運算法則能夠讓貝葉斯推理變得更加有效,進而能夠使許多不同領域實現(xiàn)快速進步。舉例來說,蒙特卡洛法就直接被應用到計算機視覺、機器人技術以及基因計算上。它的另一個好處則是能夠讓不同學科的研究者更容易地匯集他們的研究成果。圖表模型和貝葉斯統(tǒng)計學在許多領域都得到了關注,包括機器學習、統(tǒng)計物理學、生物信息學、組合優(yōu)化以及交流理論。而在機器學習領域,相當多的近期成果都來源于對其他學術領域原創(chuàng)成果的吸收。(機器學習應用在很大程度上就受益于更快的計算機以及更大的數(shù)據(jù)庫。) 延伸閱讀1.一個理想的貝葉斯代理程序 一個理想的貝葉斯代理程序最初都會設定“先驗概率分布”(Prior Probability Distribution),即先把概率賦給各個“可能世界”。但這種先驗概率存在著歸納偏置,即認為越是簡單的可能世界,越具備較高的概率。[我們可以將可能世界的簡單性問題用一個正式的術語來進行描述,即“柯爾莫哥洛夫復雜性”(Kolmogorov complexity),也就是完整描述一個世界所需要的計算機程序的最短長度。]先驗概率還包含了編程者希望賦予程序的所有背景知識。 當代理程序借助傳感器接收到新的信息后,它會遵循貝葉斯法則對新信息的分布進行條件化,從而更新已有的概率分布。條件化是一種數(shù)學運算,如果先驗概率與新的概率不一致,那么數(shù)學運算就會對原有的可能世界中的概率進行重新設置。運算的結果就是“后驗概率分布”(Posterior Probability Distribution),當然在下一輪運算開始前,這種后驗概率又會被視為先驗概率。代理程序能夠通過觀察實現(xiàn)概率聚合,將概率集中在幾個不斷縮小的與證據(jù)相匹配的可能世界中,而在這幾個領域中,越簡單的那些便有著越高的概率。 打個比方,我們可以把概率視為一大張紙上面的沙子。我們在這張紙上畫出大小不同的區(qū)域,每一個區(qū)域都對應一個可能世界,范圍越大的區(qū)域對應越簡單的可能世界。再想象一下鋪在整張紙上的沙子厚度相同:這就是我們的先驗概率分布。每當觀察者劃掉一個區(qū)域時,我們就把該區(qū)域內的沙子拿走,然后平均鋪到其他剩余區(qū)域內。整張紙上的沙子總量并沒有發(fā)生變化,只是隨著觀察證據(jù)的積累,沙子越來越集中到幾個較少的區(qū)域內。這就是貝葉斯學習的最單純的模式。(要想計算出一個假設的概率,我們只需要測量出紙上已有領域中的沙子的數(shù)量就可以了,這與該假設在其中成立的可能世界相應。) 至此,我們已經(jīng)定義了一個學習規(guī)則。對于代理程序而言,我們還需要一個決策規(guī)則。為了實現(xiàn)這一目的,我們給代理程序賦予一個效用函數(shù),即給每個可能世界分配一個數(shù)字。具體數(shù)字代表著根據(jù)代理程序基本偏好設定的可能世界中的渴望度,F(xiàn)在,代理程序在每一步運行中都會選擇有著最高期望效用的操作。(要尋找出最高期望效用的操作,代理程序可以先把所有可能的操作都羅列出來,然后計算出特定操作的條件概率分布,這種概率分布是通過觀察剛結束的操作結果來不斷調整當前的概率分布的。最終,代理程序能夠計算出操作的期望值,這個期望值是每個可能世界與被賦予操作程序之可能世界的條件化概率的乘積之和。) 學習規(guī)則和決策規(guī)則一起構成了代理程序的最優(yōu)概念。最優(yōu)概念已經(jīng)被廣泛應用到人工智能、認識論、科學哲學、經(jīng)濟學以及統(tǒng)計學上。但從現(xiàn)實層面上看,因為所需要執(zhí)行的運算是難以實現(xiàn)的,因而很難設置這樣的代理程序。所有的嘗試都死在“組合爆炸”這個問題上,我們之前討論的GOFAI便是如此。為什么會這樣?只消考慮一下所有可能世界的任何一個微小子集即可:那些構成一個計算機顯示器的子集都陷入無止境的真空狀態(tài)。一個顯示器有1000×1000個像素,每一個像素的狀態(tài)都有開和關兩種。即使是這種可能世界的子集,數(shù)量仍舊是巨大的: 21000×1000種可能的顯示狀態(tài),這個計算量比觀察宇宙所需的計算量都大。我們連可能世界的子集都無法列舉出來,更別說要去計算那些更精巧的獨立世界了。 雖然在物理上難以實現(xiàn),最優(yōu)概念依舊在理論上備受關注。這個概念給我們提供了一種標準,使我們能夠判斷啟發(fā)式的近似算法,也讓我們可以在有些時候推理出特定條件下的最優(yōu)代理程序會做些什么。我們會在第12章談到一些人工代理程序的最優(yōu)概念的替代路徑。 技術發(fā)展水平 人工智能已經(jīng)能夠在很多領域超越人類智能。表1–1列舉了計算機玩游戲的現(xiàn)狀,顯示出人工智能能夠在范圍很廣的游戲領域超越人類。 這些成就在今天看來,可能不見得有多么讓人印象深刻,但這主要是因為讓我們感到吃驚的點隨著技術發(fā)展而不斷升高所致。舉例來說,專業(yè)國際象棋比賽曾被認為是人類智能活動的集中體現(xiàn)。20世紀50年代后期的一些專家認為:“如果能造出成功的下棋機器,那么就一定能夠找到人類智能的本質所在!钡F(xiàn)在,我們卻不這么認為了。約翰·麥肯錫曾不無惋惜地悲嘆:“這種機器被造出來之后,人們就不稱其為人工智能了! 表1–1 玩游戲的人工智能 西洋跳棋 超越人類 1952年,阿瑟·塞繆爾寫過一個跳棋程序,并在1955年吸收了機器學習技術,從而改良了該程序。這是第一個玩起游戲來比程序編寫者都玩得好的程序。1994年,跳棋程序“奇努克”(CHINOOK)打敗了人類衛(wèi)冕冠軍,這是機器程序第一次在競技游戲中贏得官方世界冠軍。2002年,喬納森·謝弗和他的小組“解決號”跳棋程序總是計算出最好的棋步(謝弗的跳棋程序能夠用α–β搜索在39萬億棋步中展開搜索),最終打了個平局。
西洋雙陸棋 超越人類 1979年,漢斯·波爾萊納的BKG西洋雙陸棋程序打敗了當時的世界冠軍,這是計算機程序第一次在公開比賽中擊敗世界冠軍,盡管波爾萊納后來將這次成功歸結為運氣好。1992年,格里·泰紹羅的TD–Gammon西洋雙陸棋程序已經(jīng)達到冠軍級別的水平,該程序采用了即時差分學習算法(一種強化學習模式),使得程序本身能夠在下棋中不斷進行自我改良。從那一年之后,西洋雙陸棋程序就遠遠超越了最好的人類棋手。
海戰(zhàn)游戲(TravellerTCS) 在與人類的合作中超越人類 Traveller TCS是一款未來海戰(zhàn)游戲,在1981年和1982年,道格拉斯·萊納特的Eurisko程序在游戲中擊敗了美國冠軍,并導致游戲規(guī)則被修改,以限制該程序的非常規(guī)策略。Eurisko能夠用啟發(fā)式算法設計自己的艦隊,還能不斷優(yōu)化自己的啟發(fā)式算法。
黑白棋 超越人類 1997年,Logistello程序跟當時的世界冠軍村上健的對戰(zhàn)結果是6盤6勝。
國際象棋 超越人類 1997年,“深藍”計算機打敗了當時的國際象棋世界冠軍加里·卡斯帕羅夫?ㄋ古亮_夫承認見識到了人工智能在某些棋步上具備真正的智能以及創(chuàng)造力。從那時起,國際象棋程序就一直不斷進步。
縱橫字謎 專家級別 1999年,縱橫字謎解決程序Proverb達到了縱橫字謎玩家的平均水平。2012年馬修·金斯伯格的Dr.Fill程序在美國縱橫字謎錦標賽中與人類參賽者競賽時擠入最強者行列。但該程序的表現(xiàn)不穩(wěn)定。它能夠完美地解出對人類而言最難的字謎,卻會被非常規(guī)的字謎卡住,尤其是在遇到倒拼或者斜拼的時候。
Scrabble拼字游戲 超越人類 2002年,Scrabble拼字游戲軟件就已經(jīng)超越了最好的人類選手。
橋牌 高手水平 2005年,定約橋牌軟件就已經(jīng)能夠同最好的橋牌高手對弈。
《危險邊緣》益智問答 超越人類 2010年,IBM的“沃森”超級計算機在《危險邊緣》游戲中擊敗了肯·詹寧斯和布萊德·拉特這兩名擂主冠軍。《危險邊緣》是以提問有關歷史、文學、運動、地理、流行音樂、流行文化、科學以及其他領域的細節(jié)問題而著稱的電視益智節(jié)目!段kU邊緣》游戲的題目一般都需要通過拆字謎的方式來發(fā)現(xiàn)線索。
撲克 發(fā)揮不穩(wěn) 電腦玩家在玩得州撲克時還沒能超越人類玩家,但是在一些類似的撲克游戲中卻超越了人類水平。
空當接龍 超越人類 采用了遺傳算法的啟發(fā)法能夠為空當接龍游戲提供解決方案(以NP完全問題的普通形式),并可以超越最好的玩家。
圍棋 很高的業(yè)余水平 2012年,Zen系列圍棋程序能夠達到6段水平(很高的業(yè)余棋手水平),這個程序主要運用了蒙特卡洛樹搜索法和機器學習技術。圍棋程序此后以每年提升一段的速度向前發(fā)展。照這個速度看,圍棋程序在未來10年內很可能會擊敗人類世界冠軍。
但在這要特別注意一點,在國際象棋領域,人工智能并沒有像人們預想的那樣取得勝利。曾經(jīng)有這樣一種可能不太合理的設想,即要想讓計算機在下國際象棋時具備大師級的水平,就必須得賦予其高水平的一般智能。人們以前總以為要下好國際象棋,就要理解抽象概念、精通謀略、靈活組合棋步、廣泛地使用邏輯推演,甚至要能猜透對手在想什么。但事實并非如此。結果證明,建立在特定目的算法基礎上的機器就能夠把國際象棋玩得很好。20世紀末有了快速中央處理器時,計算機就能夠把國際象棋玩得出神入化了。但是這種人工智能也有個缺陷,就是它只能玩國際象棋,而做不了其他事。 在其他領域中,解決方案被證明比最初設想的還要復雜,而且所能實現(xiàn)的進步也更加緩慢。計算機科學家唐納德·克努特這樣打擊著人們的激情,他說道:“目前,人工智能在所有需要‘思考’的領域中成功了,但是卻在人和動物‘不思考’的領域中失敗了,‘不思考’比‘思考’在某種程度上要更難!”分析視覺景象、識別物體或者控制機器人行為以使它能夠與自然環(huán)境產生交互作用,都頗具挑戰(zhàn)性。盡管如此,還是有很多致力于解決此類問題的程序被持續(xù)不斷地創(chuàng)造出來,與此同時,硬件方面也實現(xiàn)了穩(wěn)步發(fā)展。 普通常識和自然語言理解也被認為是非常困難的。人們常常認為,要讓機器在這些任務上實現(xiàn)完整意義上的人類水平屬于“完全人工智能”領域,其意味著解決這類問題的難度等同于制造一個具備普通人類能力的智能機器的難度。換句話來說,如果有人能夠成功創(chuàng)造一個具備成人理解力的人工智能機器,那么勢必也就能夠創(chuàng)造出完成人類所能完成的所有事情的人工智能機器,后面這一步即使不能當下實現(xiàn),也必定近在眼前。 國際象棋專業(yè)級的下棋水平最終被證明能夠通過一個頗讓人意外的簡單算法來實現(xiàn),這使得人們思索是不是可以用一些簡單算法來實現(xiàn)機器的其他能力,比如普通推理能力或一些涉及編程的關鍵能力等。事實上,過去要實現(xiàn)良好性能需要有一套復雜的程序機制,但這并不意味著簡單的程序機制就做不到這一點—它還有可能會做得更好。之所以沒有出現(xiàn)可替代的簡單程序,可能只是因為它尚未被人發(fā)現(xiàn)。托勒密體系曾宣稱地球是宇宙中心,日月星辰均繞其運轉。這個體系在超過1 000年的時間里代表著天文學水平,在幾個世紀的發(fā)展完善中,為了取得更精確的預測度,它的模型變得越來越復雜:不斷地在原有的解釋天體運轉基本假設的基礎上增添一層層的條件,直到整個體系被哥白尼那個更為簡單的日心說所顛覆,而日心說在開普勒的進一步完善之后,使預測變得更加精準。 人工智能方法現(xiàn)已被應用到非常廣泛的領域中,在此沒有必要一一贅述,但是簡要列舉幾個典型的例子會有助于我們理解人工智能的應用廣度。除了我們在表1–1中所列舉的游戲領域,人工智能還被應用到許多具體領域中:能在嘈雜環(huán)境中聽清呼救聲的程序;能夠給駕駛員提供地圖展示和導航建議的路線查找系統(tǒng);能夠根據(jù)用戶前次購買和瀏覽收聽記錄給用戶推薦書籍唱片的意見參考程序;能夠幫助醫(yī)生診斷乳腺腫瘤、提供治療計劃、幫助解釋心電圖的醫(yī)學決策支持系統(tǒng)等。除此之外,還有各式各樣的機器人:機器人寵物、清潔機器人、修草坪機器人、急救機器人、外科手術機器人以及數(shù)以百萬計的工業(yè)機器人。目前世界上的機器人數(shù)量已經(jīng)超過了1 000萬。 基于諸如馬爾可夫模型統(tǒng)計技術之上的現(xiàn)代語音識別技術已被有效地應用到現(xiàn)實中,我們就曾用語音識別系統(tǒng)摘錄本書的部分章節(jié)。像是蘋果Siri這類個人數(shù)字助理系統(tǒng)已能夠接受語音指令、回答簡單問題并執(zhí)行命令了。而能夠識別手寫或者機打文本的光學字符識別系統(tǒng)現(xiàn)在也已經(jīng)被廣泛地應用到郵件分揀以及老舊文獻的數(shù)字化處理中。 機器翻譯雖然并不完美,但已經(jīng)能很好地應用到許多方面。早期系統(tǒng)要應用GOFAI手編語法,它需要技術性較強的語言學家對每種語言從頭編寫,而新的系統(tǒng)則能夠運用統(tǒng)計性的機器學習技術通過觀察已有模式來自動建立統(tǒng)計模型。機器通過分析兩種語言的語料庫來推斷出這些模型的參量。這種方法讓語言學家沒有了用武之地:編程者甚至不用理解他們所處理的語種就能夠搭建起識別系統(tǒng)。 人臉識別系統(tǒng)在近幾年已經(jīng)發(fā)展得非常完備了,現(xiàn)在已經(jīng)被應用到歐洲和澳大利亞的自動出入境系統(tǒng)上。美國國務院實施了一個用于簽證的人臉識別系統(tǒng),其中包含了超過7 500萬張的照片。影視監(jiān)管系統(tǒng)越來越多地使用復雜精妙的人工智能以及數(shù)據(jù)挖掘技術來分析聲音、視頻或者文本以審查全世界的電子傳媒并積累在強大的數(shù)據(jù)庫中。 定理證明系統(tǒng)和解方程系統(tǒng)也已經(jīng)發(fā)展得如此完備,以至于很難被歸到人工智能領域。在解方程方面發(fā)展出了Mathematica這類科學計算程序;而包含自動定理證明的形式證明方法也已經(jīng)被芯片制造商們廣為使用,以在生產之前檢測所設計的電路是否能夠運轉良好。 美國的軍事情報部門在大規(guī)模應用炸彈排查機器人、監(jiān)視攻擊兩用無人機以及其他無人駕駛機器上一直遙遙領先。
你還可能感興趣
我要評論
|