我們每年向幾百名學(xué)生教授數(shù)據(jù)科學(xué),他們都對人工智能很著迷,并會(huì)提出很好的問題。汽車如何學(xué)習(xí)自動(dòng)駕駛?亞歷克莎(Alexa)如何理解我在說什么?聲田(Spotify)是怎樣為我選擇如此精彩的播放列表的呢?臉書如何在我上傳的照片中識(shí)別我的朋友?這些學(xué)生意識(shí)到,人工智能不是來自未來的某種科幻機(jī)器人。
它存在于此時(shí)此刻。它在通過每一部智能手機(jī)改變世界。學(xué)生們都想理解人工智能,而且都想?yún)⑴c其中。
我們的學(xué)生不是唯一對人工智能產(chǎn)生熱情的人。和他們一樣欣喜的還有世界上最大的公司 — 從美國的亞馬遜、臉書、谷歌到中國的百度、騰訊、阿里巴巴。你可能聽說過,這些大型科技公司正在發(fā)動(dòng)一場針對人工智能人才的昂貴的全球軍備競賽,他們認(rèn)為這對他們的未來非常重要。我們看到,多年來,他們一直在用 30 萬美元以上的年薪和遠(yuǎn)遠(yuǎn)優(yōu)于我們學(xué)術(shù)界的咖啡來吸引剛畢業(yè)的博士。
現(xiàn)在,我們看到更多公司參與到人工智能領(lǐng)域的人才爭奪之中 —比如坐擁海量數(shù)據(jù)的保險(xiǎn)和石油公司,他們同樣可以提供可觀的薪水和獨(dú)具特色的咖啡機(jī)。
這種軍備競賽當(dāng)然是真實(shí)的,但我們認(rèn)為人工智能領(lǐng)域目前還有另一個(gè)更加強(qiáng)烈的趨勢 — 這個(gè)趨勢不是集中,而是擴(kuò)散和傳播。是的,每家大型科技公司都在努力囤積數(shù)學(xué)和編程人才,但與此同時(shí),人工智能背后的基本技術(shù)和思想正在以極快的速度擴(kuò)散,被小公司、其他行業(yè)以及世界各地的愛好者、程序員、科學(xué)家和研究人員所掌握。這種民主化趨勢是最讓我們今天的學(xué)生感到激動(dòng)的事情,因?yàn)樗麄冋诳紤]各種急切需要人工智能解決方案的問題。
比如,誰會(huì)想到一群大學(xué)生會(huì)對黃瓜數(shù)學(xué)如此著迷?當(dāng)他們聽說日本汽車工程師小池誠(Makoto Koike,音譯)的故事時(shí),他們的確很著迷。小池誠的父母有一座黃瓜農(nóng)場。在日本,黃瓜具有各種令人眼花繚亂的大小、形狀、顏色和毛刺度 — 人們必須根據(jù)這些外觀特征將黃瓜分屬九種類別,這些類別具有不同的市場價(jià)格。
過去,小池的母親每天要花八個(gè)小時(shí)手工分揀黃瓜。后來,小池意識(shí)到,他可以用谷歌的開源人工智能軟件 TensorFlow 完成這項(xiàng)任務(wù)。他可以編寫一種“深度學(xué)習(xí)”算法程序,根據(jù)照片為黃瓜分類。
小池之前從未使用過人工智能和 TensorFlow,但他很容易就根據(jù)現(xiàn)有的所有免費(fèi)資源完成了自學(xué)。當(dāng)他的人工智能分揀機(jī)器視頻在YouTube 上出現(xiàn)時(shí),小池成了深度學(xué)習(xí)和黃瓜這兩個(gè)領(lǐng)域的國際名人。他不僅為人們提供了一個(gè)有趣的故事,為他的母親免除了無數(shù)個(gè)小時(shí)的辛勞,他還向全世界的學(xué)生和程序員傳達(dá)了一個(gè)令人鼓舞的消息:既然人工智能可以解決黃瓜農(nóng)場的問題,那么它應(yīng)該可以解決幾乎所有領(lǐng)域的問題。
這條消息目前正在迅速傳播。醫(yī)生正在用人工智能診斷和治療癌癥。電力公司用人工智能提高發(fā)電效率。投資者用人工智能管理財(cái)務(wù)風(fēng)險(xiǎn)。石油公司用人工智能提高深海鉆井平臺(tái)的安全性。執(zhí)法機(jī)構(gòu)用人工智能追捕恐怖分子?茖W(xué)家用人工智能獲取天文、物理和神經(jīng)科學(xué)的新發(fā)現(xiàn)。世界各地的公司、研究人員和愛好者正在以數(shù)千種不同的方式使用人工智能,比如探測天然氣泄漏,開采鐵礦石,預(yù)測疾病暴發(fā),避免蜜蜂滅絕,量化好萊塢電影中的性別歧視。
這僅僅是開始。
我們認(rèn)為,人工智能的真實(shí)故事恰恰體現(xiàn)了這種擴(kuò)散:從過去幾十年甚至幾百年間的幾個(gè)核心數(shù)學(xué)概念,到今天的超級計(jì)算機(jī)和講話、思考、分揀黃瓜的機(jī)器,到明天無處不在的新的數(shù)字奇跡。
我們這本書的目的就是向你講述這個(gè)故事。它在一定程度上是科技故事,但它主要講述的是思想以及思想背后的人 — 這些人所處的時(shí)代比現(xiàn)在早得多,他們只是在低調(diào)地解決他們面對的數(shù)學(xué)和數(shù)據(jù)問題,他們并不知道他們的解決方案將對現(xiàn)代社會(huì)起到怎樣的作用。讀完這個(gè)故事,你會(huì)理解人工智能的含義、來源、原理及其在生活中的重要意義。
人工智能到底是什么意思?
當(dāng)你聽到“人工智能”時(shí),不要想到機(jī)器人。你應(yīng)該把它看成一種算法。
算法是一組帶有步驟的指令。這些指令非常清晰,就連計(jì)算機(jī)這樣頭腦簡單的事物也能遵循。(你可能聽說過下面的笑話。一個(gè)機(jī)器人卡在浴室里出不來了,因?yàn)橄窗l(fā)水瓶身上的算法是:“涂抹。沖洗。重復(fù)。”)算法本身并不比電鉆更加聰明,它只能把一件事情做得很好,比如為數(shù)組排序,或者在網(wǎng)上搜索可愛的動(dòng)物照片。不過,如果你將許多算法巧妙地組合在一起,你就可以生成人工智能,使人覺得它在某個(gè)領(lǐng)域可以做出智能行為。例如,你可能會(huì)向谷歌Home 這樣的數(shù)字助理提出“奧斯汀最好的早餐玉米卷餅在哪兒”等問題。這種詢問會(huì)引發(fā)算法的連鎖反應(yīng):
一個(gè)算法將原始聲波轉(zhuǎn)化成數(shù)字信號。
另一個(gè)算法將這個(gè)信號轉(zhuǎn)化成一串英語音素,即獨(dú)特的
聽覺感知:“brek-fust-tah-koze”。
下一個(gè)算法將這些音素劃分成詞語:“breakfast tacos”。
這些詞語被發(fā)送到搜索引擎 — 搜索引擎本身就是海量算法的集合,可以處理查詢,做出回答。
另一個(gè)算法將這種回答轉(zhuǎn)化成清晰的英語句子。
最后一個(gè)算法以聽上去不像機(jī)器人的方式表述這個(gè)句子:
“奧斯汀最好的早餐玉米卷餅在杜瓦爾街的胡里奧餐廳。您需要導(dǎo)航嗎?”
這就是人工智能。幾乎每個(gè)人工智能系統(tǒng)都會(huì)遵循這種“算法管道”模式,不管是自動(dòng)駕駛汽車、自動(dòng)黃瓜分揀機(jī)還是監(jiān)測信用卡賬戶盜刷的軟件。這種管道會(huì)接收來自某個(gè)具體領(lǐng)域的數(shù)據(jù),執(zhí)行一系列計(jì)算,然后輸出預(yù)測或決定。
人工智能使用的算法有兩個(gè)明顯特征。首先,這些算法處理的通常不是確定性,而是概率。例如,人工智能中的算法不會(huì)直接指出某筆信用卡交易存在欺詐。相反,它會(huì)指出欺詐概率是 92%,或者它根據(jù)數(shù)據(jù)得到的任何概率。第二個(gè)特征涉及這些算法是如何知道應(yīng)該遵循哪些指令的。在傳統(tǒng)算法中,比如運(yùn)行網(wǎng)站或處理文字的算法,這些指令是程序員提前固定下來的。不過,在人工智能中,這些指令是算法直接從“訓(xùn)練數(shù)據(jù)”中學(xué)到的。沒有人告訴人工智能算法如何判斷信用卡交易是否存在欺詐。相反,算法會(huì)看到每個(gè)類別(欺詐,無欺詐)中的許多案例,它會(huì)找到區(qū)分二者的模式。
對于人工智能來說,程序員的作用不是告訴算法應(yīng)該做什么,而是告訴算法如何根據(jù)數(shù)據(jù)和概率規(guī)則獲知自己應(yīng)該做什么。
我們是如何走到今天的?
自動(dòng)駕駛汽車和家庭數(shù)字助理等現(xiàn)代人工智能系統(tǒng)屬于新鮮事物。不過,你可能會(huì)吃驚地發(fā)現(xiàn),人工智能的重要思想其實(shí)很古老 — 許多思想已經(jīng)存在了數(shù)百年 — 我們的祖先一直在用它們解決問題。以自動(dòng)駕駛汽車為例,谷歌第一款自動(dòng)駕駛汽車于 2009年首次亮相。不過,你將在第三章發(fā)現(xiàn),這些汽車背后的主要思想之一是某個(gè)長老會(huì)牧師在 18 世紀(jì) 50 年代發(fā)現(xiàn)的 — 50 多年前,某個(gè)數(shù)學(xué)家團(tuán)隊(duì)還用這種思想解決了冷戰(zhàn)時(shí)期最大的轟動(dòng)性謎團(tuán)之一。
另一個(gè)例子是圖像分類,比如自動(dòng)在臉書照片中為你的朋友做標(biāo)記的軟件。圖像處理算法在過去五年取得了很大進(jìn)步,但你將在第二章看到,這里的關(guān)鍵思想來自 1805 年 — 而且,一位不知名的天文學(xué)家亨麗埃塔·萊維特(Henrietta Leavitt)在一個(gè)世紀(jì)前利用這些思想幫助人類解答了歷史上最深刻的科學(xué)問題之一:宇宙有多大?
再以語音識(shí)別為例,這是人工智能近年來的偉大勝利之一。亞歷克莎和谷歌 Home 等數(shù)字助理在語言方面非常流利,而且它們只會(huì)變得越來越好。不過,第一個(gè)讓計(jì)算機(jī)理解英語的人是一位美國海軍少將,而且這件事發(fā)生在將近 70 年前。(見第四章。)
這里只舉了三個(gè)例子,但它們說明了一個(gè)驚人的事實(shí):不管你考察人工智能的哪些方面,你都會(huì)找到一個(gè)被人們長期研究過的思想。所以,從各方面來看,最大的歷史謎團(tuán)不是人工智能為什么會(huì)在今天出現(xiàn),而是它為什么沒有在很久以前出現(xiàn)。要想解釋這個(gè)謎團(tuán),我們必須考慮將這些寶貴思想帶入新時(shí)代的三個(gè)強(qiáng)大的技術(shù)力量。
第一個(gè)使人工智能成為可能的力量是計(jì)算機(jī)長達(dá)幾十年的指數(shù)增長速度,通常被稱為摩爾定律。你很難直觀地理解計(jì)算機(jī)目前的速度有多快。過去的常見說法是,阿波羅宇航員登陸月球時(shí)使用的計(jì)算能力還比不上一只袖珍計(jì)算器。不過,這種說法已經(jīng)無法使人產(chǎn)生共鳴了,因?yàn)椤湔溆?jì)算器是什么東西?所以,讓我們用汽車來類比。1951 年,尤尼瓦克是速度最快的計(jì)算機(jī)之一,每秒可以進(jìn)行 2000 次計(jì)算,而速度最快的汽車之一阿爾法羅密歐 6C 的時(shí)速可達(dá) 180 公里。之后,汽車和計(jì)算機(jī)都在提速。不過,如果汽車能像計(jì)算機(jī)那樣提速,那么現(xiàn)代阿爾法羅密歐的速度將達(dá)到光速的800 萬倍。
人工智能的第二個(gè)助推器是新的摩爾定律:隨著人類所有信息的數(shù)字化,可用數(shù)據(jù)量出現(xiàn)了爆炸式增長。美國國會(huì)圖書館擁有10 太字節(jié)的存儲(chǔ)量,但是谷歌、蘋果、臉書、亞馬遜四大科技公司 2013 年一年收集的數(shù)據(jù)就是這個(gè)數(shù)字的大約 12 萬倍。而且,從互聯(lián)網(wǎng)視角來看,這已經(jīng)是上一代的事情了。數(shù)據(jù)積累的加速節(jié)奏比阿波羅火箭還要快。2017 年,YouTube 每分鐘上傳的視頻超過300 小時(shí),Instagram 每天貼出的照片超過 1 億張。更多的數(shù)據(jù)意味著更聰明的算法。
第三個(gè)支撐人工智能的因素是云計(jì)算。消費(fèi)者幾乎看不到這種趨勢,但它對人工智能產(chǎn)生了巨大的民主化影響。為說明這一點(diǎn),我們要對數(shù)據(jù)和石油進(jìn)行類比。假設(shè) 20 世紀(jì)早期的所有公司都擁有一些石油,但是它們需要獨(dú)自建設(shè)基礎(chǔ)設(shè)施,以便開采、運(yùn)輸和提煉石油。如果一家公司有了利用石油的新思想,它需要面對巨大的固定起步成本。因此,大多數(shù)石油都不會(huì)得到使用。同樣的邏輯也適用于數(shù)據(jù),即 21 世紀(jì)的石油。如果用自己的數(shù)據(jù)打造人工智能系統(tǒng)需要購買所有的裝備和專業(yè)人才,大多數(shù)愛好者和小公司都會(huì)面對難以負(fù)擔(dān)的成本。不過,微軟 Azure、IBM 和亞馬遜 WebServices 等平臺(tái)提供的云計(jì)算資源將這種固定成本轉(zhuǎn)化成了可變成本,極大地改變了大規(guī)模數(shù)據(jù)存儲(chǔ)和分析的支出比重。今天,任何想要使用個(gè)人“石油”的人都可以租用其他人的基礎(chǔ)設(shè)施,以降低成本。
當(dāng)你將這四種趨勢 — 更快的芯片、大量數(shù)據(jù)、云計(jì)算以及最重要的優(yōu)秀思想 — 放在一起時(shí),用人工智能解決實(shí)際問題的需求和能力就會(huì)出現(xiàn)爆炸式增長。