人工智慧的緣起: 達特茅斯會議 | 《人工智慧簡史》

圖自 digitalintelligencetoday | 人工智慧時間軸圖

下文節選自《人工智慧簡史》, 已獲圖靈許可, [遇見數學] 在此特別表示感謝!

1. 背景

What is past is prologue.

過去只是序幕。

— William Shakespeare(莎士比亞)

現在一說起人工智慧的起源,公認是1956年的達特茅斯會議。殊不知還有個前戲,1955年,美國西部計算機聯合大會(Western Joint Computer Conference)在洛杉磯召開,會中還套了個小會:學習機討論會(Session on Learning Machine)。討論會的參加者中有兩個人參加了第二年的達特茅斯會議,他們是塞弗里奇(Oliver Selfridge)和紐厄爾(Allen Newell)。塞弗里奇發表了一篇模式識別的文章,而紐厄爾則探討了計算機下棋,他們分別代表兩派觀點。討論會的主持人是神經網路的鼻祖之一皮茨(Walter Pitts),他最後總結時說:「(一派人)企圖模擬神經系統,而紐厄爾則企圖模擬心智(mind)……但殊途同歸。」這預示了人工智慧隨後幾十年關於「結構與功能」兩個階級、兩條路線的鬥爭。

Advertisements

開聊達特茅斯會議之前,先說說 6 個最關鍵的人。首先,會議的召集者麥卡錫(John McCarthy)當時是達特茅斯學院的數學系助理教授。1954年,達特茅斯學院數學系同時有4位教授退休,這對達特茅斯這樣的小學校而言真是不可承受之輕。剛上任的年輕系主任克門尼(John Kemeny)之前兩年才在普林斯頓大學邏輯學家丘奇(Alonzo Church)門下取得了邏輯學博士,於是跑到母校求援。這麼說起來,克門尼算是圖靈的師弟,他戰時和物理學家費曼一起工作,還一度當過愛因斯坦的數學助理,後來一頭扎在計算機研究里,和麥卡錫一起琢磨出了分時系統。他1955年在《科學美國人》雜誌上寫過一篇文章「把人看作機器」(Man Viewed as a Machine),介紹了圖靈機和馮諾伊曼[1]的細胞自動機(最早叫「自生機」),文章的簡介提到「肌肉機器」(muscle machine)和「大腦機器」(brain machine)。所謂「大腦機器」就是人工智慧的另一種說法而已。克門尼最為人知的工作應該是發明了老少咸宜的編程語言BASIC。現在估計已經沒人知道BASIC語言發明人曾是LISP語言發明人的老闆。克門尼是天生的官僚,後來位居達特茅斯學院數學系主任和校長,美國三里島核電站出事時,總統委託他當調查委員會主席,這是后話。

Advertisements

[1] 我故意沒有在「馮」和「諾伊曼」之間加那個討厭的點兒,因為在更多時候,查找參考文獻時,他的姓是列在V下,而不是N下。

克門尼從母校數學系帶回了剛畢業的4位博士前往達特茅斯學院任教,麥卡錫是其中之一。麥卡錫後來發明的 LISP 語言中最重要的功能 Eval 實際就是丘奇的λ演算,而且他後半生致力於用數理邏輯把常識形式化。大家由此猜測他可能也是丘奇的學生,但其實不是,他學的壓根就不是邏輯。他的老師是失去雙手的代數拓撲學家萊夫謝茨(Lefschetz)。但麥卡錫對邏輯和計算理論一直有強烈興趣,他1948年本科畢業於加州理工學院,在學校主辦的Hixon會議上聽到馮諾伊曼關於細胞自動機的講座,後來他剛到普林斯頓大學讀研究生時就結識了馮諾伊曼,在老馮影響下開始對在計算機上模擬智能產生興趣。

達特茅斯會議的另一位積極的參加者是明斯基。他也是普林斯頓大學的數學博士,和麥卡錫在讀書時就相熟。他的主業也不是邏輯,儘管他後來寫過一本很有影響力的計算理論的書,還培養過好幾個計算理論的博士,其中就有圖靈獎獲得者布魯姆(Manual Blum)。布魯姆目前和他老婆(Lenor Blum,就是實數計算模型BSS的B)、兒子一家三口都在卡內基梅隆大學任教。明斯基的理論情結和丘奇關係也不大,他的老師塔克(Albert Tucker)是萊夫謝茨的學生,主要做非線性規劃和博弈論,多年來擔任普林斯頓大學數學系主任,出身數學世家,兒子、孫子也都是數學家。按輩分論,麥卡錫還是明斯基的師叔。塔克的另一名出色的學生後來得了諾貝爾經濟學獎,他就是心靈美麗的納什。納什比明斯基小一歲,但比他早4年拿到博士學位,也算是明斯基的師兄了。明斯基的博士論文是關於神經網路的,他在麻省理工學院150周年紀念會議上回憶說是馮諾伊曼和麥卡洛克(Warren McCulloch)啟發他做了神經網路。有人還找過他麻煩,質疑說神經網路的研究算數學嗎,倒是老馮力挺說:現在不算,但很快就得算。倒是明斯基自己後來和神經網路結下樑子,那段故事見本書第5章「神經網路簡史」。明斯基的熟人都認為他是無所不通的天才,他的忘年交沃爾弗拉姆(Stephen Wolfram)稱,他晚年計劃寫本神學的書,但去世時書還沒影子。

塞弗里奇被後人提及不多,但他真是人工智慧學科的先驅,他在麻省理工學院時一直和神經網路的開創人之一麥卡洛克一起在維納(Norbert Wiener)手下工作,他是維納最喜歡的學生,但沒讀完博士學位。維納《控制論》一書的第一個讀者就是塞弗里奇。塞弗里奇是模式識別的奠基人,他寫了第一個可工作的 AI 程序。他後來在麻省理工學院參與領導MAC項目,這個項目後來一分為二:計算機科學實驗室和人工智慧實驗室。但分久必合,現在這兩個項目又合併了,變成了MIT CSAIL。順便給女讀者添點料:塞弗里奇的爺爺就是英國第二大百貨店塞爾福里奇(Selfridges)的創始人。所謂「顧客永遠是對的」(The customer is always right.)就出自塞爾福里奇,他本是美國人,後到英國創業,發財后老婆就死了,於是勾搭上一對匈牙利雙胞胎歌舞演員,出入賭場,賠光了家業。他的故事2013年還被有意思的英國人拍成了電視劇。塞爾福里奇百貨幾經周轉,現在的主人是美國百貨公司希爾斯(Sears)。塞爾福里奇百貨和隔壁的哈羅德百貨支撐著牛津街的零售業,現在大概一半顧客來自中國二線城市。

資訊理論的創始人香農(Claude Shannon)被麥卡錫拉大旗做虎皮也請到會上打醬油。其實麥卡錫和香農的觀點並不一致,平日相處也不睦。香農的碩士、博士論文都是講怎麼實現布爾代數的,當時麻省理工學院校長布希(Bush)親自指導。博士畢業后他去了普林斯頓高等研究院,曾和數學家外爾(Hermann Weyl)、愛因斯坦、哥德爾等共事。戰爭中,他一直在貝爾實驗室做密碼學的工作,圖靈在1943年曾秘訪美國,和同行交流破解德國密碼的經驗,其間和香農曾有會晤,一起聊過通用圖靈機。戰後香農去英國還回訪過圖靈,一起討論過計算機下棋。香農內向,從沒說過這段往事,直到1982年接受一次採訪時才提起。1950年香農在《哲學雜誌》發表過一篇講計算機下棋的文章,為計算機下棋奠定了理論基礎。香農比其他幾位年長十歲左右,當時已是貝爾實驗室的大佬。

另外兩位重量級參與者是紐厄爾和司馬賀(Herbert Simon)。紐厄爾是麥卡錫和明斯基的同齡人,他碩士也是在普林斯頓大學數學系讀的,按說普林斯頓大學數學系很小,他們應有機會碰面,但那時紐厄爾和他倆還真不認識。他們的第一次見面,紐厄爾回憶是在IBM,而麥卡錫回憶是在蘭德公司。紐厄爾的碩士導師就是馮諾伊曼的合作者、博弈論先驅摩根斯頓,紐厄爾碩士畢業后就遷往西部加入著名智庫蘭德公司。他在蘭德開會時認識了塞弗里奇,並受到對方做的神經網路和模式識別的工作的啟發,但方法論走的卻完全是另一條路。

紐厄爾(1927—1992)與 司馬賀(1916—2001)

司馬賀比他們仨都大11歲(懷特海比羅素也大11歲),那時是卡內基理工學院(卡內基梅隆大學的前身)工業管理系的年輕系主任,他在蘭德公司學術休假時認識了紐厄爾。司馬賀後來把紐厄爾力邀到卡內基梅隆大學,並給紐厄爾發了個博士學位,開始了他們終生的合作。

紐厄爾和司馬賀的合作是平等的,司馬賀是紐厄爾的老師,但他們合作的文章署名都是按字母順序紐在前司馬在後,每次他們受邀去演講,都是輪流。司馬賀每次見到別人把他名字放到紐厄爾之前時都糾正。他們共享了1975年的圖靈獎,三年後司馬賀再得諾貝爾經濟學獎。紐厄爾和司馬賀代表了人工智慧的另一條路線:符號派。他們後來把他們的哲學思路命名為「物理符號系統假說」。簡單地說就是:智能是對符號的操作,最原始的符號對應於物理客體。這個思路和英美的經驗主義哲學傳統接近。他們和當時的數學系主任、第一屆圖靈獎獲得者珀里思(Alan Perlis)一起創立了卡內基梅隆大學的計算機系,從此,卡內基梅隆大學成為計算機學科的重鎮。

2. 達特茅斯會議

會議原址:達特茅斯樓

1953年夏天,麥卡錫和明斯基都在貝爾實驗室為香農打工。香農那時的興趣是圖靈機以及是否可用圖靈機作為智能活動的理論基礎。麥卡錫向香農建議編一本文集,請當時做智能研究的各位大佬貢獻文章,這本文集直到1956年才以《自動機研究》(Automata Studies)為名出版,這個書名最後是香農起的,他不想花里胡哨,但麥卡錫認為這沒有反映他們的初衷。

文集的作者有兩類人,一類是邏輯學家(後來都變成計算理論家了),如丘奇的兩位傑出學生戴維斯和克里尼,後者的名著《元數學導論》在國內有邏輯學家莫紹揆先生的譯本。明斯基、麥卡錫也都有論文錄入,香農本人貢獻了一篇講只有兩個內部狀態的通用圖靈機的文章,文集錄入的一篇馮諾伊曼的論文後來開創了容錯計算。文集的另一類作者幾乎都是維納的信徒,如阿什比(Ross Ashby)等,以控制論為基礎。麥卡錫素不喜控制論和維納,既不想把維納當老大,也不願和他見面爭執,其中原因不詳,或許和維納與麥卡洛克吵翻了有關。麥卡洛克和皮茨這兩位為維納《控制論》思想貢獻多多的人物,在維納的自傳里壓根沒被提及。麥卡錫同時又覺得香農太理論,當時他想自立門戶,只對用計算機實現智能感興趣,於是他籌劃再搞一次活動。從香農後來接受的採訪來看,他對維納也沒有多少尊重,他覺得自己創立的資訊理論和維納一點關係也沒有。但維納卻認為香農受到他的影響,香農認為維納的這種錯覺來源於維納根本不了解資訊理論。

1955年夏天,麥卡錫到IBM打工(美國教授都是9個月工資,如果沒有研究經費,夏天要自己覓食),他的老闆是羅切斯特(Nathaniel Rochester),羅切斯特是IBM第一代通用機701的主設計師,對神經網路素有興趣。他們兩人倒是挺對脾氣,決定第二年夏天在達特茅斯搞一次活動,遂說動了香農和當時在哈佛做初級研究員(Junior Fellow[1])的明斯基一起給洛克菲勒基金會寫了個項目建議書,希望得到資助。美國富豪還是有文化傳統的,至少知道要資助好東西,值得中國土豪的後代學習。

[1] 哈佛的Fellow還是挺值錢的,歷史上人數不多,蒯因、王浩、庫恩在變成正式教授之前都做過。喬姆斯基幾乎在同時也是哈佛的Fellow。

麥卡錫給這個第二年的活動起了個當時看來別出心裁的名字:人工智慧夏季研討會(Summer Research Project on Artificial Intelligence)。普遍的誤解是「人工智慧」這個詞是麥卡錫想出來的,其實不是。麥老晚年回憶也承認這個詞最早是從別人那裡聽來的,但記不清是誰了。後來英國數學家伍德華(Philip Woodward)給《新科學家》雜誌寫信說他是AI一詞的原創者,麥卡錫最早是聽他說的,因為他1956年曾去麻省理工學院訪問,見過麥卡錫並交流過。但麥卡錫的建議書1955年就開始用「人工智慧」了,人老了回憶真不靠譜。當事人除了明斯基之外,都已仙逝,這事恐怕要成懸案了。其實英國人最早的說法是「機器智能」(Machine Intelligence),這大概和圖靈那篇「計算機與智能」有關。

大家對「人工智慧」這個詞一開始並沒取得完全共識。很多人認為啥事一加「人工」就變味了。紐厄爾和司馬賀一直主張用「複雜信息處理」這個詞,以至他們發明的語言就叫IPL(Information Processing Language)。他們從某種意義上說偏功能學派,也就是說找到智能的功能不一定非得依靠結構相同或相似。圖靈機和遞歸函數等價,但結構完全不同,所以他們強調「信息處理」。他們倆一開始頗不喜「人工智慧」幾個字。1958年,在英國國家物理試驗室(NPL)召開了「思維過程機器化」(Mechanization of Thought Process)會議,達特茅斯會議的與會者麥卡錫、明斯基、塞弗里奇都參加了,此外還有致力於神經網路研究的麥卡洛克,以及英國的控制論代表人物阿什比。兩位編程語言的先驅也出席了:巴克斯(John Warner Backus)發表了一篇關於他新發明的語言Fortran的論文,但他後來一直是函數式語言的倡導者;美國海軍女少將哈泊(Grace Hopper)的文章是講第一個編譯器的,這項工作導致了COBOL語言的誕生。中國也有女少將,也是碼農。他倆論文的題目里都有Automatic Programming的說法,這在當時就是指高級語言編程,不能和後來人工智慧中的自動編程搞混了。這次會上有人再提「人工思維」(Artificial Thinking)的說法。司馬賀等人由此也逐漸接受了AI的說法,他晚年還寫了本書《人工的科學》,倒是把Artificial這個詞更加放大了。

3. AI歷史的方法論

歷史研究方法有基於事件的和基於課題(issue)的。紐厄爾在1981年為一本頗為有料的文集《信息研究》貢獻的一篇文章「AI歷史的智力課題」走了第二條路線。他的方法也挺有意思。他把AI歷史當作鬥爭史,把歷史分為兩個階級、兩條路線的鬥爭,於是歷史成了一串兒對立的議題,如模擬與數字,串列與并行,取代與增強,語法與語義,機械論與目的論,生物學與活力論,工程與科學,符號與連續,邏輯與心理等,在每一議題下有進一步可分的子議題,如在邏輯與心理下又有定理證明與問題求解等。

被提到最多的是人工智慧與控制論。在Google Ngram里試試 Cybernetics 和 Artificial Intelligence 兩個詞在Google Books里出現的詞頻,可以看出學科的跌宕起伏。

美國最早辦的一批計算機相關的系科都創辦於20世紀60年代中期,那時有些系直接叫「計算機科學系」,而有些則叫「計算機與信息科學系」,帶「信息」的都有些「控制論」的背景,如麻省大學計算機與信息系的創辦人就有維納的學生阿比卜(Michael Arbib)。而密歇根大學則叫計算機與通訊科學系。這些系後來都改名叫計算機系了。而原來的圖書館系現在都紛紛改名叫信息科學系,如加州大學伯克利分校和華盛頓大學的圖書館學院都改名叫信息學院(School of Information),連「科學」都省了。但現在計算機系又有載入信息的趨勢,麻省大學和加州大學爾灣分校近年又改名叫信息與計算機科學學院了。大概和現在深度學習及神經網路又峰迴路轉有關吧。倒是中國的學科簡單,一直都有計算機和自動化之分,老死不相往來罷了。

「人工智慧」這個詞真正被共同體廣泛認可是在十年後的1965年,在加州大學伯克利分校的歐陸派哲學家德雷弗斯(Hubert Dreyfus)發表了「鍊金術與人工智慧」一文之後。這篇文章一開始只是針對紐厄爾和司馬賀的工作,幾年後這篇文章演變成了那本著名的(或者被AI圈子稱為「臭名昭著」的)《計算機不能幹什麼》一書,則是把整個AI當作靶子。歐陸派哲學家被人詬病數學和科學不通,但德雷弗斯有個數學家的兄弟,和他同一年在哈佛得了應用數學博士,後來又同在加州大學伯克利分校教書,是動態規劃的大家,還帶過神經網路的博士。哥倆一個立場。有時一個共同體的形成並不是靠內部的團結,而是靠外部的反對。有意思的是,「鍊金術與人工智慧」一文是德雷弗斯在蘭德公司工作時寫就的。司馬賀後來撰文猛批德雷弗斯,說他濫用蘭德公司的標籤。德雷弗斯後來抱怨他在麻省理工學院和哈佛食堂吃飯,所有做AI的人都躲他遠遠的。學術爭執哪兒都一樣。

麥卡錫和明斯基的建議書里羅列了他們計劃研究的7個領域:

(1) 自動計算機,所謂「自動」指的是可編程;(2) 編程語言;

(3) 神經網路;

(4) 計算規模的理論(theory of size of a calculation),這說的是計算複雜性,明斯基後來一直認為計算理論是人工智慧的一部分,他早期對理論問題時不時會動動手,後來一手組建了麻省理工學院的計算理論隊伍;

(5) 自我改進,這個是說機器學習;

(6) 抽象;

(7) 隨機性和創見性。

麥卡錫的原始預算是一萬三千五百美元,但洛克菲勒基金會只批了七千五百美元。麥卡錫預計會有6位學界的人出席,會議應該支付每人兩個月的薪水一千兩百美元,由此可推算出麥卡錫、明斯基當時的年薪在八千美元左右,考慮通貨膨脹和購買力,大概相當於2016年的七萬多美元,真不算多,現在隨便一個美國大學計算機系的教授薪水都遠不止這個數。這個學科真是今非昔比啊。作為對比,司馬賀1949年去卡內基梅隆大學的前身卡內基理工學院擔任新成立的工業管理系系主任時的年薪是一萬美元。

除了那六君子外,另外還有4人也參加了達特茅斯會議。他們是來自IBM的塞繆爾(Arthur Samuel)和伯恩斯坦,他們一個研究跳棋,一個研究象棋。達特茅斯的教授摩爾(Trenchard More)也參與了,他後來在工業界混的時間長,少為外人所知。達特茅斯會議中一位被後人忽視的「先知」是所羅門諾夫(Solomonoff)。

和其他來來往往的人不同,所羅門諾夫在達特茅斯嚴肅地待了整整一個暑假。他1951年在芝加哥大學跟隨費米得了物理碩士就到了麻省理工學院。但在芝加哥對他影響最大的是哲學家卡爾納普(Paul Carnap)。有意思的是,神經網路的奠基者之一皮茨也受惠於卡爾納普。司馬賀的回憶錄里也講到自己在芝加哥時聽卡爾納普的課開始啟蒙邏輯,從而開始對智能相關的問題感興趣,但後來由於和定理證明邏輯派之間的衝突,司馬賀就說自己的方法是在批判過度數學化和形式化。這麼說來,人工智慧的兩大派——邏輯和神經網路——都發源於老卡。卡爾納普那時的興趣是歸納推理,這成為所羅門諾夫畢生的研究方向。所羅門諾夫後來結識了明斯基和麥卡錫,在他們的影響下研究邏輯和圖靈機。達特茅斯會議時,他受麥卡錫「反向圖靈機」和喬姆斯基文法的啟發,發明了「歸納推理機」。他的工作後來被萬能的蘇聯數學家柯爾莫格羅夫(Kolmogorov)獨立地發明了一遍,就是現在俗稱「柯爾莫格羅夫複雜性」和「演算法資訊理論」的東西。中國的計算理論學者李明現在是這個領域的大牛,曾有專著。柯爾莫格羅夫1968年開始引用所羅門諾夫的文章,使得後者在蘇聯的名聲比在西方更加響亮。所羅門諾夫的另一個觀點「無限點」(Infinity Point)後來被未來學家庫茲韋爾改名「奇點」竊為己有。目前AI中廣泛用到的貝葉斯推理也有著所羅門諾夫的開創性痕迹。他一生並沒有大富大貴,大部分時間都是在自己的諮詢公司Oxbridge(牛津+劍橋,相當於漢語俗稱「清北」)拿政府(空軍、海軍、ARPA和NIH——NIH資助了很多AI研究)的研究經費,那公司只有他自己一個僱員。倫敦大學皇家哈洛威學院(Royal Holloway)後來在蘇聯學者領導下搞柯爾莫格羅夫獎,他是第一屆獲獎人,並在那裡兼職教授。他的學術自傳1997年發表在計算理論雜誌《計算機與系統科學》上。明斯基所謂AI孵化出計算理論的說法不無道理。

按照麥卡錫和明斯基的說法,這十個人參加了達特茅斯會議,但現在有證據表明會議還有其他的列會者。後來一直做神經網路硬體研究從而躲過AI幾十年過山車的斯坦福大學電機系教授維德羅(Bernard Widrow)後來回憶他也去了達特茅斯並且在那兒待了一周。麥卡錫原來的計劃是兩個月閉門研討,但並非所有人都對那個事那麼上心。紐厄爾和司馬賀只待了一周。紐厄爾後來回憶說達特茅斯會議對他和司馬賀沒什麼影響。

儘管是「十仙過海」,但給所有人留下最深印象的是紐厄爾和司馬賀的報告,他們公布了一款程序「邏輯理論家」(Logic Theorist),這個程序可以證明懷特海和羅素《數學原理》中命題邏輯部分的一個很大子集。司馬賀回憶錄里說自己學術生涯最重要的兩年就是1955年和1956年。這篇文章後來成了AI歷史上最重要的文章之一。

值得注意的是,「邏輯理論家」對人工智慧後來的一個分支「機器定理證明」的影響並不大。哲學家王浩1958年夏天在一台IBM-704機上,只用9分鐘就證明了《數學原理》中一階邏輯的全部定理。當然《數學原理》中羅列的一階邏輯定理只是一階邏輯的一個子集。目前,一階邏輯的機器定理證明比起20世紀50年代已有長足進展,但仍然沒有高效的辦法。畢竟,王浩證明的是一階邏輯,而「邏輯理論家」只能處理命題邏輯。數學家戴維斯和哲學家普特南合作,沿著王浩的思路進一步提出了戴維斯-普特南(DP)證明過程,後來進一步發展為DPLL。王浩對「邏輯理論家」一直持鄙視的態度,認為這是一個不專業的東西。王浩在1983年被授予定理證明裡程碑大獎,被認為是定理證明的開山鼻祖。司馬賀在他的回憶錄里則對此表示不滿,認為王浩的工作抵消了「邏輯理論家」的原創性,他們的初衷並不是要有效地證明定理,而是研究人的行為。這是后話,見第2章「自動定理證明興衰紀」。

麥卡錫多年後回憶說:他從紐厄爾和司馬賀的 IPL 語言中學到了表處理,這成為他後來發明 LISP 的基礎。明斯基後來接受採訪時說他對紐厄爾和司馬賀的「邏輯理論家」印象深刻,因為那是第一個可工作的AI程序。但事實上,明斯基在當時為大會寫的總結里對「邏輯理論家」只是輕描淡寫。麥卡錫和明斯基明顯是一夥的,會議是他們發動的,旨在創立一門新學科。但紐厄爾和司馬賀卻搶了他們的風頭。美國20世紀50年代的學術氛圍不免浮躁,這一幫人又都是年輕氣盛、野心十足。

4. 會議之後

達特茅斯會議后不久,1956年9月IRE(後來改名IEEE)在麻省理工學院召開資訊理論年會,麥卡錫受邀做一個對一個月前達特茅斯會議的總結報告。這引起了紐厄爾尤其是司馬賀的不滿,他們認為麥卡錫只能聊,沒幹貨,而達特茅斯會議唯一的乾貨是紐厄爾和司馬賀的程序「邏輯理論家」。打了一圈架,最後紐厄爾和司馬賀做了妥協:麥卡錫先做總結報告,但最後還是由紐厄爾和司馬賀講他們的「邏輯理論家」並發表一篇題為「邏輯理論機器」(Logic Theory Machine)的文章。明斯基認為是他的協調起了作用,但紐厄爾晚年則只對香農的邀請有印象,而司馬賀的回憶錄則說是大會的主席羅森布拉特和司馬賀散了很長一圈步才了斷。明斯基機敏異常,講話時帶幽默,但在對這段歷史的重構中,卻給人印象有點太「刁滑」(cynical),原因也不難猜出。研究歷史有時必須得全方位,空間或時間上的接近不見得就真實。太接近時,當事人還都活著,還在一個圈子裡混,不方便互相揭短。但在接近生命末期,或者功成名就,或者人之將死,或者對頭已死無所顧忌,敞開了說,有時雖有誇張,但一不留神就會流露真話,紐厄爾屬於後者。明斯基「刁滑」可能和他身體好有關係,偌大歲數也沒不惑,覺得還有好長的路要走。

科學達人戴森(Freeman Dyson)在他的《一面多彩的鏡子》一書中借鑒過伯林(Isaiah Berlin)「刺蝟與狐狸」的比喻:刺蝟是那些構建理論體系的人,而狐狸則是那些解決問題的人。在他眼裡,愛因斯坦、哥德爾是刺蝟,而費米、馮諾伊曼屬狐狸。科學史有時刺蝟得勢,有時狐狸當道。是不是可以說紐厄爾和司馬賀更像刺蝟,而麥卡錫和明斯基更像狐狸呢?具體到AI的源頭和達特茅斯會議,麥卡錫認為他和明斯基是發起人,紐厄爾和司馬賀是「外人」,是攪局者。明斯基的解釋是紐厄爾和司馬賀一開始的出發點是心理學,這與麥卡錫和他本人的背景不符。但在隨後的十年裡,他本人更多地走向心理學,而紐厄爾和司馬賀更靠近AI,也沒什麼矛盾。麥卡錫除了和明斯基關係緊密外,和其他AI群體的交流並不多,在所謂其他群體中,最有影響的當屬卡內基梅隆那一派了。麥卡錫晚年回憶說那時群體之間的溝通主要是通過研究生,研究生就像大佬們的大使。後來斯坦福大學、卡內基梅隆大學、麻省理工學院的學生確實互為教授,門戶之見隨著時間的推移逐漸被抹平了。

總之,1956年IRE資訊理論年會是個值得紀念的會議,除了紐厄爾和司馬賀發表的那篇文章之外,心理學家米勒(George Miller)發表了「人類記憶和對信息的儲存」(Human Memory and the Storage of Information),這是那篇著名的文章「魔力數字七」(The Magic Number Seven)的另一個版本,不知算不算一稿多發。同在此會上,偉大的喬姆斯基則發表了「語言描述的三種模型」(Three Models for the Description of Language),該文證明了有限狀態句法不能表達某類語言,這是喬姆斯基分層的起源,文中引用了還沒出版的不朽名著《句法結構》。喬姆斯基當時剛剛到MIT現代語言學系(該系後來演變為語言學與哲學系)出任助理教授並在MIT電子實驗室做機器翻譯的研究。儘管喬老爺後來是「反政府鬥士」,但有點反諷的是他早期的研究經費都來自美國空軍和海軍。

從參與者的角度看,大家會認為這次IRE的資訊理論年會比達特茅斯會議更重要,影響也更深遠。米勒回憶說,他當時直覺認識到實驗心理學、理論語言學、認知過程的計算機模擬,都是一個「大傢伙」裡面的組成部分。這個所謂的「大傢伙」就是現在的人工智慧加認知科學吧。

明斯基回憶自己在達特茅斯會議期間,在紙上畫了一個幾何定理證明器的設計,並手動模擬證明了等腰三角形的一個定理。會後的1956年9月,IBM招了新畢業的物理博士格蘭特(Herb Gelernter)實現明斯基的幾何定理證明器。麥卡錫此時受到紐厄爾和司馬賀的影響,建議在Fortran里實現表處理語言,作為實現語言。這個項目在1959年實現后,IBM削減了對AI的投入,把這個項目砍掉了,理由是IBM不想給人以機器可以替代人的印象。IBM再次資助AI是20多年後的1983年了,現在好像IBM百年老店只能靠AI系統沃森(Watson)翻身了。

麥卡錫1958年離開達特茅斯學院去了MIT,幫助創立了MIT的MAC項目。他和明斯基一起領導了MAC項目中的AI實驗室,1962年他再次跳槽到斯坦福大學。之後明斯基又和佩珀特(Seymour Papert)合作。計算機操作系統里「分時」的概念是由麥卡錫在MAC項目中首創的。他回憶說當時機器太少,但等著上機的學生很多,於是就發明了分時系統。按說分時系統的貢獻要比麥卡錫後來的AI貢獻彰顯得多,但麥卡錫得圖靈獎可不是靠「分時」,這就像愛因斯坦得諾貝爾獎沒靠相對論一樣。從這個意義上AI有點像哲學:由此衍生出很多問題,而對這些問題的解決產生出許多子學科;一旦這些子學科獨立,就不再待見AI了。另一個例子是卡內基梅隆大學的微核心操作系統MACH,其最早的發源是在卡內基梅隆大學的雷蒂(Raj Reddy)搞的分散式感測網路,MACH領導者拉希德(Rick Rashid)後來加入微軟,MACH變成微軟後來操作系統的基礎,他本人也變成微軟負責技術的決策者之一。

現在計算機科學已成為成熟的學科,每個計算機系大都有三撥人:理論、系統和AI。20年前的美國計算機圈子曾有一種說法:理論和系統的人互相看不起,但又同時看不起AI的人。AI這幾年火了,但曾幾何時,AI的人是被壓迫者。哲學曾經孕育了科學,但一旦問題被確定,就分離成為單獨的科學。最新的例子是邏輯學,現在的邏輯學家都在數學系和計算機系,哲學系被徹底空洞化。哲學家丹尼特(Daniel Dennett)曾說:AI就是哲學。按照明斯基的說法,人工智慧就是先鋒派的計算機科學。MAC項目孕育了計算機科學中很多原創的概念。以至於明斯基後來認為UNIX系統是落後的東西,因為他們丟掉了很多Multics中的精華。

利克萊德(Joseph Licklider)是信息時代的預言家和佈道者,他20世紀60年代初期在美國國防部「先進研究項目局」(ARPA)創辦「指揮與控制」(C2)辦公室,後來演變為「行為科學及指揮與控制」辦公室,最終變成有權有勢的「信息科技辦公室」(IPTO)。正是利克萊德最早想到了「人機協同」「計算機網路」「未來圖書館」等先進概念。而他的「行為科學」計劃也曾資助過監控項目,不知那是不是受到奧威爾的啟發。

1968年,參議院多數黨領袖曼斯菲爾德對ARPA的資助方向不滿,他認為國防部的錢不能被用于軍事目的之外,非軍事目的的項目應該由美國國家科學基金會NSF負責,ARPA改名DARPA,更強調「國防」。利克萊德遂於1968年離開ARPA,去了MIT擔任MAC項目負責人,統籌MIT的計算機科學實驗室和人工智慧實驗室。人們認識到利克萊德的貢獻太晚了,他於1990年過世。計算機科學最重要的實驗室之一施樂PARC的創始人泰勒(Robert Taylor)曾稱利克萊德是Johnny Appleseed,這是美國18世紀到19世紀的園丁查普曼(John Chapman)的外號,他把「蘋果樹」的種子遍撒美國。

20世紀70年代初期在海爾梅爾(George Heilmeirer)任內,DARPA大砍AI預算。協調政府和AI實驗室的工作變得頭緒繁多,明斯基決定從AI實驗室退位,讓他剛畢業的學生溫斯頓(Patrick Winston)接手。

儘管明斯基說他不喜事務性工作,但他的採訪和回憶中觸及的話題總是和聯邦政府的資助有關。溫斯頓後來回憶時說,管理一個成功的實驗室要管理好三個圈的交集:出資人(主要是政府)、科學上有創建、有國計民生的價值。他試圖說服幾任ARPA的頭兒別把AI當作一個幾年一次的項目,而是長期而獨立的一門學科。另外他對比了早期ARPA和NSF的不同,NSF是20世紀80年代才開始資助AI研究的,且給錢少,而且都是同行評議制,結果是越有成就的拿的錢越多,但很少會有根本性的原創性貢獻,ARPA早期都是頭兒們說了算,好處是如果管事的頭兒們品味好,肯定會支持好東西。這一點也值得一些科技人借鑒:大型項目決策者的品味可以超越「透明計算」嗎?

再說回海爾梅爾,他以 AI 不能幫助造武器打仗為理由,削減了對 AI 的大規模經費,但同時卻重金資助了隱形飛機和空間武器技術,使美國在相關領域一直保持領先。ARPA資助的這類項目要是通過同行評議是很難實施的。ARPA幾乎在同時也支持了ARPANET,後來演變成互聯網。有意思的是,海爾梅爾從ARPA離任後去了德州儀器(TI)做CTO,在TI卻大力提倡AI。ARPA對AI的資助在克柔克(Steve Crocker)手裡才逐步恢復。大家知道克柔克是互聯網的先驅之一。再後來的ARPA信息技術辦公室(IPTO)的負責人中還有圖靈獎獲得者薩瑟蘭(Ivan Edward Sutherland),也對AI繼續投入。精英制風格的ARPA,更適合做大型開創性項目,成功取決於少數決策者;而以民主製為基礎的NSF,歷來就是小規模資助基礎研究。

5. 預測未來:會有奇點嗎?

司馬賀1957年曾預言十年內計算機下棋會擊敗人。1968年麥卡錫和象棋大師列維(David Levy)打賭說十年內下棋程序會戰勝列維,最後賠了列維兩千塊。樂觀的預言總會給對手留下把柄:德雷弗斯後來每年都拿此事嘲諷 AI,說計算機下下跳棋還行,下象棋連十歲的孩子都干不過。這便宜話一直說到1997年,IBM的下棋程序「深藍」擊敗了卡斯帕羅夫。這真是「四十年太久,只爭朝夕」啊。在1995年卡斯帕羅夫還在批評計算機下棋缺乏悟性(insights),但1996年時他已經開始意識到「深藍」貌似有悟性了。而兩年間「深藍」的計算能力只不過提高了一倍而已。機器有沒有悟性的邊界其實就是人的解釋能力的極限。量變到質變的臨界點就是人的解釋能力,人解釋不了的東西就有悟性,解釋了的東西就沒有悟性。司馬賀和日本計算機科學家宗像俊則(Toshinori Munakata)合寫了篇解氣的文章「人工智慧的教訓」(AI Lessons)登在《ACM通訊》上。

當然,德雷弗斯們還可以將「計算機仍然不能幹什麼」加上若干個「仍然」接著批評。明斯基1968年在庫布里克的電影《2001太空漫遊》的新聞發布會上曾大放厥詞說30年內機器智能可以和人有一拼,1989年又預言20年可以解決自然語言處理。現在我們恐怕還不能說機器翻譯器令人滿意吧。過分樂觀的另一個原因,照明斯基自己的說法是,一門年輕的學科,一開始都需要一點「過度銷售」(excessive salesmanship)。但是過頭了不免被人當作狗皮膏藥或鍊金術。

2006年,達特茅斯會議 50 周年時,當時的10位與會者中有5位仙逝,活著的 5 位:摩爾、麥卡錫、明斯基、塞弗里奇和所羅門諾夫在達特茅斯團聚,憶往昔展未來。

參會人之一霍維茨(Horvitz)現在是微軟實驗室的頭目,他和他老婆拿出一筆錢在斯坦福大學捐助了一個「AI100」[1]的活動:在下面100年裡各路豪傑聚會,每5年出個AI進展報告。第一期出版於2016年,但裡面並無什麼乾貨。

[1] AI100活動在斯坦福有個網站:https://ai100.stanford.edu/

喬姆斯基晚年邊做學問邊做鬥士。2015年3月他和物理學家克勞斯對話時被問及「機器可以思維嗎?」,他套用計算機科學家戴客斯特拉(Dijkstra)的說法反問:「潛艇會游泳嗎?」如果機器人可以有意識(consciousness)的性質,機器人可以被認為有意識嗎?他進一步說「意識」是相對簡單的,而「前意識」(preconsciousness)是困難的問題。他把AI分成工程的和科學的。工程的,如自動駕駛車等,能做出對人類有用的東西;科學的一面,喬老爺明顯不認可。他引用圖靈的話:這問題沒有討論的意義(too meaningless to deserve discussion)。當一幫奇點理論的粉絲帶著正面的期望採訪喬姆斯基時,他卻對人工智慧這個被他深刻影響過的學科沒太當回事,他認為氣候和毀滅性武器是比奇點更緊迫的問題。這算有意迴避吧。

明斯基在2012年接受他的學生、預言家、奇點理論炮製者庫茲韋爾的採訪時說,他相信奇點的到來,可能就在我們的有生之年。兩位「斯基」在麻省理工學院150周年紀念會上分在一個小組討論里,卻只打了下太極,並沒有針鋒相對。明斯基2016年1月24日在波士頓去世,據說為了等奇點,他老人家把自個兒冷凍了。

參考文獻指南

人工智慧是一門新學科,歷史的讀物並不多。波登的《認知科學歷史》(Boden 2008)和尼爾森的《人工智慧探究》(Nilsson 2010)是兩本嚴肅的讀物。麥克達克(Pamela McCorduck)曾是費根鮑姆的御用作家,她1979年寫的《能思考的機器》(Machines Who Think)一書,無論是取材還是立意,從今天的角度看都略微過時。尼爾森是人工智慧學科的早期參與者,也一直是領導者之一,他多年擔任SRI的人工智慧部門負責人和斯坦福大學計算機系主任,是圈裡人。

紐厄爾1981年的文章探討了如何研究人工智慧的歷史,他總結了人工智慧歷史中不同思想的對立,他的方法也可以用來研究更廣義的計算機科學,甚至可以拓展到不同科學領域和哲學。儘管這是30多年前的文章,但今天讀來仍有啟發。

明尼蘇達大學的巴貝奇研究所是專門研究計算機科學歷史的機構。主持工作的諾伯格採訪了多名計算機科學家,並做了錄音。這些被採訪的人中也有不少人工智慧學者,例如紐厄爾、麥卡錫、明斯基、溫斯頓、布坎南等。聽這些人的錄音採訪和閱讀正兒八經的文章完全是兩種不同的體驗。採訪中的語調幽默,包含了很多文章不可能有的微妙細節。除了錄音採訪,麥卡錫還有個西蒙斯基金會的更正式的視頻採訪。

雅各布森(Annie Jacobsen)的《五角大樓大腦》(Pentagon』s Brain)是關於ARPA的詳實而有趣的歷史。從這本書中我們可以看到信息科技一直不是ARPA的主打方向,但互聯網這個ARPA歪打正著的項目卻是它最好的投資。

(第一章 完)

《人工智慧簡史》作者者:尼克

出版社:人民郵電出版社圖靈原創

出版年:2017年11月

向上滑動閱覽簡介及目錄

本書全面講述人工智慧的發展史,涵蓋人工智慧的起源、自動定理證明、專家系統、神經網路、自然語言處理、遺傳演算法、深度學習、強化學習、超級智能、哲學問題和未來趨勢等。

若是只讀一本「人工智慧」普及讀物,那麼就選擇尼克老師的《人工智慧簡史》。理由很簡單:

1. 這是第一本詳解 AI 歷史的書;

2. 尼克老師是業內行家。或許你不了解尼克老師,但他的文章在業內被廣泛引用和轉載,大量人工智慧起源方面的文章也都出自尼克老師之手,Google 搜索「人工智慧的起源」可知。

前言

第1章 達特茅斯會議:人工智慧的緣起

第2章 自動定理證明興衰紀

第3章 從專家系統到知識圖譜

第4章 第五代計算機的教訓

第5章 神經網路簡史

第6章 計算機下棋:機定勝人, 人定勝天

第7章 自然語言處理:從機器翻譯到聊天

第8章 向自然學習:從遺傳演算法到強化學習

第9章 哲學家和人工智慧

第10章 人是機器嗎?人工智慧的計算理論基礎

第11章 智能的進化

第12章 當我們談論生死時,我們在談論什麼?

附錄1 圖靈小傳

附錄2 人工智慧前史:圖靈與人工智慧

附錄3 馮諾伊曼與人工智慧

附錄4 計算機與智能

參考文獻

人名對照

遇見數學, 遇見更精彩的自己!

轉發既是鼓勵, 讓我們努力走的更遠一點!

Advertisements

你可能會喜歡