2012年1月27日
Watson (2)
八個月前,介紹了電腦 Watson 與人類的競賽,遲未推出續集,這段期間美國已有記者 Stephen Baker 出版專書,連中文版都翻譯了。
( 本書英文封面,Stephen Baker 是著名科技記者 )
( Baker 與 Watson 合影 )
( Baker 在比賽現場 )
許多人可能都從媒體得知比賽結果了,也許改談談這比賽的其他面向。
首先,比賽引起矚目,有個原因在 Watson 描繪了人工智慧的可能性,長久來,在科幻小說電影助瀾下,人類一直期待出現第一台可對話的機器人,這是所有科幻作品的基礎。
1950 年,人工智慧之父涂林 (Alan Turing) 提出「涂林試驗」,在一屏幕後,放台人工智慧電腦與一個人,由裁判進行對話,若有電腦能讓裁判誤以為它是人類,人工智慧就成功了;涂林預言,2000 年就會出現這樣的電腦,顯然他太樂觀了。
1991 年,紐約慈善家 Hugh Loebner 讓涂林試驗成真,舉辦每年一度的 Loebner 大獎,頒發獎金給反應最接近人類的電腦,這比賽成為人工智慧界盛事。
過去幾年頗風行的 MSN 機器人 (encarta@botmetro.net; smarterchild@hotmail.com),也是一樣的設計邏輯,你可在 MSN 與他們對話,我曾在很無聊時與他們聊了好陣子,不過流行風潮過後,這些機器人現在好像很少上線了。當然,2011 年的大事,就是 iPhone4S 內建了一位可對話的 Siri 小姐。
( Siri )
電腦與人對話後,小說家最擔心電腦脫離發明者控制,如前篇提到的《2001 太空漫遊》,作者克拉克 (Clarke) 給 HAL 超級電腦的命運是,因程式瑕疵而謀殺了四名太空人。
(電影《2001 太空漫遊》中 HAL 的長相)
至於創造「機器人」(Robot) 一詞的捷克劇作家 Karel Čapek ( Robot 在捷克語中是「非自願勞工」之意),1920 年的戲劇《R.U.R.》中,最末機器人發動革命殲滅了人類,人類倖存者 Helena 與機器人領袖 Raduis 的對話是 :
Helena : 「博士給你一個比我們都還要大的腦,你擁有世上最大的頭腦,不像其他機器人,你應該瞭解我的意思。」
Radius : 「我不要有任何主人,我自己清楚一切的事。」
今日大家都會提到,科幻大師艾西莫夫 (Issac Asimov) 的「機器人三大法則」(註),這些法則可限制機器人傷人,不過卻存在許多漏洞,如他的小說《裸陽》(The Naked Sun),機器人殺人因不瞭解其動作會造成傷害;或如好萊塢改編自艾西莫夫《I,Robot》的電影《機械公敵》,機器人眼見人類開始傷害地球傷害自己,決定攻擊人類。(艾西莫夫也是首創「機器人學」"Robotics" 這個字的人)
第一法則 : 機器人不得傷害人類,或袖手旁觀坐視人類受到傷害。
第二法則 : 除非違背第一法則,機器人必須服從人類的命令。
第三法則 : 在不違背第一及第二法則下,機器人必須保護自己。
不過,三法則也有溫馨一面,艾西莫夫另本小說《正子人》(The Positronic Man) 中,機器人 Andrew 為成為人類,利用法則漏洞請機器人醫生動手術,破壞零件開始代謝,它成為人類,也結束了 200 年壽命。
在日本,手塚治虫最著名的《原子小金剛》,故事裡也充斥許多反機器人的民眾,小金剛與科學省的御茶水博士,一直在為機器人人權奮鬥著,反應社會氛圍。
不過,語言學大師 Steven Pinker 認為,人們對自動化的焦慮都是不正確的,你可問電腦 : 「芝加哥和麵包箱哪一個大 ?」、「斑馬有穿內褲嗎 ?」、「地板會爬起來咬你嗎 ?」、「蘇珊上街買東西時她的頭有跟她一起去嗎 ?」,人工智慧是答不出來的,Pinker 認為,在可見未來,只有股票分析師、石化工程師和假釋委員會的人需擔心被取代,園丁、廚師、秘書的工作是不可取代的,至少還有幾十年光景。
那麼,為何 IBM 要開發這台電腦 ?
1997 年「深藍」打敗棋王後,IBM 高層一直想找個智能領域,再擦亮 IBM 招牌,這塊技術招牌在 Microsoft, Yahoo, Google 等公司競爭下,已不再閃亮;電腦已能精通數學,但更複雜的語言領域卻無人嘗試,至於為何挑上《Jeopardy》,有一說是當時正是 Ken Jennings 如日中天連戰皆捷的時刻,IBM 內部開始提議,打造一台智慧電腦向 Jennings 挑戰。
這提案首次於會議提出時,引發眾人訕笑,因西洋棋是亙古流傳的腦力運動,益智問答充其量是商業比賽,大家認為,這不過是在耍花招,根本沒解決任何實際問題;另一原因是,IBM 多達 3000 位的研究人員,沒人願意接下這任務,要讓電腦聽懂《Jeopardy》題目中的雙關語和隱喻,是很大工程。
最後接下任務的是 45 歲的 David Ferrucci,他是人工智慧專家,原主修生物,副修資訊工程,最後在醫學院入學考場,看著考卷,頓悟自己真正感興趣的是電腦。Ferrucci 是十分適合人選,他高中便與朋友合作開發一台反向字典機器,當你想到一個意思,卻想不起適當辭彙,這機器可幫上忙;他也曾在閒時開發一台寫小說的電腦,利用不同文學題材訓練電腦的鋪陳,最後發現,電腦寫的故事皆很無趣,因電腦不知什麼才叫有趣。此外,他的興趣廣泛,從語言學、演化生物學到思考的本質,都有深入研究,是最適合的研究主持人。
這大戰雖被媒體譽為人腦電腦對決,但其實 Watson 背後也是人腦團隊,從一開始 Ferrucci 所率領的 5 人小組,到最後成為擁有 25 位博士的研發團隊,各有分工,從如何讓電腦理解問題、如何選擇搜尋的資料庫、如何加快搜尋速度、如何決定答案、如何判斷信心水準等,都有不同專人負責。
研究團隊要證明的是,這台電腦並不只是加大馬力的 Google,它不是只會搜尋答案而已,而是能判斷答案,搜尋引擎並不懂問題,也不知找到的答案是否正確;所以,開發 Watson 的最大挑戰,是如何讓電腦判斷找到的資訊是答案,然後可按鈴搶答,這是電腦與人類一大差別,我們人類非常暸解自己懂什麼或不懂什麼。
所以,Watson 的大腦是這樣運作,先依語句結構與文本分析,把主持人問題轉換成可理解資訊,然後從預先灌入的資料庫進行搜尋、瀏覽、對照、交叉分析、演算法,算出可能答案的排序與對應信心指數,當信心指數大於某門檻值,就會按鈴搶答,整個過程,第一代 Watson 要花兩小時 (研究團隊總趁 Watson 解題時去吃午餐),到最後上場的版本,只需 3 秒鐘。
至於兩位人類參賽者,名氣較大的是 Ken Jennings,他在這場賽事前,就是全美家喻戶曉人物,還出過教人學習的回憶錄《Brainiac》。
這裡要先介紹段往事,1950 年,美國家戶剛有電視時,當紅益智節目《Twenty One》誕生了位明星,他是 30 歲的哥倫比亞大學教授 Charles van Doren,年輕聰明俊帥,什麼領域的題目都難不倒他,父親是哥倫比亞大學教授兼知名作家,母親是小說家,家裡還有兩座普立茲獎,節目收視隨他的偶像地位不斷飆高,無所不知的 van Doren 成了冷戰期間美國與蘇聯抗衡的腦力代表;最後,van Doren 被踢爆,每場比賽前他都先從製作人手裡拿到答案,成為過街老鼠,到國會開聽證會,還被總統艾森豪公開斥責。這段故事 1994 年曾被勞勃瑞福拍成電影《益智遊戲》(Quiz Show)。
( 電影中飾演 van Doren 的雷夫范恩斯 )
事發後,van Doren 從哥倫比亞大學辭職,改行編輯,出過一本暢銷書《A History of Knowledge》,不過更重要的成就是與父親合著了《How to Read a Book》,這是本經典書。
( 歷史照片,最右為 van Doren 本人 )
因這醜聞,美國電視有陣子見不到益智節目,直到 1964 年,《Jeopardy》重出江湖,美國才又掀起益智樂。《Jeopardy》的特色是,主持人的題目是答案,參賽者需回答這答案的題目,製作人的想法是,既然觀眾懷疑節目會透露答案給參賽者,那麼倒過來就沒這疑慮了。
( 這邏輯很古怪,有差別嗎 ? )
可能是 van Doren 對美國社會傷害太大,《Jeopardy》有個奇怪規定,每位優勝者僅能衛冕四次,也就是最多僅能上電視五次,所以 40 年來,這節目沒誕生任何一位益智明星,2003 年,製作單位終取消這愚蠢規定,第二年明星就出現了,Ken Jennings,沒有人能擊敗他,觀眾覺得他好像會一輩子待在節目裡,收視率開創新高。
( 製作單位幫 Ken Jennings 拍的介紹影片 )
這位明星就是電腦 Watson 的第一位對手,Jennings 是摩門教徒,童年住過韓國與新加坡,長大在西班牙傳教,有電腦與英語學位,曾任電腦工程師,記憶佳,國際經驗豐富,最重要的是,他從小就熱衷參加益智比賽,這也是他的職業之一。Jennings 在累積 250 萬美元的獎金後敗陣 ( 商業新聞是他的弱項,他不看報紙商業版 ),連勝停在 74 場。第二年,製作單位安排了冠軍對決的噱頭,找來 Jennings 與 2003 年之前的獎金王 Brad Rutter 對陣,結果 Rutter 贏了 200 萬美元,超越 Jennings 成為史上賞金王,他成為 Watson 的第二位對手。
( 製作單位幫 Brad Rutter 拍的介紹影片 )
究竟這兩位選手有何特長 ? 除知識外,他們擁有某些直覺上的天賦,《Jeopardy》規定,主持人題目唸完燈亮才能按鈴,若提早按,開關會被鎖住 1/4 秒,許多參賽者說,Jennings 與 Rutter 有按鈴的直覺天份,幾乎燈亮同時就按下按鈕,就像短跑選手的槍響起跑一樣。
Rutter 認為這是他幼時玩電腦遊戲的訓練,可見電腦訓練了人,人又拿這技能來對付電腦;Jennings 則說,他對自己的知識系統有種直覺,大部分時間,他都是按鈴同時才開始找答案,他的直覺知道他是否找得到答案,且屢試不爽。
另外,此二人都沒有「舌尖症候群」(Tip of the Tongue Syndrome, TOT),有些人明知答案,關鍵時刻卻找不到在腦海的哪個位置,如看到某人卻叫不出名字,Jennings 與 Rutter 幾乎沒這問題,只要他們真知道答案,一定搜尋得到,不受環境壓力影響。
( 對「舌尖症候群」有興趣者,可參閱本書 )
其實,可比較一下人腦與電腦 Watson 的差異,人類有幾項優點,首先,人類沒有判斷是否該按鈴的問題,人類知道自己懂什麼,有多大把握,但 IBM 一直苦思要用何機制衡量電腦對答案的把握,其次,人類有許多競賽技巧,Jennings 說,參賽者其實是進入出題者腦中,猜測同樣身為人類的出題者想法,還可預期主持人唸完題目的時間準備按鈴,這些本事電腦都沒有。
另外,人類大腦可在瞬間過濾不需要的雜訊,電腦卻無此分辨能力,這本書的作者 Stephen Baker 舉了個例子,著名小說《湯姆歷險記》(The Adventures of Tom Sawyer) 曾說,星星可能是月亮的孩子,這是尋找天文學知識時的雜訊,人類不會上當,但電腦卻會被干擾。
電腦最弱的,還是題目的理解,特別對雙關語、暗喻、模稜兩可的句子,如把知識分為知覺、象徵、概念,電腦可感知到有幾隻斑馬,可以理解斑馬的象徵符號是黑白條紋,知道下一隻動物也屬斑馬,但,它沒有能力形成斑馬這個概念,推理出斑馬是什麼,就像 Steven Pinker 的例子,「斑馬有穿內褲嗎 ?」,電腦並不知道。就像拜倫的知名句子,「友情是沒有翅膀的愛」,電腦不知這是什麼鬼,所以柏拉圖說,概念是人類思想和社會的根本。
更進一步說,人類會累積經驗,進行歸納,相同句子在不同情境下,意思並不同,電腦沒法歸納這些成長經驗,以 Stephen Baker 書中的例子來說,「我要一個漢堡」,若是兒子對母親說、將軍對部下說、囚犯對獄友說,意義完全不同;「我好累」這話,出自剛抵達終點的馬拉松冠軍與正在打離婚官司的人,意義也不同。若讓電腦管理紐約市警局,當它聽到新聞說,「大都會又被宰了」,它會出動大批警力包圍大都會球場。
這種語言的情境彈性與模稜兩可正是語言的優點,正因如此,我們才不需無限多的字彙,就足以形容日常生活,如果每種情境都要換不同詞彙以資區別,學語言將是很恐怖的事。
不過,這不表示電腦沒有過人之處,龐大的資料庫、搜尋速度、資料正確性,這些都是電腦被發明的原因,再強的人類天才也無能匹敵。此外,有種被稱為「摩西錯覺」(Moses Illusion) 的陷阱題,是人類弱項,電腦可沒此問題,若題目問「大洪水期間摩西帶到方舟上的每種動物數量」,答案不是 2 而是 0,因為把動物帶至方舟上的是諾亞,不是摩西;對多數人而言,摩西與諾亞是常共同出現的資訊,在大腦中屬同一群組,人類很容易上當,若題目將摩西改成歐巴馬,我們馬上就能發現陷阱。電腦處理資訊不是群組,它沒有「摩西錯覺」。
( 對「摩西錯覺」有興趣者,可參閱本書 )
(諾亞方舟)
電腦還有情緒上的優點,許多 Jennings 的競爭者說,他長得就像唱詩班男孩,且態度非常客氣,他的謙遜在節目是出了名的,許多參賽者都因此降低防備,不過 Watson 可不吃這套,他根本不懂謙遜是什麼意思。另外,不管再有經驗的參賽者,關鍵時刻的壓力都會影響表現,Watson 對這些壓力也無動於衷。
值得注意的是,有種稱為「聯想網路論」(Associative Network Theory) 的錯覺陷阱,Watson 並不比人類高明,若題目先問你雪的顏色、婚紗顏色、雲的顏色,然後問你乳牛喝什麼 ? 多數人都會答牛奶,正確答案卻是水;我們的大腦除了會被之前答案「白色」影響外,也會因聯想網路而從乳牛連結至牛奶。Watson 也有此問題,它找的是最相關的字詞,若最常出現的連結字詞不是正解,它就會上當了。
對 IBM 團隊而言,比賽壓力是很巨大的,全球都在關注 Watson 表現,而他們只有一次機會,必需一次成功,從第一代 Watson 開始,他們就陸續幫它安排許多練習賽,從中發現錯誤,這些模擬對手雖不是 Jennings 這類傳奇人物,但也都是曾在《Jeopardy》中過關斬將的好手。
練習賽結果一如預期,Watson 擅長的是最直接的事實性題目,如某曲子的作曲家是誰,某本書是誰寫的;如遇到迂迴題目,帶有故事性的,如某樂團團名的典故,某位導演拍電影的原因等,Watson 就糗了。而且,對人類而言越簡單的判斷,Watson 越辛苦,有個題目是 50 名最了不起的銀幕英雄中誰不是人,答案是靈犬萊西,對有備而來的參賽者而言,這題根本無需思考,但電腦得搜尋 50 個人名,且可能還是不知,因內建資料中不會註明這角色是不是人類,如前所言,Watson 並不知道「人類」的概念是什麼。
練習賽也顯示,Watson 不錯則已,只要答錯,都是離譜答案,表示它聽不懂題目,找錯了方向。例如,題目問哪條橫跨湄公河的橋變成了小說與電影名,Watson 的答案是「卡夫卡」(答案是桂河大橋);與智利接壤最長國家,Watson 答「玻利維亞」(答案是阿根廷,智利與玻利維亞因邊界爭議而出現許多新聞報導,Watson 被誤導了,這是聯想網路的陷阱);問法國知名細菌學家,Watson 答「我的小法國人吃起來味道如何」(這是 1971 年一部巴西電影的名字);問美國鋁業公司 Alcoa 的 Al 代表什麼,Watson 答「Al Capone」(美國黑幫領袖);問一家賀卡公司 Hallmark,Watson答「IBM」(它可能想對讓它來到世上的人致敬);最慘的是問「不」這個字的德文,Watson 答「Fuck」(正解是 Nein)。
此外, Jeopardy 有種特殊題 "Daily Double",抽到的人可投注一金額,答對後獎金即加上此金額,答錯則倒扣,許多參賽者皆因此而大逆轉;練習賽中 Watson 落後對手 5000 元,來到最後一題,它抽到了 "Daily Double",結果竟只下注 5 元,Watson 從來就沒搞懂規則過。
幾場練習賽後,Ferrucci 成立一個新的研發團隊,任務是「不要讓 Watson 看來像個傻瓜」、「也不能讓它說髒話」,此額外設計讓 Watson 無法回答關於荷蘭工程師的題目,此工程師名叫 Fokker。
研究來到最終階段時,Ferrucci 團隊開始思考 Watson 外型,他們把這視為大問題,找了奧美廣告幫忙;首先,Watson 絕不能太像真人,在機器人研究中有個「詭異之谷」理論 (Uncanny Valley),由日本機器人專家森政弘提出,此理論說,若機器人長得接近人類,我們的反應是正面的,但若越來越像人類,原本可愛之處就會越惹人反感,除非真的做到與人一模一樣。因此,開發過程,Ferrucci 一直注意社會輿論的發展,特別是網路評論,因有太多科幻作品,把這樣的機器人導成負面形象。
( 2011 年國家地理雜誌的機器人專題 )
(森政弘)
(「詭異之谷」圖解)
他們曾認真考慮皮克斯動畫的「瓦力」(Wall-E),因 Watson 外型不能具威脅性,比賽正逢大失業的金融風暴,若外型太強勢,很容易讓失業的人反感,認為電腦要來搶人工作了;這也是 Watson 名字的由來,除紀念 IBM 創辦人 Tom Watson 外,他們真的考慮到福爾摩斯的助手華生 (Watson),小說中 Watson 只是位熱心認真的助手,並不強勢,能力也遠遜福爾摩斯,這正是 IBM 定位的 Watson 形象 ( 意思就是人類還是福爾摩斯啦,人類的自尊心真這麼脆弱嗎 )。
(瓦力)
( 華生的憨厚形象 )
( 裘德洛的華生還嫌太精明了些 )
最後,奧美廣告選了地球造型,歐巴馬當選總統後,IBM 董事長帕米沙諾 (Samuel Palmisano) 在國會提出「智慧地球」概念,倡導永續發展,這計畫有個發出五道光芒的地球標誌 "Chubby Planet",最終成了 Watson 的臉,中性理智形象,符合原先設定。
( Chubby Planet )
( Watson 的臉 )
除了臉之外,還有聲音,Watson 的聲音是由演員 Jeff Woodman 合成的,他並不是預錄所有字彙 (也錄不完),而是使用語音合成系統 (text-to-speech engine, TTS),把 Watson 選的文字答案透過 Jeff Woodman 聲音發出來;現場有位控制人員負責啟動 Watson 說話,沒人知道它要說什麼,控制人員只是確保 Watson 不會亂插嘴。
( Jeff Woodman )
不過,Watson 沒有眼與耳,當題目出現在屏幕,會透過通訊網路同步傳輸給 Watson,與人類選手的視網膜看到題目同時;主持人雖也唸題目,但只有人類選手聽得到,同理,主持人有時會開 Watson 玩笑,它根本無關痛癢。比賽規則是,當主持人唸完題目 (因屏幕上也有題目,通常主持人還沒唸完,參賽者已在搜尋答案了),會有盞燈亮起,此時才能按鈴,這是人類的小優勢,我們有耳朵,知道何時燈快亮了,Watson 並不知。
《Jeopardy》製作單位對此並不陌生,他們過去也有視障與聽障的參賽者,所以他們將 Watson 當成類似選手。(不過他們應沒遇過同時視障與聽障的選手吧)
至於比賽中需選手主動選題,這是 Watson 自己決定的,它有一套演算法決定當下選什麼樣的題目最有利。
( 美國的幽默漫畫,不過比賽時 Watson 沒有連上網路,它的資料庫是內建的 )
距比賽不到一年,製作單位突通知 IBM,為公平起見,需幫 Watson 加裝按鈴手指,原本 Watson 的設計是,當它感測燈亮且決定答題時會自動發出鈴聲,但人腦決定按鈴到手指動作,要花上 200 毫秒時間,兩位人類代表雖可能更短,但 Watson 卻完全沒這過程,佔有優勢;這要求讓 Ferrucci 不悅,認為人類的優勢既是語言,乾脆也把題目轉成 0 與 1 以示公平。
不過這紛爭很快結束了,因 IBM 硬體團隊開發的按鈴手指,從發出命令到按鈴,只需 8 毫秒。
( Watson 的外觀設計過程 )
正式比賽開賽前各華文媒體的報導 :
壹傳媒
天下文化
中天新聞
(註) 艾西莫夫自己在 1985 年的作品中,另增第零法則;後人為補強邏輯漏洞,還新增第四、第五法則與繁殖法則;例如,第五法則是,機器人必需知道自己是機器人。
延伸閱讀 :
Watson(3)
訂閱:
張貼留言 (Atom)
沒有留言:
張貼留言