2011年5月18日

Watson (1)


2 月,美國益智搶答節目 "危險邊緣" (Jeopardy) 找來史上兩位紀錄保持人,迎戰挑戰者 Watson,舉世矚目。

因為,Watson 是一台電腦。

1958年,IBM 程式設計師 Alex Bernstein 幫 IBM 704 電腦開發一套下棋程式,一秒可進行 200 步運算,這是電腦與人類第一次競技;不過電腦在第 21 步就輸了,且程式無法學習,會持續犯錯,輸在相同棋路下。




1996 年,IBM 開發專門分析西洋棋的超級電腦 "深藍" (Deep Blue),名字來自科幻小說中電腦 Deep Thought 與 IBM 代表色藍色,每秒可計算 1 億步棋,主要設計者許峰雄是台灣人。

("深藍" 研發團隊,中立者為許峰雄)


IBM 向俄羅斯籍的世界棋王 Garry Kasparov 挑戰,他是史上最年輕也在位最久棋王,長達八天的比賽後,Kasparov 以 4:2 獲勝。


(棋王在紐約世貿雙子星大廈上與對手對弈)


落敗後研究團隊進行改良,一年後再向棋王挑戰,這次每秒可計算 2 億步,大家戲稱這是 "更深的藍" (Deeper Blue);雙方血戰九天,結果改由 "深藍" 以 3.5 : 2.5 打敗棋王,成為首台擊敗人類冠軍的電腦。


不過,Kasparov 對結果並不服氣,他認為 "深藍" 在比賽時有許多創意,懷疑有人從旁協助,且比賽過程允許設計師修改程式,避免電腦重複犯錯;棋王要求重賽,但 IBM 很快拆解 "深藍",宣佈退役,讓棋王無法復仇,"深藍" 的機架現展示於華府國家歷史博物館。


這段故事在 2003 年被拍成記錄片 "Game Over: Kasparov and the Machine"。





2005 年 Kasparov 退休後開始從政,他是俄羅斯總理普丁的主要反對者,多次在抗爭遊行被捕,並曾於 2007 年出馬參選俄羅斯總統。


( Kasparov 出的書 "How Life Imitates Chess",中文版)


棋王在這本書裡展現了他的博學,回憶這場比賽,他承認討厭輸棋,尤其在不瞭解輸棋原因時,他認為 IBM 倉卒結束 "深藍" 計畫,就像登陸月球卻沒留下任何照片一般;許峰雄的回應是,這比賽不是要證明電腦是否能思考,而是人類集體努力的心血能否超越最強人類的天賦。

1998 年後,Kasparov 反投入開發電腦下棋程式。



然而,打敗世界棋王,距電腦科學家的終極夢想,還有遙遠距離;因為,現今人工智慧,連科幻小說電影裡最基本的機器人能力也達不到,也就是理解人類語言。


人類語言存在著太多模糊、雙關、語意不清、省略、倒裝、口語、隱喻、反諷、暗示、推理、上下文、笑話、謎語、語氣變化,世上每個人都具備的能力,卻是人工智慧的大挑戰。

在電腦科學家心中,科幻小說大師 Arthur C. Clarke 的成名作 "2001 太空漫遊" (2001: A Space Odyssey) 揭示了一種可能性,小說裡名為 HAL 的超級電腦可與人對話,並控制整艘太空船的運行。


小說出版於 1968 年,描繪 2001 年未來世界,顯然人類科技進展落後於小說預言,今日還沒有這樣一台電腦;許多人推測 HAL 的名字靈感來自 IBM,因這三字分別是 IBM 的前一字母,也許 Clarke 心中期許 IBM 公司完成這項創舉。




2011 年,在 "2001 太空漫遊" 設定時間屆滿十年、也是 IBM 即將創立百年之際,IBM 的 25 位科學家開發出能理解人類自然語言的超級電腦,這台電腦以 IBM 創辦人 Watson 名字命名,共花四年 240 億美元研發,包括塞滿整個房間的 90 台高速運算伺服器與 2880 個 CPU,記憶體內則輸入 100 萬本書達 2 億頁資料庫,因此,Watson 既能分析自然語言句型,也能根據資料庫,回答人類問題。


Watson 計畫主持人 David Ferrucci 說,他們就是要發明影集 "星艦奇航記" (Star Trek) 裡能與人類互動的電腦;他說,比起理解自然語言,打敗棋王根本不難。

(影集 "Star Trek")


測試 Watson 能耐的最好方式就是把它送上 "危險邊緣" (Jeopardy),Jeopardy 是美國最老牌益智節目,開播於 1964 年,題目涵蓋各領域知識,且常以迂迴或雙關語方式發問,對人工智慧是艱難挑戰;據統計,這節目抽樣的 2 萬個題目中,竟涵蓋 2500 種題型,且最常出現題型僅佔 3 %。


其實 Watson 本就是為這節目設計,2004 年,IBM 副總裁 John Kelly 在酒吧內發現客人放下酒杯,專注觀看搶答過程,遂有人工智慧的開發構想。


為了人類顏面,製作單位請出節目史上兩位傳奇人物應戰,Ken Jennings 今年 37 歲,幼年隨擔任律師的父親在南韓與新加坡住了 15 年,曾取得電腦科學與英文文憑,擔任電腦工程師,目前職業則是作家;他曾於 2004 至 2005 年連續贏得 74 場 Jeopardy 比賽,累計 250 萬美元獎金。


33 歲的 Brad Rutter 則是節目歷史獎金王,分別在 2002 與 2005 年累計達 325 萬美元獎金,他從小就是益智節目的職業參賽者,在 Jeopardy 取得成功前,他是賓州唱片行店員,目前正試圖成為電視主持人。


比賽敲定於 2 月 14 日情人節當晚連續進行三天,以總分決勝負,冠軍獎金有 100 萬美元,如果電腦贏了,IBM 將把獎金全數捐出,人類獲勝則捐出一半。


錄影時,龐大的 Watson 將置於攝影棚旁的房間內,賽場有一螢幕,顯示地球動畫,電腦思考時,地球周圍將有光點環繞轉動;如 Watson 對答案有信心,光點軌跡是綠色,若無信心,則顯示橘色。此外,Watson 是以攝像頭接收題目文字,轉化成文本資料,再根據句型關鍵字語意分析,然後從 2 億頁的文字資料庫搜尋,尋找與題目最關聯字彙,若關聯性大於 50 %,就按鈴搶答。


這場未演先轟動的對決先在 1 月 13 日舉辦模擬賽,也測試 Watson 性能。賽前 Rutter 認為,電腦優勢在於答錯問題不會氣餒,不過,文字遊戲與雙關語是人類特長,人類終會勝利;Jennings 則開玩笑,幸好 Watson 不是魔鬼終結者 (The Terminator),輸了比賽不會把我殺了。


模擬賽結果,雙方各擅勝場,對較直接的問題,例如,根據 "約書亞" (Joshua) 記載,Kathleen Kenyon 曾挖掘這座城市,其城牆被修補17次,Watson 只用不到一秒就搜尋出城市是 Jericho;或如,Harriet Boyd 是第一位在這座島上發現小城並開挖的女考古學家,Watson 也很快搜尋出答案是希臘克里特島。


有些題目 Watson 則不如人類,例如,他在 "黑暗騎士" 這部電影中就如管家阿福般值得高薪報酬,答案是飾演蝙蝠俠管家的英國老牌影星 Michael Caine,這題由 Rutter 搶答成功,題目問法太迂迴,電腦也許有理解困難。


另外一題,這位童星在 "小鬼初戀" (My Girl) 電影得到了他在大螢幕的初吻,答案是麥考利.克金 (Macaulay Culkin),由 Jennings 搶答成功,這題難度在於,電腦資料庫中也許有電影簡介,但不會記載這是演員的螢幕初吻,這需要比較分析。



( 這是模擬賽的全部過程,含中文字幕 )




模擬賽後很快過了一個月,2011 年情人夜,山雨欲來風滿樓,幾乎各國媒體都預告這場比賽,當晚全美電視與網路全程直播,對決攤在全球觀眾眼下。






比賽過程,Watson 每個答案都是焦點,不論答對答錯、搶答快慢、信心水準,都是電腦科學家關心的,大家都想知道人工智慧在實戰能否派上用場。

以下為第一天部份問題 :

"任何時候你感到痛苦,嘿 "這小子" 請打住,別把整個世界背負肩頭" 。(“And anytime you feel the pain, hey "this guy" refrain, don't carry the world upon your shoulders")

這題問的是歌詞,請參賽者填入 "這小子" (this guy) 的原詞,答案是 "Jude","Hey Jude" 是披頭四名曲,這題由電腦獲勝,它的信心水準高達 98%。這種搜尋歌詞的題型,人類不太可能是對手。


Milorad Čavić 幾乎破壞了這個人完美的 2008 奧運,僅輸給這人 0.01 秒 。(Milorad Čavić almost upset this man's perfect 2008 Olympics, losing to him by one hundredth of a second)

答案是 Michael Phelps,這題由電腦輕鬆搶答成功,令人驚訝,這題目對電腦是有難度的;Milorad Čavić 是塞爾維亞游泳選手,他在 2008 北京奧運的男子 100 公尺蝶式,僅輸給金牌 Phelps 0.01 秒,後來 Phelps 拿到七面金牌。這題目刻意把游泳隱藏起來,但 Watson 很快從資料庫搜尋 Čavić 名字,找到 Phelps 的關連性。

(Michael Phelps)


1976年,在一個 "現代" 什麼的項目中,一選手因在重劍和計分點間動手腳,而在未觸碰對手下得分,被剝奪資格。(A 1976 entrant in the "modern" this was kicked out for wiring his epee to score points without touching his foe)

答案是現代五項 (modern pentatholon),還是由電腦獲勝,這題 Watson 甚至不需理解題目,在資料庫中,與 "現代" (modern) 有關的運動項目就只有現代五項。

這真是生理奇蹟,美國體操運動員 George Eyser 在 1904 年贏得體操雙槓金牌。(It was the anatomical oddity of U.S. gymnast George Eyser, who won a gold medal on the parallel bars in 1904)

答案要回答的是 "It",正解是 "missing a leg",因這位選手少了一條腿;這題 Jennings 先搶答,他答成 "少了一支手",輪電腦回答,Watson 答 "leg",還是答錯,這題顯示電腦不懂什麼是 "生理奇蹟" (anatomical oddity),它不知道答 "missing a leg" 跟 "leg" 在這裡的差別。






迪士尼樂園開張與和平標誌被創建的年代。(Disneyland opens and the peace symbol is created)


答案是 1950 年代,這種年代題對電腦不是問題,搶答速度卻不如人類,人類在題目還沒問完就準備搶答了,Watson 還需搜尋與計算;且這題有兩事件,人類只要知道其中一個就搶答了,電腦可沒這麼聰明,它要分別搜尋兩事件的發生時間再確認。


第一個現代填字遊戲發佈與 Oreo 餅乾出現的年代。(The first modern crossword puzzle is published & Oreo cookies are introduced)

答案是 1910 年代,這題電腦又犯了錯;Jennings 先搶答 1920s,答錯,輪到電腦,又回答 1920s,因它沒法接收其他人的答案,也不一定知道這些答案與它的關聯,Watson 這低級錯誤還被主持人嘲笑了一下。

這 "事件" 不需憑票入場,它是黑洞邊界,任何物質都不能從那裏逃脫。(Tickets aren't needed for this "event", a black hole's boundary from which matter can't escape)

答案是 "事件視界" (Event Horizon),是一種時空曲隔界線,這物理題對電腦有點難,因 Event 是事件的意思,這裡有雙關語,題目又故意用 "不需憑票入場" (Tickets aren’t needed) 的戲謔用法,結果電腦竟搶答成功;顯然 Watson 是從 "黑洞邊界" 找到答案,題目應把這線索也隱藏起來,Watson 就非當機不可了。


這是米開朗基羅在西斯汀禮拜堂的壁畫,描繪了被救贖與被詛咒的人。(It's Michelangelo's Fresco on the wall of The Sistine Chapel, depicting the saved and the damned)

這題電腦很輕鬆答出正解 "最後審判",西斯汀禮拜堂有兩幅米開朗基羅的畫,另一幅是 "創世紀",Watson 計算結果顯示,"最後審判" 的信心水準是 97 %,而 "創世紀" 只有 15 %。


西斯汀禮拜堂的壁畫 "最後審判"。


字彙題就是 Watson 的弱項了。

一個字有 4 個字母,有頂峰 (summit) 的意思,前 3 字母的意思則是猩猩。(It’s a 4-letter term for a summit; the first 3 letters mean a type of simian.)

答案是 apex,ape 是猩猩的意思;而 Watson 的答案竟是 peak,pea 是碗豆,顯然電腦沒聽懂題目。

流行的高雅,或指同一年畢業的學生。(Stylish elegance, or students who all graduated in the same year)

答案是 class,這題對人類而言不難,class 也有品味、風雅之義;Watson 的答案是 chic,chic 是時髦、高雅之義,電腦沒聽懂題目後半段,或太重視前段了。

接下來這題也顯出電腦的限制。

他的受害者包括布巴吉、瘋眼穆迪和石內卜,如果你說出他的名字,更容易抓住他。(His victims include Charity Burbage, Mad Eye Moody, and severus Snape; he'd be easier to catch if you'd just name him!)

答案是佛地魔,這對人類簡直是送分題,全球可能一半的人知道答案,但 Watson 並不知道,雖然它的資料庫內有哈利波特全集,但第七集裡並未明言石內卜是死於佛地魔之手,電腦只會搜尋,並不會讀小說。(這題電腦排第一的答案是哈利波特,只有 37 % 信心水準,第二才是佛地魔,第三則是鄧不利多)


第一天的最後一題與 "魔戒" 有關。

他是個通緝犯,最近一次出現在巴拉多塔,它是隻巨眼。(Wanted for general evilness; last seen at the Tower of Barad-Dur; it's a giant eye, folks, kinda hard to miss)

這題答案是 "魔戒" 小說中的索倫,也是對人類較有利的題目,但還是由電腦搶答成功;因 "巴拉多" (Barad-Dur) 實在太好搜尋了,Watson 瞬間就發現這與 "魔戒" 有關,如題目改成某個塔,電腦大概就得繳械了。

("魔戒" 中的巴拉多塔)



第一天結束,人類並未居下風,電腦與 Rutter 共同以 5000 分領先,Jennings 則是 2000 分。



不過,第一晚還僅是熱身而已。


( 第一天賽後壹傳媒的新聞報導 )




延伸閱讀 :

Watson(2)
Watson(3)




1 則留言: