秋風起鱸魚肥: Watson (2)

八個月前，介紹了電腦 Watson 與人類的競賽，遲未推出續集，這段期間美國已有記者 Stephen Baker 出版專書，連中文版都翻譯了。

( 本書英文封面，Stephen Baker 是著名科技記者 )

( Baker 與 Watson 合影 )

( Baker 在比賽現場 )

許多人可能都從媒體得知比賽結果了，也許改談談這比賽的其他面向。

首先，比賽引起矚目，有個原因在 Watson 描繪了人工智慧的可能性，長久來，在科幻小說電影助瀾下，人類一直期待出現第一台可對話的機器人，這是所有科幻作品的基礎。

1950 年，人工智慧之父涂林 (Alan Turing) 提出「涂林試驗」，在一屏幕後，放台人工智慧電腦與一個人，由裁判進行對話，若有電腦能讓裁判誤以為它是人類，人工智慧就成功了；涂林預言，2000 年就會出現這樣的電腦，顯然他太樂觀了。

1991 年，紐約慈善家 Hugh Loebner 讓涂林試驗成真，舉辦每年一度的 Loebner 大獎，頒發獎金給反應最接近人類的電腦，這比賽成為人工智慧界盛事。

過去幾年頗風行的 MSN 機器人 (encarta@botmetro.net; smarterchild@hotmail.com)，也是一樣的設計邏輯，你可在 MSN 與他們對話，我曾在很無聊時與他們聊了好陣子，不過流行風潮過後，這些機器人現在好像很少上線了。當然，2011 年的大事，就是 iPhone4S 內建了一位可對話的 Siri 小姐。

( Siri )

電腦與人對話後，小說家最擔心電腦脫離發明者控制，如前篇提到的《2001 太空漫遊》，作者克拉克 (Clarke) 給 HAL 超級電腦的命運是，因程式瑕疵而謀殺了四名太空人。

(電影《2001 太空漫遊》中 HAL 的長相)

至於創造「機器人」(Robot) 一詞的捷克劇作家 Karel Čapek ( Robot 在捷克語中是「非自願勞工」之意)，1920 年的戲劇《R.U.R.》中，最末機器人發動革命殲滅了人類，人類倖存者 Helena 與機器人領袖 Raduis 的對話是 :

Helena : 「博士給你一個比我們都還要大的腦，你擁有世上最大的頭腦，不像其他機器人，你應該瞭解我的意思。」
Radius : 「我不要有任何主人，我自己清楚一切的事。」

今日大家都會提到，科幻大師艾西莫夫 (Issac Asimov) 的「機器人三大法則」(註)，這些法則可限制機器人傷人，不過卻存在許多漏洞，如他的小說《裸陽》(The Naked Sun)，機器人殺人因不瞭解其動作會造成傷害；或如好萊塢改編自艾西莫夫《I，Robot》的電影《機械公敵》，機器人眼見人類開始傷害地球傷害自己，決定攻擊人類。(艾西莫夫也是首創「機器人學」"Robotics" 這個字的人)

第一法則 : 機器人不得傷害人類，或袖手旁觀坐視人類受到傷害。
第二法則 : 除非違背第一法則，機器人必須服從人類的命令。
第三法則 : 在不違背第一及第二法則下，機器人必須保護自己。

不過，三法則也有溫馨一面，艾西莫夫另本小說《正子人》(The Positronic Man) 中，機器人 Andrew 為成為人類，利用法則漏洞請機器人醫生動手術，破壞零件開始代謝，它成為人類，也結束了 200 年壽命。

在日本，手塚治虫最著名的《原子小金剛》，故事裡也充斥許多反機器人的民眾，小金剛與科學省的御茶水博士，一直在為機器人人權奮鬥著，反應社會氛圍。

不過，語言學大師 Steven Pinker 認為，人們對自動化的焦慮都是不正確的，你可問電腦 : 「芝加哥和麵包箱哪一個大 ?」、「斑馬有穿內褲嗎 ?」、「地板會爬起來咬你嗎 ?」、「蘇珊上街買東西時她的頭有跟她一起去嗎 ?」，人工智慧是答不出來的，Pinker 認為，在可見未來，只有股票分析師、石化工程師和假釋委員會的人需擔心被取代，園丁、廚師、秘書的工作是不可取代的，至少還有幾十年光景。

那麼，為何 IBM 要開發這台電腦 ?

1997 年「深藍」打敗棋王後，IBM 高層一直想找個智能領域，再擦亮 IBM 招牌，這塊技術招牌在 Microsoft, Yahoo, Google 等公司競爭下，已不再閃亮；電腦已能精通數學，但更複雜的語言領域卻無人嘗試，至於為何挑上《Jeopardy》，有一說是當時正是 Ken Jennings 如日中天連戰皆捷的時刻，IBM 內部開始提議，打造一台智慧電腦向 Jennings 挑戰。

這提案首次於會議提出時，引發眾人訕笑，因西洋棋是亙古流傳的腦力運動，益智問答充其量是商業比賽，大家認為，這不過是在耍花招，根本沒解決任何實際問題；另一原因是，IBM 多達 3000 位的研究人員，沒人願意接下這任務，要讓電腦聽懂《Jeopardy》題目中的雙關語和隱喻，是很大工程。

最後接下任務的是 45 歲的 David Ferrucci，他是人工智慧專家，原主修生物，副修資訊工程，最後在醫學院入學考場，看著考卷，頓悟自己真正感興趣的是電腦。Ferrucci 是十分適合人選，他高中便與朋友合作開發一台反向字典機器，當你想到一個意思，卻想不起適當辭彙，這機器可幫上忙；他也曾在閒時開發一台寫小說的電腦，利用不同文學題材訓練電腦的鋪陳，最後發現，電腦寫的故事皆很無趣，因電腦不知什麼才叫有趣。此外，他的興趣廣泛，從語言學、演化生物學到思考的本質，都有深入研究，是最適合的研究主持人。

這大戰雖被媒體譽為人腦電腦對決，但其實 Watson 背後也是人腦團隊，從一開始 Ferrucci 所率領的 5 人小組，到最後成為擁有 25 位博士的研發團隊，各有分工，從如何讓電腦理解問題、如何選擇搜尋的資料庫、如何加快搜尋速度、如何決定答案、如何判斷信心水準等，都有不同專人負責。

研究團隊要證明的是，這台電腦並不只是加大馬力的 Google，它不是只會搜尋答案而已，而是能判斷答案，搜尋引擎並不懂問題，也不知找到的答案是否正確；所以，開發 Watson 的最大挑戰，是如何讓電腦判斷找到的資訊是答案，然後可按鈴搶答，這是電腦與人類一大差別，我們人類非常暸解自己懂什麼或不懂什麼。

所以，Watson 的大腦是這樣運作，先依語句結構與文本分析，把主持人問題轉換成可理解資訊，然後從預先灌入的資料庫進行搜尋、瀏覽、對照、交叉分析、演算法，算出可能答案的排序與對應信心指數，當信心指數大於某門檻值，就會按鈴搶答，整個過程，第一代 Watson 要花兩小時 (研究團隊總趁 Watson 解題時去吃午餐)，到最後上場的版本，只需 3 秒鐘。

至於兩位人類參賽者，名氣較大的是 Ken Jennings，他在這場賽事前，就是全美家喻戶曉人物，還出過教人學習的回憶錄《Brainiac》。

這裡要先介紹段往事，1950 年，美國家戶剛有電視時，當紅益智節目《Twenty One》誕生了位明星，他是 30 歲的哥倫比亞大學教授 Charles van Doren，年輕聰明俊帥，什麼領域的題目都難不倒他，父親是哥倫比亞大學教授兼知名作家，母親是小說家，家裡還有兩座普立茲獎，節目收視隨他的偶像地位不斷飆高，無所不知的 van Doren 成了冷戰期間美國與蘇聯抗衡的腦力代表；最後，van Doren 被踢爆，每場比賽前他都先從製作人手裡拿到答案，成為過街老鼠，到國會開聽證會，還被總統艾森豪公開斥責。這段故事 1994 年曾被勞勃瑞福拍成電影《益智遊戲》(Quiz Show)。

( 電影中飾演 van Doren 的雷夫范恩斯 )

事發後，van Doren 從哥倫比亞大學辭職，改行編輯，出過一本暢銷書《A History of Knowledge》，不過更重要的成就是與父親合著了《How to Read a Book》，這是本經典書。

( 歷史照片，最右為 van Doren 本人 )

因這醜聞，美國電視有陣子見不到益智節目，直到 1964 年，《Jeopardy》重出江湖，美國才又掀起益智樂。《Jeopardy》的特色是，主持人的題目是答案，參賽者需回答這答案的題目，製作人的想法是，既然觀眾懷疑節目會透露答案給參賽者，那麼倒過來就沒這疑慮了。

( 這邏輯很古怪，有差別嗎 ? )

可能是 van Doren 對美國社會傷害太大，《Jeopardy》有個奇怪規定，每位優勝者僅能衛冕四次，也就是最多僅能上電視五次，所以 40 年來，這節目沒誕生任何一位益智明星，2003 年，製作單位終取消這愚蠢規定，第二年明星就出現了，Ken Jennings，沒有人能擊敗他，觀眾覺得他好像會一輩子待在節目裡，收視率開創新高。

( 製作單位幫 Ken Jennings 拍的介紹影片 )

這位明星就是電腦 Watson 的第一位對手，Jennings 是摩門教徒，童年住過韓國與新加坡，長大在西班牙傳教，有電腦與英語學位，曾任電腦工程師，記憶佳，國際經驗豐富，最重要的是，他從小就熱衷參加益智比賽，這也是他的職業之一。Jennings 在累積 250 萬美元的獎金後敗陣 ( 商業新聞是他的弱項，他不看報紙商業版 )，連勝停在 74 場。第二年，製作單位安排了冠軍對決的噱頭，找來 Jennings 與 2003 年之前的獎金王 Brad Rutter 對陣，結果 Rutter 贏了 200 萬美元，超越 Jennings 成為史上賞金王，他成為 Watson 的第二位對手。

( 製作單位幫 Brad Rutter 拍的介紹影片 )

究竟這兩位選手有何特長 ? 除知識外，他們擁有某些直覺上的天賦，《Jeopardy》規定，主持人題目唸完燈亮才能按鈴，若提早按，開關會被鎖住 1/4 秒，許多參賽者說，Jennings 與 Rutter 有按鈴的直覺天份，幾乎燈亮同時就按下按鈕，就像短跑選手的槍響起跑一樣。

Rutter 認為這是他幼時玩電腦遊戲的訓練，可見電腦訓練了人，人又拿這技能來對付電腦；Jennings 則說，他對自己的知識系統有種直覺，大部分時間，他都是按鈴同時才開始找答案，他的直覺知道他是否找得到答案，且屢試不爽。

另外，此二人都沒有「舌尖症候群」(Tip of the Tongue Syndrome, TOT)，有些人明知答案，關鍵時刻卻找不到在腦海的哪個位置，如看到某人卻叫不出名字，Jennings 與 Rutter 幾乎沒這問題，只要他們真知道答案，一定搜尋得到，不受環境壓力影響。

( 對「舌尖症候群」有興趣者，可參閱本書 )

其實，可比較一下人腦與電腦 Watson 的差異，人類有幾項優點，首先，人類沒有判斷是否該按鈴的問題，人類知道自己懂什麼，有多大把握，但 IBM 一直苦思要用何機制衡量電腦對答案的把握，其次，人類有許多競賽技巧，Jennings 說，參賽者其實是進入出題者腦中，猜測同樣身為人類的出題者想法，還可預期主持人唸完題目的時間準備按鈴，這些本事電腦都沒有。

另外，人類大腦可在瞬間過濾不需要的雜訊，電腦卻無此分辨能力，這本書的作者 Stephen Baker 舉了個例子，著名小說《湯姆歷險記》(The Adventures of Tom Sawyer) 曾說，星星可能是月亮的孩子，這是尋找天文學知識時的雜訊，人類不會上當，但電腦卻會被干擾。

電腦最弱的，還是題目的理解，特別對雙關語、暗喻、模稜兩可的句子，如把知識分為知覺、象徵、概念，電腦可感知到有幾隻斑馬，可以理解斑馬的象徵符號是黑白條紋，知道下一隻動物也屬斑馬，但，它沒有能力形成斑馬這個概念，推理出斑馬是什麼，就像 Steven Pinker 的例子，「斑馬有穿內褲嗎 ?」，電腦並不知道。就像拜倫的知名句子，「友情是沒有翅膀的愛」，電腦不知這是什麼鬼，所以柏拉圖說，概念是人類思想和社會的根本。

更進一步說，人類會累積經驗，進行歸納，相同句子在不同情境下，意思並不同，電腦沒法歸納這些成長經驗，以 Stephen Baker 書中的例子來說，「我要一個漢堡」，若是兒子對母親說、將軍對部下說、囚犯對獄友說，意義完全不同；「我好累」這話，出自剛抵達終點的馬拉松冠軍與正在打離婚官司的人，意義也不同。若讓電腦管理紐約市警局，當它聽到新聞說，「大都會又被宰了」，它會出動大批警力包圍大都會球場。

這種語言的情境彈性與模稜兩可正是語言的優點，正因如此，我們才不需無限多的字彙，就足以形容日常生活，如果每種情境都要換不同詞彙以資區別，學語言將是很恐怖的事。

不過，這不表示電腦沒有過人之處，龐大的資料庫、搜尋速度、資料正確性，這些都是電腦被發明的原因，再強的人類天才也無能匹敵。此外，有種被稱為「摩西錯覺」(Moses Illusion) 的陷阱題，是人類弱項，電腦可沒此問題，若題目問「大洪水期間摩西帶到方舟上的每種動物數量」，答案不是 2 而是 0，因為把動物帶至方舟上的是諾亞，不是摩西；對多數人而言，摩西與諾亞是常共同出現的資訊，在大腦中屬同一群組，人類很容易上當，若題目將摩西改成歐巴馬，我們馬上就能發現陷阱。電腦處理資訊不是群組，它沒有「摩西錯覺」。

( 對「摩西錯覺」有興趣者，可參閱本書 )

(諾亞方舟)

電腦還有情緒上的優點，許多 Jennings 的競爭者說，他長得就像唱詩班男孩，且態度非常客氣，他的謙遜在節目是出了名的，許多參賽者都因此降低防備，不過 Watson 可不吃這套，他根本不懂謙遜是什麼意思。另外，不管再有經驗的參賽者，關鍵時刻的壓力都會影響表現，Watson 對這些壓力也無動於衷。

值得注意的是，有種稱為「聯想網路論」(Associative Network Theory) 的錯覺陷阱，Watson 並不比人類高明，若題目先問你雪的顏色、婚紗顏色、雲的顏色，然後問你乳牛喝什麼 ? 多數人都會答牛奶，正確答案卻是水；我們的大腦除了會被之前答案「白色」影響外，也會因聯想網路而從乳牛連結至牛奶。Watson 也有此問題，它找的是最相關的字詞，若最常出現的連結字詞不是正解，它就會上當了。

對 IBM 團隊而言，比賽壓力是很巨大的，全球都在關注 Watson 表現，而他們只有一次機會，必需一次成功，從第一代 Watson 開始，他們就陸續幫它安排許多練習賽，從中發現錯誤，這些模擬對手雖不是 Jennings 這類傳奇人物，但也都是曾在《Jeopardy》中過關斬將的好手。

練習賽結果一如預期，Watson 擅長的是最直接的事實性題目，如某曲子的作曲家是誰，某本書是誰寫的；如遇到迂迴題目，帶有故事性的，如某樂團團名的典故，某位導演拍電影的原因等，Watson 就糗了。而且，對人類而言越簡單的判斷，Watson 越辛苦，有個題目是 50 名最了不起的銀幕英雄中誰不是人，答案是靈犬萊西，對有備而來的參賽者而言，這題根本無需思考，但電腦得搜尋 50 個人名，且可能還是不知，因內建資料中不會註明這角色是不是人類，如前所言，Watson 並不知道「人類」的概念是什麼。

練習賽也顯示，Watson 不錯則已，只要答錯，都是離譜答案，表示它聽不懂題目，找錯了方向。例如，題目問哪條橫跨湄公河的橋變成了小說與電影名，Watson 的答案是「卡夫卡」(答案是桂河大橋)；與智利接壤最長國家，Watson 答「玻利維亞」(答案是阿根廷，智利與玻利維亞因邊界爭議而出現許多新聞報導，Watson 被誤導了，這是聯想網路的陷阱)；問法國知名細菌學家，Watson 答「我的小法國人吃起來味道如何」(這是 1971 年一部巴西電影的名字)；問美國鋁業公司 Alcoa 的 Al 代表什麼，Watson 答「Al Capone」(美國黑幫領袖)；問一家賀卡公司 Hallmark，Watson答「IBM」(它可能想對讓它來到世上的人致敬)；最慘的是問「不」這個字的德文，Watson 答「Fuck」(正解是 Nein)。

此外， Jeopardy 有種特殊題 "Daily Double"，抽到的人可投注一金額，答對後獎金即加上此金額，答錯則倒扣，許多參賽者皆因此而大逆轉；練習賽中 Watson 落後對手 5000 元，來到最後一題，它抽到了 "Daily Double"，結果竟只下注 5 元，Watson 從來就沒搞懂規則過。

幾場練習賽後，Ferrucci 成立一個新的研發團隊，任務是「不要讓 Watson 看來像個傻瓜」、「也不能讓它說髒話」，此額外設計讓 Watson 無法回答關於荷蘭工程師的題目，此工程師名叫 Fokker。

研究來到最終階段時，Ferrucci 團隊開始思考 Watson 外型，他們把這視為大問題，找了奧美廣告幫忙；首先，Watson 絕不能太像真人，在機器人研究中有個「詭異之谷」理論 (Uncanny Valley)，由日本機器人專家森政弘提出，此理論說，若機器人長得接近人類，我們的反應是正面的，但若越來越像人類，原本可愛之處就會越惹人反感，除非真的做到與人一模一樣。因此，開發過程，Ferrucci 一直注意社會輿論的發展，特別是網路評論，因有太多科幻作品，把這樣的機器人導成負面形象。

( 2011 年國家地理雜誌的機器人專題 )

(森政弘)

(「詭異之谷」圖解)

他們曾認真考慮皮克斯動畫的「瓦力」(Wall-E)，因 Watson 外型不能具威脅性，比賽正逢大失業的金融風暴，若外型太強勢，很容易讓失業的人反感，認為電腦要來搶人工作了；這也是 Watson 名字的由來，除紀念 IBM 創辦人 Tom Watson 外，他們真的考慮到福爾摩斯的助手華生 (Watson)，小說中 Watson 只是位熱心認真的助手，並不強勢，能力也遠遜福爾摩斯，這正是 IBM 定位的 Watson 形象 ( 意思就是人類還是福爾摩斯啦，人類的自尊心真這麼脆弱嗎 )。

(瓦力)

( 華生的憨厚形象 )

( 裘德洛的華生還嫌太精明了些 )

最後，奧美廣告選了地球造型，歐巴馬當選總統後，IBM 董事長帕米沙諾 (Samuel Palmisano) 在國會提出「智慧地球」概念，倡導永續發展，這計畫有個發出五道光芒的地球標誌 "Chubby Planet"，最終成了 Watson 的臉，中性理智形象，符合原先設定。

( Chubby Planet )

( Watson 的臉 )

除了臉之外，還有聲音，Watson 的聲音是由演員 Jeff Woodman 合成的，他並不是預錄所有字彙 (也錄不完)，而是使用語音合成系統 (text-to-speech engine, TTS)，把 Watson 選的文字答案透過 Jeff Woodman 聲音發出來；現場有位控制人員負責啟動 Watson 說話，沒人知道它要說什麼，控制人員只是確保 Watson 不會亂插嘴。

( Jeff Woodman )

不過，Watson 沒有眼與耳，當題目出現在屏幕，會透過通訊網路同步傳輸給 Watson，與人類選手的視網膜看到題目同時；主持人雖也唸題目，但只有人類選手聽得到，同理，主持人有時會開 Watson 玩笑，它根本無關痛癢。比賽規則是，當主持人唸完題目 (因屏幕上也有題目，通常主持人還沒唸完，參賽者已在搜尋答案了)，會有盞燈亮起，此時才能按鈴，這是人類的小優勢，我們有耳朵，知道何時燈快亮了，Watson 並不知。

《Jeopardy》製作單位對此並不陌生，他們過去也有視障與聽障的參賽者，所以他們將 Watson 當成類似選手。(不過他們應沒遇過同時視障與聽障的選手吧)

至於比賽中需選手主動選題，這是 Watson 自己決定的，它有一套演算法決定當下選什麼樣的題目最有利。

( 美國的幽默漫畫，不過比賽時 Watson 沒有連上網路，它的資料庫是內建的 )

距比賽不到一年，製作單位突通知 IBM，為公平起見，需幫 Watson 加裝按鈴手指，原本 Watson 的設計是，當它感測燈亮且決定答題時會自動發出鈴聲，但人腦決定按鈴到手指動作，要花上 200 毫秒時間，兩位人類代表雖可能更短，但 Watson 卻完全沒這過程，佔有優勢；這要求讓 Ferrucci 不悅，認為人類的優勢既是語言，乾脆也把題目轉成 0 與 1 以示公平。

不過這紛爭很快結束了，因 IBM 硬體團隊開發的按鈴手指，從發出命令到按鈴，只需 8 毫秒。

( Watson 的外觀設計過程 )

正式比賽開賽前各華文媒體的報導 :

壹傳媒
天下文化
中天新聞

(註) 艾西莫夫自己在 1985 年的作品中，另增第零法則；後人為補強邏輯漏洞，還新增第四、第五法則與繁殖法則；例如，第五法則是，機器人必需知道自己是機器人。

延伸閱讀 :

Watson(3)

秋風起鱸魚肥

2012年1月27日

Watson (2)

沒有留言:

張貼留言