人機對弈之外的收穫 — AlphaGo 紀錄片觀後感

Andy Kao
6 min readFeb 10, 2018

--

在 2016 年舉辦的這場 AlphaGo 對上韓國好手李世石的比賽,想必在兩年前已經跌破大家的眼鏡,最後的結果是 AlphaGo 以四比一獲勝。對圍棋其實沒什麼概念的我,當初聽到比賽結果其實沒有太大的感想,只覺得 “啊!連全世界最厲害的選手也終究輸給機器人了啊”…. 之後就也沒有太大的關注,直到前陣子看到 Netflix 上有這部紀錄片,在興趣的驅使下就花了時間看了一下

AlphaGo Documentary

AlphaGo — 2017 年春天,由 Googel 的 Deepmind 團隊推出的官方紀錄片上映了,這部片片長 90 分鐘左右,主要的劇情分為兩個部分:

  1. 在 2015 年年底,Deepmind 先找尋了第一位蟬聯歐洲圍棋賽冠軍的中國籍選手 — 樊麾 (Fan Hui),並挑戰他。
  2. 在 2016 年三月,決定在修正並持續調整程式的演算法的五個月之後,進而挑戰全世界最棒的圍棋選手 — 李世石

以下的內文會含有些微劇透,建議看完影片再讀XD

Netflix — AlphaGo 世紀對決:https://www.netflix.com/title/80190844

Deepmind 團隊在影片中說明到,他們為什麼會想開啟 AlphaGo 這項專案計畫,主要是因為圍棋是一項非常複雜而且人類可以經由數千甚至數萬個不同的邏輯來思考整盤棋局的一個運動項目。 因此他們決定挑戰圍棋這個項目,並開始計劃一項二年的研究計畫。

初試啼聲

這部紀錄片的第一部份,Demis Hassabis 開始尋找誰要作為 AlphaGo 的第一位挑戰者,他們找到了當時蟬聯歐洲圍棋冠軍選手 — 樊麾。當初樊麾抱著懷疑的心情到了倫敦 Deepmind 的辦公室,也是他第一次接收到 “機器”作為對手的主動邀請。

對弈的過程非常輕描淡寫的帶過,講述著樊麾的敗北和錯愕。但卻為 Deepmind & AlphaGo 寫下新的一頁。樊麾落敗之後,隨即受到開發團隊的邀請,他們希望他能協助 AlphaGo 變得更好,因此樊麾也跟著 Deepmind 到了倫敦成為開發團隊裡面的測試員 — 他的測試項目就是,每天不斷跟 AlphaGo 下棋,試圖找出大家尚未發現的“弱點”。

樊麾在與黃士傑討論與 AlphaGo 對弈後的感想

越級挑戰

事隔將近半年,團隊決定再次挑戰當時的頂尖韓國選手李世石,消息一出就引發全世界媒體關注,因為大家覺得樊麾和李世石的等級有天壤之別(連李世石也自認如此),大家紛紛在韓國某飯店集合準備欣賞這場世紀之戰。比賽採五回合制,比賽之前媒體訪問了李,覺得這場對弈對他來說會有什麼需要注意的地方?李其實算是非常有自信的表示他不認為他會輸給機器人。

最終比數為四比一,李世石只有在第四場獲得勝利。而這場比賽也是團隊認為 AlphaGo 系統在李世石走了一步被大家譽為「神之一手」的棋步(據李本人賽後所說,他認為那步是唯一一步能走的棋),也因為這步棋超出了 AlphaGo 的計算能力,因為之後的棋路和計算都大大走針。

AlphaGo 與李世石的對弈畫面

在與李世石對弈比賽後,Deepmind 覺得 AlphaGo 已經到達了世界級的水平,因此宣布讓他退役。 Demis 後來發表了 AlphaGo Zero,比起 AlphaGo 而言, Zero 是一項沒有人類資源參與的計畫,是一項透過自我學習的機制來不斷成長的系統,學習速度也比 AlphaGo 快上許多。

粗略介紹了這部紀錄片的大綱之後,想談談我的理解(有 87% 可能是不專業的,畢竟我不懂圍棋 XD 也不夠懂 Deepmind),但還是想寫寫自己的看法:

  1. 雖然 AlphaGo 在這場“遊戲”中看似幾乎全勝,但大家到頭來知道這只是一場 “多人” vs 單人的不平等遊戲。除了開發團隊兩年來不斷研究圍棋在 AI 的可能突破點和計算所有的可行性之外,憑藉著不同專業人士(包含稍早參與的樊麾)來改善 AlphaGo 的演算機制,因此一開賽時, AlphaGo 連第一步棋都考慮了超過五分鐘以上,猜想當時的演算法大概已經規劃好接下來的 30 甚至更多步棋該怎麼走吧!
  2. 第一場 AlphaGo 獲勝後,很多人都很開心(除了南韓本地人除外吧XD),因為他們了解到這打破了機器運算一個新的境界。然而贏了第二和第三場後,大家的態度反而收斂許多,也開始覺得憂傷,彷彿害怕人類是否就這樣被機器壓得死死的。但 Deepmind 的開發團隊早就料想到不太可能那麼順利,在比賽前他們也知道一定會產生故障或是超乎機器運算的場合,因此比賽的五天過程他們都一直觀察 AlphaGo 的運算過程。果然,到了第四盤的中後段,“他”失誤了。失誤不算什麼,畢竟沒有人不會失誤。但機器如果失誤又代表了什麼?代表可能是幾千幾萬人的失誤?甚至又代表了需要再一個 20 年來修正這個錯誤?(當然這都只是疑問而已,想當然應該不會花費那麼久的時間)
  3. 這場人與機器的圍棋賽,我想其實不管誰得勝,都是好的結果。除了科技的進步和演算法不斷演進, AlphaGo 確實把人性帶入整個程式裡面,這一點我覺得令人佩服(這邊說的人性當然不是指他可以表現出跟人類一樣的豐富感情,畢竟在影片中也有提到,李世石面對的是一具無法藉由外觀揣摩出心情和想法的機器人,因此他面臨的壓力又更加巨大),而是開發團隊真正把每一場的經驗加諸到程式中,並詢問許多專家的意見,讓 AlphaGo 快速的迭代和成長,讓這專案變成一項非常成功的產品,比賽的過程和結果則是 AlphaGo 的專屬回饋方式。正因為有了大家不斷的努力和付出,才有了當時的 AlphaGo。因此輸給他,應該是值得驕傲的。

從來都不擅長寫文章,從小作文分數都超低,2018 年想說也試著開始寫寫東西記錄自己觀察到的事物和感想,想到什麼就寫什麼。希望哪天我也能寫些設計相關的內容跟大家分享討論!總之, 給自己訂個 2018 寫出 10篇的小目標吧~

我是 Andy,目前是 Fourdesire 的 UI/UX 設計師,我喜歡搖滾樂,設計,有空畫點小插圖,喜歡和人聊聊腦子裡的想法,如果有任何想聊聊的或是合作都歡迎用 Facebook 或是 email (shinyagrey@gmail.com)與我聯絡 :)

--

--