最強AlphaGo Zero 智慧達「外星級」

熱度478票  瀏覽4次 時間:2017年10月20日 09:07
最強AlphaGo Zero 智慧達「外星級」

【星島日報報道】Google旗下的人工智能軟件AlphaGo,在世界矚目的人機大戰中橫掃全球圍棋高手,但AlphaGo的進化版AlphaGo Zero更讓人驚訝,它能在沒有輸入任何人類經驗的情況下,迅速採取跟自己反覆對弈的自學方法,僅訓練三天便以100:0的戰績完勝二〇一六年版的AlphaGo,四十天後,又戰勝了曾擊敗人類第一棋手柯潔的一七年版AlphaGo。新版本標誌着人工智能取得巨大突破,被形容為「外星智慧」。

科網巨擘Google旗下英國深度思維(DeepMind)公司的團隊,在新一期《自然》期刊發表《在沒有人類知識條件下掌握圍棋遊戲》的論文,介紹了AlphaGo Zero。

該公司將AlphaGo的發展分為四個階段:第一個版本是AlphaGo Fan,它在二〇一五年戰勝歐洲圍棋冠軍樊麾,標誌着人工智能首次戰勝人類職業棋手;第二個版本是AlphaGo Lee,它在二〇一六年戰勝曾多次奪得世界冠軍的南韓棋手李世石,標誌人工智能戰勝人類頂級棋手;第三個版本是AlphaGo Master,在今年戰勝現今世界排名第一的中國棋手柯潔,並在與多位有世界冠軍頭銜的人類棋手「群戰」中完勝。

但是,這些版本在剛開始學習圍棋時,都要依靠人類知識,即先教它們一些人類摸索出的基本下法,然後再開始自己學習。AlphaGo Lee在參考大量人類棋譜並自我對弈約三千萬盤、訓練數月後,才於去年三月以四比一的戰績擊敗南韓九段棋手李世石。

然而AlphaGo Zero擺脫了這個限制,從空白狀態學起,研究人員沒有給它除棋盤、棋子、規則之外的任何人類輸入,「從零開始」迅速自學圍棋,反復自己與自己對弈取得飛速進步,掌握獲勝可能性高的下法,專攻「強化學習」是其主要特點。它在開始學習圍棋三天,進行了約五百萬局自我對弈後,就以一百比零完勝AlphaGo Lee;四十天後,它又戰勝了在所有人類高手看來已不可企及的AlphaGo Master。

領導AlphaGo團隊的西爾弗表示,AlphaGo Zero使用新的強化學習方法,系統從只知道圍棋的規則開始,透過神經網絡的運算自我對弈自學。該論文指出,AlphaGo Zero完全自學,「不需人類輸入」,是機器獲得超人能力的重要一步。

麻省理工學院電腦科學家海因斯驚歎道:「AlphaGo Zero就像外星人在發明自己的數學。它沒有人類的偏見和推測,學習自己認為最好的東西,誤差比人類少。」

論文指出,在數百萬局自我對弈及訓練後,AlphaGo Zero獨立發現了人類花數千年才總結出的圍棋規則,還建立了新戰略,為這個古老的遊戲帶來新見解。世界頂尖棋手的養成,動輒需要數十年的訓練、磨礪,但AlphaGo Zero創下只需三天的紀錄。

上海紐約大學電腦科學教授張崢表示,從算法來說,AlphaGo Zero比它的「前輩」更簡潔、漂亮。它擺脫了人為的大數據,在人類所定的規則下,自主發現新知識,並糾正人類的錯誤知識。柯潔在微博發文感歎:「一個純淨,純粹自我學習的Alphago是最強的……人類太多餘了。」深度思維行政總裁哈薩比斯說,他希望人工智能的這種進步能夠被應用於分析蛋白質結構、設計新材料等領域。

頂:23 踩:48
對本文中的事件或人物打分:
當前平均分:-0.12 (152次打分)
對本篇資訊內容的質量打分:
當前平均分:0.04 (123次打分)
【已經有132人表態】
44票
感動
9票
路過
7票
高興
16票
難過
17票
搞笑
21票
憤怒
9票
無聊
9票
同情
上一篇 下一篇