AI再進化!AlphaGo Zero無師自通、40天躍居圍棋王

Alphabet Inc.旗下獨立單位DeepMind 18日指出,AlphaGo最新進化版「AlphaGo Zero」功能呈現大幅提升。

AlphaGo Lee在2015年圍棋賽下贏Lee Sedol。AlphaGo Zero只花三天,完全從自行對戰中累積經驗值、沒有人類協助或依賴任何歷史資料,就能以100勝、零敗的紀錄輕鬆擊敗AlphaGo Lee。

在經過21天的自我練習後,AlphaGo Zero變得更強、超越擊敗世界圍棋冠軍柯潔的「AlphaGo Master」。40天後,AlphaGo Zero超越歷代AlphaGo版本成為世界最強圍棋手。

DeepMind表示,AlphaGo Zero是透過新型態的「加強式學習(reinforcement learning)」進行自學。

英國衛報18日報導,DeepMind執行長Demis Hassabis預期未來10年內AlphaGo的後續版本將能扮演科學與醫療專家的角色、與人類攜手合作。

OpenAI開發出來的AI機器人(AI Bot)只花了兩週的練習時間,透過「加強式學習(reinforcement learning)」、就能從完全不會進化到能夠擊敗Dota 2(Defense of the Ancients 2)職業獎金累計超過70萬美元的職業選手。OpenAI科技長Greg Brockman賽後表示,這是朝向打造更為通用系統所跨出的一步。他說,更為通用的AI系統可以學習相當複雜、混亂且重要的真實世界任務,例如當一位外科醫師。

與DeepMind AlphaGo(註:AlphaGo Zero之前的版本)相比,OpenAI團隊完全沒有向AI解釋規則、基本玩法或職業玩家的策略,他們僅不停地讓AI Bot和自己進行對戰、學習,如此一來AI Bot就不會侷限於人類給它的策略。

嘉實XQ全球贏家報價系統顯示,Alphabet Inc.(GOOGL.US)10月18日上漲0.17%、收1,012.74美元,再創歷史收盤新高;今年迄今漲幅達27.80%。

*編者按:本文僅供參考之用,並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,讀者務請運用個人獨立思考能力,自行作出投資決定,如因相關建議招致損失,概與《精實財經媒體》、編者及作者無涉。

MoneyDJ 新聞 2017-10-19 10:41:25 記者賴宏昌 報導