2016年3月19日 星期六

兩大網路 助AlphaGo獲勝

Google 旗下人工智慧公司DeepMind 的人工智慧系統「AlphaGo」與南韓棋王李世乭的對戰引全球注目,DeepMind資深研究員、也是為AlphaGo「下棋」的棋手黃士傑今天為大家「解惑」。他表示,AlphaGo的獲勝是基於類神經網路基礎的兩大網路:策略網路與值網路(Value Network),其中,策略網路減少下棋可能性的廣度,而值網路以搜尋為主,減少搜尋的深度,因此可以最快找出有效率的走法。他對未來人工智慧的應用樂觀,不認為有「消滅」,「取代」人類的負面因素,相信人工智慧是中性的,端看使用者的應用方向。黃士傑說,AlphaGo每天下幾百萬盤棋練習,有完整的全世界棋譜,策略網路的做法是在下了第一步後,從可下的數百步中,找出最適合的20步(減少廣度),再將20步中,往下搜尋可能得勝機率最高的幾步(減少深度)後,就能出手。對於和李世乭對戰的第四局,AlphaGo從「驚天一步」到「出現失誤」,最後認輸,轉變令人驚訝。黃士傑說,當時大家也可看到李世乭下出了一手「挖」,讓戰念轉, DeepMind對於失敗也很意外,還在找失敗原因,可能是bug讓值網路誤判。至於對AlphaGo來說,投降不難,「運算勝率低於20%就棄子」,電腦通知他「投降」,他也就放下棋子。對於四勝一負覺得也是很完美的結果。DeepMind資深研究員黃士傑幫AlphaGo「出手」下棋,他說,對於結果感到很滿意,相信人工智慧未來帶給人們更多幫助。彭慧明/攝影 分享 facebook twitter pinterest

沒有留言:

張貼留言