來源:公眾號 微信後台團隊 作者:微信翻譯團隊
去年DeepMind的AlphaGo Zero論|夲o表之後,我們驚嘆於Zero強化學習算法的優雅、穩定
和高效。恰好當時微信資源調度團隊研發了一個大規模雲計算平台,利用微信後台閒時的
計算資源做機器學習的推理及訓練。出於測試自研大規模雲計算平台和研究AlphaGo Zero
算法的目的,幾名工程師陸續加入PhoenixGo這個項目,把論文上的算法一步步變成了一個
“活的”、具有職業棋手棋力的AI程序。從1月底開始PhoenixGo以BensonDarr(暱稱“金毛
”)的名義在騰訊野狐圍棋平台上和全球頂尖職業棋手、圍棋愛好者及各路圍棋AI對弈,
在4月底取得了200多連勝,並在福州2018世界人工智能圍棋大賽上奪冠。
AlphaGo Zero需要海量的計算資源來生成棋譜,PhoenixGo復用了微信後台成千上萬台CPU
服務器的空閒時段得以成長,但這種量級的計算資源很難被普通大眾所獲取。為了其他研
究者可以在我們的基礎上繼續探索圍棋AI的奧秘,為了棋手可以更方便地研究圍棋AI的棋
路,也為了眾多圍棋愛好者在家用普通電腦上可以享受和職業九段手談的樂趣,我們決定
開源PhoenixGo對弈源碼和訓練好的模型。
從福州比賽回來後我們開始著手PhoenixGo的開源。經過一周多時間的源碼整理,這次我
們開源PhoenixGo對弈源碼和一個20 block的模型。訓練源碼和其它源碼由於跟微信內部
的雲計算平台耦合較深、不易分離,暫不開源。這份源碼和模型可以在單塊GPU上提供強職業棋手
的棋力,在單機多卡和多機多卡的系統上具有遠超人類棋手的水平。我們在野狐圍棋平台
上的賬號“金毛測試”,運行於1塊性能與GTX 1080 Ti性能接近的Tesla P40上,對人類
棋手具有非常高的勝率。
最後感謝DeepMind發表了AlphaGo Zero論文,讓一個不懂圍棋的技術團隊能開發出
PhoenixGo;感謝陪伴{BensonDarr、時空奇點、金毛測試、金毛陪練}@野狐圍棋、
[email protected]弈城、[email protected]成長的對弈棋手、AI程序以及廣大圍觀棋迷!
https://github.com/Tencent/PhoenixGo
新聞來源: http://sports.sina.com.cn/go/2018-05-11/doc-ihamfahw3402974.shtml