※ 引述《nnlisalive (nnlisalive)》之銘言:
: 我覺得要從程式碼方面下手了
: 首先就是阿發狗所謂的"勝率"是怎計算出來的?
: 不外乎用盤面上所得到的資訊轉換成數據
: 再代入勝率函數得到每一點的勝率
: 那這個函數適用於任何盤面嗎? 沒有任何邏輯漏洞和盲點?
: 算出來的勝率沒有誤差? 如果有個點勝率是70%
: 具體來說應該是下了這個點跑到結束N次 有0.7*N次會贏
: 但明明就還沒下完 也不知道對方會怎下
: 所以只要能騙過電腦 讓他一直下到誤判勝率的棋
: 阿發狗就會輸到怎死的都不知道了
: 問題是要怎騙過阿法狗?
: 我 不 知 道 !
AlphaGO "勝率"計算大約是
最原始概念
假設現在盤面上AlphaGO有ABCDE五個地方值得下
就對ABCDE這個五位置後續各往後 快速隨機亂下1000盤
一直下到官子結束看最後贏幾盤
假設結果
A位置 贏830盤 輸170盤
B位置 贏750盤 輸250盤
C位置 贏640盤 輸360盤
D位置 贏912盤 輸 88盤
E位置 贏120盤 輸880盤
電腦不會管平均贏了幾目只看輸贏 最後就會選位置D
==================================
當然圍棋"隨機亂下"一千盤參價值可能有限
接下來做的就是讓
"隨機亂下1000盤"變成"快速下出1000盤有參考價值的棋"
MCTS圍棋的棋力就建構在
"隨機亂下"階段 有意義的落子選擇還有快速下完那1000盤的棋局質量