Re: [將棋] 電王戰 再利用軟體漏洞人類取勝

作者: NewYAWARA (朝霞之前奏)   2015-04-11 17:06:12
首先先和各位說聲抱歉,前一篇提供的資訊有誤。
當時在收看的時候雖然畫面是照到阿久津八段,
但那時實際發言的是軟體開發者巨瀨亮一,。
因此沒發現軟體的28角漏洞的是開發者巨瀨,而不是阿久津八段,
巨瀨表示直至百萬圓挑戰企劃時,才發現這個漏洞,
不過由於無法再修改軟體,對此也無能為力。
至於阿久津八段則說他是在練習階段第三、四日左右時發現這個漏洞,
但也確實是想利用這樣的慣性來引導。
而巨瀨則說,事前即已想過若真的被導引至這樣的局面,就會直接投降。
事後主辦方的對應,則是先拿前四盤的棋譜解說墊檔,
接著在日本時間三點時,請第二局的對局者永瀨六段接手後手,
在軟體尚未下第20手的28角打局面前進行表演賽。
雙方變成了先手變位飛車銀冠,對決後手原位飛車穴熊的戰鬥。
途中後手一度取得優勢,但隨著數手疑問手評價值跟著逆轉,
最後仍由先手阿久津取得勝利。
若簡單回顧電王戰的規則演變過程,最主要是出在第二屆到第三屆之間。
第二屆是首度由現役職業棋士出戰軟體,
當時的軟體選拔是直接以前一年的「世界將棋選手權」的前五名軟體出戰。
而第二屆時軟體以3勝1負1和取勝後,也引發了數項爭議:
1. 第二局的ponanza及第四局的Puella α開發者拒絕出借軟體給予事前練習,
棋士認為為何軟體可事前吸收棋士的棋譜,但棋士卻不能得知軟體特性,
形成不公平之處。
2. 第三局的ツツカナ開發者為了證明自己不需要太過依靠既有定跡,
事前指定了前兩手的走法,第二手的74步幾乎是職棋不會出現的走法,
理論上這走法評價並不高,對人類無不利之處。
但棋士仍然認為不應有開發者事前介入情況,而該由軟體獨力運作。
3. 第五局的GPS將棋,串接了高達260餘台電腦運算,號稱一秒可運算超過3億棋步,
棋士認為人類對局沒辦法相互討論,軟體卻可串接的行為並不公平。
4. 各四小時思考時間的對局,對於人類太過不利。
因此進入到第三屆時,規則上有了大幅改變:
1. 參賽軟體強制在決賽出賽權時,做完最後程式修改後就必須出借給職業棋士研究,
  而且事前不得再做修改。
2. 全程皆必須由軟體來下,開發者不能再自行指定前數手走法。
3. 軟體只能使用大會指定統一規格電腦運作,不能再做串接。
但主辦方保證會是超高性能電腦。
4. 思考時間提高為各五小時。
5. 出賽軟體決定權改由大會另行主辦電王戰軟體預賽,讓軟體使用統一硬體對戰,
取出前五名並給予賞金。這最直接的影響是,GPS將棋由於是東大團隊開發,
不能參加這類營利比賽,所以上屆冠軍GPS將棋就消失在後續的電王戰中。
第三屆時,在第二局賽前又發生爭議。
起因是軟體やねうら王的作者由於參賽時僅花不到半年從無到有開發出軟體,
後續發現了不少bug要處理,便申請處理bug。
主辦方也特例允許,但在改完bug再交回給棋士佐藤紳哉時,
佐藤發現軟體實力有大幅精進而甚為不滿。
後續這過程也拍成PV公布後,引起視聽者的反彈,
認為這違反當時不得修改的規則,所以主辦方最終謝罪,
並要求使用未修改過的原始軟體進行對局。
(最後仍由未修改的やねうら王獲得勝利)
第四屆時這規則更被嚴格解釋。
やねうら王的作者抱怨,由於事前借出給棋士研究練習,
所以為了增加亂數性,他希望雖然是各五小時的思考時間,
但正式比賽時,想讓やねうら王認知到自己僅有三小時的用時,
以改變軟體的思維運作增強亂數性,以免出現過多研究手。
他認為所謂的五小時,應該是可自由運用,並不代表要全用完才算符合規則,
但大會仍然要求設定必須維持五小時。
而對局最後也是由やねうら王擊敗了稻葉陽七段。
另外第一局的軟體Apery開發者,為了避免職業棋士的事前研究作法,
則是在序盤的前40手時,讓軟體亂數挑選評價值前三名的應手,
讓行棋模式得以不固定。
不過這也付出了在序盤選擇了相對較差應手的代價,
在序盤就被齋藤慎太郎五段取得相當領先,最後由人類收下勝利。
事後やねうら王的作者建議,與其選擇評價值前三名應手,
不如設定讓每手思考用時採取亂數,因為軟體也會隨著思考時間不同,
運算出的應手也會有所變化,而Apery的作者也認為這想法不錯。
今年的電王戰團體賽由於是最後一屆,
明年開始即使續辦,也不會再是團體賽的形式,
也可能發展為類似頭銜戰的系列賽,
這還尚待主辦方與將棋聯盟協商。

Links booklink

Contact Us: admin [ a t ] ucptt.com