こんにちはゲストさん。会員登録(無料)して質問・回答してみよう!

解決済みの質問

将棋ソフトの評価値計算は

どのような基準で計算されてますか?

投稿日時 - 2018-07-11 06:35:45

QNo.9517189

困ってます

質問者が選んだベストアンサー

現在の将棋ソフトの多数はルール上指せる手を全て指してみて、評価関数の良いものから順番に幾つかの候補を手を繰り返す手法で、現在の局面からn手進んだ未来の評価関数を見る事で読みを実現しています。
このアプローチで作られた将棋ソフトは既に一般的な棋士よりも強く、
一定の成果を上げることに成功したと言って間違いありません。
しかし、この統計データに頼り切ってニッチな局面を評価仕切れない欠点を突いた作戦も多数存在しています。
機械学習の適用で最も重要な作業の1つである特徴選択にある。特徴とは、機械学習に入力するデータ項目のことであり、この特徴をどう選ぶか、どう作るかによって機械学習の精度は大幅に変化する。
機械学習の手法や特徴の選択は試行錯誤を伴い、一般的に非常に時間がかかる。また、高度なノウハウや大規模な計算機環境が必要とされる場合も多い。
プロ棋士に連勝!将棋ソフト「Ponanza」はなぜここまで強いのかの2ページ目の冒頭で、
ponanzaの開発者である山本氏は「計算資源が足りない。どこかに落ちてないかな」という発言しており、たまたまさくらインターネットの須藤氏が「貸しましょうか?」と応じた事から快進撃が始まりました。
また、やねうらお氏も自身のブログで1台100万以上のPCを何台も購入し、計算資源に当てているそうです。
現在の将棋ソフトはパラメータを微調整しては何十億の局面を覚えさせて、既存ソフトより強いか弱いかを実際に対局させてみて判別するようです。
同じ棋譜を読み込ませても強さが変動する現状はまるで悪夢です。
この現状を「雑巾絞り」「リセマラ」と定義しているようです。
開発者達の工夫
やねうら王ライブラリ VS Aperyライブラリでは、一般的なパソコンでも1日前後で学習が完了するような仕組みを公開してくださっていますし、
機械学習が完了した将棋ソフト同士で何十局も高速で指すフレームワーク等も開発しています。
限られた計算リソースの中で最大の結果を出す為の工夫をされています。
DeepLearning を使ってはどうか?
実際に作ってみた開発者の記事が下記です。
Deep Learningを用いた将棋プログラムGunyanzaを公開しました
一からしっかり動作する将棋ソフトを組み上げる時点でグニャラくんさんの技術力の高さが伺えるものの、どうもちょっとやそっとの努力では強い将棋ソフトに仕上がる事はなさそうです。
そのコメントでは「盤面の状態が組み合わせ爆発している。結果、意味ある評価値を持つ状態の集合が全ての状態に対して少なすぎるので、ほとんど全ての状態で全く学習していない。駒に価値を与えるとか、評価の与え方を緩くしないと」という詳しい方の意見もあります。
囲碁ソフトがプロ棋士に勝利したようですという記事のコメント欄で、
強豪将棋ソフト「やねうら王」の開発者、やねうらお氏は下記のように語っています。
「将棋の評価関数は囲碁に比べるとすこぶる設計しやすくて、計算効率もいまのところDeepLearningでやるよりは2,3桁ぐらい効率がいいので…。」
DeepLearning の効率を調べてみる
AlphaGo対李世ドル ・ Wikipediaによると、
「李との対局に使用されるAlphaGoのバージョンは、樊麾との対局と同等のコンピュータパワー(1,202 CPU、176 GPU)を使う」とありました。
1202/32=37.5625ということで、GoogleのクラウドサーバーでCPU32コアのマシンを38台借りると、月額$31,207.50と表示されました。
実際にはこれにGPUが乗っかってくるので想像も付きませんが、毎月の利用料金だけで最低400万以上もするスーパーコンピュータだったのです。
確かに囲碁はチェスや将棋に比べると別次元に1手の自由度が高い為、
囲碁のプロ棋士を打ち負かすソフトは不可能、もしくは後何十年も掛かるのではないかと言われていましたが、化物PCでその何十年かの溝を力押しで埋めた形です。
李世ドル氏の敗北は人間の敗北だという風に報道されていますが、そんな恐ろしい化物マシンに戦いを挑み、
1勝を勝ち取った李世ドル氏の囲碁の腕前を褒め称えるべきですし、そこまでのスーパーコンピューターを何年間も走らせて学習してまだまだ足りない囲碁の奥深さに恐れるべきでしょう。
ということで比較対象としては分からず仕舞いですが、もう少し囲碁ソフトのアルゴリズムが発達すればもっと小規模なマシンでプロ棋士と互角に戦える気がします。
どうもある程度問題定義が出来る分野に於いてDeepLerningは効率が悪いようです。

よろしくお願いいたします!

投稿日時 - 2018-07-11 07:31:08

お礼

面白すぎて脳みそがビリビリしました!

一目見ただけなので精読させて頂きます!
ありがとうございました!

投稿日時 - 2018-07-11 09:35:48

ANo.1

このQ&Aは役に立ちましたか?

0人が「このQ&Aが役に立った」と投票しています

回答(1)