コンピュータ将棋がぼくに教えてくれるかもしれないこと

essay 】 2010 / 10 / 11
 情報処理学会が時代がかった演出とともに日本将棋協会に挑戦状を叩きつけ実現した、清水市代女流王将vsコンピュータ将棋「あから2010」の対局、気づけばもう今日の13時の話になっていた。女流棋士会ファンクラブ「駒桜」の特設サイトで棋譜中継および中継動画が公開される模様。

 コンピュータ将棋については以前「あなたが知らない(かもしれない)コンピュータ将棋の世界」というエントリにまとめて書いたので詳しくはこちらを。

 で、今回の対局。コンピュータ将棋側は5月の世界コンピュータ将棋選手権の結果と関係なく、独自に合議制のプログラム「あから2010」を用意して臨む。ハードウェアは東京大学のクラスターマシン
  • Intel Xeon 2.80GHz, 4 cores 109台
  • Intel Xeon 2.40GHz, 4 cores 60台
の計169台 676 coresという恐るべき環境(バックアップ系も別途用意)。第20回世界コンピュータ将棋選手権ではGPS将棋が320プロセッサを持ち出してきて話題を呼んだのですが、このときはCore2Duoマシンが307台含まれておりスペックではたぶん遥かに上。

 選手権優勝プログラムの「激指」のほか、「GPS将棋」、「Bonanza」、「YSS」の4つのプログラムの合議により指し手を決定、合議マネージャー部分を「Bonanza Feliz」のTeam Bonanzaのメンバーが開発した模様。

 合議制の採用にあたっては技術的なトライとして評価しつつも、純粋に強さを求めるという点で現時点では疑問視する声もまま出ている様子。同じリソースを使った場合、単純にメインのプログラムで合法手の大きな枝を切りだして、それぞれの枝をクラスタで並列処理して深読みした結果を評価値で戻すアプローチの方が単位時間あたりの読みの深さをより深くできるがゆえに強いんじゃないか、といったあたりで。実際にBonanza Felizは選手権でGPS将棋やBonanzaをクラスタ並列処理化したボンクラーズに敗れているわけですが、一発勝負では実力差を完全には測れないこと、完全に異なる思考ルーチンを用いた合議制については過去にあまり実績がない(そもそも開発者が複数の全く異なる思考ルーチンを用意するのが大変)ことから、こればかりはやってみないとわからない、としか。

 ブクログのパブー田中徹さんと難波美帆さんが今回の対局についてのノンフィクションを公開されているのですが、その中にTeam Bonanzaのメンバーで合議制に最初に取り組んだ電通大伊藤さんのインタビューがあり、複数の市販ソフトによる合議では有意に強いという結果が出ているとのこと。

 ただ、今回の対局に関していえば、Twitterでもつぶやいたように、個人的には合議制かクラスタ並列かといった部分よりも、持ち時間3時間、持ち時間消費後1分将棋、というルールにコンピュータ将棋側がどこまで対応できているのか、が勝負のカギを握っているのではないかと思ってます。

 コンピュータ将棋は世界コンピュータ将棋選手権の決勝ルールでは持ち時間25分切れ負け(持ち時間の25分を使い切った時点で負け)、30分ごとに接続されたPC上のプログラムをマッチングして自動対局を行う「コンピュータ将棋連続対局場所 (floodgate)」では持ち時間15分切れ負けのルールを採っています。これらのルールでは局面ごとに読みの深さを変えて持ち時間を有効に消費する、といった処理を考慮する余地がほぼない。実際にfloodgateで対局を観戦するとものすごい勢いで局面が進んでいきあっという間に決着がつく感じ。持ち時間を使い果たした後の1分将棋でもそれなりの深さまで読めるコンピュータ将棋が、676コアで3時間にどれだけの処理をこなすのか想像もつきません。

 この持ち時間を、どの局面にどれくらいの割合で投入し深く読みにいくのか、という部分においては、コンピュータ将棋の世界ではあまり研究が進んでいないような(知らないだけかもしれませんが)。さらに清水女流王将の持ち時間3時間が、こちらではコントロールできない形で与えられる(相手が手を考えている時間も当然思考する)わけですが、与えられた応手をうまくフィードバックして限られた時間というリソースを最大限に活用できるのか、についてちょっと興味があるのです(が、全然調べてません)。

 機械学習、クラスタ並列処理、合議制に続いて、コンピュータ将棋は、時間という限られたリソースをいかに最適配分するか、という新たなチャレンジに直面しているんじゃないですかね、これ。現状、いくつかのプログラムでは序盤〜終盤までに複数の評価関数を用意して切り替えて用いる、といった実装があるはずですが、局面ごとに細かく読みの深さを変えるといった処理を行うものはなかったような。終盤に通常の思考ルーチンから切り替えて詰め将棋ルーチンを使う、という処理は割とあるはずですが。

 とまれ、この新たなスタートラインから積み重ねられるだろう成果が、いつかぼくに、時間をどう使うのが正しいのかをロジカルに教えてくれるかもしれない、と期待しています。







Comment(0) | TrackBack(0) | essay

この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
この記事へのトラックバックURL
http://blog.seesaa.jp/tb/165319500
※言及リンクのないトラックバックは受信されません。

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。