8×8のリバーシ(オセロ)は解析されていません。コンピュータは超人的な強さに達しており、終盤を完全に解いて人間が安定して勝てないレベルでプレイしていますが、ゲームツリー全体(約10^28の局面)が完全に列挙されたことはありません。小さいバリアントについては解析済みで、6×6リバーシは完全プレイで先手勝ちが証明されています。8×8の標準ゲームはまだ未解析のままです。 現在のプログラムへの影響については、リバーシAIの仕組みとリバーシソフトツールをご覧ください。
ゲームを「解析する」とはどういう意味か?
ゲーム理論において、ゲームが解析されているとは、両プレイヤーが完全にプレイしたときの開始局面からの結果(勝ち・負け・引き分け)が証明されている状態を指します。解析には2段階あります。
弱い解析: 開始局面から完全プレイを行ったときの結果が判明している。先手が勝つ(あるいは引き分け、負け)ことはわかっているが、全局面の完全な戦略マップがあるとは限らない。
強い解析: ゲームのあらゆる局面から完全プレイの手順が計算されている。ゲームのどの時点にいても最適な結果に導く完全な戦略が存在する。
解析済みとされるゲームのほとんどは弱い意味でのものにとどまります。強い解析には膨大な計算資源が必要です。
解析済みゲームの例
| ゲーム | 状態 | 結果 | 年 |
|---|---|---|---|
| 三目並べ | 強い解析完了 | 引き分け | 古くから知られる |
| コネクトフォー | 強い解析完了 | 先手勝ち | 1988年(ビクター・アリス) |
| ドラフツ(チェッカー、8×8) | 弱い解析完了 | 引き分け | 2007年(シェイファーら、Science誌) |
| 6×6リバーシ | 弱い解析完了 | 先手勝ち | 1993年(アリス&ブロ) |
| チェス(8×8) | 未解析 | 不明 | — |
| 囲碁(19×19) | 未解析 | 不明 | — |
| 8×8リバーシ(オセロ) | 未解析 | 不明 | — |
なぜ8×8リバーシは解析されていないのか?
問題の規模
リバーシのゲームツリーは大きいですが、複雑なボードゲームの基準からすれば天文学的ではありません。
- 局面数の推定: 約10^28
- 平均分岐係数: 局面あたり約10手
- ゲームの長さ: 合計60手(開始時の4石を除く空マスの数)
比較として:
- チェスは約10^44の局面と10^123のゲームツリーノード
- 囲碁(19×19)は約10^170の局面
リバーシはこれらのゲームと比べると扱いやすい規模ですが、10^28という数はまだ現在のハードウェアによる完全列挙には及びません。チェッカー(10^21局面)の解析には数十年の分散コンピューティングが必要でした。アルバータ大学のジョナサン・シェイファーとその仲間たちは、2007年にScience誌に証明を発表するまでほぼ20年間取り組みました。リバーシのゲームツリーはその約1000万倍の大きさです。
終盤は解析できるが、ゲーム全体はできない理由
リバーシの計算における重要な非対称性:終盤は計算可能だが、全体は不可能。
残り空マスが20個の状態から先を考えると、そこから考えられる局面は最大でも10^20程度であり、優れたプログラムなら数秒で解くことができます。残り25マスでも、十分なハードウェアがあれば可能です。しかし、第1手から完全解析するには、ゲームツリー全体を後ろ向きに解析する必要があり、現時点では計算能力が追いつきません。
これがリバーシプログラムが終盤を完璧に指す一方で、序盤・中盤にはヒューリスティック評価関数を使う理由です。ヒューリスティックは非常に優秀で人間を圧倒しますが、証明可能な完全解ではありません。
6×6の解析
1993年、研究者ビクター・アリスとマイケル・ブロは、6×6リバーシは完全プレイで先手勝ちであることを確認しました。6×6盤面は36マスしかなく、ゲームツリーが標準の8×8より大幅に小さいため分析が可能でした。アリスは以前も同様の逆向き解析技術を用いてコネクトフォー(1988年)を解析しています。
この結果は8×8ゲームの理解に重要です。完全プレイによる8×8リバーシの結果は一見しただけでは自明ではないことを示唆しています。6×6の結果はまた、先手の優位性(黒が先に指す)が小さい盤面では決定的になりうることも確認しました。リバーシのバリアントや小さい盤面についてはリバーシバリアントをご覧ください。
現在のコンピュータリバーシはどれほど強いか?
ゲームが解析されていなくても、コンピュータは人間をはるかに超えるレベルに達しています。主な歴史的節目:
ロジステロ(1990年代)
アルバータ大学のマイケル・ブロが開発したロジステロは、人間の世界チャンピオンを圧倒した最初のプログラムの一つです。1997年、ロジステロは世界オセロチャンピオンの村上健を6対0で破りました。このプログラムは深いアルファベータ探索と洗練された学習済み評価関数を組み合わせており、1997年のICCA Journalに掲載されたブロの論文で詳述されています。
これは画期的な出来事でした。同年にIBMのディープブルーがチェスでカスパロフを破ったのと並ぶ出来事です。実質的に、リバーシのコンピュータは人間の能力を超えたのです。
現代のエンジン
現代のリバーシエンジンは以下を使用しています:
- 終盤ソルバー: 残り20〜25手の完全解析
- パターンベース評価: 数百万局から学習したヒューリスティック
- ニューラルネットワーク評価: AlphaZeroに類似した深層学習アプローチを取り入れた最新エンジン
- 定石データベース: 分析済みの序盤局面のデータベース
これらのプログラムはシリアスなプレイでは事実上人間に負けませんが、第1手から証明可能な完全プレイを実行しているわけではありません。
8×8リバーシを解析するには何が必要か?
純粋に仮説として、弱い意味での完全解析には以下が必要です:
- ハードウェア: 十分な量子ビットを持つ量子コンピュータ、またはチェッカーを解いたものをはるかに超える規模の大規模分散古典計算
- アルゴリズム: 全終端局面からの逆向き解析と積極的な対称性削減の組み合わせ
- 時間: 現在の古典ハードウェアでは数世紀かかると推定される。将来の技術ではより短くなる可能性がある
そのような解析の実際的な影響は、プレイヤーには多少拍子抜けかもしれません。コンピュータがすでに超人的なレベルでプレイしている以上、完全プレイ下での理論的な結果がわかっても、人間がゲームを楽しむ体験は変わりません。
「ほぼ解析済み」の状態がプレイヤーに与える意味
コンピュータがリバーシを支配しているという事実は、実際に重要な影響をもたらします:
学習面: コンピュータ解析はほぼあらゆる局面で最善手を示してくれます。強いAIと対局し、棋譜を解析することは上達の最も効果的な方法の一つです。
競技面: 人間は最高レベルで依然として競い合っています。なぜなら、トーナメントでは心理、スタミナ、時間管理、序盤研究が対人戦で重要だからです。世界オセロ選手権(WOC)は依然として意義ある大会です。
ゲームとしての魅力: コンピュータの支配が熱意を削いだゲームもありますが、リバーシのコミュニティはコンピュータ解析を教育ツールとして積極的に活用しています。AI解析のおかげで序盤理論、終盤技術、局面理解が深まっています。
チェスと囲碁との比較
| チェス | 囲碁 | リバーシ(8×8) | |
|---|---|---|---|
| ゲームツリーサイズ | 約10^123 | 約10^360 | 約10^28 |
| 解析済み? | いいえ | いいえ | いいえ |
| コンピュータの強さ | 超人(2005年〜) | 超人(2016年〜) | 超人(1997年〜) |
| 終盤の完全解析 | 終盤テーブルベース(7駒以下) | 部分的 | あり(残り20〜25手) |
| 解析の見通し | 非常に低い(数世紀) | 事実上ゼロ | 低いが理論上は可能 |
リバーシは状態空間が最も小さく、3つの中で最終的に解析される可能性が最も高いですが、当面は未解決の問題であり続けます。