リバーシ(オセロ)のゲームツリーは約10^28のゲームシーケンスと推定されており、チェス(約10^123)よりはるかに小さいですが、現在のハードウェアによる完全解析にはほど遠いです。すべてのゲームは両プレイヤーのパスを含めて正確に60手続きます。最大スコアは64対0です。これらの数字を理解することで、コンピュータが終盤を支配できる一方でゲーム全体をまだ解けない理由が明確になります。 ゲームが解析済みかどうかについてはリバーシは解析済みか?をご覧ください。
ゲームツリー:リバーシはどれほど大きいか?
可能なゲームの総数
ゲームツリーは、開始局面から考えられるあらゆる終局までの異なる手順シーケンスの数を数えます。リバーシでは:
- 推定ゲームツリーサイズ: 約10^28のゲーム(ビクター・アリスの1994年博士論文 Searching for Solutions in Games and Artificial Intelligence、リンブルク大学による推定)
- 平均分岐係数: 局面あたり約10の合法手(序盤は通常4〜12手、中盤は20手以上になることも、その後減少)
- ゲームの長さ: 60手(各手で空マス1つを埋めるため固定。パスも手の一つ)
視覚的な比較:
| ゲーム | ゲームツリーサイズ |
|---|---|
| 三目並べ | 約10^5 |
| コネクトフォー | 約10^21 |
| チェッカー | 約10^21 |
| リバーシ(8×8) | 約10^28 |
| チェス | 約10^123 |
| 囲碁(19×19) | 約10^360 |
リバーシは解析済みのチェッカーと未解析のチェスの間に位置します。チェッカーの約10^7倍の大きさのゲームツリーを持ち、これがコンピュータが超人的な強さに達しながらも未解析の理由を説明しています。
盤面局面数
合法的な盤面局面数 — 合法的なプレイ中に出現しうる異なる石の配置 — は約10^28と推定されています。これはゲームツリー(シーケンスを数える)とは異なります。なぜなら、同じ盤面が理論上は異なる手順で達成されうるからです。
64マス上の石配置の理論的最大値(不合法なものを含む)は3^64 ≈ 4.3 × 10^30です(各マスは空・黒・白の3状態)。実際の合法局面はこのサブセットです。
ゲームの固定された長さ
リバーシの数学的に際立った特徴:すべてのゲームが固定された長さを持つ。
- 盤面には64マスある
- 4マスが最初から埋まっている
- 各手で正確に1つの空マスが埋まる
- したがって、すべてのゲームは正確に60手(パスを含む)
これはゲームが様々な長さで終わるチェス(チェックメイトや投了で)とは異なります。リバーシでは、残り60マスがすべて埋まったとき(または残りの空マスがすべて到達不能になった場合は盤面が満杯になる前に)常にゲームが終わります。
含意: すべてのリバーシ局面にはゲームフェーズが定義されています。10手目は常に序盤。45手目は常に中盤深く。55手目は常に終盤。この予測可能性が体系的な学習に役立ちます — フェーズをまたいでマスの重要性がどう変わるかについては盤面価値をご覧ください。
石数の数学
開始と終了の状態
開始局面: 黒石2枚+白石2枚=合計4枚、空マス60
終了状態: 合計4〜64枚の石、空マスが何個残るかによる。標準プレイ(60の空マスすべてが埋まる)では盤面上に正確に64枚の石がある。
合計の制約: ゲーム終了時、黒石+白石=64。
したがって:最終的に黒がB枚の石を持つなら、白は(64−B)枚となります。つまり最終結果は1つの数字で表せます — 黒の石数。典型的な競技の結果は30〜34(接戦)から45〜19以上(圧勝)の範囲です。
64対0の結果
一方が64対0(全石)で勝つことはできるか?理論上は可能。ただし:
- 大きな実力差や知識格差が必要
- 負けるプレイヤーが石を系統的に渡してしまう手を打つ
- 勝者の最終手がすべての相手石をひっくり返す特定のゲーム展開が必要
実際、64対0の結果は非常にまれで、意図的な努力や壊滅的な崩壊を要します。60対4、58対6、54対10といった結果の方が圧勝でもより典型的です。
石のひっくり返しの保存
各手で新しい石を1枚置き、既存の1枚以上をひっくり返します。重要な等式:
黒の置いた石数+白の置いた石数=60(合計手数)
正味の黒石数=黒の置いた石数−(白にひっくり返された黒石)+(黒にひっくり返された白石)
これが最終石数が単に何手打ったかだけでなく、配置とひっくり返しの複雑な相互作用であることを意味します。30手打ったプレイヤーでも、石を繰り返しひっくり返されると30枚をはるかに下回ることがあります。
終盤の解析可能性の数学
最後の20手が計算可能な理由
残り空マスが20個の状態では、そこから到達可能な局面数は各ステップの手数の積によって限られます。1局面あたり10の選択肢があっても、20手では最大10^20局面です。効率的なアルゴリズムを使えば現代のコンピュータで十分に扱えます。
アルファベータ枝刈りと最速移動順序により、強いリバーシプログラムは残り25〜30マスの局面を秒から分単位で解くことができます。これが競技AIで終盤解析が標準となっている理由です。
分岐係数の減少
リバーシの分岐係数はゲームが進むにつれて減少します:
- 序盤(1〜20手): 局面あたり4〜12の合法手
- 中盤(20〜44手): 局面あたり4〜15の合法手
- 終盤(44〜60手): 局面あたり1〜8の合法手(急速に減少)
この分岐係数の減少が終盤を計算可能にしています。最後の10手では1ターンあたりの利用可能な手数が2〜4まで落ちることも多く、コンピュータによる正確な計算が容易です。
確率と結果の統計
序盤の対称性
初期配置は完全に対称です — 両プレイヤーは(手番の順序を除いて)まったく同じ状況に直面します。先手(黒)は4つの序盤手を選べますが、対称性によりすべてが等価な局面(回転または反転)につながります。
つまりリバーシの本当の最初の手は2手目に来ます — 白が黒の第1手に応じるとき、初めて対称性が破れます。
黒と白の勝率
同等のレベルでは、競技データは以下を示しています:
- 初心者から中級レベルでは黒(先手)が若干多く勝つ
- 最高レベルではこの優位性は議論の余地があります — 白には黒に応じる情報的優位がある
- コンピュータ解析では、開始局面からの完全プレイが黒の勝ち、白の勝ち、引き分けのいずれかを確定的に確立できていない
序盤の対称性は、チェス(白の先手優位が普遍的に認められている)と異なり、どちらのプレイヤーにも明らかな構造的不利がないことを意味します。
競技プレイのスコア分布
高レベルの競技では、スコアは勝者の32〜36石の範囲に集中します — 強いプレイヤー同士の対局はしばしば接戦になります。分布はおおよそ以下の通りです:
- 30〜35の範囲: 接戦の競技試合で最も一般的
- 36〜44の範囲: 決定的だが圧倒的ではない勝利
- 45〜60以上の範囲: 一方的な対局。多くは序盤の角の喪失が原因
弱い相手やAIの低難度設定での対局では、位置的なミスが重なるため大差勝利がより多くなります。
数学的な好奇点
1手で可能な最大ひっくり返し数
1つのリバーシの手で最大8方向同時に石をひっくり返すことができます(置いた石からすべての方向)。1手でひっくり返せる石の理論的最大数は24枚(対称的な配置で残りの相手石すべて)ですが、実際の対局では1手で6〜10枚ひっくり返せれば印象的です。
完全ゲームの対称性
両プレイヤーが対称的にプレイする(盤面の対角線を挟んで相手の手を鏡像)と、誰かが対称性を破るまでゲームは完全な対称性で進行します。この数学的観察は初期のリバーシ研究で理論的な好奇点につながりました — 少なくとも引き分けを保証できることがある白の「ミラー戦略」です。
パリティと最後の手
盤面の閉じた領域の最後の手を打つプレイヤーはパリティ優位を持ちます。これは組合せゲーム理論の「最後に動いたプレイヤーが勝つ」原則と数学的に類似しています。リバーシの終盤パリティ解析は組合せゲーム理論の原則の直接的な応用で、レクリエーション数学と実践的ゲーム戦略の間のつながりです。