コードネーム、スノーウィー2000。
キューブ・アクションを考慮した局面評価ができるスノーウィー3は、テスト段階から衝撃的なソフトウェアであった。
テスト中に感心した例を挙げて説明しよう。
(図1 X:3 1)
|
図1のバーからの31には、2つの候補手がある。
ひとつは、アドバンストアンカーの21ポイントを作るプレイA。
もうひとつは、24ポイントにエンターして、3ポイントをアタックするプレイBである。
自然な手であるプレイAに比較して、プレイBのアタックは、見落としがちである。
バージョン2までのスノーウィーは、以下のように、プレイAもプレイBも同じ期待値0.163の手と判定する。(マネーゲーム、3プライ、Tiny、20%の場合)
A. 3 bar/21 Eq.: 0.163
0.4% 13.9% 54.0% 46.0% 5.8% 0.2%
(下段は、左からXのBG勝ち、G勝ち、平勝ち、平負け、G負け、BG負けの確率を示す。)
B. 3 bar/24 6/3* Eq.: 0.163(-0.000)
0.6% 17.7% 53.8% 46.2% 9.2% 0.3%
局面をよく見てみると、以下のとおりアタックの条件がそろっていることをプログラムが評価したことがわかる。
@ Oのボードが初型のままであるのに対し、Xのほうはすでに4ポイントを作ってある。
A Xのバックメンが2枚であるのに対し、Oは、1マンバックである。
B 3によるアタックで、6ポイントの重たい5枚のうちの1枚が働く。
C アタックによって、Oの9ポイントにあるブロットがビルダーとして働きにくくなる。
スノーウィー3は、以下のとおり、プレイBのほうが優れていると判定する。
B. 3 bar/24 6/3* Eq.: 0.234(-0.000)
0.6% 17.7% 53.8% 46.2% 9.2% 0.3%
A. 3 bar/21 Eq.: 0.209(-0.025)
0.4% 13.9% 54.0% 46.0% 5.8% 0.2%
(下段の確率は、スノーウィー2までと同じ。根幹の評価函数は同じものを使っているため。)
これは、アンカーメイクのプレイAの後、次の自分の手番でキューブを打てる変化がないのに対し、プレイBのアタックの後、Oがダンスすれば、下図のとおり、パスに近い強力なキューブを打てることをスノーウィー3が評価しているためである。
X on roll, cube action?
(図2:プレイBの後のダンス)
|
3-Ply Money equity: 0.609
1.1% 30.2% 67.6% 32.4% 5.5% 0.2%
1. Double, take 0.982
2. No double 0.766 (-0.216)
3. Double, pass 1.000 (+0.018)
Proper cube action: Double, take
バージョン2までのスノーウィーでは、スコア状況に応じて、ギャモンの重みづけを変えて局面を評価していただけで、キューブを考慮していないので、例えば5ポイントマッチで3−1でリードしているゲームの序盤では、やってはいけないとされる、ギャモン狙いのプレイを選択してしまうという問題点があった。
例えば、図1のポジションを5ポイントマッチで3−1でリードしている状況に置き換えると、スノーウィー3では、以下のようにアドバンストアンカーを作る保守的なプレイAが正しいという結論を出す。
A. 3 bar/21 Eq.: 0.017
B. 3 bar/24 6/3* Eq.: -0.048 (-0.065)
5ポイントマッチで3−1でリードしているスコア状況とキューブアクション両方を加味した期待値がこのポジションでほぼ0、すなわち互角になること自体、実戦の感覚に近いように思われる。このスコアでは、得点をリードされている側が最もセンターキューブを有効に使えるのである。
バージョン2までなら、どう評価するのか、スノーウィー3の画面から確認できるようになっている。その結果は、下記のように、旧バージョンのスノーウィーは、やはり、やってはいけないギャモントライのプレイBを打ってしまうことがわかる。これは、永遠にキューブがセンターのままであるならば、正しいプレイであるのだが。
A. 3 bar/21 Eq.: 0.255
B. 3 bar/24 6/3* Eq.: 0.283
最後に、バージョン3になってもなお、誤ったプレイをしてしまう例として、図3に触れたい。
(図3:1ポイントマッチで65)
|
1. 3 9/3* 8/3 Eq.: 0.361
0.0% 0.0% 68.1% 31.9% 6.3% 0.4%
Simplified 3-ply, 20%.
2. 3 18/7 Eq.: 0.354 (-0.007)
0.0% 0.0% 67.7% 32.3% 3.6% 0.1%
Simplified 3-ply, 20%.
3. 3 18/12 13/8 Eq.: 0.347 (-0.015)
0.0% 0.0% 67.3% 32.7% 3.4% 0.1%
Simplified 3-ply, 20%.
4. 3 24/19 13/7 Eq.: 0.320 (-0.041)
0.0% 0.0% 66.0% 34.0% 3.4% 0.1%
Simplified 3-ply, 20%.
5. 3 24/19 18/12 Eq.: 0.316 (-0.046)
0.0% 0.0% 65.8% 34.2% 3.3% 0.1%
Simplified 3-ply, 20%.
図3でプライムを崩す手は、人間の目から見るとブランダーである。スノーウィー1の時点でこの誤りを見つけて驚いた。26で逃げられた後のギャモン負けがダブルマッチポイントでは普通の負けと変わらないように判断してしまうことが原因の一つであるらしい。根幹の評価函数は、最初のものから変わっていないので、1ポイントマッチというキューブが影響しない場面では、スノーウィー3は、旧バージョンのままである。
スノーウィー3が出た2000年以降にも、まだまだ先に楽しみが残っているのである。