Výskum hry Othello - reversi

Úvod

Šach, hra Go, Reversi patrí medzi najpopulárnejšie strategické a kombinačné hry. Tie hry existujú pomerne dlhú dobu a plne si zaslúžia názov – kráľovské hry. V článku budem rozoberať jednu z najmenej známej hry, z tejto trojice a to: reversi. Zložitosťou patrí medzi jednoduchšie ako je šach, aj Go. Má jednoduchšie pravidlá. To je zároveň jej kúzlo, má najjednoduchšie pravidla a hra je pomerne rýchlo odohratá.

Hrám už túto hru 13 rok. Postupne ako začiatočník som našiel tie najjednoduchšie stratégie a všimol si, že niektoré polia sú dôležitejšie ako iné. Teda najdôležitejšie sú rohy, potom steny, nakoniec vnútro. Ten kto prvý obsadí rohy získava výhodu a hra sa končí víťazstvom. To bol pohľad začiatočníka. Väčšina začiatočníkov tejto hry začne počas hry vytvárať akúsi žravú techniku, teda mať počas hry najviac kameňov svojej farby otočených. No tým stráca svoju mobilitu, ma menej možnosti kam sa pohnúť, naopak súper ma väčšiu mobilitu a tým pádom ku koncu hry začína mať značnú výhodu.

Umelá inteligencia

Nie je žiadna náhoda, že programy a umelá inteligencia, cez svoje algoritmy, v dnešnej dobe nedávajú žiadne šance, aby ich človek zdolal. Pre zaujímavosť to bolo tak, že práve reversi ovládli stroje rýchlejšie ako šach, či hru Go. V hre používajú najúčinnejšie algoritmy, neustále vylepšujú svoje postupy a predovšetkým v hre reversi hrajú na 30 ťahov dopredu, používajú rozsiahle knižnice overených otvorení. V strede hry, ku koncu už vidia všetky možnosti ako hra dopadne. To je pre človeka skoro nemožný cieľ, aj keď používa najúčinnejšie stratégie. Pozri (pre doplnenie) aj článok o umelej inteligencii (Alpha go, Alpha zero) na tomto webe.

WOC hráči

Pri analýze hier najlepších hráčov tzv. WOC hráči (svetový šampionát) som dospel k záveru, že ani najlepší hráči nedokážu uhrať -20 kameňov v závere hry (záleží od otvorenia hry). To znamená prehrajú o min 20 kameňov (pri ich najlepšom výkone s komplikovanejším otvorením hry). Čo je pomerne dosť. Je to dané tým, že pokiaľ nedokáže človek nájsť dokonalý ťah, bude to síce dobrý ťah, no nie dokonalý, tak potom stačí, aby ste urobili jeden takýto ťah v hre a program Vás určite porazí. 

Šampionát v Prahe 2018:
https://youtu.be/HLW5Ms-gZAw

Po zhliadnutí par zápasov top hráčov musím povedať, že WOC hráči túto hru v dokonalých ťahoch nezvládajú ani zďaleka. Zápasy často rozhoduje náhoda v záveroch hry. Pri hre aj tých najlepších hráčov je množstvo nedobrých ťahov, ktoré preklápajú počas hry pozičnú výhodu aj zopár krát, z hráča x na y, z hráča y na x. Pokiaľ by hral proti akémukoľvek hráčovi v tomto šampionáte ten najlepší program na reversi, výsledky by vyzerali tak, že hráči by neuhrali ani 10  kameňov svojej farby z celkových 64. Pri tých najlepších by to skončilo najlepšie zrejme 44:20 ( v prospech programu). Program by ich s prehľadom porazil s veľkým náskokom. Tento šampionát v Prahe nakoniec vyhral mladučký japonec.

Prečo tento mladučký Japonec vyhral? No okrem toho, že v poslednej dobe sa zlepšil, z jeho hry plynie, že jeho výhoda je v lepšej, aktuálnej hrubej sile (kombinačné schopnosti ), ktoré sú jemne lepšie, ako u ich súperov v prvej trojke. Dvaja straší hráči majú však väčšie skúsenosti a v hre so starším Japoncom top 1 to bolo celkom o šťastí (viac doprialo chlapcovi ). Vo finálovej hre však ukazuje jeho hra lepšie aktuálne, kombinačné videnie, čo aj pravdepodobne rozhodlo. 

Šampionát Tokyo 2019:
https://www.youtube.com/watch?v=wDgtvn80qBk

Analýza hry:
otvorenie tigger, do 11 ťahu, potom ml. Takahashi urobí odklon na c4 (miesto ideálneho, dokonalého ťahu na d7). Strata mladého je ku koncu hry -2 kamene. Od tohto momentu, už nedržia líniu dokonalých ťahov vôbec. Mladý japonec dáva miesto F8, resp. G5, ale na E2. strata mladého min 4 kamene do konca. Po ďalších 2 ťahoch je to už strata 8 kameňov do konca hry. Starší to pokazí a chvíľu sa to drží na 4 kamene v prospech staršieho.
Mladší skúša komplikovať hru v 20 ťahu. Starší nevyužije prevahu horšieho ťahu (dobrý ťah je B4) a náskok si zase zmenši. Celkovo hrajú vyrovnanú partiu v strede hry. V 31 prvom ťahu starší zle potiahne a stráca výhodu. V 41 ťahu urobí mladší ďalšiu chybu a stratí drobnú výhodu. Znova ma výhodu starší. Následne potiahne mladší na G2 a ma stratu 6 kameňov (do konca hry). Po par ťahoch ma už mladší stratu do konca 10 kameňov. Starší to nevyužije ťahom na A7 ,ale rozhodne sa pre H7 (čo je v závere o 6 kameňov horši ťah). Starší neurobí hrubú chybu a udrží si 4 kamene v prospech seba do konca. Pričom im to v závere lieta od +4 do +10 v prospech staršieho. Starší nakoniec dokáže získať iba 4 kamene  v prospech seba. Existujú oveľa lepši hráči ako títo dvaja. To je 100% isté. Napr. taký Macaquillo atď. na internete.

Stratégia k dokonalej hre

Screenshot - 7_ 11png

Pozostáva z troch časti:

  1. Vedomosti, stratégie a techniky počas hry, ktoré spejú k víťazstvu. Tu sa myslí knižnica overených otvorení, potom techniky počas hry.
  2. Skúsenosti a pamäť z rôznych odohraných zápasov, množstvo schém a pozícii, ktoré sú si podobné. Toto vyžaduje dlhoročný nácvik. To je učenie neurónových sieti.
  3. Hrubá sila kombinačných schopností. Vedieť si predstaviť na čo najviac ťahov, ako bude vyzerať rozloženie. Prejsť veľa kombinácii. Toto vyžaduje vrodený talent a niekoľkoročný tréning k vylepšeniu týchto schopnosti, viď článok o umelej inteligencii.

To sú základné body, ktoré musí grand master zvládať. S najlepším súperom sa nedá uhrať v dokonalej hre, nič viac ako remíza. Už je to na takej úrovni v umelej inteligencii, že asi naozaj veľmi výnimočne by to dopadlo v tesnej výhre inak. Teoreticky to možné je, pretože žiaden program nevidí celú hru od začiatku až do konca, teda všetky variácie.

Ľudský grand master však môže uhrať remízu, no vyžaduje to dokonalé sústredenie, čas a tie tri body. No je to veľmi, veľmi ťažké. Človek totiž je omylný a hlavne často chybuje v bode tri. No nestačia tieto body. Človek musí mať tak rozvinuté schopnosti, že vidí aj on sám, že ako dopadne ta hra v určitom momente do konca. Nemusí vidieť presné rozloženia, vidí však schému a vidí, že to vedie k jeho prevahe.

Program je neuveriteľne kreatívny, nájde také kombinácie, ktoré človek ani nevidí, často sú to kombinácie, ktoré sú výnimka v stratégiách reversi. To je dané tým, že prejde všetky možnosti kombinácie hry. 

V každom prípade, ak poznáte sekvenciu dokonalých hier a máte vycibrené kombinačné schopnosti, dokážete uhrať veľa remíz aj s najdokonalejším programom. Hovorím z vlastných skúsenosti, že je to možné. Podobne by to šlo aj u šachu, kde to pôjde obtiažnejšie, pretože je väčší stavový priestor možnosti. U hry GO by majster potreboval trénovať, možno aj 70 -100 rokov, aby natrénoval svoje neurónové siete.

Malý sprievodca otvoreniami - Open Tigger

reversi4png

Malý sprievodca hrou reversi. Pre úspech v tejto hre je potrebné vedieť otvorenia hier, čo dáva väčšiu šancu získať výhodu nad spoluhráčom. Začiatočníci vôbec nepoznajú otvorenia hier, tým pádom skúsenejší hráč ich ľahko porazí, vďaka vedomosti o typoch otvorení v tejto hre.

Toto otvorenie nie je vhodné pre nováčikov, pre skúsených hráčov veľmi dobré. V tomto otvorení totiž, aj pri malej chybe (v úvode a do 10 ťahov) vedie k veľkým problémom a končí väčšinou prehrou. Toto otvorenie je teda potrebné vedieť inak to vedie k prehre.

Tu sa teda uplatňuje to, čím viac má hráč v pamäti pokračovanie tohto otvorenia, tým ma väčšiu šancu na výhru. Pokiaľ sa hráč odkloní od otvorenia, potom má menšiu šancu na výhru, ostatné možnosti vedú k prehre. Predpoklad je mať dobre kombinačné zručnosti. To je vlastne nevyhnutnosť pri každom otvorení. Toto je najnáročnejšie otvorenie a pomerne neintuitívne. Je viac možnosti tohto otvorenia, ale toto je najlepšie v tejto sekvencii:

sekvencia ťahov: existuje v závere aj alternatívny vývoj

Screenshot - 15_ 8png

Malý sprievodca otvoreniami - Open diagonal

reversi_0png

Toto otvorenie ponúka viac možnosti, variácii priebehu vyrovnanej hry. Pre začiatočníkov lepšie otvorenie.  Otvorenie je vhodné, aj pre hráča s lepšími kombinačnými schopnosťami. 
Sekvencia dokonalej hry:

final_sekvence_drawpng
Dá sa nájsť mapa všetkých dokonalých ťahov, budú vychádzať ako odštiepenie týchto dvoch spomenutých otvorení. Len tak na hrubo predpokladám, že ich bude okolo 20 celkom (všetkých možných stromov dokonalých hier).


Program na reversi

Úroveň programov na internete je naozaj variabilná, od najslabších po najlepšie. Z tých lepších to je Zebra, resp. Wzebra pre android. Medzi tie najlepšie patrí N- test, taliansky Saio. Saio je preto taký dobrý, pretože používa rozsiahlejšiu knižnicu overených otvorení dokonalej hry. Zvyšok hry prehľadáva stavový priestor možnosti a nájde najlepšie kombinácie do konca hry.