Garry Kasparov

Garry Kasparov | foto: ReutersReuters

Počítač, který porazil Kasparova, byl primitivní. Dnes se stroje učí

  • 28
Schopnost počítačů porazit šachové velmistry je jedním z ukazatelů vývoje výpočetní techniky. První prohraná partie tehdejšího krále šachu Garryho Kasparova vyvedla z míry, v roce 1996 však počítač Deep Blue ještě zdolal.

Hrálo se tehdy šest partií a Deep Blue se celkové výhře ani nepřiblížil. Kasparova totiž porazil pouze v první partii, dvě skončily remízou a ve třech zvítězil ruský šachový velmistr. Kasparov tak zvítězil se skóre 4-2 (remízy se počítají za půl bodu pro obě strany) a sebevědomě tehdy prohlásil, že mu ještě pár let do zápasu prohraného s počítačem zbývá.

Co ho v první prohrané partii udivilo, byl počítačův tah bez zjevné výhody. Na Kasparova to zapůsobilo velmi lidsky, a kvůli překvapení tehdy partii prohrál. Tvůrci počítače Kasparovovi později objasnili, že stroj počítá řadu kroků dopředu, a výhody proto dokáže předvídat i v dlouhodobějším horizontu. Kasparov přitom trénoval proti jiným programům, a styl Deep Blue ho proto zarazil.

Šachy - Šachy - ilustrační foto.

Projekt Deep Blue byl ostatně demonstrací síly výpočetní techniky. Superpočítač vytvářeli zaměstnanci firmy IBM od roku 1989, jeho počátky jsou však ještě starší. Trojice vědců na konceptu začala pracovat již během studia na vysoké škole a IBM je po promoci najalo právě kvůli výzkumu pro šachový počítač.

Autoři stroj od začátku koncipovali jako počítač, který má porazit šachové velmistry. Veškeré programování i výkon tedy sloužily jedinému cíli. Verzi z roku 1996 nahradil následující jaro počítač schopný „zvažovat“ dvakrát tolik tahů. Tedy zhruba 200 milionů za vteřinu.

Počítač z roku 1997 tehdy patřil mezi tři sta nejvýkonnějších strojů na světě. Využíval třicet procesorů s taktovací frekvencí 120 MHz, který doplňovalo 480 chipů vytvořených speciálně pro šachové kalkulace.

Šachový velmistr i navzdory tomu před původním zápasem v roce 1996 odmítl nabídku, že se finanční odměna za zápas rozdělí v poměru šedesát ku čtyřiceti mezi vítěze a poraženého. Soutěžilo se přitom o půl milionu dolarů.

Po vítězství počítač rozložili, výpisy neukázali

V květnu 1997 následoval odvetný zápas, během kterého Kasparov vyhrál první partii a utrpěl porážku v druhé. Počítač tehdy zvolil tah, který Kasparovi nedával smysl a působil na něj jako znak vysoké inteligence. Krok se tehdy na Kasparově výkonu podepsal negativně a šachový velmistr zápas prohrál se skóre 2,5 versus 3,5.

V souvislosti s prohranou druhou partií šachista nařknul IBM z podvádění. Tvrdil, že krok byl na počítač příliš kreativní, a že do hry zasáhl člověk. Firma však Kasparovo prohlášení rezolutně odmítla. Pravidla umožňovala úpravy počítače mezi jednotlivými hrami, a toho prý tvůrci Deep Blue využívali. Lidské zásahy do jednotlivých her však tvůrci z IBM popřeli.

VIDEO: Evoluce herního ovladače

Krátké animované video ukazuje evoluci herního ovladače ve formě pixel artu.

Evoluce herního ovladače

Celá situace však působila kuriózně. Kasparov totiž od společnosti žádal výpisy dřívějších zápasů počítače, které mu firma odmítla poskytnout a počítač Deep Blue po vítězném zápase rozložila a stroj již se šachisty nikdy nesoupeřil. Okolo zápasu pak vznikly teorie, podle kterých IBM podvádělo v rámci nekalých obchodních praktik. Po vítězství Deep Blue proti Kasparovovi totiž hodnota akcií IBM vzrostla o 20 %.

O patnáct let později se však k záležitosti vyjádřil jeden z návrhářů Deep Blue. Byla to prý chyba v programu. Počítač totiž nedokázal zvolit ideální tah a zahrál proto náhodně. Jednou z úprav mezi zápasy v roce 1997 bylo právě opravení chyby, která tehdy otřásla Kasparovovou taktikou.

Počítač měl navíc proti Kasparovovi jednu zásadní výhodu. Čerpal z databáze všech jeho veřejně dostupných zápasů a k dispozici měl také 700 tisíc her šachových velmistrů. Kasparov oproti tomu styl počítače neznal, a nemohl mu tak uzpůsobit svou strategii.

Kasparovova prohra v roce 1997 tehdy byla výsledkem řady prvků. Zásadní vliv na partii měla chyba v programu. Počítač vznikal za účelem porazit šachového velmistra, ale stále se jednalo o relativně primitivní formu umělé inteligence, která jednoduše využívala předem definované zásoby možných tahů.

Nezadržitelný vývoj technologií

Přesuňme se rychle do roku 2014. Tři roky stará společnost DeepMind je novým přírůstkem do portfolia Googlu a video z technologické konference odhaluje její umělou inteligenci. Ta se sama učí na základě metody pokus-omyl, kterou její tvůrci kopírují lidské nabývání nových dovednosti.

Počítač hraje jednoduché arkádové hry z minulého století a k dispozici má pouze přehled událostí na obrazovce a skóre, na základě kterého vyhodnocuje úspěšnost tahů. Ve videu je možné spatřit klasickou hru Breakout, v níž je třeba létajícím míčem zbořit zeď složenou z individuálních cihel.

Počítač během prvních sto her míč sotva zvládá odpalovat. Zhruba po hodině a půl hraní má však odehraných 200 her a mine pouze každý třetí míč. Po tři sta odehraných kolech však počítač přestane míč míjet.

Po šesti stech odehraných her pak využívá taktiku, na základě které do levého rohu zdi vybourá díru, kterou míč pošle do zadní části a elegantně tak zeď zbourá. Tedy postup, který sám objevil systémem pokus-omyl.

Hra Breakout z roku 1976

DeepMind se během experimentů naučil vítězit v dvaceti devíti hrách. Například v titulech Fishing Derby, Freeeway, Robot Tank či Kung-Fu Master a podle tvůrců si zhruba v dvanácti z nich vede lépe než nejlepší lidští hráči.

Data, která DeepMind od hry získává, počítači zpočátku nedávají žádný smysl. Analyzuje je proto kostičku po kostičce. Třídí je podle barev a tvarů, díky nimž se z obrazu snaží vyčíst vzorce. Postupně se pak hru učí ovládat a na základě výsledného skóre se zdokonaluje.

Superpočítač hrál poker

Výzkumníci naučili počítač hrát poker tak dobře, že je dlouhodobě prakticky neporazitelný

Výzkumníci z Alberty předvádějí svůj software. Na obrázku Michael Bowling,...

Učící systém se inspiruje ve způsobu, jakým funguje lidský mozek. Když se počítači daří, vnímá skóre jako odměnu, a snaží se pozitivní kroky činit co nejčastěji. DeepMind má navíc k dispozici krátkodobou paměť, díky které může zkoumat předchozí hry a analyzovat „triky“, které vedly k lepšímu skóre.

Zatím se však schopnosti počítače omezují na staré primitivní hry. Dlouhodobějším cílem je například hraní strategií jako Warcraft a Starcraft.

To však tvůrci umělé inteligence neočekávají dříve než za pět let a nevylučují ani, že takový pokrok potrvá i dvakrát déle. Autoři projektu odhadují, že je čeká ještě dvacet let práce, než se DeepMind naučí hrát akční hry typu Call of Duty. A umělá inteligence, která by sama ovládala například roboty ve válce, je otázkou půl století.

Přesto však DeepMind pro počítače představuje citelný pokrok. Zatímco v minulosti umělá inteligence například ve strategiích stavěla na asymetrických informacích a případném větším množství zdrojů, počítače budoucnosti by se po dostatečném počtu zápasů mohly přizpůsobovat stylu individuálních hráčů. To však zatím zůstává hudbou budoucnosti.