Visci

Deep Blue ja AlphaGo

Deep Blue on yksi maailman kuuluisimmista tietokoneista. Se on IBM.n kehittämä shakkitietokone, joka oli ensimmäinen tietokone, joka voitti normaalipituisilla turnauspeliajoilla käydyn ottelun tuolloin hallitsevaa maailmanmestaria Garri Kasparovia vastaan vuonna 1996.

AlphaGo taas on Google DeepMindin kehittämä go-lautapeliä pelaava tietokoneohjelma, josta tuli vuonna 2016 ensimmäinen tietokoneohjelma, joka voitti ammattilaispelaajan go-ottelussa ilman tasoituskiviä täysikokoisella pelilaudalla.

Deep Blue

Feng-hsiung Hsu aloitti shakkitietokoneen kehittämisen Carnegie Mellon -yliopistossa rakentamalla vuonna 1985 ChipTest-nimisen shakkitietokoneen. Tätä seurasi seuraava kehitysmalli Deep Thought, joka päihitti ensimmäisenä tietokoneena shakin suurmestarin voittamalla Bent Larsenin vuonna 1988. Tietokone hävisi kuitenkin helposti kahden ottelun sarjat vuonna 1989 Garri Kasparovia ja myöhemmin Michael Valvoa vastaan.

Vuonna 1995 Deep Bluen prototyyppi Deep Thought II sijoittui toiseksi tietokoneiden välisissä shakin maailmanmestaruuskilpailuissa. Deep Bluen prototyyppi hävisi muun muassa 39 siirrolla pelaamalla valkoisilla Fritz-nimistä tietokonetta vastaan, joka toimi Intel Pentium 90 MHz PC-tietokoneella. Deep Bluen prototyypin kanssa turnauksen toisen sijan jakanut Junior toimi myös PC-tietokoneella.

Deep Bluen ottelut Kasparovia vastaan

Deep Blue ja Garri Kasparov pelasivat kaksi ottelusarjaa. Ensimmäinen ottelu alkoi 10.2.1996, jolloin Deep Bluesta tuli ensimmäinen hallitsevan shakin maailmanmestarin voittanut tietokone normaalilla peliajalla. Tämän jälkeen Kasparov kuitenkin voitti seuraavista viidestä pelistä kolme. Peleistä kaksi päättyi tasapeliin. Kasparov päihitti lopulta Deep Bluen pistein 4–2 (voitosta 1 piste, tasapelistä 0,5 pistettä) 17.2.1996.

Deep Blueta päivitettiin merkittävästi – jonka johdosta sille annettiin myös lempinimi Deeper Blue – ja se pelasi Kasparovia vastaan jälleen toukokuussa 1997. Deep Blue voitti kuudennen ratkaisevan pelin ansiosta ottelut pistein 3,5–2,5 Kasparovin viimeisen pelin aloituksessa tekemän virheen myötä. Häviönsä jälkeen Kasparov kertoi nähneensä tietokoneen pelitavassa luovuutta ja syvällistä älykkyyttä. Hän väitti myös, että tietokone olisi saanut kesken ottelun apua ihmiseltä. Tämä johtui Deep Bluen tekemästä materiaalivoittoon perustuvan tietokonemaisen jatkosiirron hylkäämisestä ja inhimillisen varmistussiirron käyttämisestä, joka osoittautui ratkaisevan hyväksi.

AlphaGo

AlphaGon kehittäjä on brittiläinen yritys nimeltään Google DeepMind, joka perustettiin alun perin nimellä DeepMind Technologies vuonna 2011. Google osti yrityksen vuonna 2014, jolloin se nimettiin uudelleen Google DeepMindiksi.  Yritys tutkii syväoppivaa tekoälyä. Google DeepMind on kehittänyt muun muassa hermoverkoston, joka oppii pelaamaan videopelejä ihmisen tavoin. Yritys nousi otsikoihin vuonna 2016, kun sen kehittämä tekoälyohjelma AlphaGo voitti ammattilaispelaaja Lee Sedolin tekoälylle hankalana pidetyssä go-pelissä.

AlphaGo-versiosta, joka voitti Sedolin, ei ole kerrottu paljon julkisuudessa. Tekoälyn algoritmi perustuu koneoppimiseen ja puuhakuun sekä ihmis- ja konepelaajia vastaan tapahtuvaan harjoitteluun. Tekoäly käyttää Monte Carlon puuhakua arviointiverkon ja toimintamalliverkon ohjaamana. Arviointiverkko seuraa ja arvioi toimintamalliverkon suosittelemia erilaisia pelitapoja. AlphaGo valitsee simulaatioissa menestyksekkäimmäksi osoittautuneen pelitavan.

AlphaGon kilpailu Lee Sedolin kanssa

AlphaGon ja eteläkorealaisen 9-danin tasoisen go-pelaaja Lee Sedolin väliset viisi ottelua pelattiin seitsemän päivän aikana maaliskuussa 2016. Lee Sedol voitti peleistä vain neljäntenä pelatun ottelun ja AlphaGo kaikki muut neljä. AlphaGon ohjelma ajettiin Yhdysvalloista pilvessä Googlen palvelimilta, ja AlphaGon kivien asettamisesta laudalle vastasi DeepMind-tiimiin kuuluva Aja Huang, joka on myös itse 6-danin tasoinen go-pelaaja. Ottelusarjan voittaja sai palkinnoksi miljoona dollaria.

Peli käytiin kiinalaisilla säännöillä. Molemmilla pelaajilla oli siirtojen miettimiseen kaksi tuntia aikaa sekä kolme minuutin mittaista byoyomi-lisäaikajaksoa käytettäväksi. Asiantuntijoiden mukaan AlphaGo teki peleissä aluksi kyseenalaisia ja epätavallisia siirtoja, jotka kuitenkin osoittautuivat jälkikäteen järkeviksi. Ohjelman ei etukäteen oletettu pärjäävän Sedolille, ja jopa Denis Hassabis, DeepMindin perustajajäsen, yllättyi ohjelman voitosta.