Esileht > arvutuslik ajuteadus, tehislik teadvus > Reket või inimmõistus? Kui intelligentne on AlphaGO

Reket või inimmõistus? Kui intelligentne on AlphaGO

Kirjutasin reede hommikul kiiresti loo sellest, et tehismõistus suudab nüüd mängida GOd paremini kui Euroopa meister. Kommentaaridesse saabus peagi mõte:

Kas tennist mängib reket või reketit hoidev ja juhtiv inimene? Vastus on nii lihtne, et ei hakka seda siin välja kirjutamagi…. Inimest intellektuaalses mängus võitvat arvutit õpetas ja juhtis inimene. Seega ei võitnud inimest mitte arvuti, vaid inimeste kollektiiv, kasutades arvutit oma “käepikendusena”. Punkt.

Mind tegi see kommentaar pisut kurvaks: see teadlaste ja inseneride rühm oli just lahendanud probleemi – kuidas mängida GOd paremini kui inimene -, mida enamik teadlasi pidas praegu lahendamatuks. Arvati, et GOs inimese võitmine jääb aastate kui mitte dekaadi taha. Kuid teadlaste ja inseneride ühistöö AlphaGo suutis tõesti üllatada, võites esimest korda inimkonna ajaloos professionaalset GO mängijat. See teadustöö oli läbimurre, mis jõudis ajakirja Nature kaanele, kuid antud kommentaaris tituleeriti teda kõigest “reketiks” ja “käepikenduseks”.

Vaatame esiteks, miks minu arvates see kommentaar oli ebaõiglane ja eksitav. Seejärel uurime, kas selles kommentaaris oli iva ka.

Miks AlphaGo pole reket?

Kui Deep Blue võitis male suurmeistrit Garry Kasparovit aastal 1997, siis ma poleks selle reketi-võrdluse peale nina kirtsutanud: 1) Deep Blue ei õppinud malet mängima, talle oli kõik vajalik sisse kirjutatud, 2) ta kasutas järgmise käigu leidmiseks toorest jõudu: oma suure arvutusvõimsusega simuleeris ta läbi kõik erinevad käigud ja vaatas, kuhu need mängu edasisel kulgemisel viiksid – inimaju nii ei tee, 3) Deep Blue oskas vaid malet mängida, millegi muuga ta hakkama ei saaks.

Kuid AlphaGo on hoopis teine tera.

1) AlphaGo õppis GOd mängima. Erinevalt Deep Blue’st ei ole AlphaGole mäng sisse kirjutatud – ainus võimalus GOs inimesest paremaks saada, on õppida seda mängu mängima. AlphaGo’d ei instrueeritud, kuidas mängu mängida, ta õppis seda. Need õppimisalgoritmid AlphaGo sees sarnanevad õppimisalgoritmidega inimajus. Ka see, kuidas AlphaGo GO mängulauda tajuliselt töötles, on sarnane inimajule – laud ja sellel olevad nupud läbivad mitu (tehis)närvivõrgu kihti. Kui inimene õpiks GOd mängima, toimuks ka tema aju närvivõrkudes muutused nagu toimusid AlphaGo tehisnärvivõrgu struktuuris. Nende muutuste taga on sarnased õppimispõhimõtted. Ei programm ise ega ka tema tegijad ei oska selgitada, mis on parim GO strateegia, sest seda strateegiat pole kuskil eksplitsiitselt kirjas. Parim viis GOd mängida on õpitud ja on kirjutatud läbi õppimise suurmeistrite ajudesse ja nüüd ka AlphaGO tehismõistusesse.

2) AlphaGo ei kaalu kõiki käike ja ei ürita kümneid käike tulevikku simuleerida, vaid hindas erinevaid käike üsna sarnaselt suurmeistrite intuitsioonile. Mängu käikude etteaimamine ja läbimängimine poleks GO korral võimalik, sest erinevaid võimalusi on rohkem kui aatomeid universumis. Seetõttu peetigi GOd raskeks ja arvutile võimatuks – GOd pole võimalik võita, teades vaid reegleid; on vaja mängu tunnetada. GO mängu mängides treenitud tehisnärvivõrk pakkus AlphaGole vaid valiku võimalikest käikudest, mida ta siis teise närvivõrgu abil hindas. See on mõneti inimesele sarnane: me ei simuleeri tuhandeid käike, vaid suurmeistrid kaaluvad vaid paari käiku ja mõni käik lihtsalt “tundub õige”. Selle intuitsiooni taga on arvutused ajus, mis võivad olla üsna sarnased AlphaGo programmis toimuvatele arvutustele.

3) Deep Blue oskas vaid malet mängida. AlphaGo sarnased programmid suudavad õppida lugema välja mustreid kõiksugu andmetest ja võtavad varsti üle inimeste töö mitmetes valdkondades. Nendele inimestele, kes sääraste programmide tõttu oma töö kaotavad, ei maksa vist mainida, et tegu on vaid reketiga. Kummaline “käepikendus”, kui ta käe omajat asendab.

Kokkuvõttes ma loodan, et lugejad saavad aru mu frustratsioonist seoses tsiteeritud kommentaariga – AlphaGo pole reket. Aga eks igast arutelust võib iva ka leida, seega uurime edasi.

Miks AlphaGo pole inimese tasemel?

GOs on AlphaGo inimesest parem (ehk mitte suurmeistrist, aga olen kindel, et kõigist lugejatest). AlphaGo sarnased programmid suudavad muuhulgas meist paremini ka objekte tuvastada, üldjuhul paremini kõnet ühest keelest teise tõlkida ja suudavad varsti asendada inimesest häälassistente. Milles jääb inimene paremaks?

Eks ma oma eelmises postituses provotseerisin pisut ka, seda sama küsimust küsides. Vabandan selle eest. Ka mulle on selge, et inimene on hetkel veel tehismõistusest mitu sammu ees.

Samm 1: Teha samme. Deep Blue ajal oli see vahe eriti selge: arvuti võitis inimest males, kuid ei suutnud ise inimlapse sarnaselt malendit tõsta. Nüüd on robotid tunduvalt sujuvamate liigutustega, kuid AlphaGO istus kõigest arvutuspilves. AlphaGo sarnaste programmide lisamine robotitesse on aga juba käimas. Ja see, et AlphaGo ise samme ei tee, ei muuda teda vähem intelligentsemaks: ka Stephen Hawking ei tee ise samme.

Samm 2: Ise soovida, tahta, valida. Ilmselt on just antud punkt see, mida kasutaja Ökul edasises diskussioonis silmas pidas – AlphaGo ei tahtnud ise õppida GOd mängima; ei olnud tema soov hakata GOd mängima; ta ei läinud GOd õppima nagu laps, ta pandi õppima. AlphaGo tegi seda, mida inimesed tahtsid, et ta teeks, selles suhtes oli ta nagu käepikendus (mis sai GOs targemaks, kui inimeste kollektiiv, kelle kätt ta pikendas). Nagu eelnevalt kirjeldatud, siis AlphaGo õppis ise GOd mängima, kui ta mängima oli pandud, aga tõepoolest – ei mina ega keegi teine ei ütleks, et ta ise tahtis seda mängima hakata. Millegi soovi järgi õppimine on inimlik omadus ja ehk võiks tõesti selle järgi ka seada intelligentsuse kriteeriumeid või teste. (Aga kas depressioonis inimene, kes midagi ei taha ja ei soovi, siis pole (ajutiselt) inimlikult intelligentne?)

Samm 3: Õpitu põhjal teha adekvaatseid otsuseid päriselus. Kõlab lihtsalt, aga tegelikult pole ükski situatsioon täpselt eelmise koopia. Bussi astudes on vahel mõni inimene validaatoril ees, vahel on endal kilekott käes, vahel on bussikaart vales taskus, alati on meie keha pisut erineva nurga all … Restorani minnes näeme erinevaid inimesi, menüüsid, erinevat sisustust, inimesed ütlevad meile erinevaid asju erineva tooni, kiiruse ja väljenditega, aga ikka saame enam-vähem hakkama … ja isegi maal, kus me kohalikkku keelt ei valda! Ja vahel isegi siis, kui restoranis ka inglise keelt ei räägita! Inimesed on nii intelligentsed, kuna me suudame koheselt ja kiiresti mälust laadida õiged analoogsed olukorrad ja nende põhjal antud situatsioonis käituda. Me mõistame mingil määral, kuidas see ajudes toimub. Kuidas seda masinatesse panna?

Eks neid samme ja alasamme ole veel. Kas keegi tahaks veel mõne sammu kirja panna?

Aitäh diskussiooni eest. Arutluses selgub tõde, välja arvatud juhul, kui teda ei selgu.

  1. Krista
    veebruar 1, 2016, 1:14 p.l.

    Ma arvan, et kujutlusvõime ja võimalike olukordade simulatsioon on olemuselt väga erinevad. Viimasega saab võimas arvuti hästi hakkama, aga ma pole kindel, et ta omandaks kunagi esimese.

  2. Endel
    veebruar 1, 2016, 2:15 p.l.

    Ma arvan ka, et see reketiga võrdlemise kommentaar ei olnud eriti mõttekas. Aga minu arvates ei sobi ta malemängu ja Deep Blue kohta sugugi paremini Go kohta. Masinõpe ja „intuitsiooni” mudelleerimine on üsna vanad asjad, mida kasutati juba 1950 aastatel kabemängu programmides. Deep Blue polnud kindlasti mingi mehhaaniline kõikvõimalike käikude läbilappaja. Muidugi on masinate õppimisvõime ja ka arvutusvõimsus vahepeal palju arenenud. Samal ajal ei saa vist öelda, et viimasel ajal mingi eriti oluline teaduslik avastus oleks tehtud, praegu populaarsed õppimisalgoritmid on põhiliselt pärit ajast 1970-1990. Aga ega õigete asjade kokkupanemine pole ka päris lapsemäng. Ma arvan, et ühtemoodi tunnustust väärivad nii kabe, male, go kui ka paljude teiste programmide autorid.

  3. ökul
    veebruar 3, 2016, 11:57 e.l.

    “AlphaGo’d ei instrueeritud, kuidas mängu mängida, ta õppis seda.” Täpsustus: peaks olema “teda õpetati õppima” (valides sobivad töötlusmudelid inimesele teadaolevate hulgast), misjärel masin tõepoolest õppiski. Inimene teadis, mida tasuks masinale õpetada ja milleks seda teha ja ilma selleta poleks masin partikulaarse ülesande inimesest paremini lahendamisega hakkama saanud. Tahtes olla täpsed me siiski peame tunnistama, et masin realiseeris inimese idee ja eesmärgi, olles selle — küll väga võimekaks — vahendiks.
    Reketianaloogiast veel: inimene teab, et lendavat keha saab tagasi põrgatada lamedalt pinnalt. Ta võtab puulapatsi ja siis mingil juhul võtab nööridest punutud pingul võrgu. Ta näeb, et teisel juhul on tagasipõrgatamine edukam. Ta valmistab üha paremad reketid. Aga ega ta väga täpselt (nt aatomite tasemel ja tuumajõudude väga täpse dünaamika tasemel) ei oskagi kirjeldada seda, TÄPSELT KUIDAS reket palli tagasi põrgatab. Reketis toimuvad füüsikalised protsessid, mis inimese tegevuse edukaks teevad ja teevad edukamakski kui inimene seda omaenda käega palli tagasipõrgatades suudaks. (Natuke nagu kiusujutu moodi, aga mitte päris seosevabalt kõnealloleva probleemi suhtes. :-))

  4. Krista
    veebruar 25, 2016, 3:57 p.l.

    Siin kõlas kaks huvitavat terminit, mille osas ootan huviga teadlaste selgitusi. Kuidas teaduslikult defineerida “kujutlusvõime” ja kuidas defineerida “intuitsioon” ?

  5. jaanaru
    märts 5, 2016, 11:24 e.l.

    nu teadlased on nupukad ja leiavad ikka vajaliku definitsiooni kõigele (vajadusel isegi “teadvusele”). Nii “kujutlusvõime” kui ka “intuitsioon” on olnud põhjaliku uurimistöö objektiks. (pikemalt pole aega selgitada, sorry)

  1. No trackbacks yet.

Lisa kommentaar

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Muuda )

Twitter picture

You are commenting using your Twitter account. Log Out / Muuda )

Facebook photo

You are commenting using your Facebook account. Log Out / Muuda )

Google+ photo

You are commenting using your Google+ account. Log Out / Muuda )

Connecting to %s