Is kunstmatige intelligentie ooit bereikbaar?

door Jannigje Gerritzen

Veel informatici doen onderzoek naar kunstmatige intelligentie, maar we zijn nog steeds niet zover dat we een computer kunnen laten denken. De Turing-test moet kunnen aantonen of een computer echt kan denken. Filosofen trachten juist te weerleggen dat computers net als de mens intelligent kunnen zijn. Niettemin blijven wetenschappers proberen om computers intelligentie en taalbegrip bij te brengen. Een ander aspect van de opkomende informatietechnologie is de taal die op het Internet gesproken wordt. Op de taaldag van het NRC Handelsblad, Taal DigiTaal, op 14 september in Utrecht, kwamen kunstmatige intelligentie, taalbegrip en Internet-taal ruimschoots aan bod in een aantal lezingen.

De openingslezing werd verzorgd door Joop Doorman, emeritus-hoogleraar filosofie aan de Technische Universiteit Delft. Hij bekeek vanuit een filosofische invalshoek de vraag of we een machine kunnen bouwen waaraan we met enig recht bewustzijn kunnen toeschrijven. De Turing-test is een experiment op het gebied van kunstmatige intelligentie, waarbij iemand vragen stelt aan zowel een mens als aan een computer. Ze zijn voor de ondervrager echter niet zichtbaar, zodat hij niet weet welke antwoorden van de mens en welke antwoorden van de computer komen. Hij moet binnen vijf minuten de computer kunnen aanwijzen. Turing voorspelde dat als een machine deze test doorstaat, hij denkt als een mens. Turing voorspelde ook dat we tegen het einde van deze eeuw zover zouden zijn.

Oplichterij
Er zijn verschillende gedachtenexperimenten ontworpen die moeten aantonen dat een computer geen taalbegrip kan hebben. De taalfilosoof Searle probeerde een tegenvoorbeeld te vinden om duidelijk te maken dat er een machine bestaat die taalgedrag kopieert, maar de taal niet begrijpt. Searle opperde het volgende. Stel hij werd opgesloten in een kamer en had alleen contact met de buitenwereld via geschreven opdrachten. In de kamer had hij een instructieboek met regels voor het manipuleren van Chinese lettertekens. Hij krijgt drie zinnen binnen in het Chinees, drie rijtjes vreemde tekens dus, en nog twee vragen, ook weer in het Chinees. Door het gebruik van het regelboek kan hij bewerkingen uit gaan voeren op die rijen tekens, en krijgt er zo op een gegeven moment twee nieuwe rijtjes uit: de antwoorden op de vragen. Die stuurt hij naar buiten, waar een Chinees meisje de antwoorden leest en concludeert dat datgene wat in die kamer zit Chinees begrijpt. Searle begrijpt echter geen Chinees en dus is het mogelijk dat een computer zo’n vragentest doorstaat zonder de taal te begrijpen. Er is echter ook kritiek geweest op het experiment van Searle, onder andere dat het hele systeem, dat wil zeggen Searle plus het regelboek en alle tekens, wèl taalbegrip kan hebben.
Doorman vindt dat er meer nodig is dan vijf minuten vragen stellen om uit te maken of een machine wel of niet kan denken. Het gaat namelijk om het gedrag van het bestudeerde object en de relatie met de wereld. Hiervoor moeten object en ondervrager een gedeelde wereld hebben en een gedeelde geschiedenis. Om uit te maken of het object kan denken is een enige tijd durende observatie nodig. Doorman concludeerde in zijn lezing dat er zeer veel bluf en oplichterij voorkomt bij pogingen om het taalgedrag te simuleren, omdat er nou eenmaal veel geld aan te verdienen is. Maar negatieve resultaten, waarbij het niet lukt om zo’n machine te bouwen, zijn in ieder geval resultaten waar we wat van kunnen leren, aldus de emeritus-hoogleraar.

Boom
Na de openingslezing volgden zes lezingen, waaruit de bezoekers een keuze moesten maken. Gerard Kempen, hoogleraar cognitieve psychologie in Leiden, gaf een verhandeling over de zinsbouw. Bij het zinsbouwproces is de volgorde van de woorden van belang. Die heeft namelijk invloed op de begrijpelijkheid van een zin. Ambiguïteit komt veel voor, daarbij heeft een zin meerdere betekenissen. In de zin ‘Discussie over hulp aan verslaafden in de raad’ is het onduidelijk of de zinsnede ‘in de raad’ hoort bij ‘verslaafden’ of bij ‘discussie’.
Bij het maken van een zin begin je met een zin terwijl de structuur nog niet vastligt. Dit heet incrementele zinsopbouw. Soms veranderen mensen halverwege een zin de opbouw. Hierdoor kunnen fouten ontstaan als: ‘Er komen zo’n 450 man rekenen we op’. Taalkundigen kunnen dit soort fouten gebruiken om te achterhalen hoe de zinsbouw precies werkt. Voor de opbouw van een zin kan dan een boom gemaakt worden, waarin de werkwoorden, naamwoorden en andere grammaticale woordgroepen als bladeren aangegeven zijn. Met zo’n boom kun je het probleem van de ambiguïteit oplossen en een computer kan met een boomstructuur goed omgaan. De beperking hiervan is wel dat een parser, een program-ma dat syntactisch ontleedt, voor één zin meerdere bomen kan geven. Twintig, dertig of veertig bomen voor eenzelfde zin is niet ongewoon. De computer is dus een belangrijk hulpmiddel bij theorievorming in de taalkunde. Toepas-singn kunnen gezocht worden bij onderzoek naar afasie, waarbij mensen hun vermogen tot zinsbouw kwijt zijn door bijvoorbeeld een ongeluk. Ook zijn er toepassingen in het grammatica- en taalonderwijs. Een van de meest bekende voorbeelden is ongetwijfeld een grammaticachecker in een tekstverwerker. Die kan bijvoorbeeld controleren of de d/t/dt-regels goed gebruikt zijn. Helaas zijn er nog geen goede programma’s voor zinsontleding op de markt.

Grasduinsysteem
Het taalgebruik op het Internet wijkt sterk af van het normale taalgebruik. Er is op het Internet een nieuw jargon ontstaan, dat het best te omschrijven is als een hoop Engelse zelfstandige naamwoorden en werkwoorden, aan elkaar gebreid met Nederlandse voegwoorden. Dit stelde Tom Rooduijn, redacteur van het NRC Handelsblad in zijn lezing. Dit nieuwe taaltje bezorgt de makers van woordenboeken grote problemen want: welke woorden neem je wel of niet op, hoe vervoeg je ze en hoe worden ze gespeld? Het probleem begint al bij het woord ‘Internet’ zelf, schrijf je het met hoofdletter of met kleine letter, en is het ‘het Internet’ of gewoon ‘Internet’?
Bij het vertalen van termen blijken de Belgen puristischer dan de Nederlander. De Nederlander neemt de Engelse termen klakkeloos over, terwijl de Belg ze nog wel wil vertalen. Maar de vertalingen wringen meestal. Zo zijn bijvoorbeeld ‘grasduinsysteem’ voor ‘browser’, ‘beginbladzijde’ voor ‘homepage’ en ‘tegenschrap’ voor ‘backslash’ op zijn minst twijfelachtig. Om maar niet te spreken van vertalingen voor HTML of ASCII. Kranten hebben hier vooral problemen mee, omdat ze veel over het Internet moeten uitleggen bij berichtgeving over bijvoorbeeld kinderporno of Scientology. De taalpuristen voeren een verloren strijd. Want hoewel ‘nieuwsgroep’, ‘aanbieder’ en ‘wachtwoord’ prima vertalingen zijn, zullen ‘babbeldozen’, ‘webmeester’ en ‘sturen’ (in plaats van ‘e-mailen’) niet snel ingeburgerd raken. De voertaal is en blijft het Engels.

D8xo
De communicatie op het Internet heeft nog een andere interessante eigenschap; ze houdt het midden tussen spreken en schrijven. Het taalgebruik is zeer direct, het is toegestaan om fouten te maken en interpunctie doet er niet zo toe. Omdat de nonverbale communicatie volledig wegvalt, probeert de Internet-freak dit te compenseren door het toevoegen van emoticons oftewel smileys, en andere tekens die klemtoon aangeven. Ook zijn er op het Internet fonetische schrijfwijzen ontstaan, 4 voor ‘for’, U voor ‘you’ of d8xo voor ‘dacht ik zo’. Ook acroniemen zijn een bekend verschijnsel. BTW wordt vrijwel nooit meer uitgeschreven als ‘by the way’ en IRL bijvoorbeeld staat voor ‘in real life’. Op een gegeven moment werd het zo erg met de afkortingen dat iemand het acroniem YABA verzon: Yet Another Bloody Acronym.
De verklaring voor de vele afkortingen kan gezocht worden in de beperkte hoogte van het scherm, waardoor tekst snel van het beeld afloopt en het feit dat telefoontijd geld kost. Twee redenen dus om de communicatie zo bondig mogelijk te houden. Wat er over twintig jaar van dit taaltje over is, is niet moeilijk te zeggen. Nu al wordt voorspeld dat het toetsenbord achterhaald zal zijn. Geluid en beeld zullen de taken van het keyboard overnemen. Er zal wel iets van de taal overblijven in gesproken vorm, maar als het Internet even gewoon is geworden als de telefoon, dan zal het jargon ook gewoon zijn geworden en dus geen jargon meer zijn.

Bewustzijn
Marvin Minsky, verbonden aan het Massachusets Institute of Technology, sprak als laatste. Hij had het vooral over het menselijk brein en kunstmatige intelligentie. Volgens hem zijn hersens en geest hetzelfde. De hersenen zijn een zeer complex orgaan waarmee wij denken, maar we weten na jaren van onderzoek nog steeds niet hoe ze precies werken. Volgens Minsky is de reden dat de hersenen zo goed werken dat je alles op meerdere manieren kunt doen. Een normale computer doet alles maar op één manier. Ook voor neurale netwerken geldt dat elke actie op slechts een enkele wijze uitgevoerd wordt. Dit kan volgens Minsky dus niet leiden tot intelligentie, omdat voor begrip meer kennis nodig is. Wat Minsky graag zou zien is meer research naar wat gewone kennis is, hoe we die moeten representeren en hoe we een computer kunnen leren redeneren volgens gewoon gezond verstand, in plaats van logisch redeneren.
Er zijn miljoenen informatici die zich bezig houden met logica en syntaxis, maar er zijn er maar enkelen die zich bekommeren om dit gezonde verstand. Daarom zal het werk aan kunstmatige intelligentie zo lang duren; het accent moet verlegd worden. Een computer zal honderdduizenden betekenissen van woorden moeten kennen, want om iets echt te begrijpen moet je meerdere betekenissen van een begrip kennen. Wie echt begrijpt dat de Nijl de langste rivier op aarde is, weet óók dat je erin kunt zwemmen, dat je dan nat wordt, en dat het water stroomt in de richting van de zee. Computers kunnen bewustzijn hebben, namelijk als een computer registreert wat hij doet, en hij gebruikt die kennis meteen weer, dan is hij bewust van zichzelf. Hij is misschien wel erg dom, maar niettemin bewust.