spacer.png, 0 kB
Volg Cursor via Twitter Volg Cursor via Facebook Cursor RSS feed
spacer.png, 0 kB

spacer.png, 0 kB


“Ik hou van de grote lijn, de theorie achter een systeem.”
Cursor in PDF formaatCursor als PDF
PrintE-mail Tweet dit artikel Deel dit artikel op Facebook
“Computer, een retourtje Amsterdam, graag
1 november 2007 - Kapitein James T. Kirk praatte wat af tegen zijn computer en nooit sloeg het ding op tilt. In het hier en nu is een spraakherkenningssysteem dat snapt welke trein je wilt nemen al teveel gevraagd. Promovendus Koen van Turnhout MTD onderzocht de specificaties voor een kaartjesautomaat die zich gedraagt als een baliemedewerker.

Stel je een kaartjesautomaat van de NS voor. Twee vriendinnen turen naar het computerscherm. “Welkom bij het Openbaar Vervoer Informatiesysteem”, zegt een blikken computerstem. “Over welke verbinding wilt u informatie?” Een van de vrouwen wil graag naar het Noorderdierenpark. “Waarom?”, vraagt haar vriendin verbaasd. Zij gaat liever naar Artis. “Dan pikken we ook nog een dagje Amsterdam mee.” Na wat heen en weer gepraat besluiten de vrouwen naar Artis te gaan. “Amsterdam”, krijgt de kaartjeskiosk te horen.
Het is allemaal echt gebeurd. Alleen waren de vrouwen twee proefpersonen en het computersysteem werd aangestuurd door een onzichtbaar persoon achter een deur. Een informatiesysteem dat uit zoveel data precies de juiste informatie weet te filteren, bestaat namelijk nog niet. Maar promovendus Koen van Turnhout weet dankzij deze proefopstelling bij de faculteit Industrial Design inmiddels wel veel over de voorwaarden waaraan zo’n systeem moet voldoen.
In de eerste plaats moet de computer begrijpen wanneer de vrouwen met elkaar overleggen en wanneer ze spreken tegen hem. Dat blijkt erg lastig te voorspellen. “Er bestaan geen duidelijke wetten voor”, zegt Van Turnhout. “Als de personen naar elkaar kijken, hebben ze het waarschijnlijk niet tegen de computer. En als ze naar de computer kijken, bestaat de kans dat de boodschap voor hem is bedoeld. Als ze spreken net nadat de computer iets heeft gevraagd, hebben ze het ook vaak tegen hem. Maar zeker is dat allemaal niet.”
Tijdens de laboratoriumtesten droegen de proefpersonen haarbandjes met infrarood-ledjes. Middels sensoren aan het plafond viel zo vast te stellen in welke richting de personen op welk moment keken. Niet alleen de kijkrichting, maar ook het moment waarop mensen spraken legde Van Turnhout vast. Sprak de betreffende persoon bijvoorbeeld net na een boodschap van de computer, of na een uitspraak van de gesprekspartner? En hoe lang duurde de uiting? Op basis van dergelijke gegevens en met behulp van een statistisch model kon de onderzoeker uiteindelijk met enig succes inschatten voor wie of wat een bepaalde boodschap was bedoeld. “Zelfs zonder spraakanalyse blijkt best goed te voorspellen tot wie mensen zich richten.”

Holistisch
Het ontwerp van een kaartjesautomaat zoals hier beschreven vereist kennis van verschillende vakgebieden. Hoe communiceren mensen bijvoorbeeld? Van Turnhout, voorheen werkzaam als leraar natuurkunde, begroef zich tijdens het eerste jaar van zijn onderzoek daarom in publicaties op het gebied van de sociale psychologie. “Ik merkte dat sociaal psychologen veel holistischer kijken, minder afgekaderd dan de natuurwetenschappen”, vertelt Van Turnhout. “In het begin snapte ik echt niets van wat ze deden en waarom.” Voor de benodigde kennis op het gebied van de systeemtechnologie ging Van Turnhout vier maanden in de leer bij onderzoekers van de Carnegie Mellon University in Pittsburg, USA. “Dat was het moeilijkste gedeelte, omdat mijn achtergrond daar niet zit. Systeemingenieurs passen de wiskunde op een heel andere manier toe dan ik gewend ben.”
Toen Van Turnhout terugkeerde in Eindhoven was zijn vakgroep, die oorspronkelijk deel uitmaakte van het toenmalige IPO-instituut, ondergebracht bij de faculteit Industrial Design. Daar maakte hij kennis met onderzoekers die de interactie tussen mens en computer bestudeerden. “Daardoor heb ik uiteindelijk ook het ontwerp van de interface voor mijn rekening genomen. De oorspronkelijke vraagstelling ging helemaal niet in op de interactie met de gebruiker.” Onterecht, denkt Van Turnhout nu. “Door bezig te zijn met de interface merkte ik dat het systeem heel vroeg moet kunnen inschatten tegen wie iemand praat. Niet alleen na afloop van een boodschap, maar ook tijdens en zelfs voorafgaand aan die uiting. Je wilt de gebruikers namelijk op tijd laten weten of ze kunnen spreken of niet.”
Natuurlijk zijn er na afloop van een boodschap meer aanknopingspunten om dit in te schatten. Maar al aan het eind van een voorafgaande uiting, toonde Van Turnhout aan, is hierover met redelijke zekerheid iets te zeggen. “De lengte van de uiting zegt vaak iets. En als iemand aan het eind van zijn uiting naar het systeem kijkt, is er ook een relatief grote kans dat deze voor de computer bestemd was.”
Inschattingsfouten zijn echter onvermijdelijk. Met behulp van de eerder beschreven proefopstelling onderzocht Van Turnhout of en hoe het systeem de gebruiker hiervan op de hoogte kan stellen. Verschillende interfaceontwerpen moesten de gebruiker duidelijk maken of de computer ‘luisterde’ of niet. De resultaten maken duidelijk dat dergelijke feedback vooral nuttig is als het systeem technisch niet in orde is. Hoe die feedback er dan precies uit moet zien, moet nog worden onderzocht.

Scepsis
De automaatproducenten die aan het begin van het onderzoek zijn benaderd, toonden weinig interesse in de studie. Het doel van het onderzoek -een kaartjeskiosk die de functie van een baliemedewerker overneemt- is immers toekomstmuziek. “Ik ben zelf ook altijd sceptisch geweest over de noodzaak van zulke apparaten”, geeft Van Turnhout toe. “Maar wanneer je spraak kunt inzetten op de momenten dat je je handen niet kunt gebruiken, zijn er veel plaatsen waar zo’n systeem nuttig kan zijn. In de auto bijvoorbeeld.”
Het bredere belang van zijn onderzoek, vindt Van Turnhout, zit hem echter vooral in de interdisciplinaire aanpak. “Door buiten het kader van een discipline te treden, loop je tegen beperkingen en vragen aan die je anders niet zou zien. Volgens de sociale psychologie is een uiting bijvoorbeeld een ‘eenheid waarmee je betekenis overbrengt’. Maar om hierop een technisch systeem te baseren, zijn veel concretere criteria nodig.” Voor het ontwerp van een interface die feedback geeft over het wel of niet ontvangen van een uiting, is kennis nodig over de manier waarop mensen met elkaar communiceren. “Daarover is nog veel te weinig bekend. Althans, niet als het gaat om de toeschouwende derde persoon die het computersysteem vertegenwoordigt.”
Door zijn interdisciplinaire aanpak raakte Van Turnhout bovendien overtuigd van het stokpaardje van zijn nieuwe faculteit. Wie werkt aan een uitvinding, moet zich op tijd afvragen hoe de gebruiker hiermee uiteindelijk zal omgaan. “Stel dat je over vijf jaar met negentig procent zekerheid kunt voorspellen wie tegen wie praat. Dan moet je je nu al bezighouden met het ontwerp en de mogelijke toepassingen. Anders hobbel je achter de feiten aan en kom je te laat achter de praktische beperkingen van een systeem.”/.

Spraakherkenning/Enith Vlooswijk
Foto/Bart van Overbeeke