spacer.png, 0 kB
Volg Cursor via Twitter Volg Cursor via Facebook Cursor RSS feed
spacer.png, 0 kB

spacer.png, 0 kB
 
Cursor in PDF formaatCursor als PDF
PrintE-mail Tweet dit artikel Deel dit artikel op Facebook
Computerprogramma ‘kijkt’ als menselijk oog
6 september 2007 - Medisch specialisten in de Nederlandse ziekenhuizen analyseren jaarlijks miljoenen röntgenfoto’s. Computerprogramma’s om ze te ondersteunen, bestaan nog niet. Promovenda Evgeniya Balmashnova van de faculteit Biomedische Technologie ontwikkelde voor Océ een nieuw algoritme voor beeldherkenning, geïnspireerd op ons eigen visueel systeem. Medische toepassingen komen daardoor een klein stapje dichterbij.

Een afgekloven knuffelbeest met absurd grote ogen, een loshangende neus en een opgestikte mond is voor een jonge baby prima te herkennen als ‘gezicht’. Een staaltje ‘image matching’ waaraan zelfs het meest geavanceerde computerprogramma niet kan tippen. De meeste beeldherkenningsprogramma’s zoeken naar gelijkenissen tussen beelden op grond van de pixels waaruit een digitaal beeld is opgebouwd. Hoe meer pixels met elkaar overeenkomen, des te groter is de kans dat de beelden hetzelfde zijn. De problemen ontstaan al zodra een beeld de uitvergrote weergave is van het origineel. “Om dat probleem te ondervangen, zou de computer voor elke mogelijke schaalgrootte een vergelijking moeten maken”, licht onderzoekster Evgeniya Balmashnova het euvel toe. “Dat kost natuurlijk ontzettend veel tijd.” Ook als een beeld verschoven is ten opzichte van de originele positie, raken veel van dergelijke computerprogramma’s de draad volledig kwijt.


Het algoritme herkent het Océ-logo op grond van de kritische punten die binnen de cirkels vallen. Het gekreukelde logo herkent het niet.

Oogcellen
Binnen de onderzoeksgroep Image Analysis and Interpretation van de faculteit Biomedische Technologie wordt hard gewerkt aan een algoritme dat het menselijke herkenningsvermogen evenaart. De onderzoekers laten zich hierbij inspireren door de werking van het menselijk oog. Balmashnova en haar collega dr.ir. Bram Platel gingen aan de slag met het gegeven dat onze ogen de omgeving analyseren op alle schalen tegelijkertijd. Platel richtte zich op de praktische aspecten van het probleem, terwijl Balmashnova zich op de wiskundige kant van de zaak wierp. “Onze ogen bevatten allerlei cellen die elk een ander soort waarneming voor hun rekening nemen”, legt de wiskundige uit. “Zo reageren verschillende cellen op waarnemingen van verschillende schaalniveaus. Als we een boek waarnemen, zien we daardoor niet alleen een rechthoekig vlak, maar tegelijkertijd zien we de tekst die op de kaft staat.”
Ook het algoritme dat de onderzoekster ontwikkelde is toepasbaar op elke schaal. Het gaat niet uit van pixels, maar zoekt de belangrijkste punten in het beeld die zelden veranderen ten opzichte van elkaar: niet als het beeld wordt uitvergroot en ook niet als het van positie verandert. Met elkaar vormen die kritische punten de diepere structuur van het beeld.
Hoe die punten worden vastgesteld, is uit te leggen middels de metafoor van een vergrootglas. Door het vergrootglas op een bepaalde hoogte boven een foto te houden, is de afbeelding scherp te zien. Houd het vergrootglas iets hoger, en het beeld vertroebelt. Bepaalde structuren zijn nog zichtbaar, andere nauwelijks. Hoe hoger het vergrootglas komt, des te minder structuur er zichtbaar is. De hoogte en de plaats waarop een structuur ‘verdwijnt’, krijgen een punt. Zo ontstaat een driedimensionaal landschap van punten. Een blauwdruk die uniek is voor het plaatje, maar onafhankelijk is van schaal of positie. Het algoritme van Balmashnova werkt op vergelijkbare wijze.


Het driedimensionale landschap van kritische punten.

Tumoren
De industriële partner bij het onderzoek was Océ Technologies. Het bedrijf wil een scanner maken die in staat is om bedrijfslogo’s te herkennen in complexe documenten. Het algoritme dat Balmashnova ontwikkelde, voldoet ruimschoots aan die eis: zelfs de voorkant van een tijdschrift dat half verdwijnt onder enkele andere tijdschriften, blijkt nog traceerbaar. Maar een Océ-logo op een verkreukeld vel papier blijkt dat weer niet te zijn. “In dat geval is sprake van een lokale transformatie”, zegt de onderzoekster. “Wanneer er sprake is van een te grote lokale vervorming, werkt het algoritme niet.”
Het programma is dus bij lange na nog niet geschikt om, bijvoorbeeld, tumoren te herkennen op röntgenfoto’s. De variatie in de vorm van tumoren is daarvoor te groot. Een belangrijke volgende stap in het onderzoek is dan ook het toevoegen van specifieke kennis aan het model, zegt prof.dr.ir Bart Ter Haar Romeny, hoogleraar bij de onderzoeksgroep. “We willen een computerprogramma ontwikkelen dat beelden kan leren herkennen. Nieren zijn bijvoorbeeld allemaal anders van vorm, maar die variatie is niet eindeloos. Het computerprogramma zou structuur in die variatie moeten leren vinden.”
Voordat het zover is, zullen volgens de hoogleraar nog heel wat jaren verstrijken. Een door de computer ondersteunde diagnostiek laat dus nog wel even op zich wachten. “Mij wordt vaak gevraagd of de computer de arts ooit zal vervangen”, zegt Ter Haar Romeny glimlachend. “Nou, ik ga het in elk geval niet meemaken!”
Toch is het onderzoek van Balmashnova wel degelijk een doorbraak, benadrukt Ter Haar Romeny. “Wij proberen de wiskunde van het zien te doorgronden en die te modelleren. Dat is een betrekkelijk nieuw vakgebied, wij behoren echt tot de pioniers. Terwijl iedereen nog kijkt naar pixels, stappen wij er vanaf. Dat is echt vernieuwend.”/.