Door: Emiel van Dongen
Gepubliceerd: donderdag 18 maart 2010 21:44
Update: donderdag 18 maart 2010 21:55
Al rammelen ze soms nog wel, vertaalcomputers worden steeds beter. Een nieuwe stap naar de wereldheerschappij van Google.
‘De gesneden rauwe vis schoenen wenst het. Google groene uien ding.’ Deze rammelende vertaling van een mailtje, afkomstig van een Koreaanse Google-fan, werd in 2004 uitgespuwd door een automatische vertaaldienst. Google zag het met lede ogen aan en besloot dat dit beter moest kunnen.
Google Translate kan inmiddels 52 talen aan en wordt honderden miljoenen keren per week gebruikt. Het is veruit de beste vertaalcomputer die er is, meent Antal van den Bosch, hoogleraar Geheugen, taal en betekenis aan de Universiteit van Tilburg en expert op het gebied van vertaalcomputers. Zo goed als een menselijke vertaling is het niet, maar voor teksten met vast stramien en woordkeuze, zoals weerberichten en wetteksten, komt het wel in de buurt.
Vertalen is enorm complex. Decennialang probeerden wetenschappers om computers de taal te leren, inclusief grammatica en vocabulaire. Tot de jaren negentig. Toen begon men te snappen dat een statistische aanpak veel beter werkt. Google sprong daar handig op in en wist zo de absolute heer en meester van de vertaalcomputer te worden.
Googles straatje
Een statistisch systeem is net een kind: het leert door ervaring. Voer je zo’n machine steeds meer door mensen vertaalde teksten, dan zal die met alsmaar betere vertalingen komen. Om zich te kunnen blijven verbeteren, heeft hij naast een berg vertaalde teksten ook veel rekencapaciteit nodig. En dat is precies het straatje van Google, aldus Van den Bosch. ‘Google beschikt over een gigantisch computernetwerk én ze hebben overal op internet de vingers in.’
Niet ondenkbaar: over een tijdje zullen vertaalcomputers geïntegreerd zijn in webbrowsers. Tijdens het surfen wordt het internet dan ‘live’ vertaald. Een échte informatiemaatschappij ontstaat, waarin alle informatie voor iedereen met internet beschikbaar wordt. Het zal een enorme boost zijn voor de globalisering van de markt. En koren op de molen van Google, dat definitief onverslaanbaar zal worden.
Het ‘droomprobleem’ voor makers is nu de vertaling van gesproken tekst. Maar spraakherkenning functioneert nog verre van vlekkeloos. En dan moet daar ook nog eens de vertaling overheen. Tien jaar geleden eindigde het onderzoeksproject Verb-mobil met een gesprek tussen Duitse en Japanse zakenmensen, in hun eigen taal. Via een vertaalcomputer wisten ze zich redelijk verstaanbaar te maken. Van den Bosch verwacht dat fatsoenlijke vertaalcomputers voor gesproken taal over twintig jaar gemeengoed zullen zijn.
Het zal nog wel even duren voordat vertaalcomputers feilloos een geschreven tekst kunnen vertalen. Van den Bosch: ‘Ze worden in rap tempo beter. Nu zitten ze nog op het niveau van een menselijke amateur-vertaler, maar bijvoorbeeld voor weerberichten of handleidingen is het al semi-professioneel.'