Maschinelles Übersetzen – ein Widerspruch in sich

Das Ziel – oder sollte man besser sagen: der Traum – des Maschinellen Übersetzens ist es, Computer in die Lage zu versetzen, Texte von einer natürlichen Sprache in eine andere zu übersetzen. Bei den Texten kann es sich um alles Mögliche handeln, von profanen Dingen wie Wetterberichte, Zeitungsmeldungen, Handbücher oder technische Dokumente bis zu Liebesbriefen, Belletristik, oder Mitschriften von Unterhaltungen. Okay, vielleicht keine Belletristik, aber wenn die Geheimdienste keine Briefe und Unterhaltungen übersetzen wollen, dann weiß ich auch nicht.

Der heute vorherrschende Ansatz des Maschinellen Übersetzens ist gewissermaßen agnostisch: Er arbeitet ohne jegliches Wissen über die Welt, die menschliche Kultur, ja sogar die Sprache. Dieser Ansatz reduziert das Übersetzen zu einer schlichten Knobelaufgabe. Kevin Knight beschreibt dies anschaulich wie folgt. Uns werden einige Satzpaare in zwei außerirdischen Sprachen zugespielt, die wir noch nie gesehen haben: Arcturan und Centauri. Wir wissen, dass diese Paare Übersetzungen darstellen. Außerdem erhalten wir einen neuen Satz in Arcturan. Nun ist es an uns, seine Entsprechung in Centauri zu erraten. Knight erklärt, wie man diese Knobelaufgabe lösen kann. Am Ende enthüllt er, dass seine Sprachen Arcturan und Centauri lediglich verschleierte Formen von Spanisch und Englisch sind, und dass man – nur durch Knobeln – soeben einen fremden spanischen Satz ins Englische übersetzt hat – gerade so, wie es der Computer auch täte.

Dieser agnostische Ansatz hat den Vorteil, dass er für viele Sprachpaare leicht umzusetzen ist. Für die europäischen Sprachen zum Beispiel sind besagte Satzpaare leicht aufzutreiben – das Kanadische Parlament protokolliert seine Debatten in Englisch und Französisch, das Europäische Parlament sogar in weit mehr Sprachen. Und da der Computer von Haus aus dumm ist, kommt ihm der agnostische Ansatz natürlich entgegen. Der agnostische Ansatz hat aber auch den Nachteil, dass er nur sehr begrenzt funktioniert. Zum einen gilt das Prinzip garbage in – garbage out: Wenn ich meine Satzpaare irgendwelchen Parlamentsdebatten entnehme, dann werde ich kaum jemals etwas anderes sinnvoll übersetzen können als eben Parlamentsdebatten – wenn überhaupt.

Vor allem aber verkennt er vollkommen das Wesen der Sprache. Sprache ist ein Werkzeug, aber auch ein Spielzeug zur Kommunikation zwischen Menschen. Es gibt in diesem Spiel keine festen Regeln, kein Richtig oder Falsch; entscheidend ist, ob man vom Adressaten verstanden wird oder nicht. Und die Sprache ist eng mit der Kultur dieser Menschen verbunden. In unserer Kultur ist es beispielsweise – seit gar nicht allzu langer Zeit – normal, dass man als Kind in die Schule geht. Das haben wir alle erlebt; es ist Alltag. Folglich verstehen wir ohne Weiteres Sätze wie:

Aber schon für einen Österreicher oder eine Schweizerin ist das Abitur eine fremde Angelegenheit. Doch – auch in diesen Ländern gibt es Schulen. Aber das Pendant zum Abitur nennt sich in diesen Ländern Matura. Außerdem spricht man dort von einem Einser (aber dessen bin ich mir nicht sicher). Im angelsächsischen Raum beispielsweise gibt es den Begriff des Abiturs meines Wissens gar nicht, und mit einer Eins kann man dort erst recht nichts anfangen. Für diese Leser muss man also beim Übersetzen gleichzeitig erklären.

Und wenn ein Schüler zu spät kommt, mag mancher Lehrer fragen:

Es sollte klar sein, dass die Frage nicht wörtlich gemeint ist; die Antwort Von draußen! dürfte keinesfalls genügen. Vielmehr soll der Schüler wohl eine Entschuldigung für sein verspätetes Erscheinen vorbringen. Ich habe keinen blassen Schimmer, wie die Frage in anderen Sprachen ausgedrückt wird; womöglich gibt es dieselbe Diskrepanz zwischen Semantik und Pragmatik auch im Englischen, so dass eine wörtliche Übersetzung funktioniert – womöglich liegt man damit aber auch meilenweit daneben.

Ein geschätzter Freund von mir würde die Frage Wo kommst du denn jetzt her? gleich gar nicht als Frage formulieren; sondern er würde brüllen:

Dieses Fragment (von Ich möchte wissen, wo …, Sag mir bitte, wo …, etc.) wird schon von einigen Deutschen nicht verstanden! Wobei dies zu verschmerzen ist, da die Formulierung auch eher als Insider gemeint ist.

Leute wie ich, die ihre Bildung an jeder Ecke heraushängen lassen müssen, verwenden ganz selbstverständlich fremdsprachliche Phrasen wie nolens volens, anything goes oder rien ne va plus. Beim Übersetzen in eine andere Sprache stellt sich die Frage, ob und wie solche Phrasen ebenfalls als bekannt vorausgesetzt werden können. Es bietet sich vermutlich an, sie wörtlich zu übernehmen und eine Erklärung mitzuschicken.

In anderen Milieus wiederum spricht man von Babos und Azzlacks, man sagt Läuft bei dir! und YOLO (für you only live once), und man findet etwas nicht etwa cool, sondern swag. Natürlich gibt es auch weniger ephemere (d. h. kurzlebige) Beispiele von kreativem und zugleich alltäglichem Sprachgebrauch:

Um die Akademiker unter den Lesern nicht zu sehr mit Alltäglichem zu überfordern, gebe ich noch ein eher konstruiertes Beispiel zum Besten, welches ihnen entgegenkommen sollte:

Offensichtlich ist Satz 1 falsch (nicht als Wertung, sondern im Sinne von unwahr), Satz 2 dagegen wahr. Die naheliegende Übersetzung mit this sentence consists of … würde sowohl Inhalt als auch Wahrheitswert erhalten. Aber im Prinzip kann man den Wahrheitswert eines Satzes nicht überprüfen, und auch nicht die Äquivalenz von zwei Sätzen. Der Fachmann sagt, diese Probleme sind unentscheidbar. Möglich wären auch die Übersetzungen:

Die Diskrepanz zwischen Inhaltstreue und Wahrheitswert entsteht, weil es nicht eindeutig klar ist, ob this sentence sich auf den deutschen Originalsatz bezieht (Inhaltstreue) oder auf den dann vorliegenden englischen Satz (Wahrheitswert). Da im Beispiel der Wahrheitswert offenkundig ist, wird ein menschlicher Übersetzer wohl versuchen, ihn zu erhalten.

Folgenden Satz kann man vermutlich ins Japanische übersetzen. Ob er dabei sinnvoll bleibt, hängt davon ab, wie man ihn auslegt; daher wäre auch hier eine Erklärung neben der Übersetzung angebracht.

Aber zurück zu unserem Beispiel mit der Schule. Meiner Meinung nach kann man sich ganz schön schwer damit tun, gerade solche scheinbar einfachen, alltäglichen Sätze in eine fremde Sprache zu übersetzen, wenn man die entsprechenden Situationen nicht selbst in der anderen Kultur erlebt hat, zum Beispiel bei einem Schüleraustausch. Wie soll es da einer Maschine gehen, die nie zur Schule gegangen ist?

Maschinelles Übersetzen ist einfach ein Widerspruch in sich. (A contradiction in terms, würde der Engländer sagen.) Gerade wegen dieser fundamentalen Schwierigkeit gilt in dieser Disziplin das Prinzip anything goes: Es soll ausprobiert werden; neue Ideen zählen, Ergebnisse zählen, tolle Theoriegebäude zählen dagegen weniger. Die fundamentale Schwierigkeit scheint aber auch manche Forscher genügsam werden zu lassen und sie in ihre Nische zu treiben. Und wenn man die Fortschritte in der Disziplin sieht, könnte man resignieren und nolens volens denken: rien ne va plus.

Matthias Büchse am 31. März 2015

zurück: Preise dein Glücke
vor: Im Land der Ideen nichts Neues: Echter Fortschritt lässt auf sich warten

Impressum