Pleiten, Pannen – Post-Editing …

von | 5. Mai 2023

… und das auch bei Patenten …

Den Beruf des Übersetzers wird es in einigen Jahren nicht mehr geben“ – so gehört anno 2018 aus dem Munde eines hochrangigen Politikers, der sich vor dieser Aussage sicherlich eingehend mit dem Thema befasst hat – oder vielleicht doch nicht ..?

Wir schreiben mittlerweile anno 2023 – und es gibt uns immer noch… Wie oft hat man uns schon totgesagt, aber hier im Innern des Landes – lassen wir das … 

Gemeint hat dieser Politiker (und nicht nur er) mit dieser Aussage den Umstand, dass es immer mehr und immer höher entwickelte Computerprogramme gibt, die Texte von einer Sprache in eine andere übertragen. Ich spreche hier ganz bewusst nicht von „übersetzen“, denn diese Programme „übersetzen“ nicht – sie rechnen.

Übersetzungsprogramme – wie funktionieren die eigentlich?

Verbreitet ist der Volksglaube (wohl auch bei obigem Politiker …), dass Programme wie GoogleTranslate, DeepL, & Co. „intelligent“ genug seien, um Texte von einer Sprache in die andere zu übersetzen – man müsste ihnen nur genug Wörter „beibringen“ (Stichwort „künstliche Intelligenz“), dann würden sie nach ihren eigenen, programmierten Algorithmen diese Wörter zu grammatikalisch sinnvollen Sätzen zusammenfügen. Bei dieser Aufgabe sind sie deutlich schneller als ein menschlicher Übersetzer (diese Annahme ist richtig) und vor allen Dingen unvergleichlich billiger. Ich spreche auch hier ganz bewusst von „billiger“ und nicht von „günstiger“, denn die Realität ist folgende:

„Gefüttert“ wurden und werden diese Systeme von ihren Herstellern in der Tat. Das allerdings nicht mit Wortpaaren (Ausgangssprache – Zielsprache) und Grammatikregeln, sondern mit bereits fertigen Sätzen. Diese Sätze stammen aus frei verfügbaren Texten aus dem Internet (also z. B. von der Homepage der Firma XY, von veröffentlichten Patenten und jeglicher Art von Texten) sowie aus der Datenbank dieser Programme: Mit jedem Text, den ein zahlender oder nicht zahlender Kunde in diese Programme eingibt, wird die Datenbank gefüttert.

Datenschutz …

Selbstverständlich versprechen die Anbieter dieser Programme ihren – zahlenden – Kunden (den anderen nicht), dass ihre Textpaare / „Übersetzungen“ nicht gespeichert werden. Überprüfen kann das niemand (denn aus „Datenschutzgründen“ hat selbstverständlich kein Kunde Zugriff auf diese Datenbanken), es lässt sich nur feststellen, dass diese Datenbanken immer größer werden. Ein Schelm, der Böses dabei denkt … 

Woher diese Übersetzungsvorschläge dieser Programme im Einzelnen stammen, lässt sich also nicht ermitteln. Damit hat ein Unternehmen, dass aus Zeit- und Kostengründen seinen vertraulichen Businessplan in ein derartiges Programm eingibt, nicht die Garantie, dass sein Mitbewerber, der eine ähnliche Anfrage an dasselbe Programm stellt, nicht zu seinem größten Entzücken die Ideen des zuerst eingebenden Unternehmens geliefert bekommt …

Bei einem derart eklatanten Verstoß gegen den Datenschutz könnte man einen menschlichen Übersetzer haftbar machen – aber eine Maschine haftet nicht… Sie kann nämlich nicht denken, und „intelligent“ ist auch nicht.

Sie nutzt die ihr eingegebenen Algorithmen, um möglichst hohe Übereinstimmungen zwischen den ihr bekannten Satzpaaren und der neuen Anfrage zu finden. Sie liefert dann das, was sie schon „kennt“ – ohne (im Gegensatz z.B. zu „CAT-Tools“) eventuelle Unterschiede / Unstimmigkeiten anzugeben oder auf den Kontext zu achten.

Die Anbieter dieser Programme rühmen sich, dass ihre Programme darauf „trainiert“ wurden, eben diesen Kontext zu erkennen. So soll ein derartiges Programm z.B. aus den umliegenden Wörtern (nicht den umgebenden Sätzen!) erkennen, ob mit dem Begriff „Bank“ eine Sitzbank oder eben ein Geldinstitut oder vielleicht doch eine Datenbank gemeint ist.

Kohärenz der Übersetzung

Nicht zu vergessen: Die Maschine tut dies bei jedem Satz erneut und sucht in der ihr zur Verfügung stehenden Umgebung nach „passenden“ Lösungen. Mit anderen Worten: Eine Kohärenz des Textes ist damit nicht gegeben.

So wurde mir vor einigen Monaten die maschinelle „Übersetzung“ eines Textes vorgelegt, in dem die „Abwicklung“ oder „Auflösung“ eines Unternehmens geregelt werden sollte. Da man in diesem Zusammenhang auch von „Liquidation eines Unternehmens“ spricht, nennt sich die mit dieser Aufgabe betraute Person „Liquidator“ oder „Abwickler“. Ein „Bestattungsunternehmer“ ist etwas Anderes, aber das „wusste“ die Maschine natürlich nicht, und so tauchte in diesem Text hin und wieder (aber nicht regelmäßig) der Begriff „Bestattungsunternehmer“ anstelle der obigen Fachbegriffe auf …

NMT – Neural Machine Translation – ist nicht in der Lage, Zusammenhänge zu erfassen und liefert die Ergebnisse, die sie als Suchmaschine findet – und zwar Wort für Wort, feststehende Begriffe werden ebenso wenig berücksichtigt wie kulturelle Unterschiede.

So wurde der Begriff „balancing“ („ausgleichen“) im Zusammenhang mit einem Energiespeicher mit „Bilanzierung“ übertragen – Wort für Wort, ohne Rücksicht auf den Kontext und somit in eklatantem Widerspruch mit den Versprechungen der Anbieter von „KI / AI“ (Künstlicher Intelligenz / Artificial Intelligence).

Feststehende Begriffe

Weiterhin erhielt ich vor einigen Jahren zur Begutachtung die „NMT-Übersetzung“ einer Ausschreibung für ein Baugebiet in Belgien. Ein Wohngebiet mit seinem anliegenden Gewerbegebiet sollte erweitert werden. Der Baubeschrieb war in französischer Sprache verfasst, Zielsprache war Deutsch.

Und damit es schneller geht und kostengünstiger wird, wurde diese Anfrage flugs durch eine im Internet frei verfügbare Maschine „geschickt“ (es lässt sich übrigens im Nachhinein nachweisen, ob und mithilfe welchen Programms dies geschieht).

Dieser Maschine fehlten einige vorgefertigte Sätze in ihrer Datenbank, daher griff sie auf Wortgruppen zurück (dabei kann es schon einmal passieren, dass im Zieltext z. B. eine Verneinung entfällt oder hinzugefügt wird, denn die Maschine berichtigt sich nicht automatisch – Maschinen können nicht selbstständig denken, sie können überhaupt nicht denken…)

Und so wurde aus dem Verbot von „chien assis“ (im Deutschen „Dachgaube“) – folgerichtig ein „Es dürfen keine großen Hunde auf dem Dach sitzen“.

Umweg über andere Sprachen

Interessant war weiterhin der Umstand, dass das Programm zur Not auch den Umweg über andere Sprachen einlegte, in diesem Fall offenbar der englischen Sprache:

Eine Überschrift im französischen Ausgangstext hieß „Relief“ – gemeint war (laut Kontext der nachstehenden Absätze) die Bodenbeschaffenheit des umliegenden Parks: eben oder hügelig.

Das Programm fand in seiner Datenbank keine Passung zu diesem Begriff und bediente sich dessen, was es bereits zu bieten hatte (in der ENGLISCHEN Sprache): „Relief“ wurde zu „Erleichterung“. 

Dasselbe geschah mit den lateinischen Fachbegriffen der Moorbirken – Betula Pubescens – deren Einpflanzung in dem Park zwingend vorgeschrieben worden war. Die Maschine erkannte den Ausgangstext in seiner Gesamtheit als deutschsprachigen Text und war mit dem plötzlichen Wechsel ins Lateinische überfordert (ein Humanübersetzer hätte hier im Internet recherchiert), und so wurden die „Moorbirken“ zu „pubertierenden Birken“.

Gefahren durch Verwechslungen

So amüsant obige Beispiele (die aus meinem Alltag als technische Übersetzerin stammen) auch anmuten mögen, so gefährlich kann eine Fehlübertragung gerade im technischen Bereich werden:

Es ging um die Betriebsanleitung einer mobilen, per Batterie betriebenen Astschere, die auf dem Rücken des Baumpflegers bis in die Baumkrone getragen wird, um dort zum Einsatz zu kommen. Es versteht sich von selbst, dass von diesen Geräten trotz persönlicher Schutzausrüstung des Baumpflegers eine gewisse Gefahr ausgeht. Und so wurde von der Maschine wie folgt übertragen:

Französischer Ausgangssatz:

Ne pas stocker le chargeur branché au sécteur“ (= Den Akku nicht lagern, wenn er am Stromnetz angeschlossen ist). 

Vorschlag per NMT:

Den Akku nicht lagern, wenn er an die Astschere angeschlossen ist.

Die Begriffe „secteur“ („Stromnetz“) und „sécateur“ („Astschere“) wurden verwechselt. Der Unterschied besteht in einem einzigen Buchstaben – dem „a“ in der Mitte des Wortes.

Post-Editing – was ist das eigentlich?

Wäre es nicht dennoch einfacher, derartige Kunstwerke nach vollbrachter Tat der Maschine einfach zu „reparieren“, anstatt sie von vornherein von einem Humanübersetzer bearbeiten zu lassen? Und überhaupt, ist die immerwährende Kritik der professionellen Übersetzer an dieser Art von Arbeit nicht einfach nur „Brotneid“?

Diese und ähnliche Überlegungen haben dazu geführt, dass Unternehmen und Übersetzungsagenturen ihre vorgefertigten Übersetzungen immerhin von einem menschlichen Übersetzer Korrektur lesen lassen: „Post Editing“ nennt sich das.

Um es gleich vorweg zu sagen:

  1. „Brotneid“ haben professionelle Übersetzer nicht nötig, da der Übersetzungsbedarf weltweit jährlich steigt.
  2. Es ist allerdings ein Irrglaube, zu meinen, es würde nun genügen, die Ergebnisse von maschineller Übersetzung „nur“ noch kurz zu überfliegen, damit der gesamte Aufwand zeitlich verkürzt und kostenmäßig günstiger wird.
  3. Es ist auch weltfremd davon auszugehen, die Arbeit des Übersetzers wäre nunmehr vereinfacht und somit weniger wert.

Aufgrund der obigen Sachverhalte ist ein Post Editing-Auftrag anspruchsvoller als eine eigene Übersetzung aus dem vorgelegten Text. Aus eigener Erfahrung weiß ich, dass eine derartige Arbeit sehr ermüdend ist, da sie die Konzentration des Übersetzers noch stärker beansprucht:

Es genügt nicht mehr, die Aussage des Ausgangstextes zu erfassen und grammatikalisch einwandfrei mit den entsprechenden Fachbegriffen in die Zielsprache zu übertragen, wobei darauf zu achten ist, dass aus einem Nagel kein Stift wird und aus diesem keine Schraube (Kohärenz der Fachbegriffe – siehe obiges Beispiel mit dem Unternehmen, das durch ein Bestattungsinstitut abgewickelt werden sollte …).

Nunmehr muss auch das Ergebnis der maschinellen Übersetzung überprüft und geistig nachvollzogen werden – und zwar in jedem Satz neu, denn die Fehler (siehe oben) sind in jedem Satz anders… Bei Patenten, in denen ein Satz (ebenso wie bei Rechtstexten) mit einem Satz übersetzt wird (ohne Sätze zusammenzuziehen oder zu trennen) und bei denen ein Fachbegriff zwingend über das gesamte Patent hinweg – Beschreibung mit ihrer Kurzdarstellung, Beschreibung der Figuren, Patentansprüche und die Zusammenfassung sowie die Figuren selbst – mit demselben Fachbegriff zu übersetzen ist, ist die Überprüfung dieser Kohärenz eine anspruchsvolle Herausforderung. Ich habe noch kein Patent gesehen, bei dem diese unabdingbare Vorschrift von den Maschinen beachtet wurde, seien sie noch so spezialisiert und „intelligent“.

In Gesprächen sagen gerade Techniker, Ingenieure und Patentanwälte, dass sie mit MT ca. 25% ihrer Arbeitszeit sparen und danach „nur“ noch Korrektur zu lesen brauchen (sofern sie nicht in diesem Stadium auf einen externen Übersetzer zurückgreifen).

Des Rätsels Lösung liegt darin, dass sich diese Techniker die „Tipparbeit“ sparen – die Übersetzung braucht von ihnen nicht noch einmal manuell eingegeben zu werden. Ein professioneller Übersetzer ist im Tippen geübt – oder er verwendet ohnehin ein Diktierprogramm, mit dem sich nach einiger Einarbeitung sehr viel Zeit einsparen lässt.

Qualität – oder „good enough“?

Nicht nur die Kohärenz der Sätze untereinander, sondern auch die Wortwahl überhaupt oder auch die Satzstruktur (Nichtbeachtung der Betonung des Satzteils, auf den der Schwerpunkt gelegt werden soll) sind in den meisten Fällen derart unbefriedigend, dass sich folgende Frage stellt:

Die Begriffe austauschen, auch wenn sie nicht falsch sind, und den Satz umstellen, damit er idiomatischer klingt, auch wenn er verständlicher ist

oder

sich mit einem verständlichen, grammatikalisch einwandfreien (Rechtschreibfehler sind bei MT selten, auch wenn mir schon welche begegnet sind…) Ergebnis zufriedengeben?

Diese Frage kann nur der Auftraggeber beantworten. Welchen Zweck verfolgt er mit seinem Text, wer ist das Zielpublikum, was steht auf dem Spiel?

Die vollständige „Reparatur“ eines derartigen NMT-Ergebnisses kommt häufig genug einer Neuübersetzung gleich und ist dementsprechend zeitaufwändig, eine Nachbearbeitung durch den Humanübersetzer, deren Ergebnis gerade noch „gut genug“ – „good enough“ – ist, um beanstandungslos akzeptabel zu sein, ist zwar für den Übersetzer unbefriedigend (wir lieben unsere Arbeit!), kann aber für die Zwecke des Auftraggebers ausreichend sein, wenn es „nur“ darum geht, firmenintern Informationen weiterzuleiten.

Machine Translation in Rechtstexten?

Neben technischen Texten übersetze ich auch Rechtstexte, z.B. den gesamten Schriftverkehr zwischen Gerichten, Staatsanwaltschaften, Rechtsanwälten, und zwar sowohl im Strafrecht als auch im Zivilrecht.

Die Besonderheit bei Rechtstexten besteht darin, dass dem Umstand unterschiedlicher Rechtssysteme Rechnung zu tragen ist: So gibt es etwa im deutschen Recht verschiedene Rechtsbehelfe – Erinnerung, sofortige Beschwerde, Einspruch, Widerspruch – die es in anderen Rechtssystemen nicht oder nicht in dieser Form gibt. Dementsprechend gibt es in diesen Rechtssystemen auch keinen Begriff, der absolut äquivalent wäre.

Der Fachübersetzer – der sich zusätzlich zu seiner Übersetzerausbildung – mit diesen Unterschieden der rechtlichen Konzepte beschäftigt hat, wird eine erläuternde Fußnote in seine Übersetzung einfügen. Die Maschine hingegen macht aus einem „Abwickler“ einen „Bestattungsunternehmer“ …

Vor einigen Jahren erhielt ich eine Anfrage von einem Rechtsanwalt: Er hatte eine Klageschrift „übersetzen“ lassen und bräuchte jetzt „nur“ noch die Bestätigung / Beglaubigung eines allgemein ermächtigten Übersetzers. Deshalb wollte er mir die Klageschrift als nicht editierbares pdf zusenden, damit ich meinen Bestätigungsvermerk und meine Unterschrift daruntersetze.

Abgesehen davon, dass diese Vorgehensweise in den meisten Bundesländern gesetzwidrig wäre, wird kein Übersetzer (auch ich nicht) unter eine fremde Arbeit (und dann auch noch ungeprüft) seinen Namen und seine Unterschrift setzen und damit seine Haftung begründen – damit irgendjemand anders von einer praktisch kostenlosen Übersetzung profitiert.

Bei einem Rechtstext ist die Qualitätsstufe „good enough“ auch dann ausgeschlossen, wenn die Übersetzung nicht bestätigt / beglaubigt zu werden braucht, dafür sind die Sachverhalte zu komplex und benötigen zu viel „MI“ – „menschliche Intelligenz“.

Auch lesenswert …