Integration von automatischer Übersetzung und Translation-Memorys

tekom-Jahrestagung, Wiesbaden, 20.-22. November

Dr. Hubert Lehmann, linguatec Entwicklung & Services GmbH, Heidelberg

Einführung

Translation-Memorys sind am besten, wenn es nichts Neues zu übersetzen gibt. Bei neuen Texten sind sie nutzlos. Deshalb entstand schon vor etlichen Jahren der Gedanke, automatische Übersetzung und Translation-Memorys zu koppeln, um so für neue Sätze wenigstens Übersetzungsvorschläge zu bekommen. Erste Experimente dieser Art haben wir vor fast zehn Jahren mit IBM Translation Manager und einem Prototypen von Personal Translator gemacht. Seitdem hat sich die Qualität der automatischen Übersetzung signifikant verbessert, und viele unserer Kunden nutzen Personal Translator schon zusammen mit Translation-Memory-Systemen (Mügge, 2001), da sie darin einen erheblichen Produktivitätsgewinn sehen.

Vor- und Nachteile der automatischen Übersetzung

Jeder kennt amüsante oder vollkommen unverständliche Übersetzungen, die von automatischen Übersetzungsprogrammen erzeugt werden. Ein solches Beispiel, das von einem unserer Kunden stammt, ist in Abbildung 1 zu sehen.

Übersetzungsbeispiel
Abbildung 1

Mancher wird sich fragen, was einem Übersetzer Programme nutzen können, die solche oder schlimmere Fehler produzieren. Für die Nutzung von automatischer Übersetzung durch das allgemeine Publikum ist die Frage längst entschieden, wie van der Meer (2002) anmerkt: Systran allein übersetzt täglich zehnmal soviel wie alle Humanübersetzer zusammen.

Für den Übersetzer heißt die Frage schlicht: Lohnt sich die Korrektur der Ergebnisse, sodass sich insgesamt ein Produktivitätsgewinn ergibt? Für ihn ist es nicht so wichtig, ob die automatisch erzeugte Übersetzung korrekt oder verständlich ist, sondern wie aufwendig ist die Korrektur. Darüber gibt der kürzlich vom Fraunhofer Institut durchgeführte Anwendertest (Manz, Cho, 2002) Aufschluss, der eine Zeitersparnis von über 40% nachgewiesen hat.

Den Schwierigkeiten, die alle Programme mit den Mehrdeutigkeiten der Sprache und zu komplexen Satzstrukturen haben, steht die konsistente Übersetzung auch der exotischsten Terminologie und der praktisch unbegrenzte Wortschatz gegenüber. Die Fehler der Übersetzungsprogramme unterscheiden sich auch stark von denen, die der Mensch macht:

  • falsch gewählte Übersetzungsäquivalente aufgrund mangelnden Kontextwissens,
  • verkorkste Satzstrukturen aufgrund zu komplex strukturierter quellsprachlicher Sätze.

Dagegen sind Rechtschreibfehler oder ausgelassene Sätze bzw. Satzteile eher selten. Beim Nachbereiten automatisch erzeugter Übersetzungen muss man sich also auf diese Eigenheiten einstellen.

In der Vorbereitung muss man für die Verfügbarkeit der benötigten Terminologie sorgen, Rechtschreibfehler eliminieren und Satzungetüme gegebenenfalls umformulieren.

Möglichkeiten der Intergration

Die Integration der Systeme kann so realisiert werden, dass entweder das Übersetzungssystem oder das Translation-Memory-System im Vordergrund steht. Im Personal Translator gibt es beim Übersetzen eines Dokuments die Möglichkeit, Übersetzungen aus dem Translation-Memory zu holen und in den Zieltext einzufügen, anstatt die Sätze automatisch übersetzen zu lassen. Dazu verfügt Personal Translator über eine eigene Translation-Memory-Funktion (Seewald-Heeg, Nübel, 1999), die genutzt werden kann, um automatische und manuell erzeugte Übersetzungen zu speichern und zu finden. Damit kann in einem Schritt eine Rohübersetzung erzeugt werden, die auf die jeweils am besten geeigneten Quellen zurückgreift. Die Nachbearbeitung findet dann auf der Übersetzung des kompletten Texts statt (Abbildung 2). Der Übersetzer kann also die gesamte Arbeit innerhalb von Personal Translator bzw. mithilfe seiner Schnittstelle zu Word durchführen. Ein weiterer Vorteil besteht darin, dass die Terminologie nur in einem System vorhanden sein muss.

Satzarchiv
Abbildung 2

Ein zweiter Ansatz besteht darin, ein bestehendes Translation-Memory-System zu nutzen, um noch nicht überesetzte Segmente zu extrahieren und diese dann automatisch übersetzen zu lassen. Die resultierenden Satzpaare werden in das Translation-Memory eingefügt und speziell gekennzeichnet. Die Übersetzer benutzen dann ihre gewohnte Arbeitsumgebung und kommen mit dem Übersetzungssystem selbst nicht in Kontakt. Diese Arbeitsweise haben wir sowohl mit IBM TranslationManager als auch mit Trados für die Übersetzung von Produkthandbüchern benutzt.

Daneben wird noch die Variante benutzt, dass die Wordschnittstellen von Trados und Personal Translator gleichzeitig aktiviert werden und so die Funktionalität beider Systeme beliebig genutzt werden kann.

Diese beiden Verfahren haben den Nachteil, dass die Fachterminologie in beiden Systemen verfügbar sein muss und ein Verfahren für deren Austausch notwendig ist. Das wird dadurch erschwert, dass das Übersetzungsprogramm reichhaltigere grammatische Informationen benötigt als das Translation-Memory-System, ihm andererseits aber Definitionen, Gebrauchshinweise und ähnliches nichts nützen, die für den Menschen hilfreich sind.

Erfahrungen mit der Übersetzung von Produkthandbüchern

Der Nutzen aus der Kombination von Translation-Memories und automatischer Übersetzung hängt stark vom "Neuigkeitsgrad" der Texte und der "Überarbeitungswürdigkeit" der Übersetzungen ab. Sowohl automatisch erzeugte Übersetzungen als auch als "Fuzzy Match" gewonnene Übersetzungsvorschläge müssen durch den Menschen mit dem Original verglichen, und die notwendigen Änderungen müssen vorgenommen werden. Das kann länger dauern als eine Neuübersetzung, doch zeigt die Erfahrung, dass es sich in vielen Fällen lohnt.

Ausblick

Gerade für neue Texte bietet sich die automatische Übersetzung als Ergänzung zu Translation-Memorys an. Der Nutzen hängt vor allem von der für die Überarbeitung benötigten Zeit ab. Die wachsende Zahl von Übersetzern, die diese Lösung nutzen, spricht für ihren Erfolg.

Literatur

Manz, Sylvia, Miyoung Cho (2002), "Evaluationsbericht: Anwendertest Personal Translator 2001/2002 und Business English", Fraunhofer Institut für Arbeitswirtschaft und Organisation, Stuttgart.

Mügge, Uwe (2001), "The Best of Two Worlds, Integrating Machine Translation into Translation Memory Systems: A universal approach based on the TMX standard", Language International, December 2001, S.26-29.

Seewald-Heeg, Uta, Rita Nübel (1999), "Translation-Memory-Module automatischer Übersetzungssysteme", LDV-Forum Bd 16, Nr. 1/2, Jg. 1999, S. 16-35.

Van der Meer, Jaap (2002), "Where's that Localization Business Model 2.0?", The LISA Newsletter, Volume XI, nr. 1.4, March 2002

Email-Adresse: h.lehmann@linguatec-es.de