Lingenio GmbH Deutsch
English
Français
 
 
     
         
 
 

Die Größe der Wörterbücher von translate

Das Wörterbuch von translate Deutsch-Englisch umfasst ungefähr 290.000 unterschiedliche Wortübersetzungen, das für Deutsch-Französisch etwa 200.000, bezogen auf Übersetzungen einzelner im Text vorkommender Wortformen sind das ungefähr 1,1 Millionen bzw. 700.000.

Was bedeuten solche Zahlen? Warum redet man von Übersetzungen und nicht von Stichwörtern? Für viele - in der Tat die meisten - Wörter gibt es nur genau eine Übersetzung, aber gerade die häufigsten und wichtigsten Wörter einer Sprache haben viele Bedeutungen und deshalb auch viele Übersetzungen. Die korrekte Beschreibung von Wörtern wie machen, halten, nehmen mit all ihren Bedeutungsfacetten ist viel schwieriger als das Hinschreiben der Übersetzung für Wörter wie Desoxiribonukleinsäure (Englisch deoxyribonucleic acid). Deshalb sagt die Anzahl der unterschiedlichen Übersetzungen schon etwas mehr aus als die Anzahl der Stichwörter.

Wörter und Regeln

Das Wörterbuch von translate enthält nur wenige Zahlwörter, weil die meisten mit einem Algorithmus zerlegt und in der Zielsprache aus den Bestandteilen erzeugt werden. So wird zum Beispiel aus dreihundertelftausendfünfhundertdreiundsiebzig im Englischen three hundred and eleven thousand five hundred and seventy-three.

Interessanter ist die Behandlung zusammengesetzter Wörter und mehrteiliger Begriffe. Solche Wörter werden täglich neu gebildet, und es ist völlig unmöglich, sie alle in ein Wörterbuch aufzunehmen - Elfmeterkrimi oder Kopftuchverbot stehen heute in der Zeitung und sind morgen vielleicht vergessen. Deshalb können solche Wörter nur behandelt werden, indem man sie zerlegt und die hoffentlich richtige Übersetzung erzeugt.

Bei translate wurde außerdem oft darauf verzichtet, zusammengesetzte Wörter ins Wörterbuch aufzunehmen, wenn das Programm sie korrekt behandeln kann. Stattdessen gibt es zum Beispiel eine Übersetzungbedingung für Stunde im Wörterbuch, die bewirkt, dass in Zusammensetzungen mit einem Musikinstrument die Übersetzung lesson generiert wird. Deshalb wird aus Trompetenstunde im Englischen trumpet lesson und nicht etwa trumpet hour.

Das macht es allerdings noch schwieriger, genau abzuschätzen, wie viel des Wortschatzes einer Sprache tatsächlich durch das Wörterbuch abgedeckt wird.

Quantität und Qualität

Hinter der Frage nach der Größe des Wörterbuchs steht eigentlich die Frage nach der zu erwartenden Übersetzungsqualität. Wenn zu viele Wörter fehlen, kann ein Programm nicht gut übersetzen, oder der Anwender muss viel Mühe darauf verwenden, den Wortschatz zu ergänzen.

Trotzdem reicht Quantität allein nicht aus: Man braucht die richtigen Wörter und ihre Beschreibung muss korrekt sein. Unterschiedliche Bedeutungen müssen ebenso berücksichtigt sein wie grammatische Eigenschaften und die geeigneten Übersetzungen. Ganz wichtig ist auch, dass die häufig vorkommenden Wörter besonders sorgfältig beschrieben werden. Bei der Entwicklung von translate waren uns diese qualitativen Gesichtspunkte immer wichtiger als das Streben nach der großen Menge.

Dennoch sind im Lauf der Jahre sehr umfangreiche Wörterbücher entstanden, die neben dem Allgemeinwortschatz auch sehr viele Fachbegriffe aus einer Reihe von Gebieten enthalten und damit für die Übersetzung vieler Texte ohne weitere Ergänzung ausreichen.

Das Idiomatikwörterbuch von translate pro

Das Idiomatiwörterbuch, das für die Übersetzung nicht direkt genutzt wird (es werden aber Hinweise auf etwaige Redewendungen erzeugt), gehört zu den umfangreichsten Sammlungen von Redewendungen, die es für die deutsche Sprache gibt. Es umfasst etwa 40.000 Redewendungen mit den jeweiligen Übersetzungen ins Englische und Französische.

 

 
     

© Copyright Lingenio GmbH 2004