4. Mai 2012

Automatische Wörterbucherweiterung

In einem früheren Posting berichteten wir über unsere halb-automatische Methode der Wörterbucherweiterung. Mittlerweile haben wir das Verfahren verbessert und können nun für eine bestimmte Klasse von Konstruktionen automatisch neue Übersetzungen unserem Wörterbuch hinzufügen. Bei den Konstruktionen handelt es sich um Komposita, also zusammengesetzte Substantive wie Seerechtsabkommen. Ausgehend von unserem vorhandenen Wörterbuch und unserem Satzarchiv aus knapp 5 Millionen deutsch-englischen Satzpaaren konnten wir mit dem Verfahren 70.000 englische Übersetzungen von 60.000 deutschen Komposita automatisch ins Wörterbuch übernehmen.

Wie funktioniert die automatische Komposita-Übersetzung?
Zunächst muss das deutsche Kompositum in seine Bestandteile zerlegt werden. Das ist für den Computer ein äußerst schwieriges Unterfangen, wie wir bereits hier beschrieben haben. Nehmen wir als Beispiel das Kompositum Bildungsaustauschprogramm. Unser Kompositazerleger findet als Konstituenten: Bildung, Austausch und Programm. Die Konstituenten können nun im Wörterbuch nachgeschlagen werden:

Bildung: creation development education establishment formation forming genesis learning literacy nurture setting up
Austausch: exchange replace substitutional commutation interchange relocation swapping transposition
Programm: channel cycle program programme schedule scheme manifesto

Die Übersetzungen der beiden Bestimmungswörter Bildung und Austausch werden jetzt noch um ihre Adjektiv-Ableitungen erweitert:

development -> developmental, education -> educational …

Aus den möglichen Übersetzungen jeder Konstituente (und den Adjektiv-Ableitungen) werden dann alle möglichen Kombinationen gebildet:

creation exchange channel
development exchange channel

forming transposition manifesto

In diesem Beispiel gibt es 14 x 9 x 7 = 882 mögliche Kombinationen. Aber welche davon gibt es im Englischen? Und sind sie überhaupt Übersetzungen des Ausgangskompositums? Angenommen development relocation cycle existiert im Englischen, handelt es sich dabei überhaupt noch um die Übersetzung von Bildungsaustauschprogramm? Um das herauszufinden, durchsuchen wir unser Satzarchiv aus zweisprachigen deutsch-englischen Sätzen. Auf der deutschen Seite muss das Ausgangswort Bildungsaustauschprogramm vorkommen, und auf der englischen Seite alle drei Wörter einer der 882 erzeugten Kombinationen. Zwischen den drei Wörtern dürfen außerdem Präpositionen und Artikel vorkommen. So finden wir zu Bildungsaustauschprogramm die englische Entsprechung programme for educational exchange.
Auf gleiche Weise wird aus Seerechtsabkommen zuerst See, Recht und Abkommen, dann (neben vielen anderen Kombinationen) sea, law und convention, und schließlich convention on the Law of the Sea.

Als nächstes planen wir, unsere Methode auf andere Konstruktionen als Komposita auszudehnen. Wenn zu Wirtschaftsentwicklung die englische Entsprechung economic development gefunden werden kann, sollte das für die Nominalphrase wirtschaftliche Entwicklung auch funktionieren.

Zum Schluss einige Beispiele für automatisch gefundene Komposita-Übersetzungen (in Klammern die jeweilige Häufigkeit in unserem Satzarchiv):

Heringsfangmöglichkeit
- possibility for catching herring

Haushaltsbeschluss
- budgetary decision (10)
- budget decision (6)
- decision on the budget (2)

Souveränitätsgewinn
- gain in sovereignty

Imageverlust
- loss to the image

Gefahrensituation
- risk situation (5)
- dangerous situation (4)
- situation of risk (3)

12. September 2010

Nebenbei Englisch lernen mit dem Englisch-Blog

Abgelegt unter: deutsch-englisch — Petra @ 16:36

In der Masse der Englischlehr-Webseiten hebt sich eine hervor: Die von Markus Brendel mit seinem Englisch-Blog, der in den letzten zwei Jahren Top-Platzierungen auf lexiophiles.com erreicht hat.

So heißt es auf seinem Blog:

Der Englisch-Blog liefert jeden Tag neue Erklärungen und Übungen rund um die englische Sprache.

Der tägliche 5-Minuten-Snack für zwischendurch. Perfekt für alle, die nebenbei ihr Englisch auffrischen und verbessern wollen.

Damit trifft er den Nagel auf den Kopf (engl. to hit the nail on the head). Gerade wenn man zeitlich angespannt ist, sind Markus Kurzlektionen ideal um zwischendurch doch noch etwas Englisch dazu zu lernen. Dabei lässt er uns keinen einzigen Tag im Stich, nicht mal an Weihnachten oder wenn er im Urlaub ist. Seine Lektionen orientieren sich häufig am aktuellen Geschehen und werden von einem Video begleitet. Die neu gelernten Vokabeln kann man sich also auch gleich anhören. Nett sind auch seine Sheepman-Spiele, mit welchen uns Markus bestimmte Redewendungen raten lässt. Und wenn man selbst Fragen zu einem Englischthema (Wortbedeutung, Übersetzung, Korrektur, Aussprache,…) hat, dann kann man sich an die nette Community im Englisch-Forum wenden.
Mit den besten Empfehlungen von mir.

Der Englisch-Blog

Der Englisch-Blog

24. März 2010

linguatools Firefox-Add-on

Abgelegt unter: deutsch-englisch — Tags:, — Petra @ 03:14

Bisher musste man die URL linguatools.de betreten, um Vokabeln und die zugehörigen Verwendungsbeispiele in unserem deutsch-englischen Wörterbuch nachzuschlagen. Ab sofort können Sie das linguatools-Wörterbuch auch direkt aus dem Firefox-Fenster durchsuchen, wenn Sie das entsprechende linguatools-Firefox-Add-on installieren. Nach der Installation ist nur noch ein Neustart des Firefox-Browsers notwendig um das Add-on zu aktivieren.

Sobald Sie das Firefox-Add-on aktiviert haben, können Sie damit das linguatools-Wörterbuch auf zweierlei Art durchsuchen:

Erstens mittels des Suchfelds ganz oben rechts neben der URL-Leiste des Firefox-Fensters. Neben den standardmäßig installierten ’search engines’ ist dann auch das frisch installierte Add-on dabei, das Sie zur Vokabelsuche verwenden können. Sie erkennen es an diesem Symbol:

linguatools-fav-32x32

Lt steht für Linguatools. Ich hoffe, dass ist klar ;-)

Alternativ können Sie das Add-on verwenden, indem Sie ein beliebiges Wort im Firefox-Fenster markieren und im Kontextmenü (das Sie über die rechte Maustaste erreichen) Search Linguatools for “markiertes Wort” auswählen.

In beiden Fällen öffnet sich ein neues Firefox-Tab mit den Resultaten Ihrer Suche.

Zur Zeit befindet sich das Add-on noch im experimentellen Status. Falls Sie Probleme damit bemerken oder es sich nicht installieren lässt, freuen wir uns über ein kurzes Feedback mit der Angabe welches Betriebssystem und welche Firefox-Version Sie verwenden.

8. Februar 2010

Noch mehr falsche Freunde

Abgelegt unter: deutsch-englisch — Tags:, , — Peter @ 08:23

Im letzten Posting ging es um mehrdeutige Wörter, bei denen die Gefahr besteht, beim Übersetzen die falsche Bedeutung auszuwählen, und dadurch im Idealfall einen unfreiwillig komischen Text zu produzieren. Meist weniger lustig, aber dafür umso nerviger, sind die “falschen Freunde”, von denen es wegen der engen Verwandtschaft der beiden Sprachen in der Paarung Deutsch-Englisch besonders viele gibt. Man spricht von einem falschen Freund, wenn ein englisches Wort genauso aussieht wie ein deutsches, es aber (auch) etwas anderes bedeutet, bzw. wenn es im Deutschen in dieser Bedeutung nicht geläufig ist. Oder besser: war.

Den ersten falschen Freund für heute finden wir in dieser Überschrift:

World-of-Warcraft-Spieler beschweren sich über Charakter-Überwachung
(Heise online, 23.1.2010)

Ja, haben die World-of-Warcraft-Spieler denn so einen gefährdeten Charakter? Alles Schummler, Neider, Halunken? Nein, das englische “character” in der Bedeutung von “Spielfigur” wurde so oft einfach mit “Charakter” ins Deutsche übersetzt, dass es sich im Spielebereich schon durchgesetzt hat. Etwas unglücklich formuliert ist die Überschrift trotzdem.

Nächster falscher Freund: “local”. Früher wurde das mit “örtlich”, “ortsansässig” oder “hiesig” übersetzt, heute fast nur noch mit “lokal”. Man liest vom “lokalen Vertreter der Allianz-Versicherung”, den “lokalen Geschäften” und “lokalen Handwerkern”. Komischerweise hört man aber immer nur von den “örtlichen Lokalen”, nie von den “lokalen Lokalen”. Wieso eigentlich nicht?

Der dritte und letzte falsche Freund für heute ist die “Administration”. Dies ist ein spezielles deutsches Wort, das ausschließlich für US-amerikanische Regierungen verwendet wird: Clinton-Administration, Bush-Administration, Obama-Administration. Hat man je von einer Sarkozy-, Putin- oder Merkel-Administration gehört? Schon bedenklich: “Obama-Administration” ergibt in der deutschen Google News-Suche 55.000 Treffer, “Obama-Regierung” gerade mal 200.

4. Februar 2010

Apple verschifft Computer

In der Liste mit deutsch-englischen Übersetzungsfallen und falschen Freunden von Stefan Winterstein findet sich das lustige Beispiel von der “Verschiffung von Windows 98″. Das englische “to ship” wurde mit “verschiffen” statt “ausliefern” übersetzt. Beide Übersetzungen sind natürlich für sich genommen korrekt. Da man es hier aber mit zwei ganz unterschiedlichen Lesarten des Verbs “to ship” zu tun hat, ist der Übersetzer gefordert, die in den aktuellen Kontext passende Bedeutung auszuwählen. Das gelingt offenbar weniger oft als gedacht, denn es war ziemlich einfach über Google ein weiteres Beispiel des gleichen Übersetzungsfehlers aufzuspüren:

Fundamental laufen die Geschäfte für Apple derzeit gar nicht so schlecht. Die
weltweiten Computerverkäufe sind zwar zum Jahresende erstmals seit fünf Jahren
um 0,4 Prozent gefallen, berichtete das amerikanische Marktforschungsinstitut
IDC am Mittwoch. Immerhin konnte Apple jedoch 1,2 Millionen Computer
verschiffen und den Marktanteil auf 7,2 Prozent steigern. (FAZ vom 15.1.2009)

Neben dem Verb “verschiffen” habe ich auch “Fundamental” hervorgehoben, denn auch hieran könnte man erkennen, dass der Text aus dem Englischen übertragen wurde. Das englische “fundamental(ly)” wurde naheliegenderweise mit “fundamental” übersetzt, was sich hier aber etwas seltsam anhört. Eine alternative Übersetzung wie “grundsätzlich” würde sich flüssiger lesen.

Wie kommt so ein lachhafter deutscher Text zustande? Meine Vermutung ist: das englische Original wurde maschinell übersetzt, und diese Rohübersetzung dann in großer Eile nachkorrigiert, wobei einiges übersehen wurde.

25. Dezember 2009

Neue Version des deutsch-englischen Kontextwörterbuchs online

Bisher spuckte unser Kontextwörterbuch nur eine ungeordnete Liste von deutsch-englischen Satzpaaren aus, die irgendwo den gesuchten Begriff enthielten. Die Übersetzung des Suchbegriffs in der gewünschten Sprache musste man selber aus den Sätzen herauspicken, da sie nicht markiert wurde. Außerdem war es oft nahezu unmöglich, eine seltene Übersetzung zu finden, da es keine Sortierung der Ergebnisse nach Übersetzungsvarianten gab.

In der neuen Version ist jetzt alles besser:

  • alle möglichen Übersetzungen des gesuchten Ausdrucks werden gesammelt und übersichtlich angezeigt,
  • die Beispielsätze zu jeder Übersetzungsvariante werden zusammengefasst darunter ausgegeben,
  • auch die Übersetzungen in den Beispielsätzen werden markiert, nicht nur das eingegebene Suchwort,
  • zu vielen Suchbegriffen werden neben vollständigen Beispielsätzen auch feste Wortverbindungen angezeigt,

Ebenfalls neu sind Synonyme zum Suchwort. Sie bestehen aus den Rückübersetzungen der gefundenen Übersetzungen in die Ausgangssprache. Für Geist ↔ wit sind das beispielsweise Intelligenz, Verstand, Schlagfertigkeit, Witz, für Geist ↔ ghost dagegen Gespenst, Ghostwriter. Diese Angaben helfen bei der Auswahl der richtigen Übersetzung.

Als weitere Neuerung bietet das Wörterbuch grammatische Angaben zum Suchwort. Beispielsweise wird zum Suchbegriff “Praktika” ausgegeben, dass es sich um die Mehrzahl des sächlichen Substantivs “Praktikum” handelt, zudem werden alle Beugungsformen in einer Tabelle angezeigt.

Momentan gibt es die neue Version des Kontextwörterbuchs nur für das Sprachpaar Deutsch-Englisch, aber wir arbeiten bereits an Versionen für Deutsch-Tschechisch und Deutsch-Spanisch.

Testen Sie das neue Kontextwörterbuch, z.B. mit dem Begriff Verständnis!

7. Dezember 2009

Gleichgeschriebene deutsch-englische 'falsche Freunde'

Abgelegt unter: deutsch-englisch — Petra @ 11:30

Bei der Wikipedia findet man eine umfangreiche Liste mit deutsch-englischen falschen Freunden. Zum Beispiel wissen wir, dass das englische “silicon” auf Deutsch “Silizium” und nicht “Silikon” bedeutet.

Welche dieser falschen Freunde werden aber auf Englisch genauso wie auf Deutsch geschrieben? Hier sind sie (extrahiert aus der Wikipedia-Liste):

Englisch - Deutsch
abort - Abbruch, Fehlgeburt
administration - Verwaltung
agent - (auch) Vertreter
also - auch
argument - Streit, Diskussion
artist - Künstler
billion - Milliarde
boiler - Dampfkessel
boot - Stiefel
carbon - Kohlenstoff
chance - (meist) Wahrscheinlichkeit
character -  (auch) Figur
chef - (auch) Koch, Chefkoch,...
china - (auch) Porzellan
diverse - verschieden, ungleich
fast - schnell
fatal - (auch) tödlich
gas - (auch) Benzin
genial - herzlich, freundlich
genie - Dschinn, Flaschengeist
gift - Geschenk
grill - Gitter, Rost, ...
gymnasium - Sporthalle
hall - Flur, Diele
handy - geschickt, passend, handlich
hardware - (auch) Eisenwaren, Haushaltswaren
heck - Hölle
helm - das Steuer beim (Raum-)Schiff
hose - (Wasser-)Schlauch
impression - Eindruck,...
interview - befragen, Bewerbungsgespräch
island - Insel
joint -  Gelenk, Verbindung,
kindergarten - 'Vorschule'
lager - Lagerbier
liberal - politisch links, sozialdemokratisch
limousine - Stretch-Limousine
manifest - Passagierliste, Ladungsliste, offenkundig
marine - Marinesoldat
minute - (auch) sehr klein, winzig,...
mist - Nebel
monitor - (auch) Klassensprecher, Aufseher
moor - Heide
national - landesweit
operation - auch: Arbeitsweise, Bedienung
organ - auch: Orgel
paraffin - Petroleum
paragraph - Textabschnitt
parole - Bewährung
paste - einfügen, ankleben
patient - (auch) geduldig, beharrlich
personal - persönlich
pest - Schädling
petroleum - Erdöl
probe - Sonde
psycho - Hellseher
pudding - auch: Nachtisch, Auflauf,...
pumps - Tanzschuhe, Sportschuhe
puzzle - Rätsel, Geduldsspiel,...
queue - Reihe, Warteschlange,...
quote - Zitat, zitieren
ringer - Glöckner
roman - Römer, römisch
schmuck - Trottel, Schwachkopf
sensation - (auch) Sinneseindruck, Empfindung
sense - Sinn
slip - Versehen, Unterrock,...
slipper - Hausschuh
smoking - rauchend, das Rauchen
Sodium - Natrium
spleen - Milz
spur - Sporn (Reiten)
stall - Verkaufsstand, abnehmen,...
stark - schier, offensichtlich,...
stern - streng
still - (auch) ruhig, noch, doch
stock - Brühe, Vorrat
strafe - unter Beschuss nehmen
strand - Ader, Faden,...
string - Zeichenkette, Schnur, Seite,...
student - (auch) Schüler
tachometer - Drehzahlmesser
tag - Etikett
tank - Panzer
ton - ein anderes Maß als die Tonne
tor - steiler Felshügel
total - gesamt, zusammen
trainer - (auch) Sportschuh, Physiotherapeut
trillion - Billion
ventilator - Beatmungsgerät
vital - entscheidend, grundlegend;
wand - Zauberstab, Stab
welt - Rand, Rahmen,...
will - wird
zimmer - Rollator

Blogverzeichnis - Blog Verzeichnis bloggerei.de   RSS-Feed   Blog von linguatools.de   Impressum   Powered by WordPress ( WordPress Deutschland )