leben vs. fehlertolerante suche 1:0

Auf wer-weiss-was.de wurde heute gefrage:

„was ist eine Ormage oder Omage ?“

Man weiß es nicht hundertprozentig, aber meine Intuition (wie auch die der Antwortenden) vermutet, dass hier nach Hommage gefragt ist.

Ein Test aus dem wirklichen Leben für elektronische Wörterbücher. Suche nach omage:

Duden-Suche: „0 Treffer in Duden — Deutsches Universalwörterbuch. Oder meinten Sie: Image, Mage, omane?“

Wahrig-Rechtschreibung und Bertelsmann-Wörterbuch auf wissen.de: Hier wird keine Fehler- oder Treffermeldung ausgegeben, stattdessen zeigen beide Wörterbücher ohne weitere Hinweise den Artikel zu Image.

OWID (und elexiko): „Ihre Suchanfrage ergab 0 Treffer.“ Keine weiteren Hinweise oder Links.

Wiktionary: „Für deine Suchanfrage wurden keine Ergebnisse gefunden.“ Und: „Meintest du ‚otage‚?“ Hmm… meinten wir ‚Geisel‘? Wie gesagt, man weiß es nicht hundertprozentig.

Woxikon: „Leider keine Ergebnisse gefunden. Meintest du einen der folgenden Begriffe? Schwedisch: omböja, omge“.

LEO (Frz.-Dt.): „Für den Begriff ‚omage‘ findet sich im Wörterbuch keine Entsprechung.“ Und: „Orthographisch ähnliche Wörter — Französisch: mages — mage — image — marge — magie — otage“; „Orthographisch ähnliche Wörter — Deutsch: Magen — Marge“.

Nicht mal Google stellt die übliche Frage Meinten Sie …

Die Suche nach ormage ist nicht erfolgreicher. Hier will man mir überwiegend orange andrehen.

Eine Levenshtein-Distanz von 2 zwischen hommage und omage/ormage ist also offensichtlich zu viel verlangt — obwohl die Levenshtein-Distanz zwischen ormage und der vorgeschlagenen orange ebenfalls 2 beträgt und zwischen omage und omböja (Woxikon) sogar 4. Der Soundex-Wert von Hommage beträgt H520, der von omage O520. Kein riesiger Unterschied also, und dabei handelt es sich hier um Standardmethoden.

Das Fazit also: siehe Titel. Mit der fehlertoleranten Suche hapert es noch ziemlich. Kein einziger korrekter Treffer ist nicht unbedingt ein berauschendes Ergebnis.

PS: Auch das DWDS schreibt: „Kein Eintrag für omage gefunden.“ Allerdings ist dort auch das Wort Hommage nicht enthalten.

PPS: Im übrigen ist das auch ein schönes Beispiel für das alte Dilemma der Rechtschreibwörterbücher. „Onkel Duden, wie schreibt man [ɔ’ma:ʒ]?“ — „Na, schlag das doch im Wörterbuch nach, mein Junge!“

Internetlexikographie

14.04.2010

4 Kommentare

Horst

Doof ist halt leider, dass man nicht „mal eben“ die Levenshtein-Distanz der Eingabe zum gesamten Korpus berechnen kann — das wäre viel zu teuer. Aber ich bin sicher, dass es da schlauere Methoden gibt. Die kannten die Webentwickler dieser Seiten aber wohl auch nicht.

Permalink

08.06.2010 16:08

lexikographieblog

Ja, das stimmt schon. Und wie die schlauere Methode aussähe, kann ich auch nicht mit Sicherheit sagen. Andererseits, wie macht Google das eigentlich? Auf die Schnelle finde ich nur die Information „Googles Eingabe-Korrektur basiert auf allen im Internet vorkommenden Wörtern“ (http://www.google.com/intl/de/help/features_list.html). Das ist ein bisschen lachhaft, klingt aber trotzdem auch nach ziemlich viel.
Vielleicht steht da irgendwo ein Index mit allen möglichen Buchstabenkombinationen („mit Zurücklegen“) bis zur Länge X und den dazugehörigen möglichen „guten“ Wörtern? Den bräuchte man wenigstens nicht dauernd on the fly neu zu erstellen …
Ich bin aber immer wieder erstaunt, wie wenig von dem, was in der Literatur als ganz einfach dargestellt wird, dann auch tatsächlich praktisch umgesetzt wird. Die Levenshtein-Distanz gehört sicher dazu.

Permalink

11.06.2010 12:36

lexikographieblog

PS: Noch was Älteres zum Schmunzeln: http://www.plexblog.de/die-10-besten-meinten-sie-antworten-aus-der-google-rechtschreibkorrektur

Permalink

11.06.2010 12:51

Sorry, the comment form is closed at this time.

lexikographieblog