drei im weckler

Das Fastfood, das die Nürnberger erfunden haben, sind — und ich beginne jetzt absichtlich in Hyperhochdeutsch — drei kleine (Nürnberger) Bratwürste in einem Brötchen.

3 im Weggla

Da sich der Nürnberger (und der Mittel- und Oberfranke an sich) offensichtlich nicht vorstellen kann, dass man auch drei einer anderen Art in einem Brötchen versammeln könnte, lässt er das Bratwürste bei der Bestellung aber gleich weg, und anstelle von Brötchen verwendet er eine Verkleinerungsform von Weck, Wecke bzw. Wecken, die mit der regionaltypischen Endung -la (“-lein”) gebildet wird: Weckla oder Weggla (der Franke spricht Konsonanten gerne weich aus). Der Nürnberger Fleischsnack heißt also: Drei im Weckla.

Ganz unabhängig von Nürnberg und von Bratwürsten gibt es außerdem im Deutschen noch eine Eigenart bei der Aussprache von Wörtern: Die Endung -er wird fast wie -a ausgesprochen (Sprachwissenschaftler sprechen vom “vokalisierten r” oder “Tiefschwa” /ɐ/); Wörter wie Gaukler, Makler oder Entwickler werden “hinten” also (fast, aber nicht ganz) wie -la ausgesprochen.

Wer Deutsch in Wort und Schrift kann, weiß also, dass Wörter, die hinten -la ausgesprochen werden (oder zumindest sehr ähnlich), in der Schrift -ler auszuschreiben sind. Wer nun den Ausdruck Drei im Weckla hört und diese “Schreibregel” anwendet, landet bei:

3 im Weckler

3 im Weckler (gefunden bei einem mittelfränkischen Metzga)

(Sprachwissenschaftler sagen dazu übrigens Übergeneralisierung, wenn eine Regel, die in manchen Fällen gilt, fälschlicherweise [aber "logischerweise"] auch auf ähnliche andere Fälle angewandt wird.)

encyclopedia salesman

Heute vor 45 Jahren wurde dies hier erstmals ausgestrahlt:

Monty Python’s Flying Circus: Burglar/Encyclopedia Salesman (aus der 5. Episode der 1. Staffel)

In heutigen Zeiten, in denen große gedruckte Nachschlagewerke kaum noch Käufer finden und reihenweise eingestellt werden, sollte man darüber vielleicht keine Witze machen … aber … doch.

toleranz

Vorbemerkung für diejenigen, die nicht den ganzen Tag auf Facebook und Twitter verbringen: Die ARD hat mit ihrer Themenwoche Toleranz einen Shitstorm entfacht, der sich gegen verwendete Bild-Text-Motive sowie gegen den Begriff der Toleranz an sich richtet.

Zunächst, da dem Blogthema nahestehend: die Auseinandersetzung um den Begriff der Toleranz. Bereits seit einigen Jahren gehört es in manchen Kreisen zum guten Ton, nicht mehr “nur” Toleranz von sich und anderen zu fordern, sondern Akzeptanz — im Sinne von Goethe, der (wie im Deutschen Wörterbuch in Grimm’scher Orthographie nachzulesen ist) vor ±200 Jahren einmal geschrieben hat:

toleranz sollte eigentlich nur eine vorübergehende gesinnung sein; sie musz zur anerkennung führen.

Dies rührt von der lateinischen Herkunft (lat. tolerantia) des Wortes her, das auf Deutsch mit “Duldsamkeit” übersetzt wird; und so kommen von manchen Beschwerden auf, man wolle nicht nur “erduldet” werden (taz.de). Auf der ARD-Seite steht das obige Goethe-Zitat in einer erweiterten Form; dort ist es fortgeführt mit: “Dulden heißt beleidigen.” Das Gefühl, lediglich erduldet zu werden, dürfte tatsächlich nicht sehr schön sein, und darauf auch in der Wortwahl Rücksicht zu nehmen, ist durchaus eine Überlegung wert.

Im heutigen Sprachgebrauch bedeutet Toleranz allerdings weit mehr als nur Duldsamkeit. Im Duden online sind unter “Synonyme” mehr als ein Dutzend Ausdrücke genannt, von denen ich die meisten hier einmal nach eigenem Empfinden auf einer Skala zwischen reinem “Dulden” und maximaler “Aufgeklärtheit” aufreihe (es fehlen Menschlichkeit und Humanität, die hier m.E. nicht einzuordnen sind, sowie Indulgenz und Konnivenz, die ich für frei erfunden halte [Ironiemarker]):

Bedeutungsspektrum von "Toleranz" anhand der Synonyme von duden.de (Grafik modizifiert nach einer Grafik von Marian Müller, Wikimedia Commons, Lizenz CC BY-SA 3.0)

Bedeutungsspektrum von Toleranz anhand der Synonyme von duden.de (Grafik modizifiert nach einer Grafik von Marian Müller, Wikimedia Commons, Lizenz CC BY-SA 3.0)

Wenn Toleranz also nur im Sinne von “Duldsamkeit, Nachsicht” verstanden wird, ist das eine sehr kleine und pessimistische Auswahl aus dem Bedeutungsspektrum. Dies mag bei einigen Betroffenen durch persönliche sprachlich-weltliche Erfahrungen begründet sein — ob der Ausdruck Toleranz aber im Sprachgebrauch insgesamt überwiegend solch eine “beleidigende” Konnotation hat, wäre nur durch umfassende Corpusrecherchen zu ermitteln, die ich hier nicht durchführen kann. Wenn ich davon ausgehe, dass die Duden-Synonyme gründlich und auf empirischer Grundlage systematisch ermittelt wurden, kann ich die Forderung nach Aufgabe des Ausdrucks Toleranz nur sehr bedingt nachvollziehen. (Aber ich bin ja auch ein nicht-diskriminierter Mittelschichts-CIS-Mann, mögen jetzt einige sagen.)

Einen anderen Punkt hat ein auf dieses Thema bezogener taz-Artikel noch angesprochen, nämlich den, dass (nach Wendy Brown) “Tolerieren” ein “Machtgefälle” impliziere:

Wer andere toleriert, glaubt, dass es ihm oder ihr zusteht, sich zu entscheiden, marginalisierte Gruppen trotz ihrer „Andersartigkeit“ zu dulden. (taz.de)

Auch dieser Punkt ist sehr auf eine einzige Lesart von Toleranz bezogen (ein kontrastiver Vergleich der Bedeutung/Verwendung englisch-deutsch würde sich anbieten) — und ganz abgesehen davon: Natürlich entscheidet jede\r einzelne von uns (je nach Erziehung, Reflexionsvermögen und Ausprägungsgrad des Mitläufercharakters mehr oder weniger) am laufenden Band, welchen Sachverhalt, welches Ding, welches Individuum und welche Personengruppe (Migranten, Queer-Menschen, Banker, Polizisten, alte weiße Männer) er/sie in welchem Ausmaß duldet oder akzeptiert. Diese “Macht” haben wir alle, nicht nur was marginalisierte Gruppen angeht. Wer das abschalten will, wird vermutlich die Einnahme von gigantischen Mengen fröhlich machender Pillen großflächig zwangsverordnen müssen.

Der zweite Punkt betrifft die Wahl der Bild-Text-Motive der ARD-Themenwoche; das Motiv wird u.a. in dem oben bereits verlinkten taz-Artikel gezeigt. Mit Sprache und Wörterbüchern hat das nun gar nichts mehr zu tun, aber ich möchte doch anmerken: Als nicht-diskriminierter Mittelschichts-CIS-Mann kann ich die Motivwahl der ARD zumindest verstehen. Es ist doch schlicht und ergreifend gesellschaftliche Realität, dass die durch die Portraitierten symbolisierten Personengruppen (hat sich eigentlich schon jemand darüber aufgeregt, dass keine Frauen gezeigt werden?) im Mittelpunkt von teilweise lautstark und ruppig geführten Disputen darum stehen, ob da nun ein Kindergarten oder eine Flüchtlingsunterkunft NEBEN MEINEM HAUS!!1! gebaut werden dürfen, ob Menschen mit Behinderung MIT MEIIIINEM KIND gemeinsam in eine Klasse gehen sollen oder ob schwule oder lesbische Paare geMEIIINsam Kinder adoptieren dürfen. Wenn diese gesellschaftliche Problematik nicht symbolisch und nicht im Bild gezeigt und am besten nicht mal mehr angesprochen werden darf, wie will man ihr in der breiten Öffentlichkeit denn begegnen? Nicht so, wie der HR, das ist schon mal klar, dessen Ankündigungstext finde ich auch unsäglich. Aber, wie gesagt, als nicht-diskriminierter Mittelschichts-CIS-Mann fand ich die ARD-Motive auch nicht so problematisch, die gute Absicht war deutlich zu erkennen, und deshalb bitte ich dafür … nicht um Toleranz … um Nachsicht. Es IST doch eine gute Sache (verdammt).

anglizismus des jahres 2014: nominierungsphase

Die Nominierungsphase für den Anglizismus des Jahres 2014 hat begonnen.

Geben Sie Ihre Nominierung bis zum 21. Dezember hier ab: anglizismusdesjahres.de!

übungsaufgabe

Übungsaufgabe:

Erläutern Sie die Bedeutung und Auswirkung, die das Wort “Aber” für den gesamten folgenden Text hat:

Dürfen Firmen Familien planen? Frauen sollen ihre Eizellen einfrieren lassen, wenn es ihrer Karriere nützt. Was bislang nur Apple und Facebook fördern, könnte Schule machen. Aber viele junge Deutsche finden das richtig.

Dürfen Firmen Familien planen? Frauen sollen ihre Eizellen einfrieren lassen, wenn es ihrer Karriere nützt. Was bislang nur Apple und Facebook fördern, könnte Schule machen. Aber viele junge Deutsche finden das richtig. (Die Zeit 44 (23. Oktober)/2014)

erschienen: lexicographica 30 (2014)

Soeben druckfrisch erschienen (bald dann jetzt auch elektronisch): Lexicographica 30 (2014)

Inhalt:

Thematic Part: Methods in Lexicography and Dictionary Research / Methoden in der Lexikographie und Wörterbuchforschung / Méthodes en lexicographie et en métalexicographie

Editors of the thematic part: Michael Mann / Stefan J. Schierholz

  • Michael Mann / Stefan J. Schierholz: Methoden in der Lexikographie und Wörterbuchforschung. Ein Überblick mit einer Auswahlbibliographie
  • Sven Tarp: Theory-Based Lexicographical Methods in a Functional Perspective: An Overview
  • Alexander Geyken: Methoden bei der Wörterbuchplanung in Zeiten der Internetlexikographie
  • Carolin Müller-Spitzer: Methoden der Wörterbuchbenutzungsforschung
  • Laurent Romary / Andreas Witt: Méthodes pour la représentation informatisée de données lexicales / Methoden der Speicherung lexikalischer Daten
  • Christian M. Meyer / Iryna Gurevych: Methoden bei kollaborativen Wörterbüchern
  • Monika Bielińska: Methoden der Übersetzungswissenschaft und der zweisprachigen Lexikographie
  • Maria José Bocorny Finatto: New Methods for Specialized Lexicography: Brazilian Approach Examples
  • Ursula Hirschfeld / Eberhard Stock: Wie kommt die Aussprache ins (Aussprache‑)Wörterbuch? Methoden, Probleme und Ergebnisse normphonetischer Untersuchungen zur deutschen Standardaussprache
  • Antje Töpel: Methoden zur Erstellung von Bedeutungsparaphrasenangaben

Non-thematic Part

  • Alexandra Ebel / Friderike Lange / Robert Skoczek: Ausspracheangaben zu eingedeutschten Namen in Aussprachewörterbüchern
  • Theo J. D. Bothma / Sven Tarp: Why relevance theory is relevant for lexicography
  • Herbert Ernst Wiegand: Kotextspezifische Semantik, Pragmatik und Wörterbuchform. Glossate in einsprachigen Wörterbüchern
  • Henning Bergenholtz / Heidi Agerbo: Extraction, selection and distribution of meaning elements for monolingual information tools
  • Roger Schöntag: Diaxenische Markierungen in monolingualen Wörterbüchern des Spanischen, Italienischen und Französischen
  • Annette Skovsted Hansen: Re-vitalizing an indigenous language: Dictionaries of Ainu languages in Japan, 1625–2013

Reviews

  • Feig, Éva: Der Tesoro (1611) als Schlüssel zu Norm und Usus des ausgehenden 16. Jahrhunderts. Untersuchungen zum sprachhistorischen, lexikographischen und grammatikographischen Informationspotential des ersten einsprachigen spanischen Wörterbuchs. 2 Bde. Frankfurt am Main / Berlin / Bern / Bruxelles / New York / Oxford / Wien: Peter Lang, 2013 (Bonner romanistische Arbeiten 110). … by Stefan Ruhstaller
  • Kremer, Anette: Die Anfänge der deutschen Fremdwortlexikographie. Metalexikographische Untersuchungen zu Simon Roths Ein Teutscher Dictionarius (1571). Heidelberg: Winter, 2013 (Germanistische Bibliothek 48), 255 S. … by Peter O. Müller
  • Decurtins, Alexi: Lexicon Romontsch Cumparativ Sursilvan–Tudestg. Cuera: Societad Retorumantscha, 2012. XXIV + 1364 pp. … by Johannes Kramer

Reports

  • Anna Tkachenko: Bericht über den GAL-Kongress „Wörter, Wissen, Wörterbücher“ vom 18. bis 21. September 2012 in Erlangen
  • Thomas Bartz / Nadja Radtke: Digitale Korpora in der Internet-Lexikographie. Bericht zur Sektion „Lexikographie“ der 2. Sektionentagung der Gesellschaft für Angewandte Linguistik (GAL e.V.) am 20. September 2013 an der RWTH Aachen

Lexicography in Higher Education

  • María José Domínguez Vázquez / Stefan J. Schierholz: Der Europäische Master für Lexikographie in 2014

[Lexicographica 30: Umschlag]

google-trefferzahlen zur häufigkeitsbestimmung?

[Warnung: Der folgende Beitrag enthält mehrere Meter breite Diagramme! :-) ]

Immer mal wieder (und trotz eigentlich besseren Wissens) werden Google-Trefferzahlen herangezogen, um Aussagen über die Verwendungshäufigkeit eines sprachlichen Ausdrucks zu geben. Dabei wissen wir eigentlich, 1) dass wir nicht genau wissen, welche Texte Google überhaupt indiziert hat (m.a.W.: wir kennen das Corpus nicht), und 2) dass die Google-Trefferzahlen beim Klick auf die fünfte, zehnte oder fünfzehnte Ergebnisseite auf einmal ganz anders aussehen können (wenn die fünfzehnte Ergebnisseite überhaupt vorhanden ist und nicht zehn Milliarden Treffer auf einmal zu nur zwölf Ergebnisseiten zusammenschrumpfen). Und 3) ist mir auch irgendwann aufgefallen, dass sich die Trefferzahlen ändern, und zwar nicht, wie mit gesundem Menschenverstand zu erwarten, langsam ansteigend, sondern teilweise sehr sprunghaft nach oben und auch nach unten. Dieses Phänomen wollte ich etwas genauer unter die Lupe nehmen.

Ich habe deshalb für verschiedene Suchausdrücke über 18 Monate hinweg (vom 18. März 2013 bis zum 18. September 2014) zweimal täglich (je um 0:30 Uhr und um 12:30 Uhr) die Trefferzahlen ermittelt, um anschließend deren Verlauf zu betrachten.(*) Auf diese Weise sind pro Suchausdruck 1.100 Werte zusammengekommen. NB: Es handelt sich um die Trefferzahlen der ersten Ergebnisseite; wie bereits angedeutet, können die Zahlen auf Folgeseiten abweichen.

Die Suchausdrücke lauteten (alphabetisch; gesucht je mit Anführungszeichen): crowdfunden, Fracking, gehen, haben, Haus, Rüsselhündchen, sehen, Sprachwissenschaft sowie werden; sie sind einer damaligen Laune zu verdanken sowie der Überlegung, neben sehr häufigen Wörtern (gehen, haben, sehen, werden; Haus) auch solche mittlerer oder niedriger Frequenz und solche mit Aussicht auf erkennbare Häufigkeitssteigerung (v.a. Fracking) aufzunehmen.

Die Ergebnisse, die im Folgenden in Diagrammform gezeigt werden (ein Klick öffnet jeweils eine seeeehr breite Grafik), bestätigen den Eindruck, dass sich die Trefferzahlen sprunghaft ändern können, und zwar teilweise um ein Vielfaches des vorherigen Messwertes (Anstiege um 100% sind keine Seltenheit); genauso schnell können sie auf einen Bruchteil abfallen. Dabei ist mir keine Systematik offensichtlich: Die Ausreißer finden sich unregelmäßig, an verschiedenen Wochentagen, und ein starker Ausreißer bei einem Suchausdruck geht nicht in jedem Fall automatisch mit einem ebenso starken Ausreißer bei den anderen Suchausdrücken einher.

Das erste Diagramm zeigt dies bereits zusammenfassend anhand der prozentualen Abweichungen zu jedem Messzeitpunkt relativ zum jeweiligen Medianwert (= Null-Linie) für jeden Suchausdruck (mit Ausnahme von crowdfunden, da die außergewöhnlich hohen Abweichungen dort die Darstellung aller anderen Ausdrücke zu stark gestaucht hätte, siehe unten). Der Median schien mir geeignet als ein Wert, der von den Ausreißern (hoffentlich) nicht betroffen ist. Die Linienverläufe zeigen die starken Abweichungen, die teilweise als isolierte Spitzen, teilweise aber auch über mehrere Messzeitpunkte hinweg auftreten. Ende Oktober/Anfang November 2013 scheint es etwas mehr Aufregung zu geben, auch wenn diese sich bei einigen Ausdrücken viel deutlicher zeigt als bei anderen. Und in den vergangenen Wochen scheint mir das Hin und Her immer schlimmer zu werden:

Prozentuale Abweichung relativ zum Median für jeden Suchausdruck

Prozentuale Abweichung relativ zum jeweiligen Median für jeden Suchausdruck

Die folgenden Diagramme zeigen die Verläufe der absoluten Zahlwerte für jeden einzelnen Suchausdruck.

Bei crowdfunden gibt es relativ wenige Abweichungen, diese sind jedoch so groß, dass der übliche Frequenzbereich (der Median liegt innerhalb des Untersuchungszeitraums bei 1.860 “Treffern”) im Diagramm optisch nicht von der Null-Linie zu unterscheiden ist, da die Ausreißer nach oben Werte von 1,2 Mio. bis hin zu über 10 Mio. (!) annehmen (und damit, ausgehend vom vorherigen Wert von 1.280, einen Sprung von schlappen 820.212,5% hinlegen) — genauso schnell aber wieder zurückspringen:

Google-Ergebnisse für "crowdfunden"

Google-Ergebnisse für “crowdfunden”

Auch das relativ seltene Substantiv Rüsselhündchen (Median: 2.350; Minimum: 712; Maximum: 22.200) zeigt noch vergleichsweise wenig Auf und Ab:

Google-Ergebnisse für "Rüsselhündchen"

Google-Ergebnisse für “Rüsselhündchen”

Fracking (Median: 1.510.000; Minimum: 163.000; Maximum: 15.200.000) zeigt insbesondere Ende Oktober/Anfang November 2013, aber auch zu anderen Zeitpunkten große Ausschläge. Die erhoffte “erkennbare Häufigkeitssteigerung” ist allerdings nicht wirklich gut zu erkennen:

Google-Ergebnisse für "Fracking"

Google-Ergebnisse für “Fracking”

Sprachwissenschaft ist mit einem Median von 1.630.000 (Minimum: 241.000; Maximum: 15.600.000) in einer vergleichbaren Liga wie Fracking, zeigt aber einen ganz anderen Trefferverlauf, was schon im Vergleich der winzigen Vorschauen sichtbar wird:

Google-Ergebnisse für "Sprachwissenschaft"

Google-Ergebnisse für “Sprachwissenschaft”

Noch ein abschließendes Substantiv: das im Vergleich sehr häufige Haus (Median: 234.500.000; Minimum: 4.630.000; Maximum: 2.490.000.000) hat mehr und höhere Ausreißer als beispielsweise Sprachwissenschaft:

Google-Ergebnisse für "Haus"

Google-Ergebnisse für “Haus”

Und schließlich die hochfrequenten Verben gehen (Median: 137.000.000; Minimum: 4.900.000; Maximum: 1.240.000.000), sehen (Median: 200.000.000; Minimum: 938.000; Maximum: 1.530.000.000), haben (Median: 811.000.000; Minimum: 14.400.000; Maximum: 4.730.000.000) und werden (Median: 948.000.000; Minimum: 2.670.000; Maximum: 4.490.000.000); hier einfach zum Vergleich untereinander:

Google-Ergebnisse für "gehen"

Google-Ergebnisse für “gehen”

Google-Ergebnisse für "sehen"

Google-Ergebnisse für “sehen”

Google-Ergebnisse für "haben"

Google-Ergebnisse für “haben”

Google-Ergebnisse für "werden"

Google-Ergebnisse für “werden”

Die Lehre, die man aus diesen Schluckauf-Zahlen ziehen kann, kann nur lauten: Man sollte Google-Trefferzahlen wirklich nicht verwenden, um Aussagen über die Verwendungshäufigkeit sprachlicher Ausdrücke zu geben — und wenn schon, dann sollte man im Abstand mehrerer Tage mehrere Trefferzahlen einholen und prüfen, ob die Häufigkeitsaussage nicht auf Ausreißern basiert.

(*) Genauer gesagt, habe ich mir mittels eines Cronjobs zweimal täglich die Google-Ergebnisseite durch den Textbrowser Lynx ausgeben lassen und habe sie dann durch ein Perl-Script gejagt, das mir die Trefferzahl herausgefiltert hat. Der Cronjob lief auf dem Server des Rechenzentrums der Friedrich-Alexander-Universität Erlangen-Nürnberg — was auch immer das für Auswirkungen auf die Personalisierungs-Einstellungen von Google hat.

[Nachtrag] In den Kommentaren ist anhand von “Fracking” und “haben” stellvertretend gezeigt, in welchem Rahmen sich die Häufigkeitsverteilung der Google-Trefferzahlen bewegt.

Folgen

Erhalte jeden neuen Beitrag in deinen Posteingang.

Schließe dich 362 Followern an