Was haben Gewitter, Volksaufstand und Gesundheitsreform gemeinsam?

/

kaffee-atWussten Sie, dass sich in Pascal Couchepin ein Cappuccino versteckt? «Der deutsche Wortschatz» sucht nach Anagramen und kann noch weitaus mehr.

Ein ähnliches Projekt wie der «Global Language Monitor» (bernetblog, 08.07.09) ist das Projekt «Der deutsche Wortschatz» der Universität Leipzig.

Suchen Sie häufig nach Alternativen zu bestimmten Wörtern, nach Entsprechungen oder Ergänzungen? Nicht immer hat man ein gutes Wörterbuch zur Hand, wenn man eins braucht. In diesem Fall hilft das Wortschatzlexikon der Uni Leipzig. Die Wortschatz-Datenbank enthält Texte aus öffentlich zugänglichen Quellen, sprich Zeitungen und Internetseiten. Die Daten werden aus diesen Quellen automatisch erhoben und umfassen etwa 35 Millionen Sätze mit 500 Millionen Wörtern.

Mehr als reine Synonymsuche
Gibt man hier ein Wort ein, zum Beispiel «begeistern», erfährt man unter anderem, was das Wort bedeutet, wie geläufig es ist und wie es getrennt wird. Wichtig ist der Wortschatz vor allem für seine Synonymsuche. Es werden sowohl die Wörter aufgelistet, die als Synonym für «begeistern» verwendet werden können (ausflippen, berauschen, entflammen, enthusiasmieren, entzücken, mitreissen) als auch jene für die «begeistern» ein Synonym ist (antreiben, beflügeln, beschwören, beseelen, elektrisieren, ermutigen, locken, überzeugen). Bei Substantiven findet man zudem Angaben zur Flexion, ob es also im Genitiv «des Autors» oder «des Autoren» heisst. Beispielsätze helfen dabei, das gesuchte Wort praktisch anzuwenden.

Kontext graphisch dargestellt
Interessant finde ich die Angabe der Häufigkeitsklasse, so ist das Wort «der» um den Faktor 2^12 häufiger als «begeistern» und um den Faktor 2^21 häufiger als «enthusiasmieren» – ein Wort, von dem ich übrigens noch nie gehört habe, mich aber durchaus begeistern kann dafür … Ebenfalls werden die häufigsten linken und rechten Wortnachbarn gelistet und Wörter, die im Kontext erscheinen. Diese Wortverbindungen (in der Fachsprache Kollokationen und Kookurrenzen) sind mit der Datenbank verlinkt und in einer Grafik übersichtlich dargestellt.

Der deutsche Wortschatz: Grafik Kontextwörter zum Stichwort «Blog»

Wörter des Tages – auch als RSS-Feed
Es macht Spass, auch die übrigen Hilfsmittel des Portals zu entdecken. Unter anderem gibt es täglich um sieben Uhr die «Wörter des Tages». Heute unter anderem GewitterVolksaufstand und Gesundheitsreform (mit Assoziationsgraph und Häufigkeitsvergleich). Dazu werden verschiedene Tageszeitungen und Newsportale im Internet täglich ausgewertet. Die Aktualität eines Begriffs ergibt sich dabei aus seiner Häufigkeit heute, verglichen mit seiner durchschnittlichen Häufigkeit über längere Zeit hinweg. Ich habe gerade entdeckt, dass es die «Wörter des Tages» mittlerweise auch als RSS-Feeds gibt.

bild-41

Suche nach Anagrammen
Ausserdem lassen sich Anagramme abfragen. Aus «Helmut Kohl» wird «hohlem Kult», aus «Hans-Rudolf Merz» wird «harmlos furzend» und in Pascal Couchepin versteckt sich ein Cappuccino. Ich gebe zu, das ist nicht wirklich nutzbringend für Normalsterbliche, aber trotzdem eine nette Spielerei.

  • Kategorien
  • Tags

Kommentieren

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

* Pflichtfelder