Online-Suchinterfaces für große deutschsprachige Standardkorpora Dr. M.О. Katam
Online-Suchinterfaces für große deutschsprachige Standardkorpora Dr. M.О. Katamadze Digitales Wörterbuch der deutschen Sprache DWDS als Lexikon und als Korpusressource mit einer Wort-im-Kontext- Ausgabe (KWIC) sowie mit verschiedenen statistischen Instrumenten nutzbar. DWDS als Lexikon Informationen: • zur Grammatik des Worts (Wortart, Informationen zur Flexion, zu alternativen Formen, zur Silbentrennung und morphologischen Zusammensetzung), • zur Bedeutung (mit Wortdefinitionen, getrennt nach verschiedenen Lesarten bei Polysemen und Homonymen), • zur Etymologie (nach Pfeifer 1993), • ein Wortfeld mit assoziierten Lexemen mit Beispielsätzen aus den DWDSKorpora. • Angaben zur relativen Worthäufigkeit anhand von Frequenzkurven (pro Millionen Token im zugrunde liegenden Korpus) auf einer Zeitachse von ca. 1600 bis 2000 anzeigt. Verlaufskurven zu Wörtern „gendergerecht“, „Flüchtlingskrise“ gendergerecht Flüchtlingskrise Wortverlaufskurven und deren linguistisch relevante Analyse • kollabieren • konform • die Mauer • debattieren • integrationsunwillig • Gendervielfalt • Gutmensch • Frauenrecht • Gleichberechtigung • postfaktisch DWDS als Korpusressource • Suche nach Lemmata Da DWDS in erster Linie als Lexikon konzipiert ist, sollen sämtliche Formen eines Paradigmas zu demselben Eintrag führen. Deshalb sucht die Eingabe eines Suchbegriffs wie Hund automatisch nach der Grundform und somit auch nach flektierten Formen. • Suche nach Wortformen Will man eine bestimmte Form finden, so muss man der gesuchten Form ein @- Zeichen voranstellen. Die Suche @Hundes findet also ausschließlich die Form Hundes, einschließlich Groß- und Kleinschreibung. DWDS als Korpusressource • Suche nach Wortarten erfolgen mittels der Kategorien des STTS. Diese werden ohne Anführungszeichen hinter den Ausdruck $p= gesetzt, der die Suchvariable ›Wortart‹ spezifiziert. Die Suche $p=ADJA findet somit alle als attributive Adjektive annotierten Einheiten im Korpus. • Suchen mit regulären Ausdrücken werden wie folgt unterstützt: Das Sternchen an den Rändern des Suchausdrucks drückt eine beliebige Zeichenkette aus. Hierdurch werden nur dem Suchausdruck entsprechende Wortformen gefunden: *wand findet alle Wortformen, die auf -wand enden. *igkeit findet alle Wörter, die auf -igkeit enden. DWDS als Korpusressource • Suche nach Abfolgen Direkte Abfolgen werden durch Nebeneinanderstellen verschiedener Suchelemente ausgedrückt. Die gesamte Abfolgesuche wird in Anführungszeichen gesetzt. So findet der Suchausdruck $p=ART $p=ADJA $p=NN alle unmittelbaren Abfolgen von Artikelwörtern, Adjektiven und Nomina. Um einen Maximalabstand bzw. Abstandsbereich zu definieren, wird zwischen dem präzedenten Ausdruck und dem nachfolgenden Element die maximale Anzahl von dazwischenstehenden Elementen nach dem Rautenzeichen definiert: @sein #3 Hund findet Folgen der Wortform sein und dem Lemma Hund, wobei bis zu drei Elemente dazwischen stehen dürfen. Für den exakten Abstand wird zwischen Raute und Zahl ein Gleichheitszeichen eingefügt; analog gilt dies für den Ausdruck »größer als« (">") und »kleiner als« ("<"). Man kann auch die Anfrage präziser formulieren: @sein $p=ADJA #3 Hund uploads/Litterature/ online-suchinterfaces-f-252-r-gro-223-e-standardkorpora.pdf
Documents similaires










-
42
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jui 30, 2021
- Catégorie Literature / Litté...
- Langue French
- Taille du fichier 0.1787MB