BBAW HAW
  Update: 24.10.2008
Home Suche Linkliste Übersicht Impressum

Ihr Wort?:


        

Wörterbuchauswahl:
 
WDG (176758) ?
DRW (110321) ?
DWB (296612) ?
2DWB (6904) ?
GWB (926) ?


...
   
ELEXIKO (277962) ?
VIPM (1447) ?


...
   
DWDS-Corpus ?


...
   

Worteinträge insgesamt:
870930
 
Digitales Wörterbuch der deutschen Sprache des 20. Jahrhunderts
Zurück zum Inhalt
Factsheet DWDS

Das Projekt DWDS erstellt in zwei Phasen ein umfassenden, aus den Quellen gearbeitetes wissenschaftliches Wörterbuch der deutschen Sprache vom Jahr 1900 bis zur Gegenwart. Das Ergebnis wird nicht einfach ein gedrucktes Wörterbuch sein, sondern eine recherchierbare lexikographische Datenbank.

Die Arbeit des Projekts gliedert sich dabei in zwei Abschnitte. In der ersten Projektphase (2000-2002) wurde eine Corpusdatenbank digitalisierter Textquellen des 20. Jahrhunderts zusammengestellt. In der zweiten Projektphase (2002-2007) wird das Referenzcorpus an schon bestehende Wörterbuchressourcen rückgebunden und damit schon ein vollgültiges Arbeitsinstrument. Ergebnisse eigener Wörterbuchmodule (Kollokationen, Phonologie etc.) des DWDS werden direkt in das Wörterbuchsystem eingearbeitet und erweitern Qualität und Datengrundlage.

Corpusdatenbank

Kerncorpus: Es besteht aus etwa 100 Millionen Textwörtern, ausgewogen in der Auswahl der Textsorten und in der Streuung über das 20. Jahrhundert. Die Größe dieses Kerncorpus orientiert sich an der Größe des British National Corpus.

Erweitertes Corpus: Es umfaßt neben dem Kerncorpus zusätzlich über eine Milliarde Textwörter. Hier ist die Auswahl "opportunistisch", d.h. sie richtet sich an leicht zugänglichen und digital verfügbaren Texten aus. In seinem Umfang entspricht etwa drei Millionen DIN-A4 Manuskriptseiten.

Textsorten: Die Auswahl der Texte wird von der Arbeitsgruppe und Mitgliedern der Berlin-Brandenburgischen Akademie der Wissenschaften begleitet und begutachtet. Ziel ist es, dem Ideal der Repräsentativität möglichst nahe zu kommen, und ein lexikographisches Corpus zusammenzustellen, das als ausgewogen und hinreichend groß in Bezug auf den Wörterbuchgegenstand "Wortschatz des 20. Jahrhunderts" bewertet werden kann.

  • Schöne Literatur (25%)
  • Journalistische Prosa (25%)
  • Fachprosa (20%)
  • Gebrauchstexte (20%)
  • (Transkribierte) Texte gesprochener Sprache (10%)
Wörterbuch

Durch Verknüpfung mit schon vorhandenen Quellen wie z.B. dem Wörterbuch der deutschen Gegenwartssprache (WDG) steht schon nach zweieinhalb Jahren Projektlaufzeit der Öffentlichkeit ein abfragbares Wörterbuch zur Verfügung. Durch die Einwerbung des Wolfgang-Paul Preises konnte das Wörterbuchmodul "Kollokationen" auf den Weg gebracht werden. Geplant sind weiterhin die Module "Phonologie" und "Morphologie".