Referenzkorpus Frühneuhochdeutsch (1350–1650)

Aufbau des Korpus

Ziel des Projekts war die Erstellung eines Referenzkorpus für die frühneuhochdeutsche Sprachstufe im Rahmen des ‚Korpus historischer Texte des Deutschen‘ (ehemals ‚Deutsch Diachron Digital‘), in dem hochdeutsche Sprachdenkmäler des spätmittelalterlichen und frühneuzeitlichen Zeitraums von ca. 1350–1650 in strukturierter Auswahl zusammengefasst, digital verfügbar transkribiert, lemmatisiert sowie grammatisch annotiert wurden.

Das Projekt schließt an die bereits laufenden Referenzkorpusprojekte ‚Altdeutsch‘ und ‚Mittelhochdeutsch‘ an und nutzt alle dort entwickelten Methoden und Werkzeuge zur Digitalisierung (digital verfügbare Transkription/Annotation).

Anknüpfend an die bis 1350 reichende differenzierte Struktur des Referenzkorpus ‚Mittelhochdeutsch‘ wurde ein Korpus des Frühneuhochdeutschen gestaltet, das die Varianz der Periode hinsichtlich Diachronie, Diatopie, Medium und Textsorte abbildet.

Zusammensetzung

In das Referenzkorpus Frühneuhochdeutsch sind die Texte aus dem Bonner Frühneuhochdeutsch-Korpus eingeflossen, das zwischen 1972 und 1985 an der Bonner Forschungsstelle ‚Frühneuhochdeutsch‘ im Rahmen des Projekts ‚Flexionsmorphologie des Frühneuhochdeutschen‘ entstanden ist.
Nähere Informationen zur Zusammensetzung des Korpus finden sich in der Dokumentation.

Transkription und Annotation

Die Transkription und morphologische Annotation der Texte erfolgten in den Arbeitsstellen in Bochum (ReF.RUB inklusive ReF.RUB.ext) und Halle (ReF.MLU), die syntaktische Annotation erfolgte in der Arbeitsstelle Potsdam (ReF.UP).

Alle Texte wurden je nach Länge in einem Umfang von bis zu 20.000 Wortformen transkribiert und gemäß einem den Referenzkorpora gemeinsamen Tagset z.T. manuell und z.T. automatisch annotiert. Texte im Unterkorpus ReF.RUB.ext sind nur automatisch annotiert. Für mehr Informationen zur Annotation, siehe Annotationen.