Normalisierung

Zur Erleichterung der automatischen Analyse und Weiterverarbeitung (aus computerlinguistischer Perspektive) sind die meisten Texte des Anselm-Korpus manuell normalisiert worden. Hierunter verstehen wir – grob gesagt – eine Abbildung der historischen Formen auf modernes Deutsch, die in folgenden Guidelines genauer beschrieben ist:

  • Krasselt, J., Bollmann, M., Dipper, S., & Petran, F. (2015). Guidelines für die Normalisierung historischer deutscher Texte / Guidelines for Normalizing Historical German Texts. Bochumer Linguistische Arbeitsberichte, 15. [PDF]

Weiterführende Informationen folgen hier in Kürze, bzw. finden sich bereits auf der englischsprachigen CL-Webseite.