Forschendes Lernen am sprachwissenschaftlichen Institut

Jupyter-Plattform für interaktives Scientific Computing

Im Rahmen des Universitätsprogramms Forschendes Lernen wurde am sprachwissenschaftlichen Institut eine auf dem Softwaresystem Jupyter aufsetzende Lehr- und Lernplattform für interaktives Scientific Computing eingerichtet. Jupyter-Notebooks ermöglichen das Verfassen reproduzierbarer Analysen, anschaulicher Beispiele und interaktiver Übungen, indem Text- und Formelsatz mit ausführbarem Code kombiniert und gemeinsam mit programmatisch generierten Grafiken dargestellt werden. Das interaktive Notebook ist dabei zugleich Forschungswerkzeug und Präsentationsform.

Screenshot ©Randal Olson, CC-BY-4.0
Screenshot ©Randal Olson, CC-BY-4.0

Der Jupyter-Notebook-Server am Sprachwissenschaftlichen Institut unterstützt zur Zeit die Sprachen Python, R und Julia. Gängige Bibliotheken aus den Bereichen Sprachverarbeitung, statistische Datenanalyse und -visualisierung sind bereits vorinstalliert. Anwender können zudem eigene Bibliotheken nachinstallieren.

Nutzungsberechtigt sind alle Forschenden des Sprachwissenschaftlichen Instituts, sowie Studierende aus teilnehmenden Lehrveranstaltungen. Forschenden wird nach Anfrage bei der Administration ein Account zugewiesen. Studierende erhalten Antragsbögen von ihren jeweiligen Dozenten.

Logo ©Project Jupyter
Logo ©Project Jupyter

Lehrveranstaltungen im Kontext Forschendes Lernen

Auf Basis der neu eingerichteten Scientific-Computing-Infra­struk­tur bietet das sprachwissenschaftliche Institut ein zweiteiliges Seminarprogramm an, in dem Studierende auf Basis von im Seminar vermittelten Methodenwissen erste, eigene Ideen für linguistische Forschung zu entwickeln und ihre Erkenntnisse miteinander austauschen zu können. Durch den Doppelcharakter des interaktiven Notebooks als Forschungswerkzeug sowie als Diskursform ist die Jupyter-Plattform für diese Art forschenden Lernens besonders geeignet.

Das Seminarprogramm gliedert sich in zwei eigenständige, sich ergänzende Veranstaltungen und widmet sich zum einen der Erhebung und Verarbeitung statischer Daten aus dem World Wide Web (das Web als Korpus), andererseits der Erhebung und Verarbeitung von Daten der Gesprächsinteraktion mit Probanden (das Web als Labor).

Beide Seminare werden Studierenden im Turnus angeboten. Teilnahmevoraussetzungen und -modalitäten entnehmen Sie bitte dem jeweils aktuellen Vorlesungsverzeichnis.

©Anthony Mattox, CC-NC-2.0
©Anthony Mattox, CC-NC-2.0

Erhebung und Verarbeitung linguistischer Daten

Hier werden den Studierenden Techniken vermittelt, mittels derer sie das Web als Korpusressource nutzen und auf Basis dort erhobener Daten eigene Forschungsfragen entwickeln und quantitativ bearbeiten können. Unter Verwendung von Akquiseverfahren wie dem Webscraping, als auch mit Hilfe der Programmierschnittstellen von Social-Media-Plattformen wie Twitter, erhalten Studierende eine praktische, auf eigenständige Forschungsarbeit ausgerichtete Einführung in das Scientific-Computing-Ökosystem der Programmiersprache Python. Schließlich lernen sie Methoden aus dem Bereich des Text Mining kennen, mittels derer die Studierenden aus den von ihnen erhobenen Daten Erkenntnisse in Hinblick auf Ihre Forschungsfragen erlangen können.

Webtechnologien für Dialogdaten

Das Komplement zu den statisch im Web vorzufindenden Daten bilden die experimentellen Daten der linguistischen Gesprächsforschung. Ein Seminar unter dem Motto forschendes Lernen in diesem Bereich gibt Studierenden die Methoden an die Hand, eigene Webapplikationen zu konzipieren und umzusetzen, mit denen Dialogdaten in der Form von Chat-Protokollen erhoben und linguistisch ausgewertet werden können.

Anwendungscontainer am sprachwissenschaftlichen Institut

Für linguistische Forschungsprojekte ist das Web eine attraktive Plattform, um im Rahmen von experimentellen Studien mit Teilnehmern in Interaktion zu treten. Besonders studentische Forschungsprojekte, die über keine oder wenig Ressourcen verfügen, um potenziellen Probanden eine Teilnahme attraktiver zu machen, profitieren davon, wenn Teilnehmer direkt, von zu Hause aus und über den Browser, an Studien mitwirken können.

Docker Logo © Docker, Inc
Docker Logo © Docker, Inc

Um es Studierenden zu ermöglichen, Forschungsprojekte durchzuführen, die auf Serverkapazitäten und Erreichbarkeit aus dem Internet angewiesen sind, können am sprachwissenschaftlichen Institut Anwendungscontainer auf Basis der Cloud-Plattform Docker betrieben werden. Hierzu wird in einem sog. Dockerfile, gleichsam wie in einem Kochrezept, der genaue Aufbau der Laufzeitumgebung einer Applikation festgehalten. Dies umfasst eine Beschreibung des genauen Aufbaus des Dateisystems mit allen Programmabhängigkeiten, Angaben zur Einbindung von persistentem Datenspeicher, sowie eine Auflistung aller Netzwerkports, über welche die Forschungsanwendung mit dem Internet kommuniziert.

Die formale Beschreibung der Umgebung des zu betreibenden Dienstes gewährleistet dabei, dass das Verhalten der entwickelten Applikation auf den Serverrechnern des sprachwissenschaftlichen Instituts mit dem Verhalten am studentischen Heimcomputer identisch ist. Da in Dockerfiles eine vollständige Laufzeitumgebung beschrieben wird, können Applikationen, die in dieser Form ausgeliefert werden, zudem von anderen Applikationen des Wirtssystems isoliert betrieben werden, um die Integrität des Wirtssystems und die Vertraulichkeit durch die Applikation ggf. erhobener, personenbezogener Daten zu gewährleisten.

Wenn Sie im Rahmen Ihres Studiums am sprachwissenschaftlichen Instituts eine Applikation über das Internet betreiben wollen, wenden Sie sich zu diesem Zweck an die Administration.