Projektseminar – Sommersemester 2008    

Maik Stührenberg & Ulli Waltinger

Linguistik B.A., Texttechnologie B.A., Interdisziplinäre Medienwissenschaft, M.A.     4-6 LP/4 SWS
Mittwoch, 12-16 Uhr, Raum C01-277     Beginn: 09.04.2008
Veranstaltungsnummer/Modul:     230138/BaLinTT4.1/Modul 3, Modul 6 (Wahlpflicht)

Das Projektseminar knüpft an die Arbeit der Teilprojekte A2 und A4 der DFG-Forschergruppe "Texttechnologische Informationsmodellierung" an und verfolgt zwei Projektziele: die Entwicklung eines webbasierten Fachsprachenlexikons und die Implementierung einer Architektur zur Manipulation multipel annotierter Daten.

Die Projektarbeit soll den Studierenden einen Einblick in die angewandte Computerlinguistik und Texttechnologie gewähren, indem beginnend mit der Materialsammlung, -aufbereitung (Tokenisierung, Lemmatisierung, Filterung) eine auf Wortkokkurrenzen aufbauende Darstellung von Fachsprachen entwickelt wird, die anschließend durch eine Schnittstelle für Benutzer zugänglich gemacht werden soll. Durch die Projektarbeit soll eine Brücke zwischen dem texttechnologischen Wissen und seiner praktischen Anwendung geschlagen werden. Das Projektseminar bietet einen Einstieg in die praktische Linguistik, indem den Studierenden die Möglichkeit gegeben wird, eine praxisorientierte texttechnologische Aufgabe in Gruppenarbeit zu bewältigen.

Das Projektseminar ist in eine Folge von teils aufeinander aufbauenden Teilprojekten gegliedert. Dabei sollen weitestgehend bereits existierende Tools zur Bewältigung der Aufgaben wieder verwendet werden. Programmierarbeit erfordert die Berechnung statistischer Maße. Als Programmiersprachen kommt neben Java auch XSLT zur Verarbeitung XML-annotierte Daten zum Einsatz. Die Teilaufgaben gliedern sich im Einzelnen wie folgt:

  1. Parsen der Rohdaten (Java/C+)
  2. Berechnung der Kookkurrenzen und Annotation der Daten (Java/C+/XML/XSLT)
  3. Modellierung einer Datenbank/eines Repräsentationsformats zur Speicherung der Daten (RDBMS/native XML DBMS/XQuery)
  4. Erarbeitung von Methoden zur Verarbeitung multipel annotierter Daten
  5. Visualisierung (PHP/XSLT/XHTML)

In den ersten Sitzungen findet eine Einführung in die Programmiersprache Java statt, in der alle nötigen Grundlagen für die einzelnen Projekte vermittelt werden. Programmierkenntnisse für die Projektarbeit sind nicht zwingend erforderlich. Kenntnisse in den anderen verwendeten Techniken wie XML/XSLT werden bei Bedarf vermittelt. Alle Projektgruppen werden an die Thematik zur Bearbeitung und Lösung der Projektaufgaben herangeführt.

Für den Erwerb eines Leistungsnachweises ist neben der aktiven Teilnahme das erfolgreiche Bearbeiten eines Teilprojekts (in Einzel- oder Gruppenarbeit) nebst zugehöriger Dokumentation erforderlich. Seminarunterlagen und Seminarplan werden in Stud.IP bereit gestellt.


Weitere Veranstaltungen im aktuellen Semester:


Bisher veranstaltete Seminare: