Seminar "Einführung in die Texttechnologie" – Wintersemester 2003/2004

Proseminar   M.A., Prom.
Dienstag, 14-16 Uhr, Raum B 26   Beginn: 21.10.2003

In der Computerlinguistik ist die Texttechnologie ein stetig wachsender Bereich. Digitale Texte finden sich in nahezu allen Bereichen unseres alltäglichen Lebens: im Internet, in Dialogsystemen oder in der Textverarbeitung zu Hause.

Dieses Seminar beschäftigt sich mit dem Aufbau von (digitalen) Texten und ihrer weiteren Verarbeitung. Mit der eXtensible Markup Language (XML), die in den letzten Jahren einen triumphalen Siegeszug durch sämtliche Bereiche der computer-unterstützten Textverarbeitung angetreten hat, gibt es dafür einfach zu nutzende und frei verfügbare Werkzeuge. XML kommt nicht nur in Verlagen zum Einsatz, sondern dient auch als grundlegendes Format für aktuelle Versionen von Textverarbeitungsprogrammen wie OpenOffice oder MS Word.

Im ersten Schritt werden Texte in XML annotiert, d.h. mit einer logischen Struktur versehen. So mit Informationen angereichert, können die Texte mit Hilfe standardisierter Verfahren anschließend in andere Formate (z. B. für die Print- und Onlineausgabe) überführt werden. Damit ist XML ein wesentlicher Grundbaustein für das Single-Source-Publishing, also die automatisierte mehrfache Ausgabe von Inhalt in verschiedenen Formaten, sowie zahlreiche weitere computerlinguistische Anwendungsbereiche, u.a. das automatische Zusammenfassen von Texten oder die Realisierung intelligenter Zugriffsmöglichkeiten auf große Textbestände.

Für den Erwerb eines Leistungsnachweises ist die Bearbeitung der im Seminar gestellten Übungsaufgaben und der Abschlussklausur erforderlich.

Seminarplan

21.10. Organisatorisches
28.10. Grundlegendes
03.11. Hypertexte
11.11. HTML
17.11. HTML
25.11. HTML
02.12. Einführung in die Strukturierung von Informationen mit Hilfe von Markup- und Metasprachen
09.12. XML
16.12. XML
13.01. XML
20.01. XML - Übung
27.01. Formalismen und Standards: XPath
03.02. Formatierung und Transformation
10.02. Formatierung und Transformation
17.02. Klausur

Begleitend zum Seminar wird auf der eLearning-Plattform Stud.IP die Möglichkeit zur organisierten Gruppenarbeit und Kommunikation gegeben. Die Vergabe von gültigen Kennungen und eine Einführung in die Arbeit mit Stud.IP wird in der ersten Sitzung durchgeführt.