Sekundäre Informationsstrukturierung und vergleichende Diskursanalyse (Sekimo)
DFG-Forschergruppe "Texttechnologische Informationsmodellierung"

Von September 2005 bis März 2009 habe ich als Wissenschaftlicher Mitarbeiter im Projekt A2, "Sekundäre Informationsstrukturierung und vergleichende Diskursanalyse (Sekimo)" im Rahmen der von der Deutschen Forschungsgemeinschaft (DFG) geförderten verteilten Forschergruppe "Texttechnologische Informationsmodellierung" gearbeitet. Gegenstand des Projekts ist die Verknüpfung heterogener linguistischer Ressourcen. Neben annotierten Textdokumenten existieren externe Ressourcen wie Grammatiken, Lexika oder Ontologien. Das Projekt fokussiert den Einsatz der genannten Informationen in ihrem ursprünglichem Format ohne aufwändige vorherige Konvertierung.

Im Rahmen des Projekts wurde das XML-basierte generische Repräsentationsformat SGF (Sekimo Generic Format) entwickelt. SGF erlaubt es, multiple Annotationen in einer Datei zu speichern, Annotationen mit den Primärdaten in Beziehung zu setzen und auf Abhängigkeiten hin zu analysieren. Informationen über eine weiter entwickelte Version von SGF, XStandoff, finden sich unter http://www.xstandoff.net.