SGF – Sekimo Generic Format/XStandoff
Das Sekimo Generic Format (SGF) wurde im Rahmen des Sekimo-Projektes an der Universität Bielefeld entwickelt, um mehrfach annotierte Korpusdaten XML-konform strukturiert speichern und analysieren zu können (inkl. überlappender Strukturen). Es vereint Elemente der Standoff- und Inline-Annotation und erlaubt sowohl Baum- als auch Graphen-basierte Darstellung und Speicherung. Eine ausführliche Vorstellung des Formats findet sich in Stührenberg & Goecke, 2008. Die Verwendung als Format zur strukturierten Speicherung lexikalischer Ketten (SGF-LC) ist in Waltinger et al., 2008 beschrieben. Darüber hinaus kommt SGF als Import- und Exportformat der aktuellen Version des Web-basierten Annotationswerkzeug Serengeti im Rahmen der AnaphoricBank und des Projekts AnaWiki zum Einsatz.
Die erweiterte aktuelle Entwicklungsversion trägt den Namen XStandoff. Weitere Informationen dazu finden sich unter https://xstandoff.net.
Die XML Schemata für das Sekimo Generic Format lassen sich über die folgenden URIs laden:
Version 1.0 (stable release)
SGF-Schemata:
Anmerkung: Die SGF-Schemata stehen unter der GNU Lesser General Public License (LGPL v3) zur Verfügung.
- Basisebene (sgf.xsd; XML Namespace: http://www.text-technology.de/sekimo):
https://www.maik-stuehrenberg.de/files/sgf/1.0/sgf_stable.zip - Logging-Funktionalität (vorrangig für Verwendung mit dem Web-basierten Annotationswerkzeug Serengeti; log.xsd; XML Namespace: http://www.text-technology.de/sekimo/log):
https://www.maik-stuehrenberg.de/files/sgf/1.0/log_stable.zip
Zusätzliche Schemata zur Verwendung mit SGF:
- Das im Sekimo-Projekt verwendete XSD für die logische Dokumentstruktur (doc.xsd; XML Namespace: http://www.text-technology.de/sekimo/doc):
https://www.maik-stuehrenberg.de/files/sgf/1.0/doc.xsd - Das im Sekimo-Projekt verwendete adaptierte XSD für die Ausgabe des Machinese Syntax Dependenz-Parser von Connexor Oy (cnx.xsd; XML Namespace: http://www.text-technology.de/sekimo/cnx):
https://www.maik-stuehrenberg.de/files/sgf/1.0/cnx.xsd
Das Copyright für die zugrunde liegende DTD fdg3.dtd liegt bei Connexor Oy! - Das im Sekimo-Projekt verwendete XSD für die Speicherung semantischer Relationen (chs.xsd; XML Namespace: http://www.text-technology.de/sekimo/chs):
https://www.maik-stuehrenberg.de/files/sgf/1.0/chs.xsd - Das in der AnaphoricBank und dem Projekt AnaWiki verwendete XSD für die logische Dokumentstruktur (ana_doc.xsd; XML Namespace: http://www.text-technology.de/anawiki/ds):
https://www.maik-stuehrenberg.de/files/sgf/1.0/ana_doc.xsd - Das in der AnaphoricBank und dem Projekt AnaWiki verwendete XSD für zur Annotation von Markables mit Hilfe des Web-basierten Annotationswerkzeug Serengeti (ana_markables.xsd; XML Namespace: http://www.text-technology.de/anawiki/mark):
https://www.maik-stuehrenberg.de/files/sgf/1.0/ana_markables.xsd - Das in der AnaphoricBank und dem Projekt AnaWiki verwendete XSD für zur Annotation von semantischen Relationen mit Hilfe des Web-basierten Annotationswerkzeug Serengeti (ana_semrels.xsd; XML Namespace: http://www.text-technology.de/anawiki/relation):
https://www.maik-stuehrenberg.de/files/sgf/1.0/ana_semrels.xsd - Das in der AnaphoricBank und dem Projekt AnaWiki verwendete XSD für die strukturieret Speicherung von MASXML-Dateien basierend auf der GNOME DTD von Massimo Poesio (ana_masxml.xsd; XML Namespace: http://www.text-technology.de/anawiki/masxml):
https://www.maik-stuehrenberg.de/files/sgf/1.0/ana_masxml.xsd - Das im Indogram-Projekt verwendete XSD für die strukturierte Speicherung lexikalischer Ketten als Exportformat (SGF-LC) des Scientific Workplace (lc.xsd; XML Namespace: http://www.text-technology.de/sekimo/lc):
http://wwws.maik-stuehrenberg.de/files/sgf/1.0/lc.xsd
Version 1.1 (XStandoff Format)
Für die aktuelle Version und weitere Informationen besuchen Sie bitte http://www.xstandoff.net.