Computational Linguistics & Phonetics Co
mputational Linguistics & Phonetics Fachrichtung 4.7Universit344t des Saarlan
des

Proseminar Linguistische Annotation (SS 2010)


Gruppenarbeit

Ziel der Gruppenarbeit ist es,

a) ein Gefühl für die Probleme semantischer Annotation zu bekommen und
b) zwei verschiedene Annotationsschemata miteinander zu vergleichen.

Bei den Schemata handelt es sich um FrameNet und WordNet (bzw. SALSA und GermaNet, die deutschen Versionen der beiden Annotationsschemata).

Bilden Sie Gruppen mit je 2 Personen. Jede Gruppe bekommt eine Annotationsaufgabe.

  1. Annotieren Sie zuerst einzeln die Ihnen zugewiesenen Sätze. Senden Sie die von Ihnen annotierten Sätze bis zum 14.05.2010 per Mail an: rehbein@coli.uni-sb.de

  2. Vergleichen Sie dann zu zweit Ihre Annotationen und adjudizieren sie. Senden Sie die adjudizierten Sätze bis zum 20.05.2010 per Mail an: rehbein@coli.uni-sb.de

  3. Betrachten Sie jetzt das Annotationsschema, das Sie nicht für Ihre Annotationen benutzt haben. Welches der beiden Schemata finden Sie besser geeignet für die Annotation?
    Begründen Sie Ihre Entscheidung. Beziehen Sie dabei auch schwierige Fälle mit ein, für die sie während der Annotation keine Übereinstimmung erzielt haben. Machen Sie Vorschläge, wie man den Annotationsprozess verbessern könnte. Fassen Sie Ihre Ergebnisse in der Gruppe zusammen und senden Sie diese bis zum 24.05.2010 per Mail an: rehbein@coli.uni-sb.de

Annotationsschemata

FrameNet (SALSA)

WordNet (GermaNet)



HowTo


  1. Loggen Sie sich im PC-Pool ein und wechseln Sie in das Verzeichnis
    /proj/contrib/salto/Salto_download

  2. Starten Sie das Salto-Annotationstool mit folgendem Kommando:
    >sh Salto.sh
    Warten Sie, bis sich das Salto-Annotationstool geöffnet hat.

  3. Loggen Sie sich in Salto ein (Login: lingan)

  4. Öffnen Sie die zu annotierende Datei (File->Open File oder Strg-O). Beim Öffnen erscheint eine Fehlermeldung, die besagt, dass das TIGER-Corpus nicht gefunden werden kann. Das ist ok, denn Sie annotieren Daten aus einem anderen Korpus (Wahrig-Korpus). Ignorieren Sie die Fehlermeldung.
    Jetzt können Sie mit dem Annotieren beginnen. Vergessen Sie nicht, ab und zu zu speichern. Sollte das System zwischendurch abstürzen (ja, sowas kommt vor), verlieren Sie alle ungesicherten Daten. Beim Speichern werden Sie gefragt, in welcher Phase des Annotationsprozesses Sie sich befinden (Annotation, Adjudikation, Meta-Adjudikation). Wählen Sie die entsprechende Option aus und sichern Sie die Daten.

    Die Dateien befinden sich in einem Ordner mit Ihrem Namen:

    • Gruppe I, FrameNet(SALSA): Melanie, Benjamin:
      Pfad: /proj/contrib/salto/Salto_download/melanie|benjamin/
      Dateien: Ausgang1.FN.xml, ausgehen1.FN.xml

    • Gruppe II, WordNet(GermaNet): Dogan, Patricia:
      Pfad: /proj/contrib/salto/Salto_download/dogan|patricia/
      Dateien: Ausgang2.WN.xml, ausgehen2.WN.xml
Viel Spaß!