Computational Linguistics & Phonetics Computational Linguistics & Phonetics Fachrichtung 4.7 Universität des Saarlandes

Semantic Processing

Softwareprojekt: Computerlinguistik, 2. Studienabschnitt

Leitung: Pinkal, Sporleder
Ort: Geb. C7.4, 3.04
Zeit: Mi, 29.10.2008, 16:00 s.t. (Vorbesprechung)
Beginn: Mi, 29.10.2008
Geeignet für: B.Sc.

Wir bieten zwei Softwareprojekte im Rahmen des SALSA-Projekts an (beide Projekte können in mehrere Teilprojekte aufgeteilt werden):

1. Wikipedia als linguistisches Korpus: Es geht darum Wikipedia-Text mit linguistischen Annotationen anzureichern (Tokenisierung, Lemmatisierung, POS-Tagging etc.). Dabei soll die Linkstruktur erhalten bleiben und ggf. ein GUI zur leichteren Abfrage implementiert werden.

2. Datenanalysetool zur Wortbedeutungsdesambiguierung: Implementierung eines Programmes zur Datenextraktion. Das Programm soll verschiedene Sichten auf die Daten erlauben (POS-Tag, syntaktischer Kontext, lexikalischer Kontext, Kombinationen verschiedener Sichten etc.) und es dem Nutzer dadurch ermöglichen, herauszufinden, welche Information am relevantesten für die Desambiguierung ist.

Meldet euch bei Interesse beim SALSA-Projekt: salsa-mit@coli

Scheine
Implementierung und Dokumentation

Leistungspunkte
B.Sc. 12 LP