Hauptseminar
Wintersemester 2011/12
Stefan Thater
Montag, 14-16 Uhr, Konferenzraum 2.11
Distributionelle Modelle der Wortbedeutung spielen in der korpusbasierten lexikalischen Semantik eine zentrale Rolle. Diese Modelle basieren auf Harris' (1954) distributioneller Hypothese, der zufolge die Bedeutungsähnlichkeit zwischen zwei Wörtern mit der Ähnlichkeit der Kontexte korreliert, in denen die Wörter vorkommen. Die Bedeutung einzelner Wörter wird durch sogenannete Kontextvektoren repräsentiert, die die statistische Verteilung des Wortes über relevante sprachliche Kontexte kodieren und als Punkte im „semantischen Raum“ aufgefasst werden können. Semantische Ähnlichkeit zwischen zwei Wörtern kann mittels gängiger Methoden der linearen Algebra auf einfache Weise aus diesen Kontextvektoren berechnet werden.
In diesem Seminar werden wir anhand aktueller Literatur zum Thema den Stand der Forschung untersuchen. Dabei werden wir uns auf zwei Fragestellungen konzentrieren:
Das Seminar kann auf Wunsch auch als Proseminar anerkannt werden.
Grundkenntnisse über Korpuslinguistik und statistische Methoden.