Web-basierte Techniken in der Computerlinguistik
Proseminar, Wintersemester 2012/13
Leitung: | Michaela Regneri, Stefan Thater |
Ort: | Konferenzraum 2.11, Geb. C72 |
Zeit: | Dienstag, 10:15 - 11:45 |
Beginn: | 23.10.2012 |
Inhalt
Das Proseminar befasst sich mit dem Internet als (Wissens-) Ressource für verschiedene computerlinguistische Anwendungen. Anhand aktueller Literatur zum Thema werden wir den Stand der Forschung untersuchen und auf folgende Aspekte eingehen:
- Unterschiedliche Arten von Textquellen, etwa strukturierte Seiten (wie Wikipedia) oder Google-Suchergebnisse (Trefferzahlen und gefundene Texte)
- Besonderheiten meinungstragender Textquellen, konkret (Micro-)Blogs
- Die Aufarbeitung von Web-Texten zu anderen computerlinguistichen Resourcen (wie Ontologien oder annotierte Korpora)
- Verschiedene Möglichkeiten, über Crowdsourcing (Mechanical Turk, Online-Spiele) Computerlinguistische Aufgaben zu lösen.
- Unterschiedliche andere linguistische Aufgabenstellungen, für die das Web auf diverse Arten nützlich sein kann (z.B. Bestimmung semantischen Relationen)
Thematisiert werden auch die konkrete technische Umsetzung in web-basierten Systemen sowie (vor- und nachteilige) Besonderheiten bei der Benutzung des Internets als Textressource.
Voraussetzungen
Basiskenntnisse über Korpuslinguistik und elementare statistische Methoden sind von Vorteil, aber keine notwendige Bedingung zur Teilnahme. Die Themen können an die Vorkenntnisse der Teilnehmer angepasst werden.
Prüfungsleistung
- Vortrag
- Hausarbeit
- regelmäßige Teilnahme
- mündliche Prüfung (optional)
Leistungspunkte
5 LP