Computational Linguistics & Phonetics Computational Linguistics & Phonetics Fachrichtung 4.7 Universität des Saarlandes

Web-basierte Techniken in der Computerlinguistik

Proseminar, Wintersemester 2012/13

Leitung: Michaela Regneri, Stefan Thater
Ort: Konferenzraum 2.11, Geb. C72
Zeit: Dienstag, 10:15 - 11:45
Beginn: 23.10.2012

Inhalt

Das Proseminar befasst sich mit dem Internet als (Wissens-) Ressource für verschiedene computerlinguistische Anwendungen. Anhand aktueller Literatur zum Thema werden wir den Stand der Forschung untersuchen und auf folgende Aspekte eingehen:

  • Unterschiedliche Arten von Textquellen, etwa strukturierte Seiten (wie Wikipedia) oder Google-Suchergebnisse (Trefferzahlen und gefundene Texte)
  • Besonderheiten meinungstragender Textquellen, konkret (Micro-)Blogs
  • Die Aufarbeitung von Web-Texten zu anderen computerlinguistichen Resourcen (wie Ontologien oder annotierte Korpora)
  • Verschiedene Möglichkeiten, über Crowdsourcing (Mechanical Turk, Online-Spiele) Computerlinguistische Aufgaben zu lösen.
  • Unterschiedliche andere linguistische Aufgabenstellungen, für die das Web auf diverse Arten nützlich sein kann (z.B. Bestimmung semantischen Relationen)

Thematisiert werden auch die konkrete technische Umsetzung in web-basierten Systemen sowie (vor- und nachteilige) Besonderheiten bei der Benutzung des Internets als Textressource.

Voraussetzungen

Basiskenntnisse über Korpuslinguistik und elementare statistische Methoden sind von Vorteil, aber keine notwendige Bedingung zur Teilnahme. Die Themen können an die Vorkenntnisse der Teilnehmer angepasst werden.

Prüfungsleistung

  • Vortrag
  • Hausarbeit
  • regelmäßige Teilnahme
  • mündliche Prüfung (optional)

Leistungspunkte

5 LP