Daten- und Korpusorientierte Computerlinguistik

Seminar

Leitung: Hans Uszkoreit, Wojciech Skut, Tania Avgustinova, Thorsten Brants, Brigitte Krenn

Ort: Geb. 17.3 Seminarraum

Beginn: 18.04.97 - Zeit: geändert: Fr 13:00 - 14:30



Kursplan:

18.4. Einführung in die Daten- und Korpusorientierte CL (1)
26.4. Einführung in die Daten- und Korpusorientierte CL (2)
2.5. Annotation und Flache Verarbeitung im NEGRA-Projekt
(Aufruf des Programms `Annotate')
9.5. Annotation ausgewählter Phänomene (1)
16.5. Annotation ausgewählter Phänomene (2)
23.5. Unix-Tools zur Verarbeitung von Korpora (Folien)
30.5. -- entfällt --
6.6. Nominalphrasen/Präpositionalphrasen
13.6. Verbsyntax
20.6. 1) Carsten Brockmann: Abgrenzung, Klassifikation und Distribution von Adjektivphrasen
(Folien)
2) Joachim Sauer: Komplemente und freie Ergänzungen von Adjektiven
27.6. Oliver Döpner: Adjektivphrasen (Komparation)
4.7.
11.7. Thomas Escher: Valenztransformation
18.7. Stefan Thater: Koordination



In vielen syntaktischen und semantischen Theorien liegt das Hauptaugenmerk auf ausgewählten Phänomenbereichen, die meistens auch in Isolation betrachtet werden (Fernabhängigkeiten, freie Wortstellung, Adjunktanbindung in der Syntax, Quantorenskopus in der Semantik usw.).

In Wirklichkeit tritt jedoch keines dieser Phänomene isoliert auf. Aus diesem Grunde hat sich eine umfassende Beschreibung realer Sprache durch rein introspektive theoretische Forschung als sehr problematisch erwiesen. Datenorientierte Methoden gewinnen daher immer mehr an Bedeutung (Korpora, Treebanks usw.).

In dem Seminar soll die Interaktion von verschiedenen sprachlichen Faktoren auf Grundlage von Korpusdaten untersucht werden. Als Übung werden dabei Texte mit syntaktischen Strukturen und Kategorien annotiert. Das Annotierschema sollen die Kursteilnehmer unter Anleitung der Dozenten entwickeln.

Das Seminar eignet sich als Fortsetzungs- und Vertiefungsveranstaltung zu den Kursen Einführung in Syntax und Morphologie sowie Grammatiktheorie.


Literatur:

Mitchell Marcus, Grace Kim, Mary Ann Marcinkiewicz, Robert MacIntyre, Ann Bies, Mark Ferguson, Karen Katz and Britta Schasberger. The Penn Treebank: Annotating Predicate Argument Structure. In Proceedings of the Human Language Technology Workshop, San Francisco, March, 1994. Morgan Kaufmann.

Wojciech Skut, Brigitte Krenn, Thorsten Brants and Hans Uszkoreit. An Annotation Scheme for Free Word Order Languages. In Proceedinngs of ANLP-97, Washington, 1997.

Christine Thielen and Anne Schiller. Ein kleines und erweitertes Tagset fürs Deutsche. In Tagungsberichte des Arbeitstreffens Lexikon + Text 17./18. Februar 1994, Schloß Hohentübingen. Lexicographica Series Maior, Tübingen, 1995. Niemeyer.

Atro Voutilainen and Pasi Tapanainen. Ambiguity resolution in a reductionistic parser. In Proceedings of EACL-93, pages 394 - 403, 1993.


Voraussetzungen:

Einführungskurs Syntax und Morphologie


Stellung im Studienplan:

Wahlpflichtveranstaltung; CL-Pro- bzw. Hauptseminar


Scheine:

nach Absprache


Letzte Änderung: 25. Mai 1997 Thorsten Brants