Computational Linguistics & Phonetics Computational Linguistics & Phonetics Fachrichtung
                4.7 Universität
                des Saarlandes
main

research

projects

publications

teaching

CV

@ DFKI


Habilitationsstipendium der Deutschen Forschungsgemeinschaft (DFG)

Modulare Entwicklung implementierbarer Grammatiken für verwandte Sprachen am Beispiel der slavischen Sprachfamilie

(Zusammenfassung)
Ziel des Vorhabens ist die Entwicklung modularer auf dem Computer implementierter Grammatiken für repräsentative slavische Sprachen mit einer gemeinsamen Kerngrammatik und Komponenten, die sich parametrisiert in mehr als einer Sprachbeschreibung verwenden lassen.
Geplant ist zunächst eine komparative Untersuchung ausgewählter slavischer Sprachen mit dem Ziel, sprachübergreifende Phänomene zu ermitteln, die sich für die Beschreibung in einer Kerngrammatik eignen. Die einzelnen Beschreibungen sollen dann als Module der Kerngrammatik formuliert werden. Bisher sind drei Phänomenklassen für diese Arbeit vorgesehen: das Kasus- und Genussystem; Konstruktionen, die gewöhnlich durch Einführung leerer syntaktischer Kategorien behandelt werden; sowie die Wortstellung. Dabei wird das Hauptaugenmerk auf dem Russischen und Bulgarischen liegen, in etwas geringerem Maße aber auch auf dem Tschechischen und/oder Polnischen. Mit dieser Auswahl soll erreicht werden, daß verschiedene slavische Sprachgruppen exemplarisch vertreten sind.
Die eigentliche Formalisierung soll im Rahmen der Head-Driven Phrase Structure Grammar (HPSG) erfolgen, was die Möglichkeit bietet, alle Komponenten der Grammatik in einem einheitlichen Formalismus zu repräsentieren und bestehende Computersysteme für die Entwicklung und Verarbeitung von Grammatiken zu verwenden. Der geplante Einsatz der HPSG wird ein Test für die vielgepriesene Modularität und den Universalitätsanspruch des Grammatikmodells sein. Es ist zu erwarten, daß, wie bereits in früheren Vorarbeiten demonstriert, Grammatikmodell und -theorie modifiziert werden müssen, um den gesetzten Ansprüchen gerecht werden zu können.
Die Implementation auf dem Rechner wird der Verifikation der theoretischen Ergebnisse dienen. Die implementierten Beschreibungen sollen anderen Einrichtungen für Forschung, Lehre und Anwendungsentwicklung zur Verfügung gestellt werden.
Die theoretischen und praktischen Ergebnisse sollen den drei sprachwissenschaftlichen Disziplinen zugute kommen, deren Methoden und Theorien für den Erfolg des interdisziplinären Vorhabens benötigt werden.
Der Nutzen des Vorhabens für die Computerlinguistik ist die Wiederverwendbarkeit der gemeinsamen Bausteine und somit die Reduktion der Entwicklungszeit für neue Grammatiken. Daher müssen die fortgeschritteneren Methoden für die Grammatikspezifikation und für die grammatische Analyse eingesetzt werden.
Der erwartete Nutzen für die Slavistik ist die Präzisierung von komparativen Theorien und sprachübergreifenden Generalisierungen sowie deren Überprüfung. Hier liegt der theoretische Kern des Projekts, denn um die Aufgabe lösen zu können, müssen die Erkenntnisse und Theorien der slavischen Sprachwissenschaft in einer viel größeren Breite aber auch in einer größeren Tiefe in die computerlinguistische Arbeit einbezogen werden, als das in der Vergangenheit der Fall war.
Für die allgemeine Sprachwissenschaft werden Erkenntnisse darüber erwartet, inwieweit sich neue formale Grammatikmodelle, die zunächst rein synchronisch das grammatische Wissen eines einzelnen Sprechers repräsentieren sollen, auch für den Einsatz in der komparativen Arbeit und in der Beschreibung sprachfamilienspezifischer Phänomene eignen. Eine solche Eignung ist längerfristig gesehen auch eine Vorbedingung für den Einsatz der formalen Verfahren in der Beschreibung von Sprachwandel.
^top of this page