| Main » Was ist Computerlinguistik? |
|
Was ist Computerlinguistik?
Die Computerlinguistik ist noch ein sehr junges Fach: Die ersten Studiengänge sind weltweit in den achtziger Jahren entstanden. Computerlinguisten erforschen menschliche Sprache, wofür sie formale Modelle verwenden, die auf dem Computer realisiert werden können.
Computerlinguistik verbindet also Inhalte und Methoden aus der Informatik und der Sprachwissenschaft, und benutzt dabei Teile der Mathematik (besonders die Formale Logik) als Grundlage. Auf diese Weise gewinnt sie Erkenntnisse über die Lautstruktur, die Satzstruktur und die Bedeutungsstruktur von Sprachen, und über die Art und Weise, wie Menschen Sprache verstehen, produzieren und lernen.
Diese Erkenntnisse werden zur Entwicklung von Computersystemen angewendet. Beispiele für sprachverarbeitende Systeme sind:
- Natürlichsprachliche Zugangssysteme, die den Dialog mit dem Computer in gesprochener und geschriebener Sprache ermöglichen -- z.B. unser sprechender Fahrstuhl :-)
- Textverstehende Systeme, die automatisch Wissen aus Dokumenten extrahieren - mit der Frage, wie man Grammatik aus Texten extrahiert, befaßt sich zum Beispiel das NEGRA-Projekt.
- Maschinelle Übersetzungssysteme wie das System des berühmten Verbmobil-Projektes.
- Systeme für Rechtschreib-, Grammatik- und Stilkorrektur, die das Formulieren in einer Fremdsprache erleichtern.
Wenn man ehrlich ist, muß man allerdings hinzufügen, daß die heute verfügbaren Systeme noch nicht der Weisheit letzter Schluß sind. Es muß also noch viel Grundlagenforschung betrieben werden. Auch in diesem Bereich gibt es in Saarbrücken einige Projekte, darunter das CHORUS- und das LISA-Projekt.
Wer sollte Computerlinguistik studieren?
Wer gerne Rechner programmiert, mit mathematischer Methodik arbeitet, und Freude am Umgang mit lebendiger Sprache hat, ist ein idealer Anwärter für das Studium der Computerlinguistik!
Wichtig ist die Bereitschaft, sich auf die verschiedenen Teilbereiche des Studiums einzulassen. Ihr werdet linguistische Formalismen und mathematische Verfahren aber auch Hilfsmittel wie Unix / Linux Werkzeuge verwenden und auch Programmierkursen folgen.
Besondere Vorkenntnisse sind dazu nicht nötig - das Abitur und Aufgeschlossenheit gegenüber Sprachen, Mathematik und Computern genügen, den Rest lernt ihr beim Studium. Ihr solltet ausserdem Englisch verstehen, da Literatur und teilweise ganze Vorlesungen in englischer Sprache sein können.
Berufsbild und Berufsaussichten für Computerlinguisten
Forschung
Auch wenn computerlinguistische Produkte zunehmend von Firmen eingesetzt und entwickelt werden, ist Computerlinguistik immernoch eine "Schwellentechnologie": Die Techniken und Arbeitsmittel zum Bau sprachverarbeitender Systeme werden gerade an Forschungsinstituten und Universitäten noch intensiv erforscht und verbessert. Zur Zeit gibt es eine ganze Reihe von computerlinguistischen Forschungsvorhaben dort und in der EDV-Industrie.
Language Engineering
- Kodierung des grammatischen Wissens für eine bestimmte Sprache (Grammatikentwicklung)
- Erfassung des Wortschatzes mit den für die Verarbeitung notwendigen Informationen
- Entwicklung von Transferlexika, die in maschinellen Übersetzungssystemen die Strukturen einer Sprache in die Strukturen einer anderen Sprache überführen.
Zukunftsaussichten
- In den nächsten Jahren wird sich der Markt für die Sprachtechnologie enorm ausweiten und verschiedene Lebensbereiche nachhaltig verändern. Die Nachfrage nach Wissenschaftlern mit Computerlinguistik-Abschluss wird dann stark steigen.
- Das Berufsbild wird sich stärker in den Servicebereich verlagern, wie Wartung und Update von Sprachtechnologiesystemen und Kundenberatung (z.B. beim Zuschnitt von Lexika und Datenbasen für ein persönliches Übersetzungssystem).
Warum Saarbrücken?
Gründe, Computerlinguistik in Saarbrücken zu studieren:
- Computerlinguistik kann in Saarbrücken auch als Bachelor/Master-Studium studiert werden. Zudem kann es auch als Nebenfach für Studenten anderer Fachbereiche (z.B. Informatik) und als Promotionsfach studiert werden. (Für näheres Studienberater Herr Dr. Saurer fragen)
- Wir haben ein optimales Verhältnis bezüglich der Zahl der Studenten und der sie betreuenden Dozenten. Es gibt also keine überfüllten Hörsäle, oder Probleme, einen Arbeitsplatz an einem Rechner zu bekommen.
- Die Coli hat ein ausgewogenes Verhältnis von 56% Studenten zu 44% Studentinnen (laut Arbeitsamt).
Günstiges wissenschaftliche Umfeld
- Enge Zusammenarbeit mit dem Fachbereich Informatik, wo Saarbrücken bundesweit eine Spitzenstellung einnimmt.
- Der Lehrstuhl für Phonetik in unserer Fachrichtung bietet die Möglichkeit, sich mit der Verarbeitung gesprochener Sprache intensiv auseinanderzusetzen.
- Mit Kursen des Lehrstuhles für Psycholinguistik an unserer Fachrichtung ist auch eine Spezialisierung auf psychologische Aspekte der Sprachverarbeitung möglich.
- Interessante Bezugspunkte mit den sprachwissenschaftlichen und kommunikationswissenschaftlichen Fächern in der philosophischen Fakultät, insbesondere kognitive Psychologie und systematische Philosophie.
- Verbindungen mit den weltweit führenden Institutionen im Sprachverarbeitungsbereich durch überregionale Kooperationen und internationale Forschungsnetze.
Forschung und Praxis
- Enge Forschungszusammenarbeit mit dem DFKI (Deutsches Forschungszentrum für künstliche Intelligenz)
- Mehrere Projekte des Sonderforschungsbereiches 378 "Ressourcenadaptive kognitive Systeme" der Deutschen Forschungsgemeinschaft (DFG).
- Ausserdem werden zahlreiche unabhängige Forschungsprojekte durchgeführt, in die unsere Studenten auf verschiedene Weise integriert werden können: Über Softwareprojekte, Diplomarbeiten oder studentische Hilfskraftstellen. Auf diese Weise kommen Computerlinguistik-Studenten in Saarbrücken schon während ihres Studiums intensiv mit der Forschungspraxis in Berührung.
- Unsere Studenten haben Zugang zu modernsten Geräten: Wir arbeiten hauptsächlich mit Unix, ausserdem gibt es Windows- und Apple-Rechner.
- Industriepraktika und Auslandsaufenthalte werden empfohlen - gegebenenfalls beraten euch unsere Dozenten dabei und helfen bei Suche und Vermittlung.
Arbeitsamt
Nein, ihr sollt nicht gleich nach dem Abschluss eine Frittenbude aufmachen. Dieser Absatz soll euch auf die ziemlich umfangreichen Informationen des Arbeitsamtes zum Thema Computerlinguistik (nicht nur in SB) aufmerksam machen. Ein sinnvoller Einsatz von Steuergeldern... Die Einstiegsseite ist berufenet.arbeitsamt.de -> Computerlinguistik. Zwar wird hier der ausgelaufene Diplomstudiengang beschrieben, für einen Bachelor oder Master in CoLi gilt die Seite aber sinngemäss.
Projekte in der Computerlinguistik und im SFB378 Kognitionswissenschaft
Was ist ein "SFB"
Ein SFB ist ein Sonderforschungsbereich. Der SFB378 Kognitionswissenschaft und resourcenadaptive kognitive Prozesse verbindet seit 1996 Coli, KI (Künstliche Intelligenz), DFKI, Informatik und Psychologie, um gemeinsam besondere Herausforderungen in diesem Forschungsgebiet zu meistern. Die Homepage des SFB ist www.coli.uni-sb.de/sfb378. Mit resourcenadaptiv ist dabei grob gesagt gemeint, dass natürliche Intelligenz oft Schwerpunkte legt um effizienter arbeiten zu können. Der SFB versucht, das auch der KI beizubringen. Ausserdem ist der SFB eine gute Quelle von Hiwi-Jobs, z.B. bei CHORUS :-).
Die SFB378 Projekte kurz beschrieben
- OMEGA und DIALOG: Bei der KI (AG Siekmann) wird ein interaktiver mathematischer Beweiser entwickelt. Wichtig ist dabei auch, dass die Beweise für Menschen gut lesbar sind. Das System kann als Arbeitshilfe aber auch als Lernhilfe verwendet werden.
- VEVIAG und ARC: Hier werden das Zusammenspiel verschiedener Gedächtnisprozesse und deren Veränderungen im Alter untersucht (Schwerpunkt Psychologie).
- NEGRA und PERFORM: NEGRA entwickelt die Verbindung von constraint- und statistik-basierter Verarbeitung zur effizienten Analyse empirischer Sprachdaten. Dabei werden Korpora mit Beschreibungen typischer Sprachphänomene erzeugt. Man kombiniert hier grammatische Analyse mit der Erkennung statistischer Zusammenhänge.
- CHORUS (und ALPHA): An der Coli wird hier mit constraintbasierter Bedeutungsverarbeitung gearbeitet, um das Zusammenspiel von Kontext und Weltwissen bei der Verarbeitung unvollständiger oder auch "falscher" Sätze zu modellieren. Unterspezifizierte Informationen intelligent zu verarbeiten ist also das grosse Ziel. Bei CHORUS wird viel mit der Programmiersprache Oz gearbeitet, die ausser constraintbasierter nebenläufiger (paralleler) Verarbeitung noch Funktionen zu vielen anderen Sprachen mitbringt.
- NEP: Es gibt sogar ein eigenes Teilprojekt welches sich mit neuen Möglichkeiten der Programmiertechnik rund um Mozart/Oz beschäftigt. Oz wird seit 1991 hier am DFKI und an der Uni entwickelt.
- REAL und READY: Die Informatiker erforschen Softwareagenten und elektronische Assistenten, zum Beispiel ein tragbares System welches dem Benutzer jeweils an die Situation angepasst den Weg weisen soll.
Mehr Informationen und Projekte
Mehr interessante Projekte und Detailinformationen findet ihr auf http://www.coli.uni-saarland.de/page.php?id=projects und der oben genannten SFB378 Homepage verlinkt.
|
Diese Seite basiert auf der CoLi-Informationswebpage von Herrn Professor Uszkoreit. |
|
(Neu zusammengestellt von Ruth Kusterer, aktualisiert Juni 2002 und Juli 2003 von Eric Auer. Übernommen und aktualisiert Mai 2008 von Marc Schulder) |

