Was ist Computerlinguistik?

Die Computerlinguistik ist noch ein vergleichsweise junges Fach: Die ersten Studiengänge sind weltweit in den achtziger Jahren entstanden. Computerlinguisten erforschen menschliche Sprache, wofür sie "formale Modelle" verwenden, die auf dem Computer realisiert werden können.
Computerlinguistik verbindet also Inhalte und Methoden aus der Informatik und der Sprachwissenschaft, und benutzt dabei Teile der Mathematik (besonders die formale Logik) als Grundlage. Auf diese Weise gewinnt sie Erkenntnisse über die Lautstruktur, die Satzstruktur und die Bedeutungsstruktur von Sprachen, und über die Art und Weise, wie Menschen Sprache verstehen, produzieren und lernen. Diese Erkenntnisse werden zur Entwicklung von Computersystemen angewendet.

Beispiele für sprachverarbeitende Systeme sind:

  • Natürlichsprachliche Zugangssysteme, die den Dialog mit dem Computer in gesprochener und geschriebener Sprache ermöglichen (z.B. virtuelle Assistenten wie Siri oder Google Now).
  • Textverstehende Systeme, die automatisch Wissen aus Dokumenten entnehmen - mit der Frage, wie man Relationen zwischen Sätzen aus Texten extrahiert, befasst sich zum Beispiel Projekt B5 des SFB 1102.
  • Maschinelle Übersetzungssysteme
  • Systeme für Rechtschreib-, Grammatik- und Stilkorrektur, die das Formulieren in einer Fremdsprache erleichtern.

Natürlich muss man hinzufügen, dass die heute verfügbaren Systeme noch nicht perfekt sind. Es muss also noch viel Grundlagenforschung betrieben werden. Auch in diesem Bereich gibt es in Saarbrücken einige Projekte, z.B. Modeling and Measuring Information Density,

Wer sollte Computerlinguistik studieren?

Wer gerne programmiert, mit mathematischer Methodik arbeitet und Freude am Umgang mit lebendiger Sprache hat, ist ein idealer Anwärter für das Studium der Computerlinguistik!

Wichtig ist, dass unsere Studenten bereit sind, sich auf die verschiedenen Teilbereiche des Faches einzulassen. Eine unüberwindliche Abneigung gegen mathematische Verfahren oder ein komplettes Desinteresse am Arbeiten mit dem Computer wären tatsächlich echte Hinderungsgründe.

Aber keine Angst: Spezielle Vorkenntnisse oder Expertenwissen zu Beginn des Studiums werden nicht vorausgesetzt. Das Wissen, das man mit einem normalen Abitur erwirbt, reicht zum Einstieg in das Computerlinguistik-Studium aus. Praktische Erfahrungen mit dem Computer oder spezielle technische und mathematische Kenntnisse sind nicht nötig. Aufgeschlossenheit gegenüber Sprachen, Mathematik und Computern genügen, den Rest lernt ihr beim Studium. In den ersten Semestern gibt es Programmierkurse und eine UNIX-Einführung. Dafür ist es aber gut, wenn ihr einen eigenen Laptop mit an die Uni bringt. Ihr solltet außerdem Englisch verstehen, da Literatur und teilweise ganze Vorlesungen in englischer Sprache sein können.

Berufsbild und Berufsaussichten für Computerlinguisten

Forschung

Auch wenn computerlinguistische Produkte zunehmend von Firmen eingesetzt und entwickelt werden, ist Computerlinguistik immernoch eine "Schwellentechnologie": Die Techniken und Arbeitsmittel zum Bau sprachverarbeitender Systeme werden gerade an Forschungsinstituten und Universitäten noch intensiv erforscht und verbessert. Zur Zeit gibt es eine ganze Reihe von computerlinguistischen Forschungsvorhaben dort und in der IT-Industrie.

Industrie

Das Arbeitsfeld von Computerlinguisten ist weit ausgebreitet, es gibt viele kleine spezialisierte Firmen wie z.B. Semvox oder SpeaQ With Me. Aber auch in größeren Firmen, die andere Produkte herstellen und nicht direkt an Sprache forschen, werden Computerlinguisten angestellt. Beispiele dafür sind Amazon oder viele Automobilhersteller (z.B. BMW, Audi, Mercedes).

Zukunftsaussichten

  • In den nächsten Jahren wird sich der Markt für die Sprachtechnologie enorm ausweiten und verschiedene Lebensbereiche nachhaltig verändern. Die Nachfrage nach Wissenschaftlern mit Computerlinguistik-Abschluss wird dann stark steigen.
  • Das Berufsbild wird sich stärker in den Servicebereich verlagern wie Wartung und Update von Sprachtechnologiesystemen und Kundenberatung (z.B. beim Zuschnitt von Lexika und Datenbasen für ein persönliches Übersetzungssystem).

Warum Saarbrücken?

Gründe, Computerlinguistik in Saarbrücken zu studieren

  • Computerlinguistik kann in Saarbrücken als Bachelor/Master-Studium studiert werden. Zudem kann es auch als Nebenfach für Studenten anderer Fachbereiche (z.B. Informatik) und als Promotionsfach studiert werden. (Für näheres Studienberater Herrn Dr. Stefan Thater fragen)
  • Wir haben ein optimales Verhältnis bezüglich der Zahl der Studenten und der sie betreuenden Dozenten. Es gibt also keine überfüllten Hörsäle und man bekommt leicht Kontakt zu Dozenten und Kommilitonen im eigenen und in höheren Semestern.

Günstiges wissenschaftliches Umfeld

  • Enge Zusammenarbeit mit dem Fachbereich Informatik, wo Saarbrücken bundesweit eine Spitzenstellung einnimmt.
  • Der Lehrstuhl für Phonetik in unserer Fachrichtung bietet die Möglichkeit, sich mit der Verarbeitung gesprochener Sprache intensiv auseinanderzusetzen.
  • Mit Kursen des Lehrstuhles für Psycholinguistik an unserer Fachrichtung ist auch eine Spezialisierung auf psychologische Aspekte der Sprachverarbeitung möglich.
  • Verbindungen mit den weltweit führenden Institutionen im Sprachverarbeitungsbereich durch überregionale Kooperationen und internationale Forschungsnetze.

Forschung und Praxis

  • Enge Forschungszusammenarbeit mit dem DFKI (Deutsches Forschungszentrum für künstliche Intelligenz)
  • Mehrere Projekte des Sonderforschungsbereiches 1102 Information Density and Linguistic Encoding
  • Außerdem werden zahlreiche unabhängige Forschungsprojekte durchgeführt.
  • In allen drei Bereichen kann man sich als Student einbringen: Über Softwareprojekte und Bachelor- und Masterarbeiten kommen Computerlinguistik-Studenten in Saarbrücken schon während ihres Studiums intensiv mit der Forschungspraxis in Berührung. Zudem findet man dort leicht eine Stelle als studentische Hilfskraft.
  • Industriepraktika und Auslandsaufenthalte (zum Beispiel an einer Erasmus-Partneruniversität) werden empfohlen.

Projekte in der Computerlinguistik und im SFB1102 Information Density and Linguistic Encoding

Was ist der "SFB"?

Ein SFB ist ein Sonderforschungsbereich. Im SFB1102 Information Density and Linguistic Encoding wird seit 2014 die Rolle der Informationsdichte bei sprachlicher Kodierung erforscht. Der SFB teilt sich in drei Bereiche auf: - Situational Context and World Knowledge - Discourse and Register - Variation in Linguistic Encoding

Die Homepage des SFB ist http://www.sfb1102.uni-saarland.de. Die unterschiedlichen Projekte findet ihr hier.


Diese Seite basiert auf der CoLi Informationswebpage von Herrn Professor Uszkoreit.
(Neu zusammengestellt von Ruth Kusterer, aktualisiert Juni 2002 und Juli 2003 von Eric Auer. Übernommen und aktualisiert Mai 2008 von Marc Schulder. Aufbereitet (aber nicht aktualisiert) für die Fachschaftshomepage von Christophe Biwer (August 2015). Überarbeitet und aktualisiert von Christine Schäfer, Sophie Henning und Urs Peter (Februar 2017)