Computational Linguistics & Phonetics Fachrichtung 4.7 Universitä des Saarlandes


Home Page
News
FAQ
Neue Studenten WS 11/12
Das Fach
Das Studium
Studentenleben
Skripte
Bücherliste
Praktika/Jobs
Protokolle
LaTeX
Links


51. StuTS
TaCoS 2012



Main » Informationen über das Studium der Computerlinguistik
print login

Der Studiengang Computerlinguistik

Die Uni Saarbrücken bietet die Studiengänge Bachelor of Science Computerlinguistik und einen Master of Science in Language Science and Technology an! Informiert euch über das Kursangebot und die Studien- und Prüfungsordnung - dann seid ihr immer auf dem neuesten Stand. Lest euch auch das FAQ des Fachereichs durch. Oder mailt uns eure Fragen: fs-coli -AT- coli.uni-sb.de

Die Regelstudienzeit beim Bachelor beträgt 6 Semester:

  • Dauer: ca. 6 Semester
  • Erwerb notwendiger linguistischer, informatischer und mathematischer Grundlagen
  • Vertrautwerden mit den Arbeitstechniken der Computerlinguistik
  • Softwareprojekt
  • 6-wöchiges Berufspraktikum
  • dreimonatige Bachelorarbeit
  • Stundenplan ist relativ stark festgelegt

Nach Erwerb des Bachelor könnt ihr noch einen Master (4 Semester) draufsetzen:

  • Dauer: ca. 4 Semester
  • Vertiefung in einem selbst gewählten computerlinguistischen Spezialgebiet
  • Mehrere "Grossrichtungen":
    • Computational Linguistics
    • Computational Psycholinguistics
    • Language Technology
    • Phonetics and Speech Technology
    • Master of Language Science and Technology (eher unspezialisiert)
  • Wahl der Themengebiete ist freier
  • Studium überwiegend auf Englisch
  • 6 Monate Zeit für Masterarbeit

Allgemeines zu den Prüfungen

  • Die Note wird kumulativ aus den Noten aller Veranstaltungen und der Note der Abschlussarbeit berechnet. Die Gewichtung entspricht etwa dem Zeitaufwand der Veranstaltungen.
  • Das Ergänzungsfach wählt man selbst. Hier muss man drauf achten, sich vorher rechtzeitig mit dem entsprechenden Prof wegen der jeweiligen Prüfungsmodalitäten abzusprechen (mündliche oder schriftliche Prüfungen, etc). Oft wählt man aber ein "klassisches" Ergänzungsfach und dann ist das alles Routine.
  • Prüfungsanmeldung erfolgt über das HISPOS der Universität.
  • Die Prüfungen können bis zu 2x wiederholt werden. Danach ist man durch den Kurs endgültig durchgefallen. Handelt es sich dabei um einen Pflichtkurs des Studiums, ist auch das Studium beendet, da man die Grundvoraussetzungen nicht erfüllt. Wer also gleich merkt, dass er die Prüfung dieses Semester nicht packen wird (sei es aus Zeit- oder Verständnisgründen), braucht sich nicht zwingend für die Prüfung anzumelden, sondern kann sich einen seiner 3 Versuche sparen und versucht es nächstes Jahr.

Übersicht: Beispielhafter Stundenpan fürs Bachelor Studium

Das Studienprogramm gibt euch diverse Vorlesungen als Pflichtkurse vor, damit ihr in eurem Bachelor-Studium alle Grundlagen vermittelt bekommt. Hinzu kommen Seminare, ein Ergänzungsfach und eine Fremdsprache, die ihr (in einem gewissen Rahmen) frei wählen könnt. Hier ein Beispielstudienplan:

Bachelor:

Semester: Grundlagen Mathematik & Informatik Syntax & Morphologie Semantik & Diskurs Sonstiges
1. (32 CP) Einf. Coli (6 CP) Mathe I (8 CP)     Fremdsprache (6 CP)
Einf. ASW (3 CP) Programmierung (9 CP)
2. (32 CP) Einf. Phonetik und Phonologie (3 CP) Prog. Kurs I (6 CP)     Fremdsprache (6 CP)
Mathe II (8 CP)
Mathe III (9 CP)
3. (32 CP) Einführung Psycholinguistik (3 CP) Prog. Kurs II (6 CP) Einführung Syntax und Morphologie (6 CP) Einführung Semantik (6 CP) Fremdsprache (6 CP)
Proseminar (5 CP)
4. (28 CP)     Grammatik-
formalismen (6 CP)
Einführung Pragmatik und Diskurs (6 CP) Ergänzungsfach (6 CP)
Proseminar (5 CP)
Projektseminar (5 CP)
5. (26 CP)   Softwareprojekt (12 CP)     Praxisseminar (5 CP)
Einf. KI (9 CP)
6. (30 CP)         Hauptseminar (7 CP)
Berufspraktikum (8 CP)
Abschluss: Bachelorarbeit (12 CP) & Kolloquium (3 CP)

Allgemeine Anmerkungen zum Stundenplan:

  • Die Zahlen in Klammern sind eure Creditpoints (CP) oder auf gut deutsch Leistungspunkte (LP). Jede Vorlesungs- und Übungsstunden ist 1,5 CP wert, sodass ihr einen groben Überblick erhalten dürftet, welche Kurse wieviel Aufwand bedeuten.
  • Die neue Studienordnung sieht für jeden Kurs eine Regelstudienzeit vor, die bestimmt, in welchem Semester dieser Kurs bestenfalls besucht werden sollte. Besteht man die entsprechende Prüfung spätestens in diesem Semester, ist man berechtigt, die Klausur ein zweites Mal (meist im nächsten Jahr) zu schreiben, um seine Note nochmals zu verbessern. Danach wird die bessere der beiden Noten gewählt, verschlechtern kann man sich also nicht mehr. Im Prinzip hält einen aber auch nichts auf, die Kurse durcheinander zu würfeln und in jeder beliebigen Reihenfolge zu besuchen. Hauptsache man hat am Ende seine Creditpoints beisammen.
  • Alle Stammvorlesungen werden jährlich angeboten (d.h. nur alle 2 Semester)
  • (Pro)seminare sind dagegen oft "einmalig" und hängen vom aktuellen Angebot ab.
  • Bei der Aufstellung des individuellen Stundenplans sollte man sich an einen Richtwert von 30 CP pro Semester halten. Viel mehr ist nicht zu empfehlen, weil ihr dann mit dem Lernen nicht mehr nachkommt. Deutlich weniger sollten es aber auch nicht werden, wenn ihr euer Studium in der Regelstudienzeit beenden wollt. (Im Zweifelsfall dürft ihr aber auch bis zu 4 Semester überziehen, danach ist endgültig Schluss)
  • Die Abschlussarbeit wiegt 15 CP, das Praktikum 8 CP.

Anmerkungen zum Bachelor Studium:

  • Einige der Veranstaltungen basieren aufeinander. Z.B. ist es sinnvoll, "Einführung in die CoLi", "Einführung in die Sprachwissenschaft", "Mathematische Grundlagen I" und "Informatik I" (Programmierung) auf jeden Fall im ersten Semester zu hören. Generell ist es vor allem Anfangs empfehlenswert, sich an den Regelstudienzeiten zu orientieren.
  • Für Programmierkurs I und II kann man zwischen Prolog und Java wählen.
  • Im Ergänzungsfach und der Fremdsprache muss man gemeinsam insgesamt 24 CP erreichen. Wie man diese verteilt, ist egal. Man kann also z.B. je 12 CP in Chinesisch und Informatik machen, oder aber auch alle 24 CP in Japanisch und ganz auf ein Ergänzungsfach verzichten.
  • Für die CoLi kann nur eine eine nicht indoeuropäische Sprache angerechnet werden, was die meisten europäischen Sprachen ausscheiden lässt.

Veranstaltungen

Dies ist eine Übersicht über die Stammvorlesungen im Bachelor Studium. Jedes Jahr im Wintersemester gibt es außerdem Orientierungsveranstaltungen, wo alle Veranstaltungen und Terminänderungen vorgestellt werden. Besonders für Erstsemester gibt es in der ersten Woche spezielle Einführungsveranstaltungen. Die genauen Termine stehen jeweils im Vorlesungsverzeichnis und sind für die Einführungsveranstaltungen meist zusätzlich im Gebäude ausgehängt. Tipp: Lest Eure eMails regelmäßig!

Einführung in die Allgemeine Sprachwissenschaft

Wir benutzen Sprache jeden Tag, meist ohne einen Augenblick lang darüber nachzudenken, das wir eine äußerst komplexe Handlung vollziehen:

  • Wir wählen (meistens ;-) ) die für die Situation passende Ausdrucksweise (Pragmatik),
  • Wir wählen die Wörter, die unseren Gedanken entsprechen (Semantik),
  • Wir sagen sie in der richtigen Reihenfolge (Syntax) und in der richtigen Form (Morphologie)
  • Und wir sprechen (Phonetik) sie mit der richtigen lautlichen Struktur (Phonologie).

Wie die Ausdrücke in Klammern zeigen, hat sich für jeden Teilaspekt eine eigene Teildisziplin entwickelt, die die besonderen Fragen der jeweiligen Beschreibungsebene zu beantworten versucht.

Einführung in die Computerlinguistik

Die Einführung in die Computerlinguistik vermittelt einen Einstieg in die Aufgabenstellung und Methoden des Faches.

  • Bestimmung des Forschungsfeldes der Computerlinguistik
  • Charakterisierung der Beziehungen der Wissenschaft zu ihren Nachbardisziplinen
  • Eingehende Betrachtung der wichtigsten Anwendungsgebiete der heutigen Sprachtechnologie
  • Beispielhafte Vorstellung einiger weit verbreiteter Ansätze zur morphologischen, syntaktischen und semantischen Verarbeitung, um einen Einblick in die Methoden des Faches zu geben.
  • Exemplarischen Darstellung laufender Projekte in der industriellen und akademischen Forschung.

Programmierung I

Die Vorlesung Programmierung I wird innerhalb des Faches Informatik absolviert. Das bedeutet, dass ihr zusammen mit den Hauptfachstudenten der Informatik die Grundlagen von Programmiersprachen (am Beispiel von SML, einer Sprache für Mathematiker) erläutert bekommt. Da die Informatik mit diesem Kurs die Spreu vom Weizen trennen und halbherzig arbeitende Studenten vergraulen will, ist der Kurs verdammt anspruchsvoll und der mit Abstand härteste Kurs, der euch im ersten Jahr erwarten wird.

Mathematische Grundlagen I

Dieser Kurs befasst sich vornehmlich mit Logik. Logik ist die Lehre von den gültigen Schlussformen oder Argumenten. Folgendes ist z.B. ein logisch gültiges Argument:

(1) Alle Menschen sind sterblich.
(2) Sokrates ist ein Mensch.
--------------------------------
(3) Also ist Sokrates sterblich.

Man sagt, daß die Konklusion (3) aus den beiden Prämissen (1) und (2) logisch folgt. Die Logik stellt verschiedene Methoden bereit, die gültigen von den ungültigen Schlüssen zu unterscheiden. Für die Computerlinguistik ist die Beschäftigung mit Logik wichtig, weil ein Computer, der Sprachverstehen simulieren soll, auch aus Sätzen, die ihm explizit eingegeben werden, Schlüsse ziehen können soll, wie wir Menschen. Der Kurs stellt zwei Logiken vor: Die Aussagenlogik und die Prädikatenlogik erster Stufe. Daneben bietet er auch eine Einführung in mengentheoretische Begriffe, die in formalen Wissenschaften immer auftreten, und einige algebraische Begriffe, die für den Computerlinguisten wichtig sind, wie z.B. Gruppe und Verband.

Mathematische Grundlagen II

Dieser Kurs befasst sich mit der Theorie der formalen Sprachen und ihren zugehörigen Automaten. Formale Sprachen können als mathematische Annäherungen an natürliche Sprachen (wie z.B. Deutsch oder Chinesisch) angesehen werden. Somit tragen sie zum Verständnis der Struktur und Komplexität natürlicher Sprachen bei. Zu den verschiedenen Arten von formalen Sprachen gibt es verschiedene Arten von "Automaten". Dies sind mathematische Modelle von kleinen Maschinen (die sich als Computerprogramme realisieren lassen), die anhand von Regeln Sätze aus den Sprachen erkennen und erzeugen können. Die Automaten dienen einerseits als Maßstab, um Aussagen über die Komplexität gegebener formaler Sprachen machen zu können, andersseits können sie direkt als Vorbild für spracherkennende Computerprogramme benutzt werden.

Beispiel: Eine Sprache (a+b*c)*[xy] beschreibt alle Texte die aus einem oder mehr a oder b, dann null oder mehr b, dann einem c, und das null oder mehrfach wiederholt bestehen, mit am Ende noch einem x oder y. Also x, aaaacaabbcy, und so weiter. Sowas ist hilfreich um Texte zu durchsuchen, und mit fortgeschritteneren Techniken kann man auch Texte bearbeiten.

Programmierkurs I & II

Der Schwerpunkt des Kurses liegt auf der praktischen Einübung von Programmiertechniken (an linguistischen und nicht-linguistischen Beispielen). Die Teilnehmer sollen lernen, einfache Programme zu verstehen und zu entwickeln, sowie die erworbenen Kenntnisse selbständig zu vertiefen. Als Programmiersprache kann man entweder Prolog ("PROgrammieren mit LOGik") oder Java. Während Java eine objektorientierte Sprache ist, die sich in vielen Arbeitsgebieten großer Beliebtheit erfreut, ist Prolog eine logische Programmiersprache, die für Problemstellungen im Bereich der KI-Anwendungen genutzt wird. Und auch wenn manche Informatik-Studenten dies nicht verstehen wollen, für Computerlinguisten ist sie sehr wohl nützlich. ;-)

Einführung in die Phonetik und Phonologie

Dieser Kurs bietet den Studierenden einen ersten Einblick in die Komplexitäten des Sprechens und Hörens, die grundlegende Aktivitäten der menschlichen Kommunikation sind. Die Aufgabe der Phonetik ist die Beschreibung und Erklärung der Vorgänge der Steuerung von Atem- und Artikulationsorganen, sowie der Wahrnehmung von Wörtern und Sätzen, die durch Schall übertragen werden. Dabei ist die Untersuchung der akustischen Eigenschaften des Sprachsignals besonders wichtig. Die Aufgabe der Phonologie ist die Beschreibung der Funktionen von lautlichen Unterschieden:

  • Wie werden einerseits Wörter auseinandergehalten und wie wird andererseits die Verwandschaft zwischen Wörtern gekennzeichnet?
  • Wie werden auf der einen Seite Wörter zu Teilsätzen und Sätzen gruppiert und auf der anderen Seite die Wortgruppen voneinander getrennt?
  • Inwiefern verdeutlichen lautliche Unterschiede den Ausdruck von Frage, Aussage und Ausruf?

Einführung in Syntax und Morphologie

Um Geschriebenes oder Gesprochenes zu verstehen, müssen wir Regelmäßigkeiten zwischen den Wörtern und Sätzen und deren Bedeutungen herstellen. Wie wir Menschen das machen, wissen wir nicht so genau. Die Linguistik versucht mittels unterschiedlicher Grammatiktheorien Antworten darauf zu geben, wie die Beziehung zwischen einzelnen Wörtern bzw. Sätzen und ihren Bedeutungen zustandekommt und welche Teile und Regeln angenommen werden müssen, damit Bedeutung überhaupt entstehen kann. In der Einführung in die Syntax und Morphologie werden anhand von Sprachdaten (Beispielsätzen) bestimmte Merkmale einzelner Sprachen dargestellt und mit Hilfe grammatischer Regeln beschrieben.

Einführung in die Semantik

Die Semantik beschäftigt sich mit der Bedeutung von sprachlichen Ausdrücken und diese Veranstaltung bietet einen ersten Einblick in die Probleme bei der Bestimmung von Bedeutungen, indem sie auf Mathe I und Mathe II (siehe oben) aufbaut.

  • Weil für viele sprachliche Ausdrücke die Prädikatenlogik nicht differenziert genug ist, um deren Bedeutung zu erfassen, werden zusätzliche bzw. andere logische Konzepte (Modallogik, Typentheorie, Lambda-Ausdrücke etc.) eingeführt, die mehr Ausdrucksmöglichkeiten bieten. Man erwirbt sozusagen den logischen Grund-Werkzeugkasten für die Arbeit im Bereich Semantik.
  • Außerdem wird versucht, dem "Frege-Prinzip" gerecht(er) zu werden, daß nämlich die Bedeutung von komplexen Ausdrücken (z.B. von Sätzen) sich systematisch (!!) aus der Bedeutung ihrer Teilausdrücke (z.B. ihrer Wörter) berechnen läßt. Ein solches Vorgehen hat in den 70er Jahren Montague in der nach ihm benannten "Montague-Grammatik" erstmals ausgearbeitet.
  • Eine derartige Übersetzung von "natürlichsprachlichen" Teilausdrücken in eine logische Sprache und die Zusammensetzung dieser Teilübersetzungen durch geeignete Operationen ist das zweite Ziel dieser Vorlesung.

Einführung in Pragmatik und Diskurs

Ohne lange zu überlegen, produzieren Menschen Texte und Dialoge, die in die jeweilige Situation passen.

  • Wodurch aber werden sprachliche Äußerungen zu einem Text bzw. zu einem Dialog?
  • Wie werden Informationen über Objekte, Ereignisse und Handlungen in Texten/Dialogen organisiert?
  • Welche Möglichkeiten der Klassifikation gibt es?

Um Antworten auf solche Fragen zu finden, werden in der Veranstaltung verschiedene Theorien vorgestellt, die Texte und Dialoge untersuchen (pragmatische Theorien). Außerdem werden Darstellungsmöglichkeiten erarbeitet, die den Computer in die Lage versetzen, natürlichsprachige Texte/Dialoge zu verfassen.

Grammatikformalismen

Ein Problem, das in der Computerlinguistik eine zentrale Rolle spielt, besteht darin, sprachliche Regularitäten, die ja z.B. in der (theoretischen) Linguistik seit vielen Jahren erforscht werden, so zu formulieren und zu formalisieren, daß sie für einen Computer "verstehbar" sind. Dafür hat man in den 80er Jahren die Unifikationsgrammatiken erfunden. Diese kann man sich als eine Art formale Sprachbeschreibungssprachen vorstellen, die zwei Vorteile miteinander vereinen: Zum einen sind sie implementierbar und zum anderen geben sie dem Grammatikschreiber ein möglichst komfortables Werkzeug in die Hand, mit dem er sein Wissen über die Sprache darstellen kann. In dieser Veranstaltung werden die verschiedenen Grammatiktypen, die in den letzten Jahren entwickelt wurden, in ihren Grundzügen vorgestellt und hinsichtlich ihrer Möglichkeiten und Grenzen verglichen, z.B. LFG und HPSG.

Ergänzungsfach

Das Ergänzungsfach wird selbst gewählt und dann das ganze Studium hindurch beibehalten. Gemeinsam mit der Fremdsprache muss man hier 24 CP erreichen. Idealerweise versucht man, jedes Semester knapp 6 CP zu sammeln, dann ist man innerhalb von 4. Semestern damit fertig. Über die genauen Modalitäten für jedes Ergänzungsfach sollte man sich vorher beim entsprechenden Fachbereich informieren. Beispiele für mögliche Ergänzungsfächer sind:

Struktur einer Fremdsprache

Neben dem Ergänzungsfach könnt ihr auch noch eine Fremdsprache lernen, die nicht indoeuropäischen Ursprungs ist. Dies trifft vor allem auf asiatische und afrikanische Sprachen. Der Sinn dahinter ist, dass ihr eine grundlegend anders strukturierte Sprache kennenlernt, die euer Weltbild, wie Sprache zu funktionieren hat, umkrempelt. (Stichwort: Wer braucht eigentlich mehr als zwei Zeitformen? Lasst uns lieber zwei dutzend Höflichkeitsabstufungen einführen.) ;-)
Beispiele für interessante Sprachkurse, die vom Sprachenzentrum angeboten werden:


Erstellt von Sebastian Pado, Ruth Kusterer, Eric Auer et. al.
Aktualisiert 2008 von Marc Schulder