Mathematische Grundlagen der Linguistik III:
Statistische Methoden
Übungen zum Teil von Vera Demberg
Übung 0: Shell Grundlagen (eventuelle Fragen 26.04.2012)
Im Propädeutikum zur "Einführung in die Computerlinguistik" wurden Shell-Grundlagen eingeführt, bitte testen Sie anhand des Shell-Aufgabenblattes selbst, ob Sie diese Grundlagen beherrschen.
- Eine Shell aufmachen und das "Prompt" (Eingabeaufforderung) erkennen
- Grundform eines Befehls unter Unix
- Befehle: cd, ls (auch in Kombination mit Switches wie "ls -l" und "ls -a"), rm, mv und cp
- Kommando-Vervollständigung mit Hilfe der Tabulator-Taste (tab-completion), Benutzung der Pfeiltasten, Bedeutung von ".", ".." und "~"
- Befehle und ihre Switches/Optionen selbstständig nachschlagen
Als Quellen können dienen:
- Das Propädeutikum-Handout (Sabrina Wilske)
- Beliebige weitere Einführungsseiten im Internet, wie z.B. diese auf Englisch oder diese auf Deutsch.
Übung 1: Unix-Tools for Corpora (Abgabe und Besprechung 26.4.2012)
- Das Übungsblatt mit Beschreibung der Befehle und Aufgaben.
- Übungskorpora: brown_pos.txt, english.txt, example.txt, german_tagged.txt, german.txt.
- Musterlösung
Übung 2: Plots mit R (Abgabe und Besprechung 30.4.2012)
- Das Übungsblatt mit Beschreibung der Befehle und Aufgaben.
Übung 2b: unbewertete Übung zu HMMs (Besprechung 31.5.2012)
- Das Übungsblatt
Übung 3: PCFGs (Abgabe und Besprechung 28.6.2012)
- Das Übungsblatt (Gruppenarbeit erlaubt.)
Übung 4: Entropie (Abgabe und Besprechung 5.7.2012)
- Übungsblatt (Gruppenarbeit erlaubt.) Musterlösung
Übung 5: Kollokationen (Abgabe und Besprechung 9.7.2012)
- Übungsblatt (Gruppenarbeit erlaubt.) Daten, Musterloesung
Übung 6: Naive Bayes und Entscheidungsbaeume (Abgabe und Besprechung 19.7.2012)
- Übungsblatt (Gruppenarbeit erlaubt.)