Mathematische Grundlagen der Linguistik III:
Statistische Methoden
Übungen zum 2. Teil
README-LIESMICH-LISEZMOI zu den Übungen
Übung 5: Entscheidungsbäume
ÜbungsblattÜbung 4: Entropie
ÜbungsblattÜbung 3: PCFGs
ÜbungsblattÜbung 2: Unix-Tools for Corpora
- Das Übungsblatt mit Beschreibung der Befehle und Aufgaben (Achtung Änderungen in Aufgaben 6 und 10!)
- Die Corpora für die Übung
- Eine kleine Zusammenfassung grundlegender Verwendung eines Tabellenkalkulationsprogramms
- Einige Hinweise, um Textdaten im Spaltenformat (z.B. Ergebnisse von Unix-Befehlsketten) in diversen Spreadsheets zu importieren
Übung 1: Shell Grundlagen (21.04.2011)
Im Propädeutikum zur "Einführung in die Computerlinguistik" wurden Shell-Grundlagen eingeführt, die heute wiederholt werden sollen. Folgendes sollte bis zur nächsten Übungen beherrscht werden:
- Eine Shell aufmachen und das "Prompt" (Eingabeaufforderung) erkennen
- Grundform eines Befehls unter Unix
- Befehle: cd, ls (auch in Kombination mit Switches wie "ls -l" und "ls -a"), rm, mv und cp
- Kommando-Vervollständigung mit Hilfe der Tabulator-Taste (tab-completion), Benutzung der Pfeiltasten, Bedeutung von ".", ".." und "~"
- Befehle und ihre Switches/Optionen selbstständig nachschlagen
Als Quellen können dienen:
- Das Propädeutikum-Handout (Sabrina Wilske)
- Beliebige weitere Einführungsseiten im Internet, wie z.B. diese auf Englisch oder diese auf Deutsch.
Aufgaben: Abgabe per E-Mail am Ende der Stunde (bitte Coli-Adresse als Absender verwenden!)—Musterlösung