Praktikumsberichte · 2003-06-25 · Ruth Kusterer

Ruth Kusterer

Kontakt
Dauer 24.02.2003 -05.04.2003
Firma IAI (Institut der Gesellschaft zur Förderung der Angewandten Informationsforschung)
Adresse Martin-Luther-Str. 14
66111 Saarbrücken
Deutschland

Kurzbeschreibung der Arbeit

Ich arbeitete sechs Wochen halbtags im Projekt LEWI (Lexikonbasierte Wissenserschließung), in dem eine natürlichsprachliche Schnittstelle zu einer Volltextdatenbank entwickelt wird. Konkret also ein Interface, mit dem man Suchanfragen an den "Brockhaus" stellt, und das dann die relevantesten Dokumente raussucht und anzeigt. In der Endversion soll dann auch bei Fragetypen, wo das sinnvoll ist, die Antwort im Text hervorgehoben werden. Meine Aufgabe war erstens die Evaluation des aktuellen Standes, und zweitens die Erweiterung (Verbesserung) der verwendeten Grammatik. Um die Arbeit an der Grammatik zu erleichtern, schrieb ich außerdem ein paar Perl-Tools.

Beschreibung des Praktikums

Den Praktikumsplatz bekam ich zufällig, indem ich einen Seminarleiter nach seinem interessant scheinenden Vortrag fragte, ob seine Firma Praktika in diesem Bereich anbiete. Das ganze lief dann ganz unkompliziert ab, ich sprach mit dem Chef, Prof. Haller, über die genauen Aufgaben, den Zeitraum und die (flexiblen) Arbeitszeiten; und er stellte in Aussicht, dass ich für das Praktikum bezahlt werde (wenn ich einen spürbaren Beitrag für das Projekt leiste). :)

Ich bekam Zugang zu einem Hiwi-PC, wobei ich mich mit einem anderen Hiwi betreffs der Arbeitszeiten koordinieren musste, was sich aber einfach lösen liess. Die eigentliche Arbeit lief unter UNIX mit vi ab. Es gab keinen anderen Texteditor, deswegen war ich froh, schon Vorkenntnisse zu haben. Ein Projekt-Mitarbeiter erklärte mir in den ersten Tagen die Software und die Dokumentation der Grammatik, was mit dem, was man im CoLi-Studium gelernt hat, gut nachzuvollziehen war. Tipp: Auf jeden Fall Notizen machen, man kann sich am Ende doch nicht alle Pfade und Kommandos auswendig merken, und man muss sowieso noch oft genug anderes nachfragen.

Die Aufgabenstellung war so, dass ich den Großteil der Zeit selbständig arbeiten konnte. In unregelmäßigen Abständen war der Projekt-Mitarbeiter für Fragen erreichbar, in einigen Fällen sogar der Prof selbst, der aus eigener Erfahrung mit dem Programm viele praktische Debug-Ratschläge geben konnte.

Um ein Gefühl für das Programm zu bekommen, sollte ich in der ersten Woche eine Liste von Beispielanfragen anhand einer Liste von Kriterien evaluieren, was klappt, was nicht, und vor allem, warum nicht: Ein Fehlschlag konnte z.B. am Parser, an der Fragetyperkennung, am Thesaurus, am Lexikon, an der Rückfragen- oder der Rechtschreibkorrektur-Komponente liegen.

In den folgenden Wochen suchte ich mir neue Beispielanfragen (Quizfragen aus dem Internet), um die Treffsicherheit des Document-Retrievals weiter 'crash-zu-testen'. Für diese Tests schrieb ich mir auch zwei Perl-Tools, eines zum Syntax-Highlighting, um das Lesen der Parserausgaben zu erleichtern, und ein zweites, um zwei Analyseausgaben naiv zu vergleichen. Perl ist für sowas sehr geeignet, und der Programmierkurs lohnt sich definitiv.

Meine Hauptarbeit bestand dann aus der Erweiterung der vorhandenen Grammatik, d.h. neue Regeln hinzufügen, alte einschränken, oder erweitern. Man muss dabei immer gegenprüfen, ob durch die eine kleine Verbesserung nicht vielleicht eine größere Untermenge von anderen Analysefällen zu Nichte gemacht wird.

Auch wenn's vielleicht spießig klingt, ist es daher zu empfehlen, immer alles, was man gemacht hat, gleich zu dokumentieren, und jeden Tag Backups der Zwischenstände zu machen... Ist nicht nur praktisch, wenn man wegen eines unauffindbaren Bugs 'einen Schritt zurückgehen' muss, sondern auch, wenn man dann am Ende den Bericht abgeben soll -- oder wenn der Chef reinkommt und fragt, was man heute gemacht hat, und ob man Fragen hat. ;-) Auch hat man dann am Ende wirklich einen guten Überblick, womit man die letzten sechs Wochen überhaupt verbracht hat.

Ein weiterer positiver Nebeneffekt eines Praktikums bei einer Firma ist, dass man eventuell das Angebot bekommt, man könne über das Thema auch gleich seine Diplomarbeit schreiben. :-)