Computational Linguistics & Phonetics Computational Linguistics & Phonetics Fachrichtung 4.7 Universität des Saarlandes

Distant Speech Recognition

Vorlesung: Computerlinguistik, M.Sc.

Leitung: John McDonough
Ort: Geb. C7.1 U.15
Zeit: Di 16-18, Do 14 - 16 Uhr
Beginn: wird bekannt gegeben
Geeignet für: M.Sc.

Da die maschinelle Spracherkennung sich inzwischen aus den Forschungslabors in die Wohnzimmer, Autos und Büros entwickelt hat, wird es immer wichtiger, die potentiellen Benutzer von der Notwendigkeit der Benutzung von Nahbesprechungs-mikrophonen zu befreien. Die möglichen Anwendungen für diese Technik liegen in den Bereichen, Command-and-Control von Computern in Häusern und Büros, Fernsteurung von Geräten (z.B. Radios und Navigation-Systeme) in Autos, Interaktionen mit humanoiden Robotern, und Sprach-zu-Sprach-Übersetzung. Anordnungen mehrerer Mikrophone (Microphone-Arrays) in mittlerer und weiter Entfernung bieten eine mögliche Lösung für dieses Problem, allerdings eine Lösung, die noch viel Forschungs- und Entwicklungsaufwand bis zur Reife benötigt. In dieser Vorlesung werden die klassischen Verfahren des Array Processings und Beamformings eingeführt, und aufgezeigt, wie viele davon, die ursprünglich für ganz andere Bereiche wie Seismologie, Sonare und Weltraum-beobachtung entwickelt wurden, für Probleme auf dem Gebiet der Spracherkennung angepasst werden können. Neuere Arbeiten, in denen Beamforming und Spracherkennung integriert werden, werden auch vorgestellt. Um die optimale Leistung liefern zu können, braucht ein Beamforming-Algorithmus Unterstützung anderer Technologien, vor allem Sprecherlokalisierung, die die genaue Position eines Sprechers in einem Raum bestimmen kann. Deswegen wird solche Methoden auch bei der Vorlesung gedeckt werden. Die Vorlesung ist als Ausgangspunkt für weitere Studien und Forschungen auf diesem Gebiet gedacht.

Zur Homepage des Kurses

Literatur
Distant Speech Recognition, Matthias Wölfel and John McDonough

Stellung im Studienplan
Specialization course; area: SS&P

Leistungspunkte
6 CP