Delexikalisierungsmöglichkeiten:
Deutsche und Italienische Daten

Dateien suchen

  1. Gewünschte ips aus der Liste von Prof. Barry (oder aus einer selbst erstellten Liste) auswählen.


  2. Kiel Corpus: Den Dateinamen bestimmen, in der die ips vorkommt.

  3. Kiel Corpus: Unter UNIX die entsprechende *.s1h und *.16 (bzw. *.l16 oder *.r16) heraussuchen und ins eigene Homeverzeichnis kopieren.

Delexikalisierung mit praat

  1. Kiel Corpus Sound-Datei öffnen: Read → Read from special sound file → Read Sound from raw 16-bit Big Endian file...


  2. Bei Dateien, die mehr als die gewünschte ips enthalten, überschüssiges Material abschneiden:
    1. Edit
    2. im Edit-Fenster: überschüssiges Material markieren und mit Ctrl-X wegschneiden

  3. Manipulationsdatei erzeugen: To Manipulation...


  4. Manipulationsdatei editieren: Edit

  5. Im "praat objects" Fenster: Extract pulses


  6. Delexikalisierte Sound-Datei mit Original-Intonation erzeugen: To Sound (hum)...


  7. Um eine monotone Intonation zu bekommen: Manipulationsdatei von der delexikalisierten Datei erzeugen (To Manipulation...)


  8. Diese neue Manipulationsdatei editieren: Edit

  9. Im "praat objects" Fenster: Get resynthesis (PSOLA)


  10. Nicht vergessen: Die beiden erzeugten Sound-Dateien speichern! (Write → Write to WAV file...)
Beispiel: Original, hum mit Intonation, hum 100 Hz.

Delexikalisierung mit MARY

Kiel Corpus: *.dat-Dateien erzeugen:

  1. Folgende Perlskripte herunterladen und im eigenen Homeverzeichnis speichern: s1h2dur.pl und dur2dat_silbenbill.pl


  2. Unter UNIX im eigenen Homeverzeichnis die Perlskripte auf die gewünschten Kiel Corpus Dateien anwenden, z.B. für die Datei k61be046.s1h folgende Befehle eintippen:

    1. perl s1h2dur.pl k61be046.s1h > k61be046.s1h.dur
    2. perl dur2dat_silbenbill.pl k61be046.s1h.dur > k61be046.dat

AVIP Corpus (Italienisch):

Hier gibt es pro Sprecher nur eine *.dat-Datei:

Erzeugung des "MBROLA input" für MARY:

Von Hand:

  1. Aus der jeweiligen *.dat-Datei den Abschnitt mit der ausgewählten ips herauskopieren und abspeichern.


  2. Die Laute systematisch ersetzen, z.B.
  3. Ggf. Dauern ändern: Wenn (in der veränderten Datei!) zwei identische Laute aufeinander folgen, dann müssen diese zu einem zusammengefasst werden (mit entsprechend aufsummierter Dauer).


  4. Alle Informationen außer Laut und Dauer löschen.


  5. Als erste Zeile einfügen: _ 100.00 (0,100)


  6. Als letzte Zeile einfügen: _ 100.00 (100,100)

Mit einem Perlskript (für die Variante -m-m-m):

  1. Aus der jeweiligen *.dat-Datei den Abschnitt mit der ausgewählten ips herauskopieren und abspeichern.


  2. Folgendes Perlskript herunterladen und im eigenen Homeverzeichnis speichern: dat2hummary.pl


  3. Beispiel-Aufruf für k61be046.dat: perl dat2hummary.pl k61be046.dat > k61be046.mary.txt


Eingabe in MARY:

  1. Als Input format "MBROLA: duration & frequency values (MBROLA input)" auswählen.


  2. Unter "Voice" eine Männerstimme auswählen.


  3. Als Input text den von Hand oder mit einem Perlskript erzeugten Text eingeben und den Button "Process" drücken.


  4. "Save to disk" auswählen und die erzeugte Sound-Datei speichern.


Beispiel: Original, sasasa -m-m-m, pbla, pbSZla.