VERIF1DE

ID:

ELRA-S0343

The speech corpus VERIF1DE contains 20 recordings (sessions) of 150 German speakers each over the telephone network. Sessions are distributed over a period of time (speakers were not allowed to record more than one session a day, but this was not controlled). Each session contains 40 single recordings, mainly speech read from a prompt sheet. The acoustic environment is classified into quiet (14) and noisy (6); the telephone channel is either fixed network (10) or GSM (10). Recorded content is mainly SpeechDat conform extended by some extra items. The corpus has been pre-validated by BAS, then repaired (extra recordings to replace missing items), and then a final validation was performed by SPEX. After the final validation (version 1) the corpus was again repaired to some extent (version 1.3).

Content of version 1.3, dated 24/10/2001:
• Number of speakers: 150
• Number of sessions: 3,000
• Number of recordings: 120,000
• File formats:
- SpeechDat European telephone format ALAW 8kHz, 8 bit, raw
- SpeechDat annotation files (SAM)
- Metadata: speaker and recording protocols (SpeechDat)
- Lexicon: ISO-8859 ASCII / SAM-PA (manually corrected)
• SpeechDat orthographic transcription
• Distribution medium: DVD-R

View resource description in all available languages

Le corpus de parole VERIF1DE comprend 20 enregistrements (sessions), chacun réalisé par 150 locuteurs allemands via le réseau téléphonique. Les sessions sont réparties par période de temps (les locuteurs n’étaient pas autorisés à enregistrer plus d’une session par jour, sachant que ceci n’était pas contrôlé). Chaque session comprend 40 enregistrements distincts, principalement de la parole lue à partir d’une feuille d’énoncé. L’environnement acoustique est classifié en calme (14) et bruité (6); le canal téléphonique est d’une part réseau fixe (10) et d’autre part GSM (10). Le contenu enregistré est conforme au standard SpeechDat principalement avec une extension à quelques éléments supplémentaires. Le corpus a été pré-validé par BAS, puis corrigé (enregistrements supplémentaires pour remplacer des éléments manquants), puis une validation finale a été réalisée par SPEX. Après la validation finale (version 1), le corpus a été à nouveau corrigé (version 1.3).

Contenu de la version 1.3, du 24/10/2001:
• Nombre de locuteurs: 150
• Nombre de sessions: 3000
• Nombre d’enregistrements: 120000
• Formats de fichiers:
- Format telephone européen SpeechDat ALAW 8kHz, 8 bit, raw
- Fichiers d’annotation SpeechDat (SAM)
- Meta-données: protocoles de locuteur et d’enregistrement (SpeechDat)
- Lexique: ISO-8859 ASCII / SAM-PA (corrigé manuellement)
• Transcription orthographique SpeechDat
• Support de distribution: DVD-R

You don’t have the permission to edit this resource.