BITS Unit Selection Synthesis Corpus

View resource name in all available languages

Corpus de synthèse de sélections d’unités BITS

BITS-US

ID:

ELRA-S0224

BITS stands for "BAS Infrastructures for Technical Speech Processing" and was funded by the German Ministry of Science and Education during 2003-2005.

The BITS synthesis corpus consists of two parts: a set of logatome recordings for controlled diphone synthesis (ELRA-S0217) and a set of sentence recordings for unit selection techniques (ELRA-S0224).

This corpus contains 6,732 recordings spoken by 4 professional German speakers covering all German diphone combinations in different prosodic contexts.

The data is stored on 4 DVDs. Each DVD contains the recordings, the annotation files and the meta data files of one of the four professional speakers, and the entire corpus' documentation. Each speaker was recorded in an insulated room with low reverberation.

Each sentence was recorded in three channels: close microphone, large membrane microphone and laryngographic signal. All recordings are segmented and labelled into phonemic units as well as annotated prosodically.

The same 4 professional speakers also spoke the BITS Logatome Synthesis Corpus (ELRA-S0217) enabling the user to combine diphone and unit selection techniques based on the same speakers.

• Total number of recordings: 6,732
• Total duration: 813 minutes
• Format: WAV 48kHz, 16 bit, Praat TextGrid, BAS Partitur Format (BPF)
• Segmentation: extended German SAM-PA
• Prosodic Annotation: GTobi 'Light'

View resource description in all available languages

BITS ("BAS Infrastructures for Technical Speech Processing" - Infrastructures BAS pour le traitement de la parole technique) a été financé par le ministère allemand des sciences et de l’éducation entre 2003 et 2005. Le corpus de synthèse BITS est constitué de deux parties : un ensemble d’enregistrements de logatomes pour la synthèse de diphones contrôlés (ELRA-S0217) et un ensemble d’enregistrements de phrases pour les techniques de sélection d’unités (à paraître).

Ce corpus comprend 6 732 enregistrements prononcés par 4 locuteurs professionnels allemands et couvre toutes les combinaisons de diphones allemands dans différents contextes prosodiques.

Les données sont fournies sur 4 DVD. Chaque DVD contient les enregistrements, les fichiers d’annotation et les fichiers de méta-données pour un locuteur, ainsi que la documentation complète du corpus. Chaque locuteur a été enregistré dans une salle isolée avec une réverbération basse.

Chaque phrase a été enregistrée sur 3 canaux : un micro-casque, un microphone à membrane large et un signal laryngographique. Tous les diphones sont segmentés et étiquetés en unités phonémiques et sont annotés au niveau prosodique.

Les 4 locuteurs sont identiques à ceux du Corpus de synthèse de logatomes BITS (ELRA-S0217), permettant ainsi à l’utilisateur de combiner les techniques de diphones et de sélections d’unités basées sur les mêmes locuteurs.

• Nombre total d’enregistrements : 6 732
• Durée totale : 813 minutes
• Format: WAV 48 kHz, 16 bit, Praat TextGrid, Format « Partitur » de BAS
• Segmentation: SAM-PA étendu à l’allemand
• Annotation prosodique : GTobi 'Light'

You don’t have the permission to edit this resource.