Swiss-French SpeechDat(M)

View resource name in all available languages

Base de données SpeechDat(M) du suisse-romand

ID:

ELRA-S0103

The Swiss-French SpeechDat(M) project comprises 1000 recorded Swiss-French speakers (575 female and 425 male speakers) . The corpus contains phonetically rich sentences & application oriented utterances such as keywords, digits, etc..
Speech samples are stored as sequences of 8-bit 8 kHz A-law speech samples (before compression). Each prompted utterance is stored in a separate file. Each signal file is accompanied by an ASCII SAM label file which contains the relevant descriptive information.
The following items were recorded:
- 1 sequence of 6 single digits including the hash (#) and the star (*) symbols
- 1 sheet id number (5 connected digits / 1 natural number)
- 1 telephone number (spontaneous)
- 1 16-digit credit card number
- 2 natural numbers (1 + sheet id)
- 2 money amounts
- 1 quantity
- 3 spelled words
- 1 time phrase (prompted, word style)
- 1 date (spontaneous)
- 1 date (prompted)
- 1 yes/no question
- 1 city name (prompted)
- 1 city name (spontaneous)
- 5 function words
- 1 name (spelling table)
- 1 mother tongue (spontaneous)
- 1 education level (out of 3 choices)
- 1 telephone type (out of 6 choices)
- 10 sentences (read)
- 1 query to telephone directory (given the name and the city of subject)
- 1 free comment on the session

A pronunciation lexicon with a phonemic transcription in SAMPA is also included.

View resource description in all available languages

La base de données SpeechDat(M) du suisse-romand comprend des enregistrements téléphoniques de 1000 locuteurs suisses romands (425 hommes et 575 femmes) enregistrés directement à travers le réseau téléphonique fixe suisse.

Le stockage des fichiers de parole suit les standards du projet ESPRIT SAM. Les fichiers de parole ont été échantillonnés à 8 kHz, enregistrés en séquences de 8 bits, loi-A, et ensuite compressés. Chaque énoncé a été stocké dans un fichier séparé. Chaque fichier signal est accompagné d'un fichier d'en-tête au format ASCII SAM qui contient la description du fichier parole correspondant.

Les éléments suivants ont été enregistrés :

* 1 séquence de 6 chiffres qui inclut les signes (*) et (#) ;
* 1 numéro d’identification à 5 chiffres connectés et un nombre entier
* 1 numéro de téléphone (spontané)
* 1 numéro de carte de crédit à 16 chiffres
* 2 nombres entiers naturels ;
* 2 montants en devises ;
* 1 quantité
* 3 mots épelés ;
* 1 phrase comportant une notion de temps (lue);
* 1 date (spontanée) ;
* 1 date (lue) ;
* 1 question oui/non ;
* 1 nom de ville (lu) ;
* 1 nom de ville (spontané) ;
* 5 mots de commande ;
* 1 nom (épelé) ;
* 1 langue maternelle (spontanée) ;
* 1 niveau d'éducation (3 choix proposés) ;
* 1 type de téléphone (6 choix proposés) ;
* 10 phrases lues ;
* 1 requête adressée aux renseignements téléphoniques (nom et lieu d'habitation du sujet connus) ;
* 1 commentaire libre sur la session.

Un lexique de prononciation avec sa transcription phonétique en SAMPA est également fourni.

You don’t have the permission to edit this resource.