MULTEXT Prosodic database 
Base de données prosodique MULTEXT
This database comprises one CD-ROM for each five languages (French, English, Italian, German and Spanish), totalling 4 hours and 20 minutes of speech and involving 50 different speakers (5 male and 5 female per language). The recordings on which the corpus is based consist of passages of about five sentences extracted from the EUROM.1 speech corpus (Esprit 2589 project "Multi-lingual Speech Input/output Assessment, Methodology and Standardisation"). The corpus was stylised automatically by an algorithm which factors out microprosodic effects and represents the intonation contour of utterances by a series of target points. Once interpolated by a smooth curve (spline), these points produce a contour indistinguishable from the original when re-synthesised, apart from a few detection errors. A symbolic coding of the 50000 pitch movements of the corpus is also provided, along with the time-alignment of orthographic transcription to signal at word level. The entire corpus was verified and manually corrected by experts for each language.
The CD-ROMs contain for each passage:
· the signal file from EUROM.1,
· the alignment of orthographic transcription to signal at word level,
· the Fo file,
· the stylisation files,
· the re-synthesis using the stylised Fo,
· the symbolic coding file,
· the residual Fo, i.e. the difference between the Fo and the stylised curve,
· a description file for the recording.
Additional information: Campione, E., Véronis, J. (1998). A multilingual prosodic database. Proceedings of ICSLP'98, Sidney, Australia.
(download PDF version):
Cette base comprend un CD-ROM pour chacune des 5 langues (français, anglais, italien, allemand et espagnol). Elle totalise 4 heures et 20 minutes de parole et 50 locuteurs différents (5 hommes et 5 femmes par langue). Les enregistrements consistent en des passages d'environ cinq phrases extraites du corpus de parole EUROM.1.
Ce corpus a été stylisé automatiquement par un algorithme qui met en évidence les effets micro-prosodiques et représente le contour d'intonation des occurrences par un série de points cibles. Une fois intercalés dans une courbe régulière (spline), ces points produisent un contour indistinct à partir de l'original re-synthétisé, mises à part quelques erreurs de détection. Un codage symbolique des 50 000 mouvements d'inclinaison du corpus est également fourni, ainsi que l'alignement temporel au niveau du mot de la transcription orthographique avec le signal. L'intégralité du corpus a été vérifiée et corrigée manuellement par des experts de chaque langue.
Les CD contiennent pour chaque passage :
le fichier de signal d'EUROM.1,
l'alignement au niveau du mot de la transcription orthographique avec le signal,
le fichier Fo,
les fichiers de stylisation,
la re-synthèse utilisant le fichier Fo stylisé,
le fichier de codage symbolique,
la résiduelle Fo, i.e. la différence entre Fo et la courbe stylisée,
un fichier de description de l'enregistrement.
Information complémentaire : Campione, E., Véronis, J. (1998). A multilingual prosodic database. Proceedings of ICSLP'98, Sidney, Australia.
(version PDF téléchargeable:
