Synthèse vocale

Infos
La synthèse vocale est la technique de synthèse sonore qui vise à la création artificielle de paroles, via un système de traitement du signal. Elle peut s'inscrire dans un système d'interaction vocale.
Synthèse vocale

La synthèse vocale est la technique de synthèse sonore qui vise à la création artificielle de paroles, via un système de traitement du signal. Elle peut s'inscrire dans un système d'interaction vocale.

Historique

Il y a eu plusieurs techniques de synthèse vocale jusqu'à nos jours. La première, populaire entre 1965 et 1985, est appelée synthèse vocale par règles. Celle-ci est basée sur la modélisation de la parole à partir d'un spectre sonore. Des règles peuvent être écrites pour générer un spectre sonore artificiel. Cette technique permet des économies de mémoire considérables. La seconde technique, dite par concaténation de diphones, n'est pas purement artificielle. Les sons synthétisés sont en fait des segments d'enregistrement de parole artificiellement attachés les uns à la suite des autres. Cette technique peut être produite avec moins de 10 Méga octets de données sonores. La parole synthétisée semble plus naturelle que celle produite par règles, mais des problèmes persistent lorsque la longueur de phonème, l'intonation et l'accent tonique sont pris en compte. Pour remédier à ces problèmes, il est possible d'augmenter la quantité d'extrait sonore à utiliser pour la concaténation. Plusieurs extraits pour un même diphone peuvent être utilisés dans un même contexte, et plusieurs types de contextes (intonation, accent, type de phrase) peuvent avoir chacun leurs diphones. On parle alors de synthèse par sélection de diphones ou sélection d'unités (Unit Selection). Ceux-ci sont ensuite utilisés lors de la synthèse vocale de façon à réduire les mauvaises transitions. Cette amélioration peut demander des bases de données de diphones de plusieurs Méga octets, voire de plusieurs Giga octets.

Techniques

Formants

voir Formant

Intonation

à rédiger

Diphones

Un diphone représente la transition entre deux phonèmes successifs.

Voir aussi

- Lecteur d'écran
- Reconnaissance vocale
- Vocalisation
- Vocoder ===
Sujets connexes
Accent tonique   Concaténation   Festival Speech Synthesis System   Formant   Intonation prosodique   Lecteur d'écran   Phonème   Reconnaissance vocale   Spectre sonore   Synthèse sonore   Traitement du signal   Vocalisation   Vocoder  
#
Accident de Beaune   Amélie Mauresmo   Anisocytose   C3H6O   CA Paris   Carole Richert   Catherinettes   Chaleur massique   Championnat de Tunisie de football D2   Classement mondial des entreprises leader par secteur   Col du Bonhomme (Vosges)   De viris illustribus (Lhomond)   Dolcett   EGP  
^