Résumé |
Les outils d’analyse et de synthèse de la voix suscitent beaucoup d’intérêts et s’intègrent dans de nombreuses applications. Afin de répondre à la complexité des phénomènes mis en jeu dans sa production, la communauté scientifique s’intéresse à des approches fondées sur (1) la concaténation d’unités de sons, (2) des modèles de signaux, (3) la modélisation source-filtre, (4) des modèles physiques simplifiés, (5) des modélisations vibro-aéroacoustique complexes. Les approches de type signal (1-3) permettent des analyses/synthèses de qualité et les approches plus physiques permettent de mieux comprendre le fonctionnement de la voix. Cependant, le réalisme sonore est encore limité dans le cas des modèles de signaux car des phénomènes significatifs (e.g. couplage glotte/conduit vocal) ne sont pas représentés et il est difficile d’obtenir des méthodes d’estimation et d’inversion robustes pour les modèles physiques. On se propose ici de construire, d’étudier et de valider des systèmes dynamiques de production de la voix hérités de la structure source-filtre mais intégrant l’effet de la géométrie de la glotte et du couplage avec le conduit vocal; on se situe à l’interface entre (3) et (4). Le projet s’articule en trois parties: 1. Des modèles à pilotage forcé hérités du « modèle source-filtre » mais incluant des phénomènes physiques négligés dans les versions initiales (tels que couplage aéro-acoustique) seront proposés et étudiés. Dans un premier temps, le modèle standard de Liljencrants-Fant sera utilisé. Il pilotera l’ouverture d’un modèle géométrique de glotte plutôt que directement son débit glottique. 2. Un dispositif électronique d’électroglottographe multi-capteurs à multiplexage fréquentiel sera développé dans le cadre d’un projet mécatronique de l’Ecole des Mines de Paris, Mines’ParisTech. 3. Des outils d’estimation automatique des paramètres de pilotage seront développés pour chaque modèle afin d’aboutir à une chaîne complète d’analyse-resynthèse de son. |