Strategies to Enhance Whispered Speech Speaker Verification: A Comparative Analysis

Auteurs-es

  • Milton O. Sarria-Paja Institut National de la Recherche Scientifique, Centre EMT, University of Quebec
  • Tiago H. Falk Institut National de la Recherche Scientifique, Centre EMT, University of Quebec

Mots-clés :

Parole chuchotée, détection de genre, vérification du locuteur, fréquence instantanée, classement de l’effort vocal, spectre de modulation

Résumé

De nos jours, les outils tirant profit de l’analyse automatique de la parole sont de plus en plus utilisés au quotidien. Cette mobilité engendre de nouveaux défis pour les développeurs, qui doivent composer avec différents types de parole (par exemple, des chuchotements) et de sources de bruit. Dans cet article, une attention spéciale est accordée à la parole chuchotée, qui malgré son importance particulière dans le contexte d’une augmentation fulgurante de l’utilisation de téléphones intelligents dans le monde, demeure un champ inexploré. Plus spécifiquement, cet article explore les niveaux de performance atteignables lorsque la parole chuchotée est utilisée pour la vérification de locuteurs, à la fois dans des conditions correspondant et non-correspondant d’entraînement et de test. Plusieurs stratégies sont explorées afin d’améliorer la performance dans le cas non-correspondant, de même que dans des situations impliquant un bruit ambiant. Nos résultats confirment ceux obtenus dans des domaines connexes : des gains de performance significatifs peuvent être obtenus en développant des modèles de locuteurs basés sur la parole voisée et chuchotée. De plus, des gains additionnels peuvent être obtenus en considérant des modèles spécifiques à un style de parole et au sexe. Globalement, un niveau de performance semblable à celui obtenu avec la parole voisée a été atteint lors d’une tâche de vérification de locuteurs basée sur la parole chuchotée. En particulier, la fusion au niveau des traits caractéristiques (? feature fusion?) s’est avérée une stratégie importante pour le succès d’applications pratiques dans des conditions de parole propre et bruitée. 

Bibliographies de l'auteur-e

Milton O. Sarria-Paja, Institut National de la Recherche Scientifique, Centre EMT, University of Quebec

PhD estudent

Institut National de la Recherche Scientifique, Centre EMT, University of Quebec

Tiago H. Falk, Institut National de la Recherche Scientifique, Centre EMT, University of Quebec

Assistant Professor, INRS-EMT
Director, MuSAE Lab

Fichiers supplémentaires

Publié-e

2015-12-15

Comment citer

1.
Sarria-Paja MO, Falk TH. Strategies to Enhance Whispered Speech Speaker Verification: A Comparative Analysis. Canadian Acoustics [Internet]. 15 déc. 2015 [cité 15 juill. 2024];43(4):31-45. Disponible à: https://jcaa.caa-aca.ca/index.php/jcaa/article/view/2670

Numéro

Rubrique

Article - Sciences de la parole