Strategies to Enhance Whispered Speech Speaker Verification: A Comparative Analysis
Mots-clés :
Parole chuchotée, détection de genre, vérification du locuteur, fréquence instantanée, classement de l’effort vocal, spectre de modulationRésumé
De nos jours, les outils tirant profit de l’analyse automatique de la parole sont de plus en plus utilisés au quotidien. Cette mobilité engendre de nouveaux défis pour les développeurs, qui doivent composer avec différents types de parole (par exemple, des chuchotements) et de sources de bruit. Dans cet article, une attention spéciale est accordée à la parole chuchotée, qui malgré son importance particulière dans le contexte d’une augmentation fulgurante de l’utilisation de téléphones intelligents dans le monde, demeure un champ inexploré. Plus spécifiquement, cet article explore les niveaux de performance atteignables lorsque la parole chuchotée est utilisée pour la vérification de locuteurs, à la fois dans des conditions correspondant et non-correspondant d’entraînement et de test. Plusieurs stratégies sont explorées afin d’améliorer la performance dans le cas non-correspondant, de même que dans des situations impliquant un bruit ambiant. Nos résultats confirment ceux obtenus dans des domaines connexes : des gains de performance significatifs peuvent être obtenus en développant des modèles de locuteurs basés sur la parole voisée et chuchotée. De plus, des gains additionnels peuvent être obtenus en considérant des modèles spécifiques à un style de parole et au sexe. Globalement, un niveau de performance semblable à celui obtenu avec la parole voisée a été atteint lors d’une tâche de vérification de locuteurs basée sur la parole chuchotée. En particulier, la fusion au niveau des traits caractéristiques (? feature fusion?) s’est avérée une stratégie importante pour le succès d’applications pratiques dans des conditions de parole propre et bruitée.
Fichiers supplémentaires
Publié-e
Comment citer
Numéro
Rubrique
Licence
Author Licensing Addendum
This Licensing Addendum ("Addendum") is entered into between the undersigned Author(s) and Canadian Acoustics journal published by the Canadian Acoustical Association (hereinafter referred to as the "Publisher"). The Author(s) and the Publisher agree as follows:
-
Retained Rights: The Author(s) retain(s) the following rights:
- The right to reproduce, distribute, and publicly display the Work on the Author's personal website or the website of the Author's institution.
- The right to use the Work in the Author's teaching activities and presentations.
- The right to include the Work in a compilation for the Author's personal use, not for sale.
-
Grant of License: The Author(s) grant(s) to the Publisher a worldwide exclusive license to publish, reproduce, distribute, and display the Work in Canadian Acoustics and any other formats and media deemed appropriate by the Publisher.
-
Attribution: The Publisher agrees to include proper attribution to the Author(s) in all publications and reproductions of the Work.
-
No Conflict: This Addendum is intended to be in harmony with, and not in conflict with, the terms and conditions of the original agreement entered into between the Author(s) and the Publisher.
-
Copyright Clause: Copyright on articles is held by the Author(s). The corresponding Author has the right to grant on behalf of all Authors and does grant on behalf of all Authors, a worldwide exclusive license to the Publisher and its licensees in perpetuity, in all forms, formats, and media (whether known now or created in the future), including but not limited to the rights to publish, reproduce, distribute, display, store, translate, create adaptations, reprints, include within collections, and create summaries, extracts, and/or abstracts of the Contribution.