Real-time Ultrasound-enhanced Multimodal Imaging of Tongue using 3D Printable Stabilizer System: A Deep Learning Approach

Auteurs-es

  • M. Hamed Mozaffari University of Ottawa http://orcid.org/0000-0002-2297-6114
  • Won-Sook Lee Professor, School of Electrical Engineering and Computer Science (EECS), University of Ottawa, Ottawa, Ontario, Canada, K1N 6N5

Résumé

Malgré une prise de conscience renouvelée de l'importance de l'articulation, les instructeurs ont toujours du mal à répondre aux besoins en prononciation des apprenants en langues. Il existe des outils pédagogiques relativement rares pour l’enseignement et l’apprentissage de la prononciation. Contrairement aux instructions inefficaces, les instructions de prononciation traditionnelles telles que l'écoute et la répétition, des systèmes de rétroaction visuelle électronique (EVF) tels que la technologie à ultrasons ont été utilisés dans de nouvelles approches.
Récemment, une méthode multimodale améliorée par ultrasons a été développée pour visualiser les mouvements de la langue d'un apprenant superposé au visage de la tête du locuteur. Ce système a été évalué pour plusieurs cours de langue via un paradigme d’apprentissage mixte au niveau universitaire.
Le résultat a été affirmé que la visualisation du système d’articulateur comme un biofeedback pour les apprenants en langues améliorerait considérablement l’efficacité de l’apprentissage de l’articulation.
Malgré l'utilisation réussie de la technique multimodale pour la formation à la prononciation, des travaux manuels et une manipulation humaine sont encore nécessaires. Dans cet article, nous souhaitons contribuer à cet ensemble croissant de recherches en abordant les difficultés des approches précédentes en proposant un nouveau système de formation complet, automatique et en temps réel, à la prononciation multimodale, bénéficiant de puissantes techniques d'intelligence artificielle.
L'objectif principal de cette recherche était de combiner les avantages de la technologie à ultrasons, de l'impression tridimensionnelle et des algorithmes d'apprentissage en profondeur pour améliorer les performances des systèmes précédents. Notre évaluation pédagogique préliminaire du système proposé a révélé une amélioration significative de la flexibilité, du contrôle, de la robustesse et de l’autonomie.

Biographie de l'auteur-e

M. Hamed Mozaffari, University of Ottawa

School of Electrical Engineering and Computer Science

Fichiers supplémentaires

Publié-e

2020-03-17

Comment citer

1.
Mozaffari MH, Lee W-S. Real-time Ultrasound-enhanced Multimodal Imaging of Tongue using 3D Printable Stabilizer System: A Deep Learning Approach. Canadian Acoustics [Internet]. 17 mars 2020 [cité 22 nov. 2024];48(1). Disponible à: https://jcaa.caa-aca.ca/index.php/jcaa/article/view/3305

Numéro

Rubrique

Article - Sciences de la parole