Segmentation de signaux audio: Une nouvelle approche utilisant le critere d'alignement
Mots-clés :
Audio systems, Digital signal processing, Field programmable gate arrays (FPGA), Principal component analysis, Audio indexing, Classical principal component analysis, Machine learning problem, Model freeRésumé
La discrimination de classes sonores dans un système d’indexation audio est indispensable et conditionne les performances de celui-ci. En effet, étant donné la complexité de la bande sonore d’un document audiovisuel il est souvent recherché l’accès rapide à des bruits ou des événements sonores particuliers comme des passages musicaux ou des locuteurs particuliers ou des mots clefs préétablis. Cet objectif fait appel à une étape préalable de discrimination classe/ non classe. Nous proposons dans cet article un algorithme original permettant la segmentation semi supervisée de signaux audio. Cet algorithme met en œuvre une Analyse en Composantes Principales (ACP) combinée avec le critère d’alignement de noyaux introduit en apprentissage statistique. Cet algorithme ne nécessite pas une modélisation des données ni aucune connaissance préalable du contenu des fichiers audio analysés. Les résultats obtenus sur une base de données de sons radiodiffusés multi sources montrent clairement la pertinence de cette approche. Sa simplicité de mise en œuvre et d’interprétation permettent la possibilité de son exploitation dans un processus de décision en ligne.Fichiers supplémentaires
Publié-e
Comment citer
Numéro
Rubrique
Licence
Author Licensing Addendum
This Licensing Addendum ("Addendum") is entered into between the undersigned Author(s) and Canadian Acoustics journal published by the Canadian Acoustical Association (hereinafter referred to as the "Publisher"). The Author(s) and the Publisher agree as follows:
-
Retained Rights: The Author(s) retain(s) the following rights:
- The right to reproduce, distribute, and publicly display the Work on the Author's personal website or the website of the Author's institution.
- The right to use the Work in the Author's teaching activities and presentations.
- The right to include the Work in a compilation for the Author's personal use, not for sale.
-
Grant of License: The Author(s) grant(s) to the Publisher a worldwide exclusive license to publish, reproduce, distribute, and display the Work in Canadian Acoustics and any other formats and media deemed appropriate by the Publisher.
-
Attribution: The Publisher agrees to include proper attribution to the Author(s) in all publications and reproductions of the Work.
-
No Conflict: This Addendum is intended to be in harmony with, and not in conflict with, the terms and conditions of the original agreement entered into between the Author(s) and the Publisher.
-
Copyright Clause: Copyright on articles is held by the Author(s). The corresponding Author has the right to grant on behalf of all Authors and does grant on behalf of all Authors, a worldwide exclusive license to the Publisher and its licensees in perpetuity, in all forms, formats, and media (whether known now or created in the future), including but not limited to the rights to publish, reproduce, distribute, display, store, translate, create adaptations, reprints, include within collections, and create summaries, extracts, and/or abstracts of the Contribution.