logo Ircam

Localisation binaurale de sources sonores réalistes par factorisation en matrices non-négatives

Associated People: Nicolas Obin
Date of Activity: 
16/01/2019

Contexte :

Le stage s’inscrit  dans le cadre d’une collaboration entre les laboratoires STMS  (Sciences et Technologies de la Musique et du Son) et l’ISIR (Institut des Systèmes Intelligents et de Robotique) initiée depuis plusieurs années sur la conception de nouveaux paradigmes d’analyse d’environnement sonores spatialisés pour l’écoute robotique binaurale. La collaboration permet de développer et de consolider une position dominante nationale et internationale sur l’écoute artificielle, par le croisement de compétences en analyse d’environnements sonores par apprentissage (STMS) et l’écoute binaurale en robotique (ISIR).  Les travaux menés jusqu’à présent ont permis : 1) la conception d’algorithmes de localisation binaurale à partir de méthodes de factorisation en matrices non-négatives  (NMF) multi-canaux pour la localisation de sources sonores multiples en environnement bruités ; et 2) la réalisation d’une base de données de référence d’environnements binauraux réels avec un "Head And Torso Simulator" (HATS) Kemar pour permettre l’évaluation des algorithmes développées précédemment dans une tâche de localisation en environnement réel. 

 

 Objectifs :

L’objectif du stage est de contribuer à la réalisation et à l’optimisation d’algorithmes de localisation de sources sonores par NMF, et de réaliser une base d’évaluation quantitative  de la localisation binaurale de sources sonores à partir de captations binaurales en environnement réel :

1)    La compréhension du formalisme NMF pour la localisation de sources sonores en écoute binaurale, et la maîtrise des algorithmes existants;

2)    Le formatage des bases de données binaurales pour pouvoir être utilisés pour une évaluation quantitative sur une tâche de localisation de sources sonores ;

3)    L’optimisation des algorithmes NMF binauraux sur la tâche de localisation.

Le stage s’appuiera sur les connaissances actuelles en machine d’écoute et factorisation NMF de l’équipe Analyse et Synthèse (AS) des Sons à l’Ircam et sur les bases de données réalisées en collaboration entre l’Ircam et l’ISIR. Possibilité de poursuite en thèse.