logo Ircam

Détection, localisation et caractérisation sonore par un robot mobile

Associated People: Nicolas Obin
Date of Activity: 
13/01/2017

 

Responsables : Nicolas Obin, (IRCAM ), Théophile Gonos, Hanan Salam, David Vigouroux (A.I.Mergence)

Lieu: A.I.mergence (Paris)

Contexte : A.I.Mergence est une jeune société (JEI) spécialisée en intelligence artificielle et robotique autonome. Elle conçoit un robot intelligent de sécurité/surveillance nommé E-4 pour les particuliers et les entreprises. E-4 remplace les systèmes d’alarme conventionnels. Il planifie des rondes automatiquement afin de surveiller la maison. Lorsqu’E4 se met en veille, il est capable de détecter un bruit anormal. Le robot se réveille ensuite et se dirige ainsi vers la source du bruit afin vérifier qu’il n’y a pas eu une intrusion.

Objectifs : Dans le cadre du développement du robot de sécurité E-4, le stage aura pour but de concevoir le module, composants électroniques et algorithmes, en charge de détecter et localiser la source d’un son. Le travail à effectuer dans ce stage concernera l’extension du système de la localisation multi-sources par NMF [ROUTE, 2015; Benaroya, 2017] développé par l’IRCAM. Il pourra comprendre :

- la généralisation de l’algorithme au « multinaural »

- l’extension de l’algorithme pour prendre en compte les indices binauraux tel que Interaural Level Difference (ILD) et Interaural Time Difference (ITD) [Sawada, 2013, Magron, 2016]

- l’adaptation à l’environnement sonore : savoir distinguer le bruit de l’environnement et le bruit propre du robot. Ce travail est important pour la caractérisation de bruit notamment lorsque le robot est en mouvement.

- l’expérimentation en milieu réaliste, c.a.d avec les « oreilles » de robot mobile E-4

Une étude préliminaire sur la détection d’activité anormale sera réalisée. Le robot devra être capable de différentier un bruit « normal » pour une maison spécifique d’un bruit qui ne l’est pas.

Les problématiques abordées durant le stage seront choisies en début du stage après une phase d’étude bibliographique. Les solutions réalisées au cours du stage seront intégrées au robot de sécurité E-4 et tester en conditions réelles.

Bibliographie :

[Benaroya, 2017] L. Benaroya, N. Obin, M. Liuni, A. Roebel, W. Raumel, S. Argentieri. NTF-based binaural sound source localization for robot audition, ,submitted to IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2017.

 [Magron, 2016] P. Magron, R. Badeau, B. David. Complex NMF under phase constraints based on signal modeling: application to audio source separation, in IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2016.

[ROUTE, 2015] ROUTE: RObot à l’écoUTE, programme Convergence, Sorbonne Universités (juin 2015-mai 2016).

[Sawada, 2013] H. Sawada, H. Kameoka, S. Araki, and N. Ueda. Multichannel Extensions of Non-Negative Matrix Factorization With Complex-Valued Data, in IEEE Transactions on Audio Speech and Language Processing (TASLP), 21(5), p.971-982, 2013