Xuran Zhao présente ses travaux sur la réduction de dimensionnalité multivue pour la biométrie multimodale

Photo_Xuran_Zhao(4/4) C’est Xuran Zhao qui clôt notre série de présentation des quatre thèses lauréates du programme Futur et Ruptures de l’Institut Mines-Télécom. Les résultats de ses travaux, menés à Eurecom, permettent l’annotation automatique de grandes bases de données biométriques (big data). Cette annotation peu coûteuse peut jouer un rôle essentiel dans le développement à venir de nombreuses applications liées aux domaines de la biométrie, de la sécurité et du multimédia.

Titre de la thèse
Réduction de dimensionnalité multivue pour la biométrie multimodale

Résumé
Les données biométriques sont souvent représentées par des vecteurs de caractéristiques de grandes dimensions, qui impliquent des écarts important entre sessions. On a donc besoin de techniques efficaces de réduction de dimensionnalité pour extraire les caractéristiques discriminantes, de faibles dimensions, et pour atténuer les écarts non désirés, redondants pour la reconnaissance. Ces techniques de réduction de dimensionnalité discriminantes suivent généralement un schéma d’apprentissage supervisé, dans lequel est apprise une projection de sous-espace avec des paires étiquette-caractéristique. Toutefois, les données d’entraînement étiquetées sont généralement limitées en quantité et souvent ne reproduisent pas avec fiabilité les écarts entre sessions rencontrés sur les données test. La taille limitée des jeux d’entraînement étiquetés produit souvent des matrices de projection faussées et des performances dégradées en reconnaissance.

Cette thèse propose d’utiliser la réduction de dimensionnalité multivue (RDMV), qui vise à extraire les caractéristiques discriminantes des systèmes de biométrie multimodale, dans lesquels différentes modalités sont observées comme autant de vues de mêmes données. Plutôt que de baser l’entraînement sur des paires étiquette–caractéristique, les projections RDMV sont entraînées sur des paires caractéristique–caractéristique, pour lesquelles on n’a pas besoin des informations d’étiquette. Etant donné que les données non étiquetées sont plus faciles à acquérir en grande quantité, et étant donné la coexistence naturelle des vues multiples dans les problèmes de biométrie multimodale, il est possible d’apprendre des sous-espaces discriminants, de faibles dimensions, en utilisant les approches RDMV proposées, de façon largement non supervisée.

Selon les différentes fonctionnalités des systèmes de biométrie, à savoir la reconnaissance (dont l’identification et la vérification), le groupement et l’extraction, nous proposons trois cadres RDMV qui répondent aux contraintes de chaque fonctionnalité. Les approches proposées, toutefois, partagent un même principe : toutes les méthodes visent à apprendre une projection pour chaque vue, de telle façon qu’on parvient à une forme d’accord dans les sous-espaces, entre différentes vues. Les cadres RDMV proposés peuvent ainsi être réunis en un cadre général de réduction de dimensionnalité multivue par l’accord des sous-espaces. Nous considérons que ce concept novateur d’accord entre sous-espaces constitue la contribution principale de cette thèse.

Lire les 3 autres billets présentant les thèses lauréates du programme Futur et Ruptures
(1/4) Amine Ben Salem présente ses travaux sur les nanofils photoniques
(2/4)
Olivier Morillot présente ses travaux sur la reconnaissance de textes manuscrits
(3/4) Anaïs Vergne présente ses travaux sur la topologie algébrique appliquée aux réseaux de capteurs

En savoir + sur le programme Futur et Ruptures