(1/3) Qui sera le grand gagnant du prix de thèse Futur & Ruptures ? Réponse le 7 avril prochain, lors de la cérémonie de remise des Prix de la Fondation Télécom. Auteurs de thèses distinguées pour leur excellence, les trois lauréats recevront chacun un prix, pour un montant total de 9 500 €. En attendant de connaître le classement final, nous vous présentons dans une série de trois billets leurs travaux, menés au sein des laboratoires des écoles de l’Institut Mines-Télécom.
Aujourd’hui, nous vous présentons les travaux de Giovanni Chierchia, conduits au sein du département Traitement du Signal et des Images (TSI) à Télécom ParisTech. Il a utilisé l’optimisation mathématique pour mieux aborder les problèmes de vision par ordinateur, notamment la restauration d’images et la détection d’images falsifiées.
Une image numérique est définie par le nombre de pixels qui la composent en largeur et en hauteur et par l’étendue des couleurs que peut prendre chaque pixel. Améliorer la qualité visuelle d’une image dégradée revient donc à retrouver ces deux valeurs, en faisant en sorte qu’elles soient les plus proches possible des valeurs originales. Cette tâche peut être traduite par un problème mathématique où le but est d’optimiser un objectif quantitatif (ici, on calcule le minimum d’une fonction convexe). Dans le cadre de sa thèse, Giovanni Chierchia a développé des algorithmes qui permettent d’obtenir de meilleurs résultats, en des temps plus rapides pour résoudre trois types de problèmes en vision par ordinateur.
Cette nouvelle approche d’optimisation est d’abord très efficace pour la restauration d’images hyperspectrales : des images qui contiennent, en plus des composantes rouge, verte et bleue, celles acquises dans l’infrarouge et l’ultraviolet. Comme cela représente une grande quantité de données, on utilise une méthode de compression, l’acquisition comprimée (compressive sensing) qui ne conserve que les données utiles ; mais il est ensuite très difficile de reconstruire l’image. Grâce à un modèle exploitant la grande corrélation entre les données spatiales et spectrales, et à un algorithme efficace d’optimisation convexe, Giovanni Chierchia a réussi à obtenir des images reconstruites de meilleure qualité en trois fois moins de temps qu’avec les méthodes existantes.
Il a aussi travaillé à améliorer la classification des données, par exemple pour identifier quelle surface est associée à chaque pixel d’une image hyperspectrale. Il a mis au point un algorithme d’apprentissage supervisé (technique d’intelligence artificielle qui permet de généraliser pour des données inconnues ce qu’il a pu apprendre grâce aux exemples déjà traités) pour classer automatiquement des groupes de pixels selon leur zone d’appartenance. Là encore, les algorithmes de Giovanni Chierchia réduisent les erreurs de classification et les temps d’apprentissage.
Ses méthodes sont aussi utiles pour la détection d’images falsifiées, en permettant d’identifier quels pixels ont été manipulés sur une image. Le chercheur s’est basé sur le fait qu’une caméra introduit, dans chaque photo, un bruit unique ayant pour origine la non-uniformité de réponse du capteur photographique (PRNU). Le PRNU peut être estimé à partir d’une vingtaine de photos prises par la caméra. Si une photo a été modifiée, certains pixels ne contiennent plus le même bruit de la camera et sont donc déclarés falsifiés. Cette approche permet d’augmenter la probabilité de détection, surtout dans le cas de petites falsifications.
Ces outils trouvent des applications dans de nombreux domaines : la géophysique qui utilise des images hyperspectrales pour identifier les différents matériaux dans un terrain, la restauration de peintures ou de manuscrits anciens et, bien évidemment, l’investigation numérique légale, pour vérifier l’authenticité des photos. Les algorithmes développés par Giovanni Chierchia sont également utilisés dans d’autres travaux de recherche, comme l’allocation de débit en codage vidéo et l’imagerie à grande gamme dynamique.
En savoir + sur le programme Futur et Ruptures
Titre de la thèse : Éclatement épigraphique pour la gestion de contraintes convexes non-linéaires. Applications à la restauration d’images, la classification supervisée et la détection d’images falsifiées. Résumé : Dans cette thèse, nous proposons une approche d’optimisation convexe pour aborder des problèmes en restauration d’images multi-composantes, en apprentissage supervisé et en détection d’images falsifiées. Le fil conducteur de ces problèmes est la présence de contraintes convexes non linéaires. Nous avons élaboré une technique d’éclatement de ces contraintes pour en simplifier la gestion. En s’appuyant sur cette approche, nous avons également proposé des contributions spécifiques dans les applications susmentionnées.La première partie de la thèse vise à décrire la technique d’éclatement de contraintes non-linéaires. Plus précisément, il s’agit de décomposer un ensemble de sous-niveau d’une fonction séparable en une collection d’épigraphes. Ceci se traduit par une réduction de la complexité des algorithmes d’optimisation lorsque cet ensemble est basé sur des fonctions telles que la valeur absolue, la fonction distance à un ensemble convexe, la norme euclidienne, la norme infinie, ou la fonction max. Nous démontrons à travers des simulations numériques que la méthode proposée peut efficacement gérer des contraintes basées sur des fonctions usuelles en restauration d’image ou en apprentissage supervisé, telles que la variation totale non-locale, la divergence de Kullback-Leibler ou la régression logistique.La deuxième partie de la thèse apporte trois contributions fondées sur l’éclatement épigraphique. La première consiste en une nouvelle régularisation pour le traitement des images multi-composantes qui généralise la variation totale non-locale en prenant en compte le tenseur de structure. La seconde contribution fournit un algorithme d’apprentissage supervisé permettant d’apprendre efficacement et exactement une machine à vecteurs de support multi-classe avec une régularisation parcimonieuse. La troisième contribution consiste à décrire une approche variationnelle pour la détection d’images falsifiées à travers la non-uniformité de la réponse photonique (bruit propre à chaque caméra). Des expériences numériques ont été menées pour chacune de ces applications afin de démontrer l’efficacité et la performance de notre approche par rapport aux méthodes de l’état de l’art.
Voir la liste des publications issues de la thèse.
4 comments
Pingback: Et le grand gagnant des Prix 2015 de la Fondation Télécom est... - Recherche & Innovation
Pingback: Et les grands gagnants des Prix 2015 de la Fondation Télécom sont… - Institut Mines-Télécom
Pingback: Y los ganadores de los Premios 2015 de la Fundación Télécom son… - Institut Mines-Télécom
Pingback: Y los ganadores de los Premios 2015 de la Fundación Télécom son… - IMT