Une IA pour assister les personnes âgées

Cet article a été initialement publié sur le site de Télécom SudParis.

Projets européens H2020Une intelligence artificielle empathique et expressive ? Le concept, semblant tout droit sorti de la romance homme-machine du film Her, est au centre du projet horizon 2020, EMPATHIC. Ce projet veut permettre le développement d’un logiciel de coach virtuel personnalisable d’assistance aux personnes âgées. Entretien avec sa responsable scientifique pour Télécom SudParis, Dijana Petrovska-Delacretaz, experte en reconnaissance vocale.

 

Quel est l’objectif du projet Empathic ?

Dijana Petrovska-Delacretaz : Son nom complet est « Empathic Expressive Advanced Virtual Coach To Improve Independent Healty Life-Years of the Elderly« . Son but est de développer un coach virtuel avancé, empathique et expressif, pour assister les personnes âgées dans leur vie de tous les jours. Une interface dotée d’une intelligence artificielle à plusieurs modalités qui serait adaptable, modulable et disponible sur plusieurs supports : PC, smartphone ou tablette. On veut exploiter toute une gamme d’informations audiovisuelles et les interpréter pour se rendre compte de l’état de l’utilisateur et essayer de lui répondre et d’interagir avec lui de la façon la plus convenable possible pour l’aider. Pour cela, on va assembler plusieurs technologies comme le traitement du signal ou la biométrie.

Comment allez-vous concevoir cette IA ?

DPD : Nous allons associer du traitement du signal, de la reconnaissance de la parole et du visage, et de la reconnaissance des formes avec des « deep networks » (réseaux de neurones artificielles profonds). C’est-à-dire reproduire un peu la structure de notre cerveau avec les moyens de calculs des ordinateurs et des processeurs. Ce nouveau paradigme est devenu possible grâce à l’augmentation massive de leur puissance de stockage et de calcul. Il nous permet de faire beaucoup plus de choses en beaucoup moins de temps.

En outre, on exploitera des technologies de modélisation 3D pour développer des avatars aux visages plus expressifs – que ce soit un humain, un chat, un robot, un hamster ou même un dragon – et adaptables aux préférences de l’utilisateur, afin de faciliter le dialogue entre ce dernier et le coach virtuel. Le plus intéressant, d’un point de vue biométrique mais aussi d’intelligence artificielle, c’est d’utiliser un maximum de modalités : de l’utilisation de la voix et des expressions du visage jusqu’à la reconnaissance des émotions. Le tout permettra au coach virtuel de reconnaître son interlocuteur et d’avoir un dialogue adéquat avec lui.

Pourquoi pas un robot-assistant ?

Le robot Nao est utilisé à Télécom SudParis dans des travaux de reconnaissance et d'interprétation des gestes.
Le robot Nao est utilisé à Télécom SudParis dans des travaux de reconnaissance et d’interprétation des gestes.

DPD : Le logiciel sera parfaitement implémentable dans un robot, comme Nao déjà utilisé ici sur les plateformes HadapTIC et EVIDENT. C’est donc en effet une alternative envisageable : plutôt que d’avoir un coach virtuel sur le PC ou le smartphone, il est physiquement avec vous. L’avantage avec un coach dématérialisé, c’est que je peux l’emporter beaucoup plus facilement avec moi, sur ma tablette durant mes voyages.
De plus, un robot comme Nao, d’un point de vue sécurité, n’est pas autorisé partout. Nous voulons vraiment développer un système qui soit facilement portable et ne soit pas encombrant. Le défi est de combiner toutes ces technologies, qu’elles fonctionnent ensemble afin qu’on puisse dialoguer avec une intelligence artificielle selon des scénarios plus adaptés à une personne âgée, sur divers appareils.

Qui participe au projet Empathic ?

DPD : L’université del Pais Vasco à Bilbao coordonne le projet et contribue à la partie dialogue. En complément, nous procurons la technologie de biométrie vocale et de reconnaissance des émotions du visage ainsi que l’apparence physique de l’avatar. Les partenaires industriels impliqués dans le projet sont Osatek, Tunstall, Intelligent Voice et Acapela. Osatek est la plus grande entreprise espagnole d’objets connectés de surveillance et d’assistance à domicile. Tunstall est spécialisée dans ce genre de matériel aussi. Quant à Intelligence Voice et Acapela, ils vont surtout nous apporter de l’aide sur la reconnaissance vocale et la synthèse de la parole. Par ailleurs, Osatek et Intelligent Voice vont s’occuper de sécuriser les serveurs et stocker les données. L’idée est d’avoir un prototype à leur proposer qu’ils pourront exploiter par la suite.

Enfin, l’association e-Seniors, la Seconda Universidad d’Italie et l’Oslo University Hospital fourniront les 300 utilisateurs-testeurs avec lesquels on expérimentera l’interface EMPATHIC tout au long du projet. C’est grâce à eux que l’on pourra avoir une validité statistique significative.

Quelles sont les grandes étapes du projet ?

DPD : Le projet a été lancé en novembre 2017 et nos recherches vont donc s’étaler sur trois ans. A l’heure actuelle, nous préparons une première étape d’acquisition qui se déroulera au printemps 2018. Pour cette première étape, nous allons pratiquer des enregistrements suivant un système de « wizard of Oz » (Magicien d’Oz), dans le living lab de Télécom SudParis, EVIDENT. Ce système nous permet de simuler l’agent virtuel grâce à une personne qui se trouve dans une autre pièce, afin de collecter des données sur le dialogue entre l’utilisateur et l’agent. Grâce à lui, nous pourrons complexifier les scénarios que devra prendre en compte notre intelligence artificielle par la suite. Cette première étape va aussi nous fournir des données audiovisuelles supplémentaires et nous permettre de sélectionner les meilleures incarnations de coachs virtuels à proposer aux utilisateurs. Pour moi, c’est important.

Quels débouchés et applications possibles ?

DPD : C’est un projet de recherche à la fin duquel nous sommes censés avoir développé un prototype. L’idée d’avoir des partenaires industriels, encore une fois, est pour eux d’obtenir rapidement et d’adapter ce prototype selon leurs besoins. Le but de ce projet n’est pas de produire une innovation particulière, mais plutôt d’assembler et d’adapter toutes ces technologies différentes afin d’accomplir leurs potentiels à travers des cas particuliers – principalement, l’assistance à la personne âgée.

Autrement, l’avantage d’EMPATHIC est de présenter de nombreux débouchés possibles : dans les jeux-vidéo ou même les réseaux sociaux. Beaucoup de gens interagissent avec des avatars dans des mondes virtuels aujourd’hui – comme dans le jeu-vidéo Second Life, d’où provient l’un de nos avatars, Bob l’Hawaïen. EMPATHIC pourrait donc être adaptable en dehors du cadre de la santé, c’est certain.

 

Ne pas confondre le virtuel et la réalité

La « Vallée de l’Étrange » (ou « Uncanny Valley ») est un concept central en matière d’intelligence artificielle et de robotique. Il théorise que si un robot ou une IA possède une forme humaine (physique ou virtuelle), il ne faut pas que la ressemblance avec l’homme soit trop forte – à moins qu’elle soit parfaite en tout point. « Dès qu’il y a une forte ressemblance avec l’humain, le moindre défaut est étrange, dérangeant et devient finalement une barrière en terme d’interaction avec la machine« , explique Patrick Horain, ingénieur d’études à Télécom SudParis, spécialisé en imagerie numérique.

Dijana Petrovska-Delacretaz l’a bien intégré et développe les différents coachs virtuels d’EMPATHIC en conséquence : « C’est important d’en tenir compte. Faire un visage photoréaliste, qui ressemble réellement à un proche sans pouvoir discerner le vrai du faux, est un challenge scientifique. Mais dans le cadre de notre projet, c’est un problème. Cela peut être perturbant pour une personne âgée ou confuse d’interagir avec un avatar ressemblant à une personne réelle voire à un proche. Il est toujours préférable de proposer des coachs virtuels dont on comprend bien qu’ils ne sont pas humains. »

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *