CandyVoice, une start-up qui donne de la voix !

Récemment détentrice d’un prêt d’honneur du Fonds numérique (co-financé par l’IMT et la Fondation Télécom), la start-up CandyVoice incubée à Télécom ParisTech, s’apprête à conquérir le marché du grand public grâce à ses partenaires avant d’atteindre de nouveaux secteurs professionnels avec sa technologie d’analyse vocale sur mesure.

Avec déjà huit logiciels et un brevet à son actif, le CEO de CandyVoice Jean-Luc Crebouw n’est pas novice dans l’innovation. Depuis toujours sa méthode pragmatique et intuitive lui a permis de créer des logiciels de traitement du signal ex nihilo. CandyVoice, incubée à Télécom ParisTech depuis 2015, c’est pour lui l’aboutissement de 23 ans de R&D.

« La voix je ne l’écoute pas, je la regarde »

Transformer, imiter, reproduire la voix telles sont les capacités de CandyVoice. En partant d’un simple concept de vocodeur permettant d’analyser les composantes spectrales de la voix, Jean-Luc Crebouw décrit son système : « comme une marguerite, tous les modules sont greffés sur le logiciel ». Les paramètres de la voix que sont la fréquence, l’intensité et le timbre, sont modifiés selon l’effet recherché ». A titre d’exemple, pour transformer une voix, il lui suffit alors de modifier une ou plusieurs des composantes de ces paramètres, pour la rendre plus aigu ou encore nasillarde. Mais la voix transformée reste celle de l’utilisateur, ce qui n’est plus le cas lorsque le logiciel permet de faire une imitation.

Dans le cas de l’imitation vocale, la voix source est transformée en voix cible. L’atout majeur de CandyVoice est sa capacité à pouvoir imiter de manière instantanée. Pour aboutir à un tel résultat, la start-up a élaboré son propre logiciel de Text To Speech (TTS). Celui-ci lui permet d’enregistrer un maximum des 37 phonèmes de la langue française. Un phonème correspond à la plus petite unité distinctive de la chaîne parlée qui va engendrer un changement de sens, par exemple le /v/ de voix et le /t/ de toi. Les phonèmes dépendent de la langue. L’association de deux phonèmes constitue un diphone. CandyVoice a réussi à placer 98% des diphones dans un texte de 260 phrases. « Toutefois, le système fonctionne même avec 10% en moins », précise l’innovateur.

Des applications multiples pour libérer la voix et son usage

Actuellement seule une voix de synthèse générique anime la technologie TTS. Si l’utilisateur veut personnaliser ce principe, l’inconvénient du dispositif est non négligeable : le temps. Le temps de calcul, le temps d’enregistrement et le temps d’attente. CandyVoice bouscule les échéances. Après 15 minutes d’enregistrement de la voix de l’utilisateur, le résultat s’obtient dans la foulée. Avec ce concept, la start-up s’attaque à un premier client qui n’est pas des moindres : le grand public. Celui-ci pourra accéder gratuitement à un service lui proposant 110 phrases directement enregistrables sur smartphone et ainsi créer son modèle d’imitation qui sera utilisé par les partenaires utilisateurs de TTS dans leur produit. CandyVoice veut ainsi devenir numéro un de la personnalisation du TTS pour grand public.

A plus long terme, CandyVoice a beaucoup à offrir aux secteurs professionnels. Certains usages peuvent être entièrement ludiques comme les jeux-vidéos. A partir des technologies d’imitation, de reconnaissance des émotions dans la voix et le logiciel de visème de CandyVoice, les avatars des jeux en réseau s’exprimeront avec la voix de leur utilisateur tout en effectuant des mouvements de lèvres au plus proche du discours prononcé. En effet, le visème permet de représenter une expression faciale selon le phonème prononcé.

Par ailleurs, Jean-Luc Crebouw veut proposer sa technologie au domaine de la santé. Il propose de mettre fin à la frustration de milliers de personnes ayant perdu définitivement ou temporairement leur voix en leur donnant la possibilité d’en acquérir une sur mesure. Les personnes atteintes de la maladie de Charcot par exemple, pourraient même enregistrer leur voix en anticipant l’inéluctable. Pour celles ayant déjà perdu l’usage de la parole, la start-up propose le même service réalisé à partir d’archives vocales.

Représentation de la boîte à outil ou fonctions proposées par CandyVoice. — Représentation de la boîte à outils ou des fonctions proposées par CandyVoice.

Une offre sans limite ?

Le dispositif de CandyVoice est particulièrement probant, si bien que la question de protection dans le cadre de biométrie vocale pose un réel enjeu. La start-up propose de créer une sorte d’antivirus construit sur sa technologie d’imitation qui permettrait d’identifier directement l’utilisation de son procédé d’imitation et donc de déceler lorsqu’une voix est imitée ou bien réellement celle de l’utilisateur.

Finalement, toutes les applications demandeuses de voix sont des clientes potentielles pour CandyVoice. Objets communicants, réseaux sociaux, robotique… A quand le fil d’actualité Facebook entièrement animé par les voix de nos amis, ou le robot aide-soignant avec la voix de la personne de notre choix ?

En savoir +

I'MTech L'actualité scientifique et technologique de l'IMT

CandyVoice, une start-up qui donne de la voix !

« La voix je ne l’écoute pas, je la regarde »

Des applications multiples pour libérer la voix et son usage

Une offre sans limite ?

2 comments

Laisser un commentaire