TeraLab, une plateforme big data d’ambition européenne

TeraLab, plateforme de l’IMT destinée à l’accélération de projets big data par le rapprochement des chercheurs et des entreprises, est depuis le 1er décembre 2016 labellisée « Silver i-Space ». Décerné par la Big Data Value Association, ce label est un gage de la qualité des services proposés, à la fois sur les plans techniques et juridiques. Il témoigne de la pertinence de TeraLab dans l’écosystème d’innovation big data à l’échelle européenne, et de la capacité de la plateforme à offrir une solution à l’état de l’art. Anne-Sophie Taillandier, sa directrice, aborde avec nous les raisons de ce succès et les projets futurs de TeraLab.

 

Que signifie pour vous ce label « Silver i-Space » décerné par la Big Data Value Association (BDVA) le 1er décembre dernier ? 

Anne-Sophie Taillandier : C’est un prix important car il est référençant au niveau européen. La BDVA est un organe d’autorité puisqu’elle gère le bon déroulement du partenariat public-privé sur le big data mis en place par la Commission européenne. Ce label a donc un impact sur notre capacité à travailler à l’échelle continentale. DG Connect, la branche de la Commission chargée du déploiement d’un marché numérique unique en Europe, y est particulièrement attentive : elle préfère que les projets de recherche H2020 valorisent des plateformes déjà existantes par exemple. C’est donc une meilleure visibilité dans l’écosystème d’innovation international.

En plus de Teralab, trois autres plateformes ont eu cette labellisation. Cela vous met-il en concurrence au niveau européen ?

AST : Les i-Space sont complémentaires, pas concurrentiels. Avec TeraLab nous revendiquons surtout une zone neutre : c’est une bulle d’oxygène dans la vie d’un projet pour que les gens — chercheurs et entreprises — testent les choses tranquillement. La complémentarité entre les plateformes permet de fédérer les énergies. Typiquement, un des autres Silver i-Space labellisé en décembre est le SDIL, basé en Allemagne et plus orienté pour des solutions industrielles. Les personnes qui se tournent vers le SDIL ont déjà fait un choix industriel. Les acteurs qui se tournent vers TeraLab n’ont pas encore fait de choix, et veulent explorer la valeur potentielle de leurs data.

Comment expliquez-vous cette reconnaissance par la BDVA ?

AST : TeraLab cherche toujours à être à l’état de l’art. Nous offrons une plateforme équipée des derniers outils. Depuis le quatrième trimestre 2016 par exemple, elle est équipée de GPU : ce sont des processeurs initialement destinés au calcul de rendus graphiques, mais qui trouvent de bonnes applications en deep learning. Les optimisations de calcul qu’ils offrent permettent de diviser par quinze le temps d’apprentissage des algorithmes. Nous pouvons donc mettre des machines beaucoup plus puissantes à disposition des chercheurs qui travaillent en deep learning. Jusqu’à présent, l’infrastructure ne permettait pas cela. D’une manière générale, si nous sentons qu’un projet a besoin d’un équipement particulier, nous regardons si nous pouvons l’implanter et si cela a un sens. Cette mise à jour permanente est d’ailleurs une des missions fixées dans le cadre du Programme Investissements d’avenir (PIA) par la Direction générale des entreprises.

C’est donc avant tout une excellence technique de la plateforme qui est reconnue ?

AST : Pas seulement, TeraLab c’est une infrastructure mais aussi un écosystème et un ensemble de services. Nous accompagnons nos partenaires pour qu’ils puissent mettre à disposition leurs données. Nous avons également des exigences de qualité sur les aspects juridiques. Par exemple, nous travaillons sur une habilitation de l’Agence des systèmes d’information partagés de santé (ASIP) afin de pouvoir héberger des données de santé à caractère personnel. Techniquement, nous avons ce qu’il faut pour recevoir ces données et travailler dessus. Mais il nous faut satisfaire des exigences légales et administratives pour le faire, comme respecter la norme ISO 27001. Nous devons donc fournir des garanties sur la façon de recevoir les données des entreprises, de mettre en place les contrats, etc.

Toute la partie amont du traitement de la donnée fait-il aussi l’objet d’innovations ?

 AST : Oui, parce que nous devons en permanence garantir le consentement autour de la donnée. Pour cela, notre proximité avec des chercheurs de l’IMT est une force. Nous avons ainsi des projets sur le tatouage des données, sur la cryptographie par segmentation, ou encore sur la blockchain. L’analyse des données et l’extraction de valeur à partir de celles-ci ne peuvent se faire qu’une fois toute une phase amont terminée. Le choix des outils pour assurer les questions de privacy est donc essentiel, et nous devons en permanence assurer une mise à l’état de l’art sur ces aspects de sécurité également.

En quoi ces critères de qualité sont-ils ensuite traduits d’un point de vue business ?

AST : Aujourd’hui, TeraLab est impliquée dans des projets touchant à de nombreuses thématiques. Nous parlions de la blockchain, mais je peux également citer l’industrie du futur, l’énergie, le tourisme, la santé, l’assurance, les questions d’open source, d’interopérabilité… Et surtout, depuis 2016 TeraLab est au point d’équilibre financier : les recettes des projets compensent les coûts de fonctionnement. C’est loin d’être anecdotique, car cela signifie que la plateforme est pérenne. TeraLab continuera donc d’exister après 2018, date de fin du PIA qui lui a donné naissance.

Quels sont les grands objectifs de TeraLab pour l’année à venir ?

AST : Consolider cet équilibre dans un premier temps et continuer d’assurer la pérennité de TeraLab. Pour cela, nous travaillons actuellement sur des projets big data à l’échelle européenne afin de répondre aux appels à projets de la Commission via H2020. Ensuite, lorsque nous aurons l’habilitation de l’ASIP à héberger des données de santé à caractère personnel, nous comptons bien lancer des projets de recherche en santé. En particulier sur la médecine dite « 4P » : personnalisée préventive, prédictive et participative.

 

Pour aller plus loin sur TeraLab :

La BnF allie sociologie et big data pour cerner ses gallicanautes

TeraLab et La Poste collaborent pour lutter contre la fraude des colis