L’analyse de sentiments et des émotions, c’est l’une des applications qu’on rencontre couramment en NLP (Natural Language Processing). Elle offre nombre d’opportunités dans la recherche scientifique, dans le secteur de la santé et dans le business. Cette application pourrait, à titre d’exemple, permettre de savoir si produit ou service est plutôt bien vu ou plutôt mal vu, de façon automatique en se basant sur du texte écrit dans un style dialectal.
Hatem Haddad, dirigeant de la Start-up iCompass spécialisée dans l’intelligence artificielle, a créé le TunBert.
Entretien.
WMC : Pourquoi est-ce si important de créer un langage dialectal à travers lequel, nous pouvons évaluer les dimensions émotionnelles des utilisateurs des réseaux sociaux ?
“Bert“ est un modèle de langage développé par Google en 2019 ; d’autres modèles ont suivi depuis dont le TunBert.
A quoi servirait-il ? Aujourd’hui, dans le domaine de traitement des langues, si nous n’avons pas de modèles de langues, nous ne pouvons pas avancer. Grâce à cette révolution, les performances des systèmes ont explosé. Le nouveau système créé a dépassé existait auparavant devenu obsolète. Il fallait que nous, en tant qu’iCompass, en tant que Tunisiens, passions à la vitesse supérieure, c’est-à-dire créer un modèle générique de notre dialecte pour l’appliquer à différents niveaux.
Une des applications mises en place est l’analyse des sentiments, la détection des entités nommées dans un texte ou dans la voix des internautes, prédire le caractère positif ou négatif d’un commentaire.
L’application nous permet d’analyser le texte dans tous ses formats. Nous pouvons différencier un dialecte d’un autre, entre pays parlant la même langue et entre régions dans un même pays.
Là je parle des applications mais TunBert est la matière première que d’autres pourraient réutiliser, qu’il s’agisse d’entreprises ou de chercheurs.
TunBert est un peu comme la pâte d’une pizza, tout le secret est dans sa préparation, il faut la réussir, ensuite chacun peut prendre cette pâte et ajouter les ingrédients qui lui conviennent, rajouter ce qu’il faut, ou la transformer, peu importe du moment qu’elle peut être utile à tout le monde. TunBert nous a coûté de l’argent et du temps, mais il était important de le concevoir, si nous le faisons pas, personne ne le fera.
Et qu’est-ce que vous y gagnez, vous devez rentabiliser votre travail, non ? Vous créez les algorithmes et vous les vendez ?
Nous, nous avons créé la matière première pour que d’autres puissent avoir leurs propres applications. A iCompass, nous avons déjà notre application, maintenant c’est aux autres de concevoir à partir de TunBert des applications qui les intéressent pour les réemployer dans leurs domaines.
En Tunisie, il n y a pas assez d’experts dans le traitement automatique de la langue. Le TunBert est offert pour permettre à tout l’écosystème de monter en puissance, il va s’exercer, créer des applications, ainsi notre pays pourrait être l’aire de jeu et avoir des concepteurs beaucoup plus costauds et gagner en pratique et ce, même si ça ne nous profite pas directement.
On peut faire de la Tunisie une place centrale dans le domaine du NVB en Afrique, au Maghreb, et dans les pays arabes. Le plus important est d’intéresser le business à l’IA et de faire monter en compétence l’écosystème tunisien pour qu’il puisse rivaliser d’autres écosystèmes.
Nous voulons que la Tunisie ait un positionnement de choix sur l’échiquier de NLP.
Pour vulgariser ce que vous venez de dire, je suis entrepreneur, je veux lancer un produit, je viens voir iCompass, je lui demande de tester ce produit via TunBert et je peux tester à grande échelle puisque que je peux connaître les appréciations de tout le monde.
Le TunBert offre de multiples possibilités à tous les acteurs de la vie socioéconomique, c’est un outil important dans l’évaluation de la perception des consommateurs du produit, de sa robustesse, de sa qualité ou encore de la pertinence de l’idée de son lancement.
De point de vue business, technologiquement, nous avons beaucoup avancé par rapport à d’autres. Actuellement, la place de l’IA au sein des entreprises est de plus en plus importante. L’informatique cognitive, le e-learning, le deep learning occupent de plus en plus de la place et vous avez des secteurs demandeurs comme la santé, et nous avons travaillé dessus avec Instadeep, le transport, la communication, la finance et d’autres.
Quelle est la part de l’éthique dans tout cela ? N’y a-t-il pas de risques de manipulation des individus pour leur spolier le droit à avoir un libre arbitre ?
Pour y parer, l’union européenne vient d’imposer une charte éthique à tous ceux qui recourent à l’intelligence artificielle. Les Chinois ont une éthique différente, les Etats-Unis ont la leur. Le recours à l’IA s’arrête là où les intérêts des pays commence à menacés. En Tunisie et en Afrique, on n’en parle même pas. C’est pour cela, que nous voulons l’élaborer pour dire par exemple qu’une application non éthique ne doit pas être lancée et là je parle des applications qui manipulent les gens.
Mais vous savez, à travers l’histoire, à chaque fois que la technologie évolue, il y a eu de la manipulation. Je peux citer l’imprimerie, la radio ou encore la télé. Nous avons vu la technologie au service de l’idéologie, celle d’Hitler ou de Mussolini.
La même question se pose aujourd’hui, la différence, est que nous ne verrons pas un Hitler ou un Mussolini accéder au pouvoir parce que l’écosystème dans son ensemble a commencé à maitriser cette évolution technologique qui est la radio, la télé ou le journalisme.
Si nous arrivons grâce à notre travail, à nos applications à vulgariser la compréhension des émotions, nous allons certainement permettre une certaine manipulation mais nous allons aussi permettre à d’autres de mieux la comprendre, de la maitriser et d’y faire face à cette manipulation.
Les élections US depuis Obama, sont la meilleure illustration de la manipulation de masse. Aujourd’hui, quand on navigue sur FB, on a des propositions de contenu personnalisées, ils savent ce que nous voulons et ce que nous ne voulons pas, et quand une société tunisienne mets sur le marché permettant de comprendre pareil process, elle offre à l’écosystème les moyens de se défendre.
La Tunisie est-elle à jour en matière d’IA ?
Il faut reconnaître que l’écosystème en Tunisie, surtout la partie business ne s’est pas mise réellement au web. Elle ne réalise pas encore la puissance du traitement automatique de l’information. Nous allons, en tant que Startup IA, très vite, mais créer un écosystème beaucoup plus costaud incitera à la création d’applications dans la recherche et dans le business. Si des universitaires, chercheurs et professeurs réalisent l’importance de TunBert pour l’amélioration de leurs performances, nous serons à ICompass gagnants par ricochet.
Pour info, nous avons participé à une compétition régionale et nous nous sommes rendus compte que des pays voisins, amis, ennemis, proches, loin, travaillent tous sur les langues dialectales et surtout la langue tunisienne. Je peux citer le Japon, la Chine, la Russie, Israël, le Sénégal, le Rwanda, le Zimbabwe et d’autres. Et ces pays n’ont pas les données pour l’intelligence artificielle, donc il faut les leur procurer. Sans données on ne peut rien faire.
Avant, les données sur les dialectes tunisiens étaient chiffrées à 6 000 phrases, avec Icompass on a atteint les 100 000 et plus. Une telle base de données est extraordinaire pour tout le monde. Notre offre à nous est de 100 000 phrases, mais nous avons assemblé des millions d’expressions tunisiennes qualifiées, nettoyées, de très bonne qualité et annotées manuellement.
Pour le système, « Apprenons pour les sentiments », le principe est de déterminer ce qui est positif et ce qui est négatif, après on présente une nouvelle phrase et nous lui demandons, si elle est positive ou négative, mais pour ça il faut beaucoup de données.
Vous êtes des leaders dans le domaine de l’intelligence artificielle, et vous avez des partenariats avec d’autres startups dans l’IA. Comment vos applications peuvent-elles pousser des secteurs comme la santé ou l’industrie à devenir plus performants ?
Chaque domaine a ses particularités, son propre vocabulaire, et ses propres mots avec leur sens particulier. Nous travaillons sur cette problématique pointue : les langues, les mots, les sens et la voix. Grâce à nous, les robots deviennent parlants, capables d’écouter, d’assimiler les sons et les voix et même de comprendre et réagir. Ce sont deux technologies différentes qui se complètent et qui se rejoignent. Les startups tunisiennes doivent avoir un produit complet à proposer sur au marché mondial.
Si nous nous mettons en tant que startups tunisiennes à collaborer ensemble, nous pourrons créer des produits intégrés et complets. C’est ainsi que nous pourrons être compétitifs sur le marché mondial sachant qu’à ce niveau, l’Etat est absent.
Dans d’autres pays, l’Etat encourage et donne tous les moyens aux entreprises exerçant dans l’IA et l’innovation. Il les incite à conquérir des marchés par tous les moyens : si la startup vend pour 1 millions de $, l’Etat lui offre 1 million $ pour la pousser à aller plus loin. Nous sommes en pleine guerre technologique mondiale : c’est le premier à maîtriser une innovation qui gagne. Voyez ce qui se passe entre les USA et la Chine.