Le géant des réseaux sociaux META a dévoilé SPIRIT-LM, un modèle d’intelligence artificielle capable de mêler texte et parole ouvrant la voie à des interactions homme-machine encore plus naturelles et expressives.
SPIRIT-LM n’est pas un simple chatbot textuel comme on en voit fleurir partout. Ce modèle multimodal va beaucoup plus loin en combinant compréhension du langage écrit et oral.
Concrètement, il peut analyser non seulement le sens des mots, mais aussi le ton de la voix, les intonations, bref, toute la dimension émotionnelle de la parole.