La reconnaissance vocale, l’avenir du dialogue homme-machine?

 
 
SGE.RDH40.210407170614.photo00.quicklook.default-245x163.jpg
Le PDG de Microsoft Steve Ballmer (d) regarde une démonstration du logiciel Windows Vista à New York, le 30 janvier 2007 (Photo : Spencer Platt)

[21/04/2007 17:06:31] PARIS (AFP) Commander son ordinateur, surfer sur internet, envoyer un SMS, piloter son GPS: grâce à la voix, ce sont autant d’options désormais possibles avec la reconnaissance de la parole, une tendance en vogue appelée à révolutionner l’interface homme-machine, prédisent des spécialistes.

Le PDG de Microsoft Steve Ballmer a émis un tel pronostic, lors de l’annonce en mars du rachat de la société Tellme Networks, spécialiste des services téléphoniques par reconnaissance vocale.

Windows Vista, le nouveau système d’exploitation du groupe, intègre cette nouvelle technologie. “C’est une première étape importante pour (la) démocratiser” et la faire connaître au grand public, avance Nicolas Mirail, chef de produit technique Windows Vista pour Microsoft France.

Une fois le micro configuré, il est donc possible d’accéder au menu sans utiliser ni clavier ni souris, de dicter à voix haute des textes ou encore de naviguer sur le web… à condition toutefois que le PC ait été entraîné à saisir les intonations de l’utilisateur.

Ce type de logiciel, qui a avant tout du succès auprès des personnes souffrant d’un handicap ou des réfractaires à la saisie du clavier, séduit aussi les professions habituées à rédiger des rapports, à l’instar des métiers juridiques et médicaux.

Le CHU de Rouen a ainsi équipé une centaine de ses médecins d’un logiciel, “Dragon Naturally Speaking”, qui convertit paroles en texte à la vitesse de 160 mots par minute, selon le groupe américain qui l’édite, Nuance (ex-ScanSoft), leader sur ce marché.

Au bout d’un an, “une personne sur deux s’en sert” encore, indique Jean-Claude Parenty, responsable du projet. La réussite de la dictée numérique dépend en effet “de l’ambiance sonore, de la position du microphone, de la fluidité” du discours. Si ces paramètres sont mal maîtrisés, “le résultat risque d’être incertain”, admet-il.

Malgré ces aléas, le mode d’interaction vocal affiche ses ambitions au-delà des ordinateurs, se proposant aussi de faciliter le dialogue avec téléphone, baladeur ou GPS, en particulier à bord des voitures.

La demande de commandes vocales pour les systèmes de navigation et instruments de bord est notamment en plein essor.

L’américain Ford a également lancé cette année à bord de 12 modèles un système d’activation vocale permettant aux conducteurs de passer un appel en prononçant simplement le nom ou le numéro d’un correspondant ou de lancer un morceau stocké sur leur baladeur.

Ce système est aussi capable de lire à haute voix les SMS, en attendant de pouvoir transcrire en texte un message oral, une option qui se développe sur mobile, notamment pour les malvoyants, mais reste très marginale.

Aujourd’hui la reconnaissance vocale tire principalement son succès de la gestion des appels vers des services téléphoniques, de la recherche d’horaires, d’adresses ou d’indications routières aux services bancaires.

Comparée au système à touches, elle assure un choix beaucoup plus large et une meilleure orientation des appels vers l’opérateur pertinent, selon François Chaffard, responsable d’offre vocale chez Prosodie, qui gère 70 millions d’appels par an.

Souvent taxé de mécanique, le dialogue se veut de plus en plus “naturel” pour que le client puisse “s’exprimer plus librement”, comme s’il avait au bout du fil un être humain, explique Patrice Vielpeau, responsable des ventes chez Nuance.

Demain, on peut imaginer que tous les appareils doués d’intelligence informatique “pourraient être commandés à la voix”, estime M. Mirail, et “pourquoi pas avec le regard”… ou même, selon certains scientifiques, la pensée.

 21/04/2007 17:06:31 – © 2007 AFP