[19/09/2008 21:23:01] SAN FRANCISCO (AFP) L’internet est devenu plus intelligent cette semaine avec la diffusion d’une “carte sémantique” qui apprend aux ordinateurs le sens des mots et dispose d’un lexique dix fois plus étendu que celui d’un étudiant américain moyen. La société Cognition Technologies a commencé il y a quelques jours à proposer des licences aux créateurs de logiciels désireux d’élaborer des programmes qui “comprennent” les mots selon le contexte de la phrase, tout comme le fait le cerveau humain. “Nous avons virtuellement appris à l’ordinateur tous les mots et les phrases de la langue anglaise,” explique à l’AFP le patron de Cognition, Scott Jarus, assurant qu’il s’agit là de la plus grande carte sémantique du monde. “Tous ces savoirs cumulés sont clairement destinés au Web 3.0, que l’on appelle aussi le Web sémantique. Cela a pris 30 ans. C’est un travail de passionnés”, ajoute-t-il. Cette future troisième génération d’internet, le Web 3.0, est un ensemble de technologies qui vise à rendre la toile accessible et utilisable par tous les programmes et les logiciels, indépendamment des systèmes d’exploitation et des supports. Transformé en gigantesque base de données, le Web sémantique utilisera des applications d’intelligence artificielle intuitive fonctionnant à toute vitesse grâce à l’internet haut débit. La technologie sémantique permettra d’orienter l’internaute très exactement vers l’objet de sa recherche, au lieu de se contenter de faire correspondre des mots-clés. Ainsi, une recherche menée avec cette technologie sémantique sur internet pour “chants mélancoliques-oiseaux” saura lier la tristesse dans des chansons avec de nombreuses espèces d’oiseaux. La carte de la société Cognition est déjà utilisée dans le logiciel de LexisNexis Concordance “e-discovery” pour passer au crible et trier les tonnes de documents amassés pendant un procès. “Nous les aidons à touver une aiguille dans une botte de foin”, relève M. Jarus. “Autrefois, il fallait utiliser des boîtes et des boîtes de papier, maintenant 80% de ce matériel est numérique”, ajoute-t-il. Un programme informatique de jurisprudence –base du droit anglo-saxon– utilise cette technologie pour exploiter plus d’un demi-siècle de décisions de justice et trouver des précédents, selon Cognition. La carte sémantique est aussi utilisée dans des banques de données médicales. Cognition assure aussi avoir joué un rôle dans l’essor de l’encyclopédie participative en ligne Wikipedia. Un des objectifs du Web 3.0 est de créer des “agents” d’intelligence artificielle qui trieront pour un utilisateur donné les montagnes d’informations circulant sur internet et répondront exactement à ses besoins. Ce sera “une application constamment à l’affût des choses qui pourraient vous intéresser, avec une connaissance conceptuelle parfaite de ce que vous cherchez,” s’enthousiasme M. Jarus, dont la société a plusieurs rivales ayant chacune leur approche de la technologie sémantique. En juillet, le géant Microsoft a ainsi acheté Powerset, un moteur de recherche sémantique permettant l’interprétation des intentions des internautes lors de leurs recherches sur internet. Les moteurs de recherche standard se contentent d’additionner les mots utilisés dans la requête de l’internaute. “Les moteurs de recherche sont incapables aujourd’hui de comprendre que les mots +arbuste+ et +arbre+ renvoient à un même concept”, avait expliqué Satya Nadella, vice-président senior de Microsoft, en annonçant l’acquisition de cette jeune société basée à San Francisco (Californie, ouest). |
||
|