Google propose une recherche sur des archives de presse remontant à 1800

 
 
SGE.KWK85.060906213343.photo00.quicklook.default-245x161.jpg
Logo de Google (Photo : Torsten Silz)

[06/09/2006 21:33:59] MOUNTAIN VIEW (AFP) Le moteur de recherche Google a lancé mercredi un nouveau service de recherche d’informations en anglais dans des archives de presse remontant à avant 1800, principalement américaines, et compte étendre cette initiative à d’autres pays, a indiqué le groupe mercredi.

Disponible sur son site en anglais Google.com (rubrique “news”), ce service permet de chercher par mot-clé et par date et fournit une retranscription des textes de l’époque, et parfois même la reproduction des pages de journaux.

Pour inaugurer ce lancement, Google suggère aux internautes de tester une recherche sur différents mot-clé, dont “Jacques Chirac”. On peut ainsi par exemple retrouver un article d’un journal du Texas qui annonce la formation, le 31 mai 1968, d’un nouveau gouvernement français par le Premier ministre Georges Pompidou, avec M. Chirac comme secrétaire d’Etat aux Finances.

La qualité reste cependant à améliorer car, le texte en question fourni par le site newspaperarchive.com (payant pour obtenir le fac-similé du journal) résulte visiblement d’un système de reconnaissance automatique des caractères qui est encore très approximatif et mélange tous les articles de la page.

Le service de Google renvoie en fait à quantité de sites d’archives, payants ou gratuits, déjà mis en place par différents grands journaux ou sites de presse, comme le magazine Time, The Guardian, le New York Times ou encore des sites qui compilent des centaines de médias comme Factiva.

“Aujourd’hui, ce service permet de rechercher des articles en anglais sur notre site Google.com, mais notre but est d’inclure davantage de contenu: nous travaillons avec nos partenaires internationaux pour rendre leur contenu disponible également, et nous prévoyons de lancer ce service dans les autres pays”, a précisé Google à l’AFP.

 06/09/2006 21:33:59 – © 2006 AFP