26/10/2001 • 18h20
Le Web réticent à l’archivage
Depuis le 24 octobre, un fonds américain d’archivage du Web a ouvert ses portes aux internautes.
Le concept a de l’allure. Fournir un accès public à un fonds d’archivage du Web remontant à 1996. Lancé il y a quatre ans par l’entrepreneur Brewster Kahle, The Internet Archive revendique aujourd’hui plus de 10 milliards de pages web archivées. Depuis le 24 octobre, l’institution à but non lucratif a lancé un tout nouveau service baptisé Wayback machine (machine à remonter le temps), un outil qui permet aux internautes de consulter, par exemple, les sites tels qu’ils existaient il y a quatre ans. Le tout est stocké dans une base de données pesant 100 terabytes, hébergée sur des serveurs situés à San Francisco. Pour mener à bien ce travail titanesque, la bibliothèque numérique, autoproclamée mémoire du Web, est censée rendre compte de l’évolution du Réseau, a bénéficié de l’appui financier et technique de poids lourds de l’informatique et de la culture. Parmi lesquels Compaq, AT&T, Xerox PARC, ou la très vénérable bibliothèque du Congrès américain. Pendant quatre ans, des robots ont ainsi passé au peigne fin les entrailles de la Toile et récupéré des millions de captures de sites. Grâce à une technique qui permet d’aspirer et de restituer la totalité du contenu d’un site web à un moment précis. The Internet archive propose également un accès libre à des fonds numériques spécifiques, comme celui traitant de la dernière campagne pour l’élection présidentielle américaine (sites des candidats, des partis, sites parodiques, etc.) constitué sous l’impulsion de la bibliothèque du Congrès. Seul problème : aujourd’hui, la moindre requête effectuée sur le site se solde inlassablement par la même réponse : ERROR 16. Accompagnée par cette explication peu encourageante : "Nous sommes désolés. Nous sommes dans l’impossibilité d’extraire les données demandées. Nous sommes confrontés à des difficultés techniques et nous vous recommandons d’essayer plus tard." Frustrant.
|