Unidad 6.8: El Archivo de la Web

 

Con las cifras del ISC Internet Somain Survey del Internet System Consortium a la vista, es indudable que muchos de nuestros países son potencias en producción digital en Internet. Por poner un ejemplo, solo en Chile existen aproximadamente seis millones de páginas web distribuidas en el dominio nacional (.cl, casi dos millones) y otros dominios temáticos (.com, .edu, .org). Conservar ese patrimonio es una tarea ingente, y si es probable que las grandes organizaciones (medios de comunicación, universidades, empresas, administración pública, etc.) lleven a cabo políticas severas de preservación de sus propias producciones, la gran mayoría de recursos digitales publicados en Internet, por chilenos o de interés de la comunidad chilena, modificarán sus contenidos, o incluso desaparecerán. Cientos de miles de websites de pequeñas empresas, de asociaciones culturales, científicas, educativas o deportivas. Páginas web de particulares que publican para sus amigos o vecinos. Miles de concurridos blocs y de foros digitales. Revistas, portales, y un largo etcétera que posiblemente representen la fuente de información chilena más importante en un futuro próximo, por no hablar de acontecimientos puntuales, como el reciente caso de la expropiación de la petrolera YPF por parte del estado argentino, que tienen en Internet su espacio informativo por excelencia.

 

Si consideramos esos contenidos de interés ¿Quién debe conservar y garantizar el acceso permanente a ese patrimonio? ¿Debe el gran Internet Archive ocuparse de preservar nuestro futuro? ¿O son las bibliotecas nacionales iberoamericanas las que deben cooperar para garantizar el acceso permanente de sus ciudadanos a la producción digital en español?

 

No es sencillo marcar prioridades presupuestarias pensando en el patrimonio del futuro y hacerlas convivir con las lógicas necesidades de la preservación de la memoria bibliográfica de pasado y del presente, pero iniciativas como el proyecto Padicat de la Biblioteca de Cataluña pueden acabar siendo una solución, al haber contribuido a desarrollar un programa informático de código libre que permite a las bibliotecas nacionales capturar, procesar y dar acceso a las páginas web, y haber marcado algunas líneas de trabajo que tarde o temprano acabarán asimilando las instituciones nacionales de la memoria (bibliotecas, archivos, museos) y que simplemente intentan adecuar sus objetivos a una nueva realidad: Internet.

La pregunta para el debate es: ¿deben las instituciones dedicar recursos al archivo de Internet, o es preferible dedicar esa inversión económica a otro tipo de documentos?

 

A la pregunta de si se debe dedicar recursos al archivo de Internet creo que la respuesta debe ser afirmativa. Ahora bien, sabemos que Internet es una mole de información inabarcable y es evidente que no todo debe ser salvaguardado. Pero… ¿como decidir que se debe almacenar y que no? ¿Qué va a ser esencial y que no? Me pregunto, si únicamente debemos dejar la clasificación sobre que capturar a criterios de dominios (tipo .cat o .au), a acuerdos con administraciones, universidades, centros de investigación y otras instituciones y a selecciones de acontecimientos importantes para nuestro territorio (elecciones, festividades) o… debemos ir más allá.

 

La clasificación o revisión de los recursos que en un futuro pueden ser relevantes por personal de los archivos o gestores de información sería más costoso pero más fiable en cuanto a los contenidos de las páginas que se almacenara. No me refiero a que se realicen revisiones una a una (esto sería imposible e inútil) sino a promover líneas de investigación sobre nuevos criterios por los que filtrar la información presente en internet que debe ser seleccionada para su conservación, o por el contrario debe ser eliminada (ignorada o no recuperada).

 

Además no solo se debe ocupar Internet Archive de preservar nuestro pasado, convirtiéndose prácticamente en la única depositaria de nuestra memoria colectiva en Internet (monopolio de información). La información es una fuente de poder y un derecho de todos los ciudadanos y por ello debe ser una labor coordinada entre las naciones y regiones, y los organismos internacionales.

 

A esto añadiría una responsabilidad por parte de las empresas privadas para salvaguardar sus archivos web. Lo más importante es que se debe garantizar el acceso permanente a los recursos digitales publicados en Internet.