ShareAmerica

A medida que las comunicaciones, los reportajes de noticias e incluso registros mundanos pasan del ámbito impreso al digital, la Biblioteca del Congreso mantiene datos de gran parte de estos.

Abigail Grotke, jefa del equipo de archivo de internet de la biblioteca, y sus colegas han venido documentando contenido de Internet desde el año 2000. Al mismo tiempo que se crea un registro de importantes y florecientes discursos en línea, el equipo también está reuniendo colecciones que ayudarán a los investigadores en el futuro a tener una idea clara de la vida en el siglo XXI.

Los “funcionarios que recomiendan selecciones” en la biblioteca, en consulta con expertos en las materias, seleccionan tuits, entradas de blogs y otros artículos en línea. Los archivos resultantes son accesibles para usuarios de todo el mundo.

Uno de los focos de las colecciones son las elecciones estadounidenses. “En la prensa, recibiríamos volantes y panfletos y cosas así”, dijo Grotke, pero después de las elecciones, “muchos de los sitios en internet de las campañas desaparecen”.

Doce años de Twitter
En 2010, la Biblioteca del Congreso firmó un acuerdo con Twitter para adquirir los textos de todos los tuits públicos a partir de 2006. La Biblioteca indicó que tomó esta medida por la misma razón que recolecta otros materiales: para conservar “un historial de conocimiento y creatividad”.

Sin embargo, a medida que las redes sociales han explotado, la Biblioteca cambió su estrategia de recolección en diciembre de 2017, optando por preservar los tuits relativos a temas y eventos, como las elecciones o temas actuales de interés nacional, como las políticas públicas.

Esto concuerda con la forma en que la Biblioteca archiva otras plataformas de redes sociales, como Facebook.

Grotke dice que la Biblioteca archiva alrededor de 30 terabytes de internet cada mes (un terabyte es la capacidad de muchas computadoras personales recientes). El archivo de internet ha recopilado unos 1.3 petabytes de datos, es decir, 1,300 terabytes, desde el año 2000.

“Tratar con esa cantidad de datos es un gran desafío”, dijo Grotke, “pero estamos a la altura. Es emocionante”.

Algunos sitios de internet archivados por la Biblioteca del Congreso:

    • United States Elections Web Archive (Archivo de internet de elecciones en Estados Unidos)
    • Giphy Database of GIFs (Base de datos de animaciones “GIF”)
    • Winter Olympic Games 2002 Web Archive (Archivo de internet de los Juegos Olímpicos de Invierno de 2002)
    • Small Press Expo Comic and Comic Art Web Archive (Archivo de internet de exposición de autores independientes de historietas e ilustraciones artísticas de historietas)

Dejar una respuesta

Please enter your comment!
Please enter your name here

4 × cuatro =