A medida que las comunicaciones, los reportajes de noticias e incluso registros mundanos pasan del ámbito impreso al digital, la Biblioteca del Congreso mantiene datos de gran parte de estos.

Abigail Grotke, jefa del equipo de archivo de internet de la biblioteca, y sus colegas han venido documentando contenido de Internet desde el año 2000. Al mismo tiempo que se crea un registro de importantes y florecientes discursos en línea, el equipo también está reuniendo colecciones que ayudarán a los investigadores en el futuro a tener una idea clara de la vida en el siglo XXI.

Los “funcionarios que recomiendan selecciones” en la biblioteca, en consulta con expertos en las materias, seleccionan tuits, entradas de blogs y otros artículos en línea. Los archivos resultantes son accesibles para usuarios de todo el mundo.

Uno de los focos de las colecciones son las elecciones estadounidenses. “En la prensa, recibiríamos volantes y panfletos y cosas así”, dijo Grotke, pero después de las elecciones, “muchos de los sitios en internet de las campañas desaparecen”.

Doce años de Twitter

En 2010, la Biblioteca del Congreso firmó un acuerdo con Twitter para adquirir los textos de todos los tuits públicos a partir de 2006. La Biblioteca indicó que tomó esta medida por la misma razón que recolecta otros materiales: para conservar “un historial de conocimiento y creatividad”.

Tuit:
La Casa Blanca @WhiteHouse
El presidente Trump llegó a Davos, Suiza, temprano esta mañana, un día antes de convertirse en el segundo presidente estadounidense en pronunciar un discurso en la reunión anual del Foro Económico Mundial.
Lee más: http://45.wh.gov/mBema1
11:57 horas – 25 de enero de 2018
(Enlaces en inglés)

Sin embargo, a medida que las redes sociales han explotado, la Biblioteca cambió su estrategia de recolección en diciembre de 2017, optando por preservar los tuits relativos a temas y eventos, como las elecciones o temas actuales de interés nacional, como las políticas públicas.

Esto concuerda con la forma en que la Biblioteca archiva otras plataformas de redes sociales, como Facebook.

Grotke dice que la Biblioteca archiva alrededor de 30 terabytes de internet cada mes (un terabyte es la capacidad de muchas computadoras personales recientes). El archivo de internet ha recopilado unos 1,3 petabytes de datos, es decir, 1.300 terabytes, desde el año 2000.

“Tratar con esa cantidad de datos es un gran desafío”, dijo Grotke, “pero estamos a la altura. Es emocionante”.