À medida que as diversas formas de comunicação, as notícias jornalísticas e até mesmo os registros mundanos migram da forma impressa para o domínio digital, a Biblioteca do Congresso mantém registros de grande parte disso.
Abigail Grotke, chefe da equipe de arquivamento da web na biblioteca, e seus colegas estão documentando o conteúdo da internet desde 2000. Ao criar um registro importante e em expansão da linguagem on-line, a equipe também está reunindo acervos* que ajudarão os pesquisadores em algum tempo no futuro a ter uma clara ideia do que era viver no início do século 21.
Os “funcionários da biblioteca que fazem recomendações”, em consulta com especialistas em assuntos, selecionam tuítes, artigos de blog e outros itens on-line. Os arquivos daí resultantes são acessíveis a usuários em todo o mundo.
As eleições americanas são um dos focos dos acervos. “Se fosse na forma impressa, teríamos panfletos e folhetos e coisas assim”, disse Abigail, mas depois que as eleições acabarem, “muitos sites da campanha [na internet] desaparecem”.
Doze anos de Twitter
Em 2010, a Biblioteca do Congresso assinou um acordo com o Twitter para adquirir os textos de todos os tuítes públicos de 2006 em diante. A biblioteca informa que adotou essa medida pela mesma razão que coleciona outros materiais — a fim de preservar “um registro de conhecimento e criatividade”.
President Trump arrived in Davos, Switzerland, early this morning—one day before he becomes only the second American president to address the World Economic Forum Annual Meeting. Read more: https://t.co/capXYzH5Jh pic.twitter.com/vJ0VXIi1Of
— The White House (@WhiteHouse) January 25, 2018
Casa Branca: O Presidente Trump chegou a Davos, na Suíça, no início desta manhã — um dia antes de se tornar o segundo presidente americano a discursar na Reunião Anual do Fórum Econômico Mundial. Leia mais: http://45.wh.gov/mBema1
À medida que as mídias sociais cresceram em popularidade, a biblioteca alterou sua estratégia em relação a seu acervo em dezembro de 2017, e escolheu preservar tuítes que girassem em torno de temas e eventos, como eleições ou questões em curso que possuem interesse nacional, como políticas públicas.
Isso se alinha com a forma da qual a biblioteca arquiva outras plataformas de redes sociais, como o Facebook.
Abigail diz que a biblioteca armazena cerca de 30 terabytes de conteúdo da internet a cada mês (um terabyte é a capacidade de muitos computadores de mesa recentes). O Arquivo da Web coletou cerca de 1,3 petabyte de dados — correspondente a 1.300 terabytes — desde 2000.
“Lidar com essa quantidade de dados já é um grande desafio”, disse Abigail, “mas estamos preparados para isso. É estimulante.”
* site em inglês

Dos arquivos da internet da biblioteca
Arquivo da Internet sobre as Eleições dos Estados Unidos
Base de Dados de Gifs do site Giphy
Arquivo da internet dos Jogos Olímpicos de Inverno de 2002
Histórias em Quadrinhos da Small Press Expo e Arquivo de internet de Arte Cômica