À medida que as diversas formas de comunicação, as notícias jornalísticas e até mesmo os registros mundanos migram da forma impressa para o domínio digital, a Biblioteca do Congresso mantém registros de grande parte disso.

Abigail Grotke, chefe da equipe de arquivamento da web na biblioteca, e seus colegas estão documentando o conteúdo da internet desde 2000. Ao criar um registro importante e em expansão da linguagem on-line, a equipe também está reunindo acervos* que ajudarão os pesquisadores em algum tempo no futuro a ter uma clara ideia do que era viver no início do século 21.

Os “funcionários da biblioteca que fazem recomendações”, em consulta com especialistas em assuntos, selecionam tuítes, artigos de blog e outros itens on-line. Os arquivos daí resultantes são acessíveis a usuários em todo o mundo.

As eleições americanas são um dos focos dos acervos. “Se fosse na forma impressa, teríamos panfletos e folhetos e coisas assim”, disse Abigail, mas depois que as eleições acabarem, “muitos sites da campanha [na internet] desaparecem”.

Doze anos de Twitter

Em 2010, a Biblioteca do Congresso assinou um acordo com o Twitter para adquirir os textos de todos os tuítes públicos de 2006 em diante. A biblioteca informa que adotou essa medida pela mesma razão que coleciona outros materiais — a fim de preservar “um registro de conhecimento e criatividade”.

Casa Branca: O Presidente Trump chegou a Davos, na Suíça, no início desta manhã — um dia antes de se tornar o segundo presidente americano a discursar na Reunião Anual do Fórum Econômico Mundial. Leia mais: http://45.wh.gov/mBema1

À medida que as mídias sociais cresceram em popularidade, a biblioteca alterou sua estratégia em relação a seu acervo em dezembro de 2017, e escolheu preservar tuítes que girassem em torno de temas e eventos, como eleições ou questões em curso que possuem interesse nacional, como políticas públicas.

Isso se alinha com a forma da qual a biblioteca arquiva outras plataformas de redes sociais, como o Facebook.

Abigail diz que a biblioteca armazena cerca de 30 terabytes de conteúdo da internet a cada mês (um terabyte é a capacidade de muitos computadores de mesa recentes). O Arquivo da Web coletou cerca de 1,3 petabyte de dados — correspondente a 1.300 terabytes — desde 2000.

“Lidar com essa quantidade de dados já é um grande desafio”, disse Abigail, “mas estamos preparados para isso. É estimulante.”

* site em inglês