Средства связи, новостные сообщения и даже обычные учетные записи переходят от печатных форм к цифровым, и большинство этих материалов уже хранятся в Библиотеке Конгресса.

Абигейл Гротке, руководитель группы по онлайн-каталогизации, и ее коллеги составляют электронный архив интернет-контента с 2000 года. Одновременно с этой важной работой группа собирает коллекции, которые в будущем помогут исследователям получить полное представление о первых десятилетиях XXI века.

Сотрудники библиотеки после консультаций с экспертами отбирают твиты, сообщения в блогах и другие материалы. Их архивы доступны пользователям по всему миру.

Американские выборы – одна из главных тем коллекции. “Нам приносили печатные листовки, брошюры и тому подобные материалы, – говорит Гротке. – Мы их сохранили, ведь после выборов многие веб-сайты просто исчезли”.

Двенадцать лет сети Twitter

В 2010 году Библиотека Конгресса США подписала соглашение с Twitter о приобретении текстов всех твитов, опубликованных начиная с 2006 года. Работники библиотеки объясняют, что пошли на это по той же причине, по которой собирают и другие материалы – для сохранения “информации о знаниях и творчестве”.

Дональд Трамп
Возвращаюсь домой после очень интересной двухдневной поездки в Давос (Швейцария). Мое выступление об экономическом возрождении Америки понравилось. Многие из моих новых знакомых будут инвестировать в США! #MAGA

В связи с быстрым ростом популярности соцсетей, библиотека в декабре 2017 года изменила свою стратегию, приняв решение сохранять твиты, посвященные событиям общенациональной значимости и освещающие различные вопросы государственной политики.

Библиотека ведет архивы и других социальных медиаплатформ, например Facebook.

Гротке говорит, что ежемесячно архивируется около 30 терабайт информации. Всего с 2000 года в архиве было размещено около 1,3 петабайт данных.

По словам исследователя, работать с таким огромным объемом данных непросто, но интересно, и ее группа к этому готова. 

Рисунок большого, красивого здания (@ Shutterstock)
(@ Shutterstock)

Из веб-архивов библиотеки

Веб-архив “Выборы в США”
База данных GIF-изображений Giphy
Веб-архив Зимних Олимпийских игр 2002 года
Веб-архив комиксов Press Expo Comic и Comic Art