Твиттер-архив: Библиотека Конгресса отдаст приоритет историческим твитам
Предыстория
В 2010 году Библиотека Конгресса (БK) заключила соглашение с Twitter об архивировании каждого публичного твита, когда-либо отправленного. Этот амбициозный проект направлен на сохранение обширного хранилища социальных комментариев и коммуникаций для будущих поколений.
Проблемы архивирования данных Twitter
На протяжении многих лет при управлении архивом Twitter возникло несколько проблем.
- Объём и размер твитов: Объём твитов резко возрос, что привело к увеличению сложности хранения и обработки данных. В 2010 году пользователи Twitter отправляли приблизительно 50 миллионов твитов в день. Сегодня это число резко возросло до более 500 миллионов твитов в день.
- Изменение характера твитов: Твиты значительно эволюционировали с момента их создания. Изначально твиты были ограничены 140 символами и в основном состояли из текста. Однако с тех пор ограничение по символам было увеличено до 280, и теперь твиты часто включают изображения, видео и анимированные GIF-файлы. БK архивирует только текст твитов, что означает потерю значительной части контекста.
- Ограниченные ресурсы: БK не обладала необходимыми ресурсами или опытом для эффективного управления архивом Twitter. В библиотеке не было штатных инженеров для обработки огромного потока твитов, что привело к значительным задержкам и проблемам с предоставлением доступа к архиву исследователям.
Решение об отдаче приоритета историческим твитам
В свете этих проблем БK решила отдать приоритет архивированию твитов, которые считаются исторически важными. Это решение было объявлено в официальном документе, опубликованном БK, в котором излагались причины изменения политики.
БK признаёт, что Twitter — это постоянно развивающаяся платформа, и невозможно предсказать, как она будет меняться в будущем. Цель библиотеки — собрать и сохранить репрезентативную выборку твитов, которые могут дать представление о социальной, политической и культурной жизни нашего времени.
Текущее состояние архива
Текущий 12-летний архив твитов не является общедоступным, и БK пока не объявила, когда он может стать доступным. Библиотека планирует, что архив будет служить снимком первых лет общения в социальных сетях, подобно тому, как БK сохраняет телеграммы с ранних дней этой технологии.
Потенциальная ценность архива
Исследователи из различных областей, включая социологию, психологию, политологию и коммуникации, выразили заинтересованность в доступе к архиву Twitter. Они считают, что данные могут предоставить ценную информацию о поведении человека, социальных тенденциях и политическом дискурсе.
Вывод
Решение БK отдать приоритет архивированию исторических твитов является признанием проблем, связанных с управлением и сохранением данных социальных сетей. Хотя полный архив ещё не доступен для общественности, есть надежда, что БK в конечном итоге найдёт способ сделать его доступным для исследователей и общественности, что позволит нам получить более глубокое представление о нашем цифровом прошлом и настоящем.