Архів Twitter: Бібліотека Конгресу США надасть пріоритет історичним твітам
Передумови
У 2010 році Бібліотека Конгресу США (LOC) уклала угоду з Twitter на архівацію кожного публічного твіту, який коли-небудь надсилався. Цей амбітний проєкт мав на меті зберегти величезний репозитарій соціальних коментарів та комунікації для майбутніх поколінь.
Проблеми архівування даних з Twitter
З роками виникло декілька проблем в управлінні архівом Twitter.
- Обсяг і розмір твітів: Обсяг твітів стрімко зростає, що робить все більш складним зберігання і обробку даних. У 2010 році користувачі Twitter надсилали приблизно 50 мільйонів твітів на день. Сьогодні це число стрімко зросло до понад 500 мільйонів твітів на день.
- Змінна природа твітів: Твіти значно змінилися з моменту їх створення. Спочатку твіти обмежувалися 140 символами і в основному складалися з тексту. Проте, обмеження на кількість символів було збільшено до 280, і тепер твіти часто включають зображення, відео та анімовані GIF-файли. LOC архівує лише текст твітів, що означає, що значна частина контексту втрачається.
- Обмежені ресурси: LOC не мала необхідних ресурсів і досвіду для ефективного управління архівом Twitter. У бібліотеці не було штатних інженерів для обробки величезного потоку твітів, і це призвело до значних затримок і труднощів у наданні доступу до архіву дослідникам.
Рішення надати пріоритет історичним твітам
Враховуючи ці проблеми, LOC вирішила надати пріоритет архівуванню твітів, які вважаються історично важливими. Це рішення було оголошено в білій книзі, опублікованій LOC, в якій викладено причини зміни політики.
LOC визнає, що Twitter є постійно розвиваючоюся платформою, і неможливо передбачити, як вона буде змінюватися в майбутньому. Метою бібліотеки є збір і збереження репрезентативної вибірки твітів, які можуть дати уявлення про соціальний, політичний і культурний ландшафт нашого часу.
Поточний стан архіву
Поточний 12-річний архів твітів не є загальнодоступним, і LOC ще не оголосила про терміни, коли він може стати доступним. Бібліотека має намір, щоб архів служив знімком перших років комунікації в соціальних мережах, подібно до того, як LOC зберігає телеграфи з ранніх днів цієї технології.
Потенційна цінність архіву
Дослідники з різних галузей, включаючи соціологію, психологію, політологію та комунікацію, висловили зацікавленість у доступі до архіву Twitter. Вони вважають, що дані можуть надати цінні відомості про людську поведінку, соціальні тенденції та політичний дискурс.
Висновок
Рішення LOC надати пріоритет архівуванню історичних твітів є визнанням труднощів, пов’язаних з управлінням і збереженням даних соціальних мереж. Хоча повний архів ще не є загальнодоступним, сподіваємося, що LOC зрештою знайде спосіб зробити його доступним для дослідників і громадськості, дозволяючи нам отримати глибше розуміння нашого цифрового минулого і сьогодення.