Twitter архів: Библиотеката на Конгреса ще приоритизира историческите туитове
Предистория
През 2010 г. Библиотеката на Конгреса (LOC) сключи споразумение с Twitter за архивиране на всеки публичен туит, изпращан някога. Този амбициозен проект имаше за цел да запази голям архив от социални коментари и комуникации за бъдещите поколения.
Предизвикателства пред архивирането на данни от Twitter
През годините се появиха няколко предизвикателства при управлението на архива на Twitter.
- Обем и размер на туитовете: Чистият обем на туитовете нарасна експоненциално, което прави съхранението и обработката на данните все по-трудно. През 2010 г. потребителите на Twitter изпращаха приблизително 50 милиона туита на ден. Днес това число се е увеличило до над 500 милиона туита на ден.
- Променящ се характер на туитовете: Туитовете са се развили значително от създаването им. Първоначално туитовете бяха ограничени до 140 знака и се състояха предимно от текст. Сега обаче ограничението на знаците е увеличено до 280, а туитовете често включват изображения, видеоклипове и анимирани GIF файлове. LOC архивира само текста на туитовете, което означава, че се губи значително количество контекст.
- Ограничени ресурси: LOC нямаше необходимите ресурси или опит за ефективно управление на архива на Twitter. Библиотеката нямаше щатни инженери за обработка на огромния поток от туитове и това доведе до значителни закъснения и предизвикателства в предоставянето на достъп до архива за изследователи.
Решение за приоритизиране на историческите туитове
В светлината на тези предизвикателства, LOC реши да приоритизира архивирането на туитове, които се считат за исторически важни. Това решение беше обявено в бяла книга, публикувана от LOC, в която са изложени причините за промяната в политиката.
LOC признава, че Twitter е постоянно развиваща се платформа и е невъзможно да се предскаже как ще продължи да се променя в бъдеще. Целта на библиотеката е да събира и съхранява представителна извадка от туитове, които могат да дадат представа за социалния, политическия и културния пейзаж на нашето време.
Настоящо състояние на архива
Текущият 12-годишен архив от туитове не е публично достъпен и LOC все още не е обявила времева рамка за това кога може да стане достъпен. Библиотеката възнамерява архивът да служи като моментна снимка на ранните години на комуникациите в социалните медии, подобно на начина, по който LOC съхранява телеграми от ранните дни на тази технология.
Потенциална стойност на архива
Изследователи в различни области, включително социология, психология, политически науки и комуникации, изразиха интерес да имат достъп до архива на Twitter. Те смятат, че данните биха могли да предоставят ценна информация за човешкото поведение, социалните тенденции и политическите дискурси.
Заключение
Решението на LOC да приоритизира архивирането на исторически туитове е признание за предизвикателствата, свързани с управлението и съхранението на данни от социалните медии. Въпреки че пълният архив все още не е публично достъпен, има надежда, че LOC в крайна сметка ще намери начин да го предостави на разположение на изследователи и обществеността, което ще ни позволи да получим по-задълбочено разбиране за нашето дигитално минало и настояще.