Archiv na Twitteru: Kongresová knihovna bude upřednostňovat historické tweety
Pozadí
V roce 2010 uzavřela Kongresová knihovna (LOC) dohodu se společností Twitter o archivaci každého veřejného tweetu, který byl kdy odeslán. Tento ambiciózní projekt měl za cíl uchovat rozsáhlé úložiště společenských komentářů a komunikace pro budoucí generace.
Výzvy při archivaci dat z Twitteru
V průběhu let se při správě archivu Twitteru objevilo několik výzev.
- Objem a velikost tweetů: Obrovský objem tweetů exponenciálně vzrostl, což ztěžuje ukládání a zpracování dat. V roce 2010 uživatelé Twitteru odeslali přibližně 50 milionů tweetů denně. Dnes toto číslo raketově vzrostlo na více než 500 milionů tweetů denně.
- Proměnlivá povaha tweetů: Tweety se od svého vzniku výrazně vyvinuly. Zpočátku byly tweety omezeny na 140 znaků a sestávala především z textu. Limit znaků byl však od té doby rozšířen na 280 a tweety nyní často obsahují obrázky, videa a animované GIFy. LOC archivuje pouze text tweetů, což znamená, že se ztrácí velké množství kontextu.
- Omezené zdroje: LOC neměla potřebné zdroje nebo odborné znalosti pro efektivní správu archivu Twitteru. Knihovně chyběli inženýři na plný úvazek, kteří by zpracovávali obrovský příliv tweetů, což vedlo k významným zpožděním a výzvám při zpřístupňování archivu výzkumníkům.
Rozhodnutí upřednostnit historické tweety
Vzhledem k těmto výzvám se LOC rozhodla upřednostnit archivaci tweetů, které jsou považovány za historicky významné. Toto rozhodnutí bylo oznámeno v bílé knize vydané LOC, která nastínila důvody změny politiky.
LOC uznává, že Twitter je neustále se vyvíjející platforma a je nemožné předvídat, jak se bude v budoucnu dále měnit. Cílem knihovny je shromáždit a uchovat reprezentativní vzorek tweetů, které mohou poskytnout poznatky o sociální, politické a kulturní krajině naší doby.
Současný stav archivu
Současný 12letý archiv tweetů není veřejně přístupný a LOC zatím neoznámila časový harmonogram, kdy by mohl být zpřístupněn. Knihovna má v úmyslu, aby archiv sloužil jako snímek raných let komunikace na sociálních médiích, podobně jako LOC uchovává telegramy z počátků této technologie.
Potenciální hodnota archivu
Vědci z různých oborů, včetně sociologie, psychologie, politologie a komunikace, vyjádřili zájem o přístup k archivu Twitteru. Domnívají se, že data by mohla poskytnout cenné poznatky o lidském chování, společenských trendech a politickém diskurzu.
Závěr
Rozhodnutí LOC upřednostnit archivaci historických tweetů je uznáním výzev spojených se správou a uchováváním dat ze sociálních médií. Přestože celý archiv zatím není veřejně přístupný, existuje naděje, že LOC nakonec najde způsob, jak jej zpřístupnit výzkumníkům a veřejnosti, což nám umožní získat hlubší porozumění naší digitální minulosti a současnosti.