Archiwum serwisu Twitter: Biblioteka Kongresu będzie priorytetowo traktować historyczne tweety
Wprowadzenie
W 2010 roku Biblioteka Kongresu (LOC) zawarła umowę z Twitterem w celu zarchiwizowania każdego publicznego tweeta, jaki kiedykolwiek został wysłany. Ten ambitny projekt miał na celu zachowanie ogromnego zbioru komentarzy społecznych i komunikacji dla przyszłych pokoleń.
Wyzwania związane z archiwizacją danych serwisu Twitter
Na przestrzeni lat pojawiło się kilka wyzwań związanych z zarządzaniem archiwum serwisu Twitter.
- Objętość i rozmiar tweetów: Liczba tweetów wzrosła wykładniczo, co znacznie utrudnia przechowywanie i przetwarzanie danych. W 2010 roku użytkownicy serwisu Twitter wysyłali około 50 milionów tweetów dziennie. Obecnie liczba ta gwałtownie wzrosła do ponad 500 milionów tweetów dziennie.
- Zmieniająca się natura tweetów: Tweety znacznie ewoluowały od czasu powstania. Początkowo tweety były ograniczone do 140 znaków i składały się głównie z tekstu. Jednak limit znaków został od tego czasu zwiększony do 280, a tweety często zawierają teraz obrazy, filmy i animowane pliki GIF. LOC archiwizuje tylko tekst tweetów, co oznacza, że tracona jest znaczna ilość kontekstu.
- Ograniczone zasoby: LOC nie dysponowała niezbędnymi zasobami ani wiedzą specjalistyczną, aby skutecznie zarządzać archiwum serwisu Twitter. Biblioteka nie miała inżynierów pracujących w pełnym wymiarze godzin do przetwarzania ogromnego napływu tweetów, co powodowało znaczne opóźnienia i problemy z udostępnianiem archiwum badaczom.
Decyzja o priorytetowym traktowaniu historycznych tweetów
W świetle tych wyzwań LOC postanowiła priorytetowo traktować archiwizację tweetów, które są uważane za mające znaczenie historyczne. Decyzja ta została ogłoszona w białej księdze opublikowanej przez LOC, w której przedstawiono powody zmiany polityki.
LOC uznaje, że Twitter jest stale ewoluującą platformą i nie sposób przewidzieć, jak będzie się zmieniał w przyszłości. Celem biblioteki jest gromadzenie i przechowywanie reprezentatywnej próbki tweetów, które mogą dostarczyć informacji na temat społecznego, politycznego i kulturalnego krajobrazu naszych czasów.
Bieżący status archiwum
Bieżące 12-letnie archiwum tweetów nie jest publicznie dostępne, a LOC nie ogłosiła jeszcze harmonogramu, kiedy może stać się dostępne. Biblioteka zamierza, aby archiwum służyło jako migawka wczesnych lat komunikacji w mediach społecznościowych, podobnie jak LOC przechowuje telegrafy z początków tej technologii.
Potencjalna wartość archiwum
Badacze z różnych dziedzin, w tym socjologii, psychologii, nauk politycznych i komunikacji, wyrazili zainteresowanie dostępem do archiwum serwisu Twitter. Uważają, że dane mogą dostarczyć cennych informacji na temat ludzkich zachowań, trendów społecznych i dyskursu politycznego.
Wnioski
Decyzja LOC o priorytetowym traktowaniu archiwizacji historycznych tweetów jest uznaniem wyzwań związanych z zarządzaniem i przechowywaniem danych mediów społecznościowych. Chociaż pełne archiwum nie jest jeszcze publicznie dostępne, mamy nadzieję, że LOC ostatecznie znajdzie sposób, aby udostępnić je badaczom i opinii publicznej, co pozwoli nam głębiej zrozumieć naszą cyfrową przeszłość i teraźniejszość.