Twitter Archívum: A Kongresszusi Könyvtár az Előnyt Élvező Történelmi Tweeteknek
Háttér
2010-ben a Kongresszusi Könyvtár (LOC) megállapodást kötött a Twitterrel, hogy a valaha küldött minden nyilvános tweetet archiváljon. Ennek az ambiciózus projektnek az volt a célja, hogy egy hatalmas tárházat őrizzen meg a társadalmi kommentárokból és kommunikációból a jövő generációi számára.
A Twitter-adatok archiválásának kihívásai
Az évek során több kihívás is adódott a Twitter-archívum kezelése során:
- A tweetek mennyisége és mérete: A tweetek száma exponenciálisan nőtt, ami egyre nehezebbé teszi az adatok tárolását és feldolgozását. 2010-ben a Twitter-felhasználók körülbelül 50 millió tweetet küldtek naponta. Manapság ez a szám 500 millió tweetre nőtt naponta.
- A tweetek változó jellege: A tweetek jelentősen fejlődtek a kezdetek óta. Kezdetben a tweetek 140 karakterre korlátozódtak, és elsősorban szövegből álltak. Azonban a karakterkorlátot azóta 280-ra bővítették, és a tweetek most gyakran tartalmaznak képeket, videókat és animált GIF-eket is. A LOC csak a tweetek szövegét archiválja, ami azt jelenti, hogy a kontextus jelentős része elveszik.
- Korlátozott erőforrások: A LOC nem rendelkezett a Twitter-archívum hatékony kezeléséhez szükséges erőforrásokkal vagy szakértelemmel. A könyvtárnak nem voltak teljes munkaidős mérnökei a tweetek óriási beáramlásának feldolgozására, és ez jelentős késedelmekhez és kihívásokhoz vezetett az archívum kutatók számára való hozzáférhetővé tételében.
A történelmi tweetek archiválásának előnyben részesítése
Ezekre a kihívásokra válaszul a LOC úgy döntött, hogy azoknak a tweeteknek az archiválását részesíti előnyben, amelyeket történelmileg fontosnak tartanak. Ezt a döntést a LOC által közzétett egy fehér könyvben jelentették be, amely ismerteti a politikai változás okait.
A LOC elismeri, hogy a Twitter egy folyamatosan fejlődő platform, és lehetetlen megjósolni, hogy a jövőben hogyan fog tovább változni. A könyvtár célja, hogy a tweetek egy reprezentatív mintáját gyűjtse össze és őrizze meg, amelyek betekintést nyújthatnak korunk társadalmi, politikai és kulturális tájába.
Az archívum jelenlegi állapota
A tweetek jelenlegi 12 éves archívuma nem nyilvánosan hozzáférhető, és a LOC még nem jelentette be, hogy mikorra válhat elérhetővé. A könyvtár szándéka, hogy az archívum a közösségi média kommunikáció korai éveinek pillanatfelvételeként szolgáljon, hasonlóan ahhoz, ahogy a LOC a táviratokat őrzi meg az adott technológia korai napjaiból.
Az archívum lehetséges értéke
A szociológia, pszichológia, politológia és kommunikáció területén dolgozó kutatók egyaránt érdeklődést mutattak a Twitter-archívum elérésére. Úgy vélik, hogy az adatok értékes betekintést nyújthatnak az emberi viselkedésbe, a társadalmi trendekbe és a politikai diskurzusba.
Következtetés
A LOC azon döntése, hogy előnyben részesíti a történelmi tweetek archiválását, elismeri a közösségi médiában megjelenő adatok kezelésével és megőrzésével kapcsolatos kihívásokat. Bár a teljes archívum még nem nyilvánosan hozzáférhető, remélhetőleg a LOC végül talál módot arra, hogy kutatók és a nyilvánosság számára is elérhetővé tegye azt, lehetővé téve számunkra, hogy mélyebb betekintést nyerjünk digitális múltunkba és jelenünkbe.