Twitterarkiv: Library of Congress ska prioritera historiska tweets
Bakgrund
2010 ingick Library of Congress (LOC) ett avtal med Twitter för att arkivera varenda offentlig tweet som någonsin skickats. Detta ambitiösa projekt syftade till att bevara en stor samling av samhällsdebatt och kommunikation för framtida generationer.
Utmaningar med att arkivera Twitterdata
Flera utmaningar har dykt upp genom åren med att hantera Twitterarkivet.
- Volym och storlek på tweets: Den stora volymen tweets har ökat exponentiellt, vilket gör det allt svårare att lagra och bearbeta data. 2010 skickade Twitteranvändare ungefär 50 miljoner tweets per dag. Idag har den siffran skjutit i höjden till över 500 miljoner tweets per dag.
- Tweetsens föränderliga natur: Tweets har utvecklats avsevärt sedan starten. Till en början var tweets begränsade till 140 tecken och bestod främst av text. Men teckenbegränsningen har sedan dess utökats till 280, och tweets innehåller nu ofta bilder, videor och animerade GIF:ar. LOC arkiverar endast texten i tweets, vilket innebär att en betydande mängd kontext går förlorad.
- Begränsade resurser: LOC saknade nödvändiga resurser eller expertis för att effektivt hantera Twitterarkivet. Biblioteket hade inte ingenjörer på heltid för att bearbeta det enorma inflödet av tweets, och det ledde till betydande förseningar och utmaningar med att göra arkivet tillgängligt för forskare.
Beslut att prioritera historiska tweets
I ljuset av dessa utmaningar har LOC beslutat att prioritera arkivering av tweets som anses vara av historisk vikt. Detta beslut tillkännagavs i en vitbok publicerad av LOC, som redogjorde för skälen till förändringen i policyn.
LOC erkänner att Twitter är en plattform under ständig utveckling, och det är omöjligt att förutspå hur den kommer att fortsätta att förändras i framtiden. Bibliotekens mål är att samla in och bevara ett representativt urval av tweets som kan ge insikter i det sociala, politiska och kulturella landskapet i vår tid.
Arkivets nuvarande status
Det nuvarande 12-åriga arkivet av tweets är inte tillgängligt för allmänheten, och LOC har ännu inte meddelat en tidsplan för när det kan bli tillgängligt. Biblioteket avser för att arkivet ska fungera som en ögonblicksbild av de tidiga åren av kommunikation i sociala medier, på liknande sätt som LOC bevarar telegram från de tidiga dagarna av den teknologin.
Arkivets potentiella värde
Forskare inom olika områden, inklusive sociologi, psykologi, statsvetenskap och kommunikation, har uttryckt intresse av att få tillgång till Twitterarkivet. De tror att uppgifterna skulle kunna ge värdefulla insikter i mänskligt beteende, sociala trender och politiska diskussioner.
Slutsats
LOC:s beslut att prioritera arkivering av historiska tweets är ett erkännande av de utmaningar som är förknippade med att hantera och bevara data från sociala medier. Även om hela arkivet ännu inte är tillgängligt för allmänheten, är det förhoppningen att LOC så småningom kommer att hitta ett sätt att göra det tillgängligt för forskare och allmänheten, vilket gör det möjligt för oss att få en djupare förståelse av vårt digitala förflutna och nutid.