Twitter-arkisto: Kongressin kirjasto aikoo priorisoida historialliset twiitit
Tausta
Vuonna 2010 Kongressin kirjasto (LOC) teki sopimuksen Twitterin kanssa kaikkien koskaan lähetettyjen julkisten twiittien arkistoimiseksi. Tämän kunnianhimoisen hankkeen tavoitteena oli säilyttää valtava kokoelma yhteiskunnallista kommentointia ja viestintää tulevia sukupolvia varten.
Twitter-datan arkistoinnin haasteet
Vuosien varrella Twitter-arkiston hallinnassa on ilmennyt useita haasteita.
- Twiittien määrä ja koko: Twiittien valtava määrä on kasvanut eksponentiaalisesti, mikä vaikeuttaa yhä enemmän tietojen tallentamista ja käsittelyä. Vuonna 2010 Twitter-käyttäjät lähettivät noin 50 miljoonaa twiittiä päivässä. Nykyään tämä luku on noussut yli 500 miljoonaan twiittiin päivässä.
- Twiittien muuttuva luonne: Twiitit ovat kehittyneet huomattavasti alkuperäisestä muodostaan. Aluksi twiitit rajoittuivat 140 merkkiin ja koostuivat pääasiassa tekstistä. Merkkimäärän rajoitusta on kuitenkin sittemmin laajennettu 280 merkkiin, ja twiitit sisältävät nykyään usein kuvia, videoita ja animoituja GIF-tiedostoja. LOC arkistoi vain twiittien tekstin, mikä tarkoittaa, että merkittävä määrä kontekstia menetetään.
- Rajoitetut resurssit: LOC:llä ei ollut tarvittavia resursseja tai asiantuntemusta Twitter-arkiston tehokkaaseen hallintaan. Kirjastolla ei ollut kokoaikaisia insinöörejä käsittelemässä valtavaa twiittien virtaa, mikä johti merkittäviin viivästyksiin ja haasteisiin arkiston saattamisessa tutkijoiden saataville.
Päätös priorisoida historialliset twiitit
Näiden haasteiden valossa LOC on päättänyt priorisoida sellaisten twiittien arkistoinnin, joiden katsotaan olevan historiallisesti merkittäviä. Tämä päätös ilmoitettiin LOC:n julkaisemassa valkoisessa kirjassa, jossa esitettiin politiikan muutoksen syyt.
LOC tunnustaa, että Twitter on jatkuvasti kehittyvä alusta, ja on mahdotonta ennustaa, miten se tulee muuttumaan tulevaisuudessa. Kirjaston tavoitteena on kerätä ja säilyttää edustava otos twiiteistä, jotka voivat tarjota tietoa aikamme sosiaalisesta, poliittisesta ja kulttuurisesta maisemasta.
Arkiston nykyinen tila
Nykyinen 12 vuoden twiittiarkisto ei ole julkisesti saatavilla, eikä LOC ole vielä ilmoittanut aikataulua sille, milloin se saattaisi olla saatavilla. Kirjaston tarkoituksena on, että arkisto toimisi kuvana sosiaalisen median viestinnän varhaisista vuosista, samalla tavalla kuin LOC säilyttää sähkeitä kyseisen teknologian alkuajoilta.
Arkiston mahdollinen arvo
Tutkijat eri aloilta, kuten sosiologiasta, psykologiasta, valtiotieteestä ja viestinnästä, ovat ilmaisseet kiinnostuksensa päästä käsiksi Twitter-arkistoon. He uskovat, että tiedot voisivat tarjota arvokasta tietoa ihmisen käyttäytymisestä, yhteiskunnallisista suuntauksista ja poliittisesta keskustelusta.
Johtopäätös
LOC:n päätös priorisoida historiallisten twiittien arkistointi on tunnustus sosiaalisen median tietojen hallintaan ja säilyttämiseen liittyvistä haasteista. Vaikka koko arkisto ei ole vielä julkisesti saatavilla, on toivoa, että LOC löytää lopulta tavan saattaa se tutkijoiden ja yleisön saataville, mikä mahdollistaa meille digitaalisen menneisyytemme ja nykyisyytemme syvällisemmän ymmärtämisen.