Twitter-Archiv: Kongressbibliothek will historische Tweets priorisieren
Hintergrund
2010 schloss die Kongressbibliothek (LOC) eine Vereinbarung mit Twitter, jeden jemals gesendeten öffentlichen Tweet zu archivieren. Dieses ehrgeizige Projekt zielte darauf ab, eine riesige Sammlung sozialer Kommentare und Kommunikation für zukünftige Generationen zu erhalten.
Herausforderungen bei der Archivierung von Twitter-Daten
Im Laufe der Jahre sind bei der Verwaltung des Twitter-Archivs mehrere Herausforderungen aufgetreten.
- Volumen und Größe von Tweets: Die schiere Menge an Tweets ist exponentiell gewachsen, was die Speicherung und Verarbeitung der Daten zunehmend erschwert. Im Jahr 2010 schickten Twitter-Nutzer etwa 50 Millionen Tweets pro Tag. Heute ist diese Zahl auf über 500 Millionen Tweets pro Tag gestiegen.
- Veränderliche Natur von Tweets: Tweets haben sich seit ihrer Einführung erheblich weiterentwickelt. Anfangs waren Tweets auf 140 Zeichen beschränkt und bestanden hauptsächlich aus Text. Inzwischen wurde das Zeichenlimit jedoch auf 280 erweitert, und Tweets enthalten jetzt häufig Bilder, Videos und animierte GIFs. Die LOC archiviert nur den Text von Tweets, was bedeutet, dass eine beträchtliche Menge an Kontext verloren geht.
- Begrenzte Ressourcen: Der LOC verfügte nicht über die notwendigen Ressourcen oder das Fachwissen, um das Twitter-Archiv effektiv zu verwalten. Der Bibliothek fehlten Vollzeit-Ingenieure, um den massiven Zustrom von Tweets zu verarbeiten, was zu erheblichen Verzögerungen und Herausforderungen beim Zugriff von Forschern auf das Archiv führte.
Entscheidung, historischen Tweets Priorität einzuräumen
Angesichts dieser Herausforderungen hat die LOC beschlossen, der Archivierung von Tweets, denen historische Bedeutung zugeschrieben wird, Priorität einzuräumen. Diese Entscheidung wurde in einem von der LOC veröffentlichten Whitepaper bekannt gegeben, in dem die Gründe für die Änderung der Richtlinie dargelegt wurden.
Die LOC erkennt an, dass Twitter eine sich ständig weiterentwickelnde Plattform ist und es unmöglich ist, vorherzusagen, wie sie sich in Zukunft weiterentwickeln wird. Das Ziel der Bibliothek ist es, eine repräsentative Auswahl von Tweets zu sammeln und zu bewahren, die Einblicke in die soziale, politische und kulturelle Landschaft unserer Zeit geben können.
Aktueller Status des Archivs
Das aktuelle 12-jährige Archiv von Tweets ist nicht öffentlich zugänglich, und die LOC hat noch keinen Zeitplan bekannt gegeben, wann es verfügbar sein könnte. Die Bibliothek beabsichtigt, dass das Archiv als Momentaufnahme der frühen Jahre der Social-Media-Kommunikation dient, ähnlich wie die LOC Telegramme aus den Anfängen dieser Technologie aufbewahrt.
Möglicher Wert des Archivs
Forscher aus verschiedenen Bereichen, darunter Soziologie, Psychologie, Politikwissenschaft und Kommunikation, haben ihr Interesse am Zugriff auf das Twitter-Archiv bekundet. Sie glauben, dass die Daten wertvolle Einblicke in menschliches Verhalten, soziale Trends und politische Diskurse liefern könnten.
Fazit
Die Entscheidung der LOC, der Archivierung historischer Tweets Priorität einzuräumen, ist eine Anerkennung der Herausforderungen, die mit der Verwaltung und Erhaltung von Social-Media-Daten verbunden sind. Obwohl das vollständige Archiv noch nicht öffentlich zugänglich ist, ist zu hoffen, dass die LOC schließlich einen Weg finden wird, es Forschern und der Öffentlichkeit zugänglich zu machen, sodass wir ein tieferes Verständnis unserer digitalen Vergangenheit und Gegenwart erlangen können.