Les Archives Twitter : la Bibliothèque du Congrès va donner la priorité aux tweets historiques
Contexte
En 2010, la Bibliothèque du Congrès (LOC) a conclu un accord avec Twitter pour archiver chaque tweet public jamais envoyé. Cet ambitieux projet visait à préserver un vaste référentiel de commentaires et de communications sociales pour les générations futures.
Les défis de l’archivage des données Twitter
Au fil des ans, plusieurs défis sont apparus dans la gestion des archives Twitter.
- Volume et taille des tweets : Le volume considérable de tweets a connu une croissance exponentielle, rendant de plus en plus difficile le stockage et le traitement des données. En 2010, les utilisateurs de Twitter envoyaient environ 50 millions de tweets par jour. Aujourd’hui, ce nombre a explosé pour atteindre plus de 500 millions de tweets par jour.
- Nature changeante des tweets : Les tweets ont considérablement évolué depuis leur création. Initialement, les tweets étaient limités à 140 caractères et consistaient principalement en du texte. Cependant, la limite de caractères a depuis été étendue à 280, et les tweets incluent désormais souvent des images, des vidéos et des GIF animés. La LOC archive uniquement le texte des tweets, ce qui signifie qu’une part importante du contexte est perdue.
- Ressources limitées : La LOC ne disposait pas des ressources ou de l’expertise nécessaires pour gérer efficacement les archives Twitter. La bibliothèque manquait d’ingénieurs à plein temps pour traiter l’afflux massif de tweets, ce qui a entraîné des retards importants et des difficultés pour rendre les archives accessibles aux chercheurs.
Décision de donner la priorité aux tweets historiques
À la lumière de ces défis, la LOC a décidé de donner la priorité à l’archivage des tweets jugés d’importance historique. Cette décision a été annoncée dans un livre blanc publié par la LOC, qui exposait les raisons du changement de politique.
La LOC reconnaît que Twitter est une plateforme en constante évolution et qu’il est impossible de prédire comment elle continuera à changer à l’avenir. L’objectif de la bibliothèque est de collecter et de préserver un échantillon représentatif de tweets pouvant fournir des informations sur le paysage social, politique et culturel de notre époque.
État actuel des archives
Les archives actuelles de tweets sur 12 ans ne sont pas accessibles au public, et la LOC n’a pas encore annoncé de calendrier pour leur éventuelle mise à disposition. La bibliothèque a l’intention que les archives servent d’instantané des premières années de la communication sur les réseaux sociaux, de la même manière que la LOC conserve les télégrammes des débuts de cette technologie.
Valeur potentielle des archives
Les chercheurs de divers domaines, notamment la sociologie, la psychologie, les sciences politiques et la communication, ont exprimé leur intérêt pour l’accès aux archives Twitter. Ils estiment que les données pourraient fournir des informations précieuses sur le comportement humain, les tendances sociales et le discours politique.
Conclusion
La décision de la LOC de donner la priorité à l’archivage des tweets historiques est une reconnaissance des défis liés à la gestion et à la préservation des données des réseaux sociaux. Bien que les archives complètes ne soient pas encore accessibles au public, il est espéré que la LOC trouvera à terme un moyen de les mettre à la disposition des chercheurs et du public, nous permettant ainsi d’acquérir une compréhension plus approfondie de notre passé et de notre présent numériques.