Archivo de Twitter: la Biblioteca del Congreso priorizará los tuits históricos
Antecedentes
En 2010, la Biblioteca del Congreso (LOC) celebró un acuerdo con Twitter para archivar cada tuit público jamás enviado. Este ambicioso proyecto tenía como objetivo preservar un vasto repositorio de comentarios y comunicaciones sociales para las generaciones futuras.
Desafíos del archivo de datos de Twitter
A lo largo de los años, han surgido varios desafíos en la gestión del archivo de Twitter.
- Volumen y tamaño de los tuits: El gran volumen de tuits ha crecido exponencialmente, lo que dificulta cada vez más el almacenamiento y procesamiento de los datos. En 2010, los usuarios de Twitter enviaban aproximadamente 50 millones de tuits por día. Hoy, ese número se ha disparado a más de 500 millones de tuits por día.
- Naturaleza cambiante de los tuits: Los tuits han evolucionado significativamente desde su inicio. Inicialmente, los tuits estaban limitados a 140 caracteres y consistían principalmente en texto. Sin embargo, desde entonces, el límite de caracteres se ha ampliado a 280, y los tuits ahora suelen incluir imágenes, vídeos y GIF animados. La LOC solo archiva el texto de los tuits, lo que significa que se pierde una cantidad significativa de contexto.
- Recursos limitados: La LOC no contaba con los recursos o la experiencia necesarios para gestionar eficazmente el archivo de Twitter. La biblioteca carecía de ingenieros a tiempo completo para procesar la enorme afluencia de tuits, y esto generó importantes retrasos y desafíos para que los investigadores pudieran acceder al archivo.
Decisión de priorizar los tuits históricos
A la luz de estos desafíos, la LOC ha decidido priorizar el archivo de tuits que se consideran de importancia histórica. Esta decisión fue anunciada en un libro blanco publicado por la LOC, que describía las razones del cambio de política.
La LOC reconoce que Twitter es una plataforma en constante evolución y es imposible predecir cómo seguirá cambiando en el futuro. El objetivo de la biblioteca es recopilar y conservar una muestra representativa de tuits que puedan proporcionar información sobre el panorama social, político y cultural de nuestro tiempo.
Estado actual del archivo
El archivo actual de tuits de 12 años no es de acceso público, y la LOC aún no ha anunciado un plazo para cuándo podría estar disponible. La biblioteca pretende que el archivo sirva como una instantánea de los primeros años de la comunicación en las redes sociales, de manera similar a como la LOC conserva los telégrafos de los primeros días de esa tecnología.
Valor potencial del archivo
Investigadores de diversos campos, como la sociología, la psicología, la ciencia política y la comunicación, han expresado su interés en acceder al archivo de Twitter. Creen que los datos podrían proporcionar información valiosa sobre el comportamiento humano, las tendencias sociales y el discurso político.
Conclusión
La decisión de la LOC de priorizar el archivo de tuits históricos es un reconocimiento de los desafíos que implica gestionar y preservar los datos de las redes sociales. Si bien el archivo completo aún no está disponible públicamente, se espera que la LOC eventualmente encuentre una manera de ponerlo a disposición de los investigadores y el público, permitiéndonos obtener una comprensión más profunda de nuestro pasado y presente digitales.