Arquivo do Twitter: Biblioteca do Congresso priorizará tweets históricos
Histórico
Em 2010, a Biblioteca do Congresso (LOC) firmou um acordo com o Twitter para arquivar todos os tweets públicos já enviados. Este projeto ambicioso visava preservar um vasto repositório de comentários e comunicações sociais para as gerações futuras.
Desafios do arquivamento de dados do Twitter
Ao longo dos anos, vários desafios surgiram na gestão do arquivo do Twitter.
- Volume e tamanho dos tweets: O grande volume de tweets cresceu exponencialmente, tornando cada vez mais difícil armazenar e processar os dados. Em 2010, os usuários do Twitter enviavam cerca de 50 milhões de tweets por dia. Hoje, esse número disparou para mais de 500 milhões de tweets por dia.
- Natureza em mudança dos tweets: Os tweets evoluíram significativamente desde seu início. Inicialmente, os tweets eram limitados a 140 caracteres e consistiam principalmente em texto. No entanto, desde então, o limite de caracteres foi expandido para 280, e os tweets agora geralmente incluem imagens, vídeos e GIFs animados. A LOC arquiva apenas o texto dos tweets, o que significa que uma quantidade significativa de contexto é perdida.
- Recursos limitados: A LOC não tinha os recursos ou a expertise necessários para gerenciar efetivamente o arquivo do Twitter. A biblioteca não contava com engenheiros em tempo integral para processar o enorme fluxo de tweets, o que resultou em atrasos e desafios significativos para tornar o arquivo acessível aos pesquisadores.
Decisão de priorizar tweets históricos
Diante desses desafios, a LOC decidiu priorizar o arquivamento de tweets considerados historicamente importantes. Essa decisão foi anunciada em um documento oficial publicado pela LOC, que descrevia as razões para a mudança de política.
A LOC reconhece que o Twitter é uma plataforma em constante evolução e é impossível prever como ela continuará a mudar no futuro. O objetivo da biblioteca é coletar e preservar uma amostra representativa de tweets que possa fornecer insights sobre o panorama social, político e cultural de nosso tempo.
Situação atual do arquivo
O arquivo atual de tweets de 12 anos não é de acesso público, e a LOC ainda não anunciou um cronograma para quando ele poderá estar disponível. A biblioteca pretende que o arquivo sirva como um instantâneo dos primeiros anos da comunicação em redes sociais, semelhante à forma como a LOC preserva os telegramas dos primeiros dias dessa tecnologia.
Valor potencial do arquivo
Pesquisadores de vários campos, como sociologia, psicologia, ciência política e comunicação, expressaram interesse em acessar o arquivo do Twitter. Eles acreditam que os dados podem fornecer informações valiosas sobre comportamento humano, tendências sociais e discurso político.
Conclusão
A decisão da LOC de priorizar o arquivamento de tweets históricos é um reconhecimento dos desafios envolvidos na gestão e preservação de dados de redes sociais. Embora o arquivo completo ainda não esteja disponível publicamente, espera-se que a LOC eventualmente encontre uma maneira de disponibilizá-lo para pesquisadores e o público, permitindo-nos obter uma compreensão mais profunda de nosso passado e presente digitais.