Twitter档案馆:国会图书馆将优先考虑历史推文
背景
2010年,国会图书馆(LOC)与Twitter达成协议,存档每一条曾经发送过的公开推文。这个雄心勃勃的项目旨在为后代保存一个巨大的社会评论和交流资料库。
存档Twitter数据的挑战
多年来,在管理Twitter档案馆的过程中出现了一些挑战。
- 推文的数量和规模: 推文的数量呈指数级增长,使得存储和处理数据变得越来越困难。2010年,Twitter用户每天发送约5000万条推文。如今,这个数字已飙升至每天超过5亿条推文。
- 推文不断变化的性质: 自Twitter诞生以来,推文已经发生了很大变化。最初,推文被限制在140个字符以内,主要由文本组成。但是,此后字符限制已扩展到280个,推文现在通常包含图片、视频和动画GIF。LOC只存档推文的文本,这意味着大量的内容都丢失了。
- 资源有限: LOC没有有效管理Twitter档案馆所需的资源或专业知识。图书馆缺乏全职工程师来处理大量涌入的推文,这导致研究人员在访问档案馆时遇到了严重的延迟和挑战。
优先考虑历史推文的决定
鉴于这些挑战,LOC决定优先考虑那些被认为具有历史意义的推文的存档。这一决定是在LOC发布的一份白皮书中宣布的,其中概述了政策变更的原因。
LOC认识到Twitter是一个不断发展的平台,不可能预测它在未来将如何继续变化。该图书馆的目标是收集和保存具有代表性的推文样本,这些样本可以提供我们这个时代社会、政治和文化环境的见解。
档案馆的现状
当前为期12年的推文存档尚未公开,LOC尚未宣布可能何时公开的时间表。该图书馆希望档案馆能够作为社交媒体交流早期的快照,类似于LOC保存来自该技术早期的电报的方式。
档案馆的潜在价值
来自社会学、心理学、政治学和传播学等各个领域的学者已经表示有兴趣访问Twitter档案馆。他们相信这些数据可以为人类行为、社会趋势和政治话语提供宝贵的见解。
结论
LOC决定优先考虑历史推文的存档,是对管理和保存社交媒体数据所涉及挑战的一种认可。虽然完整的档案馆尚未公开,但希望LOC最终能够找到一种方式让研究人员和公众可以使用它,从而使我们能够更深入地了解我们的数字过去和现在。