Twitterアーカイブ:米国議会図書館が歴史的ツイートを優先
背景
2010年、米国議会図書館(LOC)はTwitterと、これまでに送信されたすべての公開ツイートをアーカイブする契約を結びました。この野心的なプロジェクトは、未来の世代のために膨大なソーシャルコメンタリーやコミュニケーションの貯蔵庫を保存することを目的としていました。
Twitterデータのアーカイブにおける課題
長年にわたり、Twitterアーカイブの管理にはいくつかの課題が生じてきました。
- ツイートの量とサイズ:ツイートの量は飛躍的に増加し、データの保存と処理がますます困難になっています。2010年には、Twitterユーザーは1日に約5,000万ツイートを送信していました。現在、その数は1日あたり5億ツイート以上に急増しています。
- ツイートの性質の変化:ツイートは誕生以来大きく進化してきました。当初、ツイートは140文字に制限されており、主にテキストで構成されていました。しかし、その後、文字制限は280文字に拡張され、ツイートには画像、動画、アニメーションGIFが含まれることが多くなりました。LOCはツイートのテキストのみをアーカイブしており、つまり大量のコンテキストが失われます。
- 限られたリソース:LOCはTwitterアーカイブを効果的に管理するために必要なリソースや専門知識がありませんでした。ライブラリには大量のツイートを処理する常勤のエンジニアが不足しており、研究者がアーカイブにアクセスする際にかなりの遅延や課題が生じていました。
歴史的ツイートを優先する決定
これらの課題を踏まえ、LOCは歴史的に重要とみなされるツイートのアーカイブを優先することを決定しました。この決定はLOCが発表したホワイトペーパーで発表され、ポリシー変更の理由が説明されています。
LOCは、Twitterが絶えず進化するプラットフォームであり、今後どのように変化し続けるかを予測することは不可能であることを認識しています。図書館の目標は、私たちの時代の社会的、政治的、文化的状況に関する洞察を提供できるツイートの代表的なサンプルを収集して保存することです。
アーカイブの現在の状況
現在の12年間のツイートアーカイブは公開されておらず、LOCはまだいつ公開されるかについてのタイムラインを発表していません。図書館は、このアーカイブをソーシャルメディアコミュニケーションの初期の頃のスナップショットとして活用したいと考えています。これは、LOCがその技術の初期から電報を保存しているのと同じようなものです。
アーカイブの潜在的な価値
社会学、心理学、政治学、コミュニケーションを含むさまざまな分野の研究者は、Twitterアーカイブへのアクセスに関心を示しています。彼らは、このデータが人間の行動、社会的動向、政治的言説に関する貴重な洞察を提供できると考えています。
結論
LOCが歴史的ツイートのアーカイブを優先する決定は、ソーシャルメディアデータを管理および保存することに伴う課題を認識している表れです。完全なアーカイブはまだ公開されていませんが、LOCが最終的には研究者や一般の人々に公開する方法を見つけ、私たちのデジタルの過去と現在をより深く理解できるようにすることを期待しています。