트위터 아카이브: 의회도서관, 역사적 트윗에 우선순위 부여
배경
2010년 의회도서관(LOC)은 트위터와 모든 공개 트윗을 아카이브하기로 하는 계약을 맺었습니다. 이 야심 찬 프로젝트는 미래 세대를 위한 광대한 소셜 커뮤니케이션 및 의견 저장소를 보존하는 것이 목적이었습니다.
트위터 데이터 아카이빙의 난제
수년에 걸쳐 트위터 아카이브 관리에 몇 가지 난제가 발생했습니다.
- 트윗의 양과 크기: 트윗의 양은 기하급수적으로 증가하여 데이터를 저장하고 처리하는 것이 매우 어려워졌습니다. 2010년 트위터 사용자는 하루에 약 5천만 개의 트윗을 보냈습니다. 현재는 그 수가 하루에 5억 개 이상으로 급등했습니다.
- 트윗의 변화하는 특성: 트윗은 처음 생겨난 이후로 크게 진화했습니다. 처음에는 트윗이 140자로 제한되었고 주로 문자로 이루어져 있었습니다. 하지만 그 뒤에 문자 제한이 280자로 확대되었고, 이제는 트윗에 이미지, 비디오, 애니메이션 GIF가 자주 포함됩니다. LOC는 트윗 텍스트만 아카이빙하므로 상당한 양의 컨텍스트가 손실됩니다.
- 제한된 리소스: LOC는 트위터 아카이브를 효과적으로 관리할 필요한 리소스나 전문성이 없었습니다. 연구소에는 엄청난 양의 트윗을 처리할 정규 엔지니어가 부족하여 연구자들이 아카이브에 접근하는 데 상당한 지연과 문제가 발생했습니다.
역사적 트윗에 우선순위를 두기로 한 결정
이러한 난제로 인해 LOC는 역사적으로 중요하다고 여겨지는 트윗의 아카이빙에 우선순위를 두기로 결정했습니다. 이 결정은 LOC에서 발표한 백서에서 발표되었으며, 정책 변화의 이유를 설명했습니다.
LOC는 트위터가 지속적으로 진화하는 플랫폼이고 앞으로 어떻게 변화할지 예측할 수 없다는 점을 인정합니다. 이 연구소의 목표는 우리 시대의 사회적, 정치적, 문화적 풍경에 대한 통찰력을 제공할 수 있는 트윗의 대표적 샘플을 수집하고 보존하는 것입니다.
아카이브의 현재 상태
현재 12년간의 트윗 아카이브는 공개되지 않았으며 LOC는 아직 언제 공개될지에 대한 일정을 발표하지 않았습니다. 이 연구소는 아카이브가 초기 소셜 미디어 커뮤니케이션의 스냅샷으로 작동하기를 원합니다. 마치 LOC가 그 기술의 초기 시절부터 전보를 보존하는 것처럼 말입니다.
아카이브의 잠재적 가치
사회학, 심리학, 정치학, 커뮤니케이션을 포함한 다양한 분야의 연구자들은 트위터 아카이브에 접근하는 데 관심을 표명했습니다. 그들은 이 데이터가 인간 행동, 사회적 트렌드, 정치적 담론에 대한 귀중한 통찰력을 제공할 수 있다고 믿습니다.
결론
LOC가 역사적 트윗 아카이빙에 우선순위를 두기로 한 결정은 소셜 미디어 데이터를 관리하고 보존하는 데 따르는 난제를 인식한 것입니다. 전체 아카이브가 아직 공개되지 않았지만 LOC가 결국 연구자와 대중에게 공개할 방법을 찾기를 바랍니다. 그러면 우리는 우리의 디지털 과거와 현재를 더 깊이 이해할 수 있을 것입니다.