CLOCKSS(Controlled Lots of Copies Keep Stuff Safe)は、学術出版物や研究データのデジタルコンテンツを長期的に保存し、将来の研究者や学術コミュニティがアクセスできるようにするための非営利の分散型アーカイブシステムです。世界中のサーバーにデータを分散保存し、出版社の倒産や自然災害などの非常事態が発生した際にのみ公開される仕組みで、学術情報の永続的な保存とセキュリティを保証します。学術出版物の信頼性を高め、研究者や読者にとって重要なリソースを提供します。

CLOCKSSとは何か?

概要と目的

CLOCKSS(Controlled Lots of Copies Keep Stuff Safe:クロークス)は、学術出版物や研究データのデジタルコンテンツを長期的に保存し、将来の研究者や学術コミュニティがアクセスできるようにするための非営利の分散型アーカイブシステムです。

このシステムは、電子ジャーナルや重要な学術コンテンツが消失するリスクを軽減し、デジタル時代における学術情報の持続可能な保存を実現することを目的としています。

CLOCKSSの設立背景と発展

設立背景

CLOCKSSは、2006年にスタンフォード大学のLOCKSS(Lots of Copies Keep Stuff Safe)技術を基盤として試行的にスタートしました。

デジタル化が進む中、学術情報の長期保存の重要性が高まるにつれて、このプロジェクトの必要性が増し、設立されました。特に、電子ジャーナルの普及に伴い、コンテンツの永続的な保存のニーズが高まったことが設立の背景にあります。

設立当初は、限られたコンテンツを保存する試験的なプロジェクトでしたが、現在では世界中の多くの学術機関が参加し、国際的な規模で運用されています。

CLOCKSSの主な特徴

CLOCKSSは、学術情報の長期保存とアクセスを確保するために設計された先進的なデジタルアーカイブシステムです。その使命や技術的な強み、そしてコミュニティ主導のグローバルな協力体制を通じて、学術コンテンツの未来を守るための信頼できるプラットフォームを提供しています。以下では、CLOCKSSの主な特徴について詳しくご紹介します。

CLOCKSSの主な特徴

  • 保存の使命:CLOCKSSは、持続可能なオンラインアーカイブを作成することで、デジタル学術の長期的な存続を確保することを目指しています。
  • グローバルな協力:世界中の学術出版社と研究図書館によるコミュニティ主導の協力体制です。
  • アーカイブ方式:世界中の主要研究図書館に設置された12のアーカイブノードでコンテンツを保存しています。
  • コンテンツの範囲:ジャーナル記事、書籍、関連データ、画像、ソフトウェア、動画、ウェブアーカイブを含みます。
  • 技術:受賞歴のあるLOCKSS技術を使用して、コンテンツを元のデジタル形式で保存し、必要に応じて新しい形式に移行します。
  • オープンアクセス:「トリガーイベント」が発生した場合、CLOCKSSは利用可能にするすべてのコンテンツにCreative Commonsオープンアクセスライセンスを付与し、誰もが自由にアクセスできるようにします。

CLOCKSSの利用者と登録数

CLOCKSSの利用者および登録に関連する重要な数字は以下の通りです(2024年8月):

  • 5,690万件のジャーナル記事を保存
  • 524,600冊の書籍をアーカイブ
  • 69のトリガーされたタイトルをオープンアクセス化
  • 12のミラーリポジトリサイト(12の世界の大学・団体にて保存)
  • 300の支援図書館
  • 606の参加出版社

これらの数字の量は、CLOCKSSがいかに学術情報コンテンツの保存とアクセスを保証するための重要なインフラであることを示しています。

CLOCKSSのメリット

学術コミュニティが直面する課題に対するCLOCKSSの効果的な解決策について、詳細にご紹介します。

CLOOKSを利用するメリット

  • 持続可能性: CLOCKSSは持続可能な長期的デジタルアーカイブを提供します。
  • 品質保証: コンテンツは研究図書館によって選択され、信頼できる学術出版社によって品質が保証されています。
  • リスク軽減: 人為的ミス、コンピューター攻撃、経済的または組織的な失敗など、様々な原因によるデジタル損失から学術コンテンツを保護します。
  • 費用対効果: 図書館と出版社が協力することで、デジタル保存に関連するコストとストレスを軽減できます。

CLOCKSSは、将来の世代のために学術コンテンツを保存する上で重要な役割を果たし、貴重な研究が長期的にアクセス可能で保護されることを保証しています。

CLOCKSSの仕組みと技術基盤

分散型保存システム

CLOCKSSの技術基盤は、分散型アーキテクチャ(分散型全体構造)にあります。

デジタルコンテンツは、世界中の複数のノード(独立して機能する個々の要素)に分散して保存され、これにより一部のノードが故障してもデータが失われることを防ぎます。各ノードは独立して機能し、データの複製を通じて保存の信頼性が確保されます。

ダークアーカイブとしての運用

CLOCKSSは、通常は非公開のダークアーカイブとして運用されます。

保存されたコンテンツは外部からのアクセスが制限され、データの安全性が確保されます。トリガーイベントが発生した場合にのみ、参加機関を通じてデータが公開されます。

ダークアーカイブとは?学術コンテンツを永続保存する重要性

ダークアーカイブは、デジタルデータの長期保存とセキュリティ確保のための重要な手段です。その基本概念から歴史、利用ケース、コスト、法的側面、クラウドストレージとの関連まで、さまざまな視点からダークアーカイブの全体像を徹底解 […]

技術基盤:LOCKSSとP2P

CLOCKSSの技術的基盤は、スタンフォード大学が開発したLOCKSS(Lots of Copies Keep Stuff Safe)技術に基づいています。

この技術は、分散型のピア・ツー・ピア(P2P)ネットワークを利用してデータの複製と長期間の保存を実現します。以下では、LOCKSSとP2Pの仕組みについて詳しく解説します。

LOCKSSとは?

LOCKSS(Lots of Copies Keep Stuff Safe)は、スタンフォード大学によって開発された、学術コンテンツの長期保存を目的としたシステムです。

この技術は、学術ジャーナルやデジタルコンテンツを複数の分散されたサーバーに保存し、それらのコピーを同期させることで、コンテンツの安全性と耐久性を確保します。LOCKSSの主な特徴は次の通りです。

LOCKSSの特徴

  • 分散保存: コンテンツは、世界中の複数の場所に分散して保存され、データの複製が各保存拠点で独立して保管されます。これにより、一部の保存拠点で障害が発生しても、他の拠点でデータが保護されるため、データの喪失リスクが最小限に抑えられます。
  • 自律的な保存: LOCKSSは、自動的にコンテンツの完全性をチェックし、必要に応じて欠落した部分を修復します。このプロセスは完全に自律的であり、外部からの介入なしにデータが維持されます。
  • スケーラビリティ: LOCKSSは、データ量の増加に伴い、容易に保存拠点を追加できるため、システムのスケーラビリティが高いです。これにより、保存するデータが増えても対応可能です。

ピア・ツー・ピア(P2P)ネットワークとは?

LOCKSSのもう一つの重要な要素がピア・ツー・ピア(P2P)ネットワークです。P2Pネットワークは、中央のサーバーを介さずに、複数のコンピュータ(ピア)が直接相互にデータを共有し合う仕組みです。CLOCKSSにおけるP2Pの特徴は以下の通りです。

ピア・ツー・ピア(P2P)ネットワークの特徴

  • 分散化: P2Pネットワークでは、データが複数のピア(サーバーやノード)に分散して保存されます。この分散構造により、特定のピアが障害を受けても、他のピアからデータを取得できるため、システム全体の耐障害性が向上します。
  • 自律性: P2Pネットワークの各ピアは独立して動作し、自動的にデータの同期や修復を行います。これにより、中央管理者がいなくても、ネットワーク全体のデータ整合性が保たれます。
  • データ冗長性: P2Pネットワークでは、データが複数のピアに冗長的に保存されるため、データの消失リスクが大幅に減少します。たとえいくつかのピアがデータを失っても、他のピアに保存されたデータが残るため、復元が可能です。

LOCKSSとP2Pの連携

CLOCKSSは、LOCKSSの技術をベースにし、P2Pネットワークの利点を最大限に活用して、データの長期保存と信頼性を確保しています。LOCKSSとP2Pの連携により、以下の利点が得られます。

LOCKSSとP2Pの連携のメリット

  • 高い耐障害性: 分散保存とP2Pの相互バックアップにより、システム全体の耐障害性が飛躍的に向上します。
  • 継続的なデータ整合性: 各ピアが自律的にデータの整合性をチェックし、欠損を修復するため、保存データが長期間にわたり正確な状態で維持されます。
  • コスト効率の向上: 分散型のピア間でリソースを共有することで、中央管理のコストが削減され、運用の効率が向上します。

LOCKSSとP2Pネットワークは、CLOCKSSが提供するデジタルコンテンツの安全な長期保存の核となる技術であり、その組み合わせにより、学術情報の持続的なアクセスが保証されます。

CLOCKSSのユニークな特徴

他のデジタル保存システムとの比較

CLOCKSSは、他の多くのデジタル保存システムと比較して、いくつかの独自の特徴を持っています。

多くのシステムでは保存されたデータが常にアクセス可能な状態にありますが、CLOCKSSは通常非公開のダークアーカイブとして運用され、トリガーイベントが発生した場合にのみデータが公開されます。

この設計により、データのセキュリティが強化され、不正アクセスのリスクが最小限に抑えられます。

トリガーイベントとは?

トリガーイベントとは、CLOCKSSに保存されたデータが公開される特定の条件や状況を指します。通常、CLOCKSSは「ダークアーカイブ」として非公開の状態でデータを保持していますが、トリガーイベントが発生すると、これらのデータが公開され、アクセス可能になります。

以下に、主なトリガーイベントの例を挙げて説明します。

トリガーイベント例

出版社の倒産

トリガーイベントの代表的な例は、データを提供している出版社の倒産です。

出版社が倒産すると、そのコンテンツがもはや一般に提供されなくなる可能性があります。この場合、CLOCKSSは保存されたコンテンツを公開し、学術コミュニティに対して永続的なアクセスを提供します。

コンテンツ提供の停止

出版社が特定のコンテンツの提供を永久に停止することを決定した場合も、トリガーイベントとみなされます。このような状況では、CLOCKSSがそのコンテンツを公開し、学術的価値のある情報が失われることを防ぎます。

大規模な自然災害や戦争

大規模な自然災害や戦争などの非常事態が発生し、特定地域の学術情報へのアクセスが阻害される場合もトリガーイベントが発動されます。このような状況では、CLOCKSSが保存するコンテンツが公開され、グローバルな学術コミュニティへのアクセスが保証されます。

法的措置による強制公開

特定の法的措置によってコンテンツの公開が求められる場合も、トリガーイベントとしてCLOCKSSがデータを公開することがあります。この場合、法的な要請に従い、必要なコンテンツが一般にアクセス可能になります。

これらのトリガーイベントによって、CLOCKSSは学術情報の安全性と長期保存を確保しつつ、必要に応じて情報を公開し、学術的な利用を支援します。

分散保存とデータ保護

CLOCKSSの分散保存機能により、データは世界中の複数の場所に分散して保存されます。

これにより、特定のサーバーやデータセンターが物理的な災害に見舞われても、他の保存場所でデータが確保されるため、データの保護が徹底されます。また、特定の条件下でのみデータが公開されるため、長期間にわたってデータの安全性が保たれます。

相互運用性と拡張性

CLOCKSSは、他のデジタル保存システムと相互運用性を持つように設計されています。これにより、異なるシステム間でデータ交換が可能となり、学術機関や出版社は既存のインフラを利用して容易にCLOCKSSにデータを保存できます。この設計により、幅広い機関がCLOCKSSを利用してデータ保存を行うことが可能です。

分散保存を行っている大学や団体

CLOCKSSの分散保存は、世界中の12の主要な大学や団体が協力して行っています。

以下は、CLOCKSSはデータの分散保存を行っている主要な大学や団体とその所在地をまとめた表です。

北米、欧州、アジア太平洋の3地域にアーカイブノードを分散配置することで、地理的・政治的リスクを軽減し、デジタルコンテンツの長期保存を実現しています。特にアジア太平洋地域では、日本、中国、オーストラリアが重要な保存拠点として機能しています。

分散保存をしている12のCLOCKSS保存拠点

国・地域地域大学・団体名
アメリカ合衆国北米スタンフォード大学 (Stanford University)
アメリカ合衆国北米インディアナ大学 (Indiana University)
アメリカ合衆国北米バージニア大学 (University of Virginia)
アメリカ合衆国北米OCLCオンラインコンピュータライブラリセンター (OCLC)
アメリカ合衆国北米ライス大学 (Rice University)
カナダ北米アルバータ大学 (University of Alberta)
イギリスヨーロッパエジンバラ大学 (University of Edinburgh)
ドイツヨーロッパフンボルト大学 (Humboldt University)
イタリアヨーロッパサクロ・クオーレ・カトリック大学 (Università Cattolica del Sacro Cuore)
日本アジア太平洋国立情報学研究所 (National Institute of Informatics)
中国 香港アジア太平洋香港大学 (University of Hong Kong)
オーストラリアアジア太平洋オーストラリア国立大学 (Australian National University)
分散保存をしている12の保存拠点

CLOCKSSがもたらす学術出版への影響

学術出版における役割

CLOCKSSは、学術出版物の長期保存とアクセス保証を提供することで、学術出版の信頼性を高めています。特に、電子ジャーナルの普及に伴い、デジタルコンテンツの保存が不可欠となり、CLOCKSSの役割が重要視されています。

著者と読者への影響

著者にとって、CLOCKSSは自身の研究成果が永続的に保存され、将来的にも引用やアクセスが保証されるという安心感を提供します。読者にとっても、過去の研究にアクセスできる信頼性の高い情報源として重要です。

出版業界全体への貢献

CLOCKSSは、学術出版業界全体に対しても大きな貢献をしています。特に、出版社が倒産した場合でも、過去のコンテンツが保存されていることで、学術情報の断絶を防ぎます。これにより、学術出版の持続可能性が向上し、業界全体の信頼性が向上します。

まとめ

CLOCKSSは、デジタル学術コンテンツの長期保存を目的とした非営利の重要なシステムです。

その分散型アーキテクチャにより、データは12の世界中の大学・団体に分散保存されており、一部のノードが障害を受けてもデータの安全性が保証されます。

また、ダークアーカイブとして運用され、特定のトリガーイベントが発生するまでデータは非公開で保護されます。

これにより、学術情報の永続的な保存と、非常事態発生時の確実なアクセスが可能となります。さらに、技術の進展に伴い、デジタル保存の方法が進化する中でも、CLOCKSSの役割は今後ますます重要性を増すでしょう。学術出版や研究コミュニティにとって、CLOCKSSは信頼性の高い保存システムとして、今後も中心的な役割を果たし続けることが期待されます。

この記事を書いた人

学術情報発信ラボ 編集チームのアバター

学術情報発信ラボ 執筆・編集チーム

学術情報発信に携わる編集チームとして、長年にわたり学術出版に関する深い知識と実績を有する。国内の数十誌にわたる学術雑誌の発行サポート経験を活かし「学術情報発信ラボ」の執筆チームとして、研究者や編集者に向けた最新のトピックや、研究成果の迅速な発信に貢献する情報を発信している。

専門分野は学術出版、オープンアクセス、学術コミュニケーションであり、技術的な側面と学際的なアプローチを交えた解説が特徴。

最近の投稿