製品 > ArcGIS > オープンビジョン > ArcGIS が地理空間データを FAIR にする

ArcGIS

ArcGIS が地理空間データを FAIR にする

この記事は米国 Esri の ArcGIS Blog に掲載された記事をもとに再構成したものです。

原文: Help to Make Your Data FAIR: Part I (esri.com)

この記事では、データマネジメントにおいて注目されている FAIR 原則に着目し、その概要と、ArcGIS がデータを FAIR にするために地理空間データのプロバイダー (提供者) をどのようにサポートするかを説明します。

FAIR とは?

私たちは皆、意思決定のために相互運用可能なデータに簡単にアクセスできることを必要とし、その恩恵を受けています。FAIR データ原則は、Findable (検索可能), Accessible (アクセス可能), Interoperable (相互運用可能), Reusable (再利用可能) なデータへの依存度が高まる研究者のデータ管理を改善するため、Nature Scientific Data 誌*1 に発表されました。この原則は、研究者だけでなく、データ管理者や利用者にとっても原普遍的な価値を持つことが知られています。
FAIR の精神は、相互運用可能なデータセットの検出可能性を向上させることです。人や機械/エージェントがデータセットについて知らない場合、どのようにしてデータセットを見つけ、接続し、再利用するのでしょうか?

FAIR データはオープンデータと同一ではなく、補完的な概念であることに留意することが重要です。マーストリヒト大学の説明*2 によると、オープンデータとは、誰もが自由に使用、共有、構築できるデータのことです。FAIR 原則は、倫理的、法的、契約的な制約に配慮した形でデータを共有するためのベストプラクティスを提供するものです。FAIR 原則は、データが無償でなければならないとか、ライセンス条件に邪魔されないようにしなければならないとは述べていません。代わりに、FAIR 原則は、データソースが適切に文書化され、アクセス可能な状態で、データとインフラの将来の相互運用性に焦点を当てています。FAIR 原則は、共有されたデータが真に有用であるためには、ちょっとした配慮が必要であることをプロバイダーが理解できるようにするためのものと言えるでしょう。

FAIR 原則は、

  • データ(またはデジタルオブジェクト)
  • メタデータ(データを記述する情報)
  • インフラ(ツールやシステム)

という 3 種類のエンティティに言及しています。

FAIR 原則は、さらに以下の付録で詳しく説明されているサブ原則に分類されます。例えば、原則 F4 では、メタデータとデータの両方が検索可能なリソース(インフラストラクチャ コンポーネント)に登録またはインデックス化されると定義しています。

GO FAIR イニシアチブ*3 は最近、FAIR 原則をより深く理解するための便利な注釈版を発表しました。GO FAIR によると、そのビジョンは、European Open Science Cloud (EOSC) における初期開発に主眼を置き、グローバルな FAIR Data & Services (IFDS) の一貫した発展を促進すること*4 と述べています。また、欧州クラウドイニシアティブ – 欧州における競争力のあるデータおよび知識経済の構築*5 も参照してください。もちろん、FAIR 原則は世界中から関心が集まっています。

FAIR の 4 つの原則

Findable

検索可能なデータは、再利用可能なデータへの第一歩です。機械判読可能なデータとメタデータは、SEO と組み合わせることで、Web 検索エンジンがデータを見つけやすくし、機械や人間が探索できるようにします。

Accessible

アクセス可能なデータにより、ユーザーは、認証等の手段を含め、発見したデータにアクセスする方法を知ることができます。アクセス可能なデータは、オープンなパブリックデータ、許可されたユーザーだけが利用できるプライベートで安全なデータにも適用できます。

Interoperable

相互運用可能なデータは、オープン標準やオープン仕様を活用して、他のデータやシステムと統合することができます。

Reusable

再利用可能なデータは、メタデータによって豊富に記述され、透過性のあるデータ使用ライセンスで公開され、ドメインに関連するコミュニティ標準に準拠しています。再利用可能性は、FAIR データ原則の主要な目標です。

FAIR の 4 つの原則

地理空間コミュニティは、FAIR データの原則を受け入れ、アクセス可能で相互運用可能なデータの必要性を長い間評価してきました。2021年、標準開発組織である Open Geospatial Consortium (OGC) は、この原則を取り入れたミッションステートメントを更新しました。

“この組織は、500 以上の企業、政府機関、研究機関、大学を代表し、位置情報を FAIR – Findable, Accessible, Interoperable, and Reusable にしたいという願いで結ばれています。”

Esri は OGC の主要メンバーとして、この重要なミッションを支援しています。では、Esri が FAIR データの原則を支持することは、具体的にどのような意味を持つのでしょうか。結局のところ、その意義は、世界の位置情報データを作成、公開、コラボレーション、共有、そして再利用するユーザーを支援することでしょう。私たちの目標は、ArcGIS システムが適切な地理空間インフラストラクチャによって FAIR データを実現できるようにすることです。

Esri は、FAIR 原則の精神を支持してきた歴史があります:

ArcGIS : FAIR 原則の実装を支援

これらは壮大な原則ですが、どのように実践するのでしょうか。

データが自動的に FAIR になるわけではありません。FAIR は、組織の努力とそれをサポートするツールによって実現されます。例えば、組織はデータを Web サービスとして公開し、コンテンツに適切なメタデータを付与し、適切なライセンスを付与する必要があります。ツールは、ユーザーインターフェイス、自動化、ワークフロー、インフラストラクチャおよびコンプライアンスを通じてこれらの取り組みをサポートし、FAIR を容易に実装できるようにする必要があります。

データの作成、公開、コラボレーション、共有、使用、再利用を行う際には、さまざまなソフトウェアや SaaS を横断して作業することになります。ArcGIS は、ワークフロー全体で FAIR データの原則を実行できるように支援します。これらの FAIR 原則の実践の概要を見てみましょう。

データとメタデータを作成・管理する際に、ArcGIS Pro を使用して、ドメインに関連するコミュニティと国際標準が実践されます。

ArcGIS Enterprise および ArcGIS Online を使用することで、機械判読可能な Web サービスとそのメタデータを、オープン標準やオープン仕様の有名な形式(JSON や XML など)で公開できます。API キーにより、ベースマップ、ルーティング、ジオコーディングなどの一般的なロケーション サービスにすばやくアクセスするための必要な認証が可能になります。ArcGIS のアイテム ID は、制御されたアクセスに必要な認証メカニズムを提供します。これにより、個人や組織間のコラボレーションが可能になるため、パートナーとの連携がより容易になります。

コンテンツは、データ所有者から与えられた権限に基づいて、オープン データまたはプライベート データとして適切なユーザーに共有され、明確なライセンス条件とともに説明されます。ArcGIS Hub を通してコンテンツを共有すると、FAIR 原則が実現されます。共有されたデータや Web サービスは、ArcGIS Hub のカタログを使用して簡単に検索、アクセスおよび連携されます。さらに、Hub を使用することで、コミュニティとの連携が可能になります。

GIS の専門家、アナリスト、開発者は、ArcGIS REST API や ArcGIS、オープンソース、サードパーティ API のさまざまなマッピング ツールを使用して、相互運用可能な Web サービスを使用および再利用します。最後に、ArcGIS のロー コードおよびノー コード アプリ ビルダーは、Web サービスが簡単に再利用でき、対話的な情報プロダクツを通じて、専門家以外でもアクセスできることを保証します。

リファレンス

この記事が、FAIR データの原則を調査し、そして適用するモチベーションになることを願っています。

  1. Wilkinson, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci. Data 3:160018 doi: 10.1038/sdata.2016.18 (2016).
    https://www.nature.com/articles/sdata201618
  2. Maastricht University, 2020. The FAIR principles explained (YouTube video)
    https://youtu.be/5OeCrQE3HhE?t=61 accessed 4-April, 2021
  3. https://www.go-fair.org/go-fair-initiative
  4. https://www.go-fair.org/go-fair-initiative/vision-and-strategy/
  5. European Commission, 2016. European Cloud Initiative – Building a competitive data and knowledge economy in Europe
    https://eur-lex.europa.eu/legal-content/en/TXT/?uri=CELEX:52016DC0178

付録 ArcGIS が FAIR データ原則をサポート

以下の表は、GO FAIR イニシアチブが提唱するフレームワークに従い、ArcGIS の観点から FAIR の各原則をどのようにサポートしているかを示したものです。

F: Findable

ArcGIS の対応
F1. (メタ) データにはグローバルに一意で永続的な識別子が割り当てられる ArcGIS アイテムには、アイテム ID と呼ばれるグローバルに一意で永続的な識別子が割り当てられます。
F2. データは豊富なメタデータで記述される (後述の R1 で定義) ArcGIS のアイテムとそれに関連するメタデータは、密に連動しており、アイテムの所有者によって詳細に記述することができます。ArcGIS では、メタデータは説明するアイテムとともに保存されます。ArcGIS Metadata モデルは、ISO、FGDC、INSPIRE など、さまざまな国際的なメタデータの標準とプロファイルをサポートする上位互換です(ArcGIS ではメタデータの「スタイル」と呼ばれています)。Esri Geoportal Server では、一般的なメタデータプロファイルが提供されます。ArcGIS のデフォルトのメタデータ スタイルである [アイテム説明] では、アイテムの説明を表示および編集できます。ArcGIS Online では、メタデータの改善に役立つアイテム情報のスコアをユーザーに提供します。
F3. メタデータには説明するデータの識別子が明確かつ明示的に含まれる ArcGIS のメタデータには、説明するデータのファイル識別子が明確かつ明示的に含まれています。ArcGIS では、アイテムのメタデータはアイテムの一部として保存されます。メタデータは、アイテムの要件と、アイテムが公開および共有される際のシステム内のフローに基づいて、アイテムごとに異なる形で保存されます。
F4. (メタ)データは検索可能なリソースに登録またはインデックス化されている ArcGIS ソフトウェア および SaaS は、ブラウズと検索を重点的にサポートするメタデータ エレメントによってインデックス化される、さまざまなアイテム タイプをサポートしています。ArcGIS のアイテムは、ArcGIS Living Atlas of the World、ArcGIS Enterprise、および ArcGIS Online などのエコシステム全体で検索に利用できます。arcgis.com/home/search での検索は、ArcGIS Online でパブリックに共有されているコンテンツを返します。ArcGIS Hub コンテンツ ライブラリに共有されたアイテムはインデックス化されているため、コンテンツを簡単に発見することができます。hub.arcgis.com での検索では、コンテンツの所有者、所属する組織、および世界中の他のハブに属するキュレーション コンテンツによって共有されたすべての関連コンテンツが返されます。ArcGIS Hub のアイテムページは、一般的な検索エンジンでコンテンツを簡単に見つけられるように、検索エンジン最適化(SEO)が適用されています。

A: Accessible

ArcGIS の対応
A1. (メタ)データは、標準化された通信プロトコルを使用して、その識別子によって検索可能である ArcGIS アイテムは、ArcGIS API や well-known URL を介して、標準化された通信プロトコルを使用して一意の識別子で検索できます。データは、一般的な JSON および画像形式で利用可能です。ユーザーは、サービスの REST URL の末尾に /info/metadata を追加して、サービスのすべてのメタデータを含む XML ファイルを取得することができます。開発者は、このメタデータを解析して、サービスのエンドユーザーに希望するフォーマットで提供することができます。
A1.1. プロトコルは、オープン、フリー、そして普遍的に実装可能である ArcGIS のデフォルトの Web サービスは、GeoServices REST オープン仕様を使用しています。この仕様は、元々は Esri が開発したものですが、2010 年に Open Web Foundation に移管されました。Esri は、オープンでセキュアなアーキテクチャ設計に取り組んでいます。OGC およびイメージ サービスや API、NENA、IHO、ISO、INSPIRE などの組織発のコンテンツ標準など、オープン、フリー、かつ普遍的に実装可能なさまざまな Web サービス標準がサポートされています。UN Standards Guide Edition 3 (2022)では、オープンは必ずしも無償を意味するものではないことに留意しています(標準化団体のビジネスモデルによっては、標準の開発コストは会費や売上から回収される)。前述のように、ArcGIS はさまざまな国際的なオープン メタデータ標準をサポートしています。
A1.2. プロトコルは、必要に応じて、認証と認可の手順を可能にする ArcGIS Platform は、位置情報サービスやプライベートデータへの安全なアクセスをサポートします。これにより、許可されたユーザおよびサービスのみが、保護された情報にアクセスできるようになります。API キーにより、ベースマップ、ルーティング、ジオコーディングなどの一般的な位置情報サービスに素早くアクセスするために必要な認証が可能です。ArcGIS Identity は、ユーザーや組織のプライベートなコンテンツにアクセスするために必要な認証メカニズムを提供し、より豊かな体験を提供します。
A2. データが利用できなくなった場合でも、メタデータにアクセス可能? ArcGIS のデータとメタデータは密に連動しています。一度作成されたメタデータは、ArcGIS によって管理され、アイテムとともにコピー、移動、削除されます。コンテンツの非推奨 (削除なし) もサポートされています。

I: INTEROPERABLE

ArcGIS の対応
I1. (メタ) データは、知識表現のために、フォーマルで、アクセス可能で、共有され、広く適用可能な言語を使用する ArcGIS Web サービスは、REST API によって公開されるすべてのリソースが URL エンドポイントを通じてアクセス可能な、シンプルでオープンな Web インターフェースを提供します。GeoServices REST は、幅広いクライアントやアプリケーションで実績があり、理解しやすい方法です。GeoServices は、メタデータとフィーチャのエンコードに広くアクセス可能な JSON を使用します。ArcGIS API および SDK には、ArcGIS REST API を操作するための多くのヘルパー クラス、関数、およびユーティリティが含まれています。メタデータは、人間や機械が読み取り可能な、HTML および XML 表現を広く使用して表現されます。メタデータは、JSON-LD を使用して表現され、Web 上で公開されたデータ カタログ間の相互運用性を促進するように設計された Resource Description Framework (RDF) ボキャブラリを使用して、ArcGIS Hub によって DCAT / DCAT-AP に自動的に変換されます。
I2. (メタ)データは、FAIR 原則に従う語彙を使用する テキサス大学図書館によって説明されているように、Controlled Vocabularies (統制語彙) とは、単語やフレーズの標準化および編成された配置であり、データを記述するための一貫した方法を提供するものです。アイテム内では、ArcGIS はユーザ定義の属性ドメインをサポートしており、名前、説明、フィールド タイプなどの値に制約を与えることができます。メタデータの作成者は、ISO、INSPIRE、FGDC カテゴリなど、FAIR 原則に従った統制語彙から用語を割り当てて、コンテンツの品質と情報検索を改善することができます。
I3. (メタ)データには、他の(メタ)データへの修飾参照が含まれる ArcGIS アイテムには、システムによって自動的に生成された修飾参照と、メタデータでユーザーによって提供された参照を含めることができます。たとえば、ArcGIS Online アイテムの詳細では、「作成元/公開元」の概要情報が自動的に提供されます。

R: REUSABLE

ArcGIS の対応
R1. (メタ)データは、正確で関連性のある複数の属性で豊富に記述される 空間参照や属性フィールドなどの ArcGIS アイテム プロパティは、ArcGIS Pro によってそのメタデータに自動的に追加できます。Web サービスの公開や共有に伴い、メタデータもデータとともに共有されます。ツールを使用すると、Web サービスのレイヤー、マップおよびアプリ内でアクセス可能な属性と説明を用いて、データの属性を詳細に記述することができます。たとえば、フィールドエイリアスは、ユーザーフレンドリーなコンテンツの説明を提供する重要な方法です。Esri は、ArcGIS Hub でオープン データを共有する場合など、コンテンツの表示、共有、および再利用を改善するために必要なグッドプラクティスのガイダンス文書とツールを定期的に提供しています。
R1.1. (メタ)データは、明確でアクセス可能なデータ使用ライセンスとともに公開される ArcGIS は、コンテンツ所有者や公開者が、アイテムの使用方法、使用条件及びライセンス等を簡単に提供するためのツールを提供します。ArcGIS では、ハブ アイテムのページにクリエイティブ コモンズ ライセンス(CC0、CC BY、CC BY-SA)およびオープン データ コモンズ ライセンス (PDDL、ODbL、ODC-By) のライセンス アイコンとリンクを動的に表示します。FAIR の原則は、オープン (公開) データだけでなく、プライベート/セキュアなデータにも適用できることに注意してください。利用規約には、特別な制限、免責事項、条件、またはコンテンツの使用に関する制限が含まれる場合があります
R1.2. (メタ)データは詳細な起源と関連付けられている データの正確性、起源および時期に関する情報が無い場合、そのデータに基づく意思決定の信頼性が高いとは言えません。データの起源は、ユーザが記録したアイテムの出典を示すメタデータの引用といった単純なものから、必要に応じて、ArcGIS がアイテムのジオプロセシング履歴をメタデータ内に自動的に保持するものまであります (例えば、データの実績と処理履歴が求められる法的質問への対応など)。
R1.3. (メタ)データはドメインに関連したコミュニティ標準に適合する ここで説明するように、ArcGIS はデータ、Web サービスおよびメタデータのためのドメイン関連の標準と仕様を幅広くサポートしています。たとえば、DCAT と DCAT-APはドメイン関連のグローバル標準であり、ユーザーのコンテンツを Data.gov や data.europa.eu などのオープン データ サイトとシームレスに連携させることができます。