FAIRデータ原則に関する覚書き part 2: Findable 2/4
2日目。これ最初と最後で訳語が相当揺れそう。。。まあ試訳なのでまずは続けてみます。
~~~~~
F2: Data are described with rich metadata
F2: Data are described with rich metadata - GO FAIR
これは何を意味するのでしょうか?
FAIRデジタルリソースの作成において、メタデータは、データの文脈、品質、条件、または特性に関する記述的情報を含み、広範かつ拡張可能でなければなりません(そして、そうすべきです)。豊かなメタデータにより、コンピュータはルーチンワーク、退屈な分類及びタスクの優先順位付けを自動的に行うことができるため、現在、研究者から多くの注目を集めています。
この原則の論理的根拠は、データの識別子がなくても、メタデータによって提供される情報に基づいてデータを見つけることができるはずだ、ということです。このように、F2に準拠することで、データの場所を特定し、再利用や引用を増やすことができます。
豊かなメタデータは、誰がデータを使用したいのか、どのような目的のために使用するのかを推測してはいけないことを意味します。したがって、経験則として、「このメタデータは有用ではない」と決して言うべきではありません。とにかくそれを広く提供してください!
例:
これには、「本質的な」メタデータ(例えば、画像ファイルのDICOM情報: http://www.nf.mpg.de/vinci3/doc/image-formats.htmlのように、自動的に生成・取得されたデータ)と、「文脈に依存する」メタデータ(例えば、使用されたプロトコル; 正式なプロトコルの文書のキーワードとリンクとともに、使用された測定装置; 製造業者のキーワードとリンクとともに、捕捉されたデータのユニット(関与する種を含む); 分類群IDによって明示的に、例えばhttp://www.uniprot.org/taxonomy/9606、研究にフォーカスした遺伝子/タンパク質/その他; (例えばGO Terms: http://www.geneontology.org/)、観測またはシミュレートされた天文データセットの物理的パラメータ空間、縦方向データに関連する疑問及び概念、材料の特性の計算、またはその他 実験の詳細)を含みます。”ユーザー制御メタデータ: https://www.w3.org/2007/08/video/positions/Schepers.html”を参照してください。
例文の枠組み:
Try using the DTL Metadata Editor: http://editor-v2.fair-dtls.surf-hosted.nl/#/edit(注:リンク切れ)
Marking up your dataset with DCAT: https://theodi.org/guides/marking-up-your-dataset-with-dcat
ISA framework: http://isa-tools.org/
~~~~~
最後の例文は相当に自信がない(というか原文も列挙しすぎ)。終わったら見直したい。