みなみの備忘録

とあるライブラリアンの備忘録です。

11/20 "A data citation roadmap for scientific publishers"論文メモ

11/20に出版された"Scientific Data"の論文に、なかなか興味深いものがあったので読んでみた。

A data citation roadmap for scientific publishers | Scientific Data

共著者の所属がElsevier、Springer、PLOS、eLife、Wiley等々、著名な出版社が8つも並んでいる。アツい連携(所属的に)。

論文のポイントをざっくりまとめると、

1) JDDCP(データ引用に関する共同宣言)の準拠が目標
2) 目標達成のため、Data Citation実装のためのパイロット企画を実施
3) 論文の出版プロセス(Pre-submission → Submission and review → Production → Publication)に沿って必要な情報を整理
4) 各利害関係者(著者及び出版社)におけるデータ引用の効用を最大化したい

の4つになりそう。

全体の流れとしては、なぜデータを引用するのか、という意義の整理(Table 1)に始まり、データ引用の書式(Figure 1)、データ引用が機能するための構造(Figure 2)、データ利活用のためのステートメント(Figure 3)などに触れつつ、各出版社による実装のタイムライン(Table 2)まで示している。なんか本気度がすごい。

つい最近、池内さんの連載記事がJDDCP提言による規範化の限界について触れていたところだが、

データ引用-新たな規範への道のり

(エンバーゴ期間中のため著者稿)http://hdl.handle.net/2241/00153144

こういう形で動くとは驚き。
~~~~~
内容につき、個人的に気になったところは2つ。一つ目はFigure 2の構造について。論文とデータの関係を記述する上で、データリポジトリのランディングページに記載すべき要件が明記されているのは初めてみたかも。
この図によれば、ランディングページでは

①Human readable metadata

②Machine readable metadata

の2つを持ち、②Machine readable metadata内では 1) article PID と  2) data PID をセットで持つことになる。このこと自体は(論文の根拠データであれば)割と当たり前に見えるけれども、DOI handbook上はデータのリゾルブ先が直接データでも構わないことになっていたはず(※)。
データ自体には(通常)PIDなどのメタデータを書き込めない以上、リンク情報を持つにはランディングページが必須になる訳だけれども、明確に引用の要件として整理された意義は大きいと思う。JaLCのガイドラインでは既にランディングページの存在を前提とした記述にやってはいるものの、これはぜひ内容を反映させてほしい。

***追記 ちょうど今日関係者間の研究会(?)があったので該当部分を紹介したところ、いろいろ議論が広がった。有難い。後でもうちょっと考えます。
・ランディングページの論文とデータのリンクを誰が作るのか。

→ 著者によるメンテナンスは考えにくい。データリポジトリサイドの協力が必須になるのでは。

 → 協力してくれるデータリポジトリかどうか、が出版社側でのrecommended repositoryの要件になっていくかも?

→ 投稿時に義務付けて著者にやってもらう方向性もありそう。
→ (論文内でも言及されているが)Scholixのフレームワークに入るかどうかもポイントか。
参考:RDA and ICSU-WDS Announce the Scholix Framework for Linking Data and Literature | RDA

~~~~~
二つ目は引用データについて。8~9ページにかけて"Downstream delivery to Crossref"、"Downstream delivery to PubMed"の2つが出版後のプロセスとして整理されているけれども、SpringerNatureやPLOSは確かI4OC(Initiative for Open Citations)の推進機関だったはず。

I4OC: Initiative for Open Citations
Crossrefに集約させたデータを公開する方向性には特に触れられていない(ちらっとi4oc.orgの文字は出てくる)が、引用データについて合意は取れなかったということだろうか。論文と違って元データは国際的に原則公開の方向なので、引用データも原則公開として良さそうなものだけれど。

引用データが自由に使えるとまた違ったサービス展開に繋がりそうな気もする(全く根拠はない)ので、とりあえず今後の動きに期待したい。

 

※DOIを登録する際にRAへメタデータの提出は要求されるものの、ランディングページを準備しなくてもメタデータだけあれば良い、ということ。

参考:DOI Handbook - 解決