みなみの備忘録

とあるライブラリアンの備忘録です。

1/17 パブリックドメイン資料の利用条件シンポジウム参加メモ

1/17に開催された下記シンポジウムに参加しました。

シンポジウム デジタル知識基盤におけるパブリックドメイン資料の利用条件

#PDシンポ hashtag on Twitter

最近下記のような記事が出ていたこともあり、

Reproductions of Public Domain Works Should Remain in the Public Domain - Creative Commons

どんな展開になるのか興味があり参加。途中までしかいられなかったものの、特に冒頭の渡辺先生ご講演は現状の整理にとても有意義だったので、簡単に記録を。
=====
ご講演の主題(取り扱うテーマ)は以下の2つ。

  • CCライセンスを権利者の立場にはないものが、PD資料につけるということ(CCライセンスの拡大適用)
  • PD資料に利用条件を課すこと

さらに、先生からのメッセージは以下の2つということで、スライドの冒頭で示されていた。

  • 利用者にとって使いやすい環境を作るべき。リーガルコミュニケーションの標準化は重要。
  • 「お願い」+「規範」は検討価値があるのでは?

続いて、上記に至るまでの考察が示される。CCライセンスがデジタルアーカイブについている例は珍しくないが、ライセンスのサポート側としては複雑。必然的に誤解を伴っている可能性が高く、ライセンスを無視しても権利侵害が起こらないという事例が増えることは、CCライセンスにとって良くないのでは・・・との懸念。
さらに、著作権制度について考える立場からは、アーカイブ運営主体も権利者だ、という誤解を招いたり、数値データのように著作物ではないものが著作物だと誤解され、利用の委縮が文化・経済にとっての逸失利益に繋がってしまうのでは。
もっとも、CCライセンスを流用したいとの要望は、オープンデータの世界でもその他の領域でもよくあるとのこと。また、デジタル化やアーカイブの維持にはコストがかかり、料金をとりたい場合もあったり、社会的意義を知りたい/評判を高めたい目的もある、との言及あり。

-----

こういった背景を踏まえた上でどのような視点を重視するかと言えば、利用者にとって使いやすい環境を一番に挙げられていた。利用規約や独自ライセンスはこの観点から難があり、学習コストが高く、乱立すると組み合わせ利用の大きな妨げになる。せめてデジタルアーカイブ共通利用規約(のようなもの)が必要だろう、とのこと。
また、「お願い」と「規範」の意義についてもここで触れられていた。そもそも強制力を持たせることにどれだけの意味があるのか?という疑問から始まり、具体的な人物像の分析に。いわく、CCライセンスであれば、PD資料の権利者ではない人が付したところで強制力はなく、PDなので著作権もない。誰がライセンスを遵守するのかといえば、真面目で丁寧(=きちんと利用規約を読んで要望を理解した人)だが、権利の所在について誤解している人(=CCライセンスがついているので、データ保有機関が権利者だと思っている人)になる。本当にそれでいいのか?

さらに、「利用規約による強制」への分析が続く。利用規約はユーザーフレンドリーではなく、読まれないことも多い。規約は法的に有効性が高いものの、射程が限られる(DAウェブサイトの直接利用者のみ。ウェブサイト外で受け取った人は利用規約に縛られない)。また、著作者の数が多い場合、現実問題として列挙が難しい。表記を指定しても、いろいろ想定できない場面が出てくる(例えば、ポッドキャストでは文字を書けない)。CCライセンスで書かれているように、合理的な記載であればよい、という要件の緩和が必要。
そのうえで、権利情報と利用条件の伝え方はある程度標準化されているrightsstatementsはよいのでは。PDならPDと明記する、利用規約で縛るならそれも伝える。標準化されているので学習コストも低減できるメリットがある。

-----

ここからは「お願い」ベースへの分析。強制力を持たせないのも一案、という前振りから、インターネットは力比べ(≒規約の有無を押し通すやり方)に向く場ではなく、法的にどうあれ、反感を買えば炎上するリスクがある。特に、利用規約は炎上のネタになってきた(権利を召し上げる系の投稿サイトの規約)、との懸念を紹介。
また、「お願い」ベースが実は提供機関の実態に近い本音なのでは?という分析も。つまり、「報告できないなら利用(あるいはクレジットの付与)を断念してほしい」とまでは考えていないし、「無報告利用者を捕捉して利用報告(あるいはクレジットの付与)を強制する」つもりもないだろう、という推察。

続いて、(「お願い」に実効性を持たせるための検討として)アカデミアの規範との関係性について。アカデミアにおけるcitation(またはquotation?)に著作権上の根拠はないが、citationがないと剽窃になりうる。アイディアの借用など許諾が不要な行為であっても同様であり、法規範とは別の要請からきている(先行研究を知っていることを示す、読者による検証・詳細な研究を可能にする:知のトレーサビリティ)。文化全体にそれを期待するのはやや厳しいだろうが、オピニオンリーダーや、利用者コミュニティを巻き込んだ合意形成をすればよいのでは。

-----

中間まとめ。利用者本位のリーガルコミュニケーションという視点が重要。利用規約、rightsstatements、お願い、どれであれ多様な内容や伝え方は利用者の負担。学習コスト削減には標準化、共通化が必要(あるいは有効)。上記を前提にしつつ、どのように実現していくかを考える上で、CCライセンスのデザインから学べることの紹介。「利用条件」のような一般名詞ではなく、固有名詞で名前がついている。サイトやプロジェクトに特有の条件ではないため、多くの資源が同一の条件で使え、かつ見るだけで分かる。アイコンで表現される、略称がある、固有のURLがある、etc...

-----

最後に留意すべき点の指摘がいくつか。非常に人気があることが確実なコンテンツは、利用条件が厳しくても利用される。利用条件が緩くても、他のコンテンツとのアテンションの奪い合いになる。とすると、利用条件よりも他の要素(discoverability、メタデータ、ニーズとメタデータのマッチ度の高さ)が重要なのでは、というコメントがあった。
=====
その後の各機関によるデジタルアーカイブ事例報告も含め、ライセンス(という単語が適切かどうかは一旦置いておき)の共通理解を促進する観点で面白いイベントだった。「お願い」がやはり妥当な線、という方向性が示されたのは結構大きい気がする。

ただ、個人的に気になる点としては、「お願い」はデジタルアーカイブ公開が目的の機関であれば機能するが、利用統計を活用して事業資金の獲得や産業利用に繋げるといった立場からはやや物足りないはず(いざというときの対抗手段を、みすみす手放すことはないと思う)。契約による強制力は、なお必要な場面がありそう。もっとも、デジタルアーカイブの対象資料は一度PDになったものなので、たまたま保有していた機関が「囲い込み」することには相当の反発があるだろうが・・・オープンアクセスの議論に見られたような「最低限の制約」の共有が次の課題だろうか。

2019年の振り返り

今年はほとんど更新できなかったものの、振り返り記事だけでも書いておこうと一念発起。やや書き散らし気味なのはご容赦を。
=====

1月

ラボで世論調査をやりたいとの企画が持ち上がり、どたばたと準備。いろいろ要因が重なり結局延期になってしまったが、良い勉強になった(特にデータ入手の実態を理解する上で)。月末には九大にお邪魔して、研究データ管理のお話をすることに。遠方の来客に驚く。

シンポジウム 「オープンデータと大学」(1/30) | 九州大学附属図書館

2月

NDLにお呼ばれして識別子の話など。一緒に呼ばれたお二方が万能過ぎたため、自分の立ち位置にかなり悩む。RDUFシンポジウムでは活動紹介の後、妙に長い質疑応答(ほぼディフェンス)を行うはめに。。

「研究データのライセンス検討プロジェクト」小委員会活動報告

所内ポータルサイトが何とかローンチに漕ぎつける。
3月

ぼんやり考えていた大学院の話が、某先生に相談して急に具体化。忙しく研究計画などを練る。ラボでは歴史データを扱う話が動き始め、出版物の電子化作業も並行。大図研イベントでのオンライン講演や、

データジャーナルを知る:20190320_data journal
外部小委員会の報告書執筆も重なってあまり記憶がない。

RDUFについて | 研究データ利活用協議会 RDUF (Research Data Utilization Forum)

月末にはお世話になったディレクターが異動になり、重ねてお隣さんがいなくなってしまい、やや意気消沈。
4月

大学院の話も加速し始め、10月入学を目標に設定。「オープンサイエンスのいま」続投決定+即時公開。めでたい。職場ではデータ管理とか可視化系の仕事が動き始め、データ・ライブラリアンっぽい仕事をした(ようやく?)。地味にJOSS2019対応に時間を取られる。
5月

JPCOARへの申請が通り、JAIRO Cloudアカウントの引き渡しあり。黙々とメタデータを作成(300件ちょっと?)。楽しい。ウェブサイトの移行対応支援で、WARPにハーベストされたデータの修正に着手。止まっていた某研究会の再開に向け、人が増えたり戻られたり。JOSS2019のオーガナイズも。

研究データのライセンス表示ガイドラインの実践に向けて

6月

リポジトリの公開準備。大学院の話が暗礁に乗り上げそうな中、新しい職の話が舞い込む。いろいろ悩みつつも、ご縁とチャンスを大事に進めることに。

2019/9/1 転職しました。 - みなみの備忘録

「平成を振り返って」特別寄稿がめでたく公開。結構なページ数になったため、2号に分けて出すことに。

平成を振り返って(平成元年~平成21年)

平成を振り返って(平成21年~平成31年)

7月

現職の面接。迷った末に自分がやりたいことをそのまま話したら通してもらえた。なんとも懐が深い。
INFOPRO2019に初参加し、活動の宣伝や原稿執筆者の勧誘など。ポスター発表もした(喋ったのは自分ではないが)。

研究データのライセンス表示ガイドライン | Guidelines for Licensing Research Data

所属先リポジトリがめでたく公開・・・のはずが直前でいろいろあり、こっそりと出すことに。本記事執筆時点でもまだ本体ウェブサイトにリンクを貼ってもらえない様子(悲)。
8月

転職準備。お世話になっている方から博論が通った旨のご連絡をいただき、自分も大学院に向けたテンションが上がるものの、大学院の面接と某原稿の〆切が被る。早々にお詫びのメールを出して(ほんとすみません)、面接に備える。またしても年休は使いきれず・・・
9月

神保町に拠点が移る。初日は挨拶回り。かなりの数が知り合いだったので新鮮味は薄かったものの(笑)、落ち着く環境に。勤務時間のフレックス制が素晴らしすぎる。初めの週は、初任者研修として各人の業務をみっちり1時間ずつご紹介いただいた(贅沢)。JPCOAR作業部会に久々復帰。中旬には大学院の合格連絡があり一安心。
10月

葉山で大学院の入学式+3泊4日の研修。英語のみということでついていけるかちょっと不安だったものの、終わってみれば意外と楽しく過ごせたような。仕事も手探りながら徐々に自分の所掌が固まり、道筋をつけられるようになってきた(気がする)。急遽小特集を組むことになった12月号の記事の校閲がひたすら続く・・・
11月

図書館総合展は1日だけ参加。フォーラムに参加しなかったのは初めてかもしれない。ひたすらブースで呼び込みと説明をした。新しく立ち上げるプロジェクトの呼びかけと説明で忙しく過ごす。前月に引き続き、主査を務める1月号の校閲案件が多数。
12月

上旬は某委員会の企画会議。1年ぶりだったのでいろいろ要領を忘れている・・・編集委員の皆さんすみません。中旬はAXIES年次大会に参加。一風変わった学会(?)の雰囲気が面白く、そしてなぜか福岡で職場の皆さんとがっつり飲む機会が。来年のJOSS2020企画も練りつつ、年末に向けて外部活動の成果物公開を急ぐ。今更ながら、26日に審議依頼を送りつけたのは事務局に悪いことをしてしまったかもしれない(反省)。年末年始は何としても論文を書く(現在進行中)。
=====
あと、今年は全体的に体調を崩し気味だったのが反省点(運動不足か)。来年はもう少し稽古したい。

2019/9/1 転職しました。

1年も経たずにこのタイトルで記事を書くことになろうとは。とはいえ、職場ブログでも既に挨拶文を書いてしまったので、自分用にも忘れないうちに書き留めておきます。

=====

そもそもの再転職の契機は大学院への進学が具体化したこと。もともとうっすら希望はあったものの、自分は何を研究したいのか、突き詰めたいのかがいまいち見えていなかった。とあるイベントの際に某先生とお話していた際、「希望があるなら相談に乗るよ」と言ってもらったことがきっかけで、3月頃にまずは自分の活動予定をまとめ、見てもらいながら構想を練っていく。その作業が存外に楽しく、また今後のキャリア展開に方向性を模索していたこともあり、何とか形にして試してみたいという気に。

これまた某先生の計らいで指導教官になっていただける方も見つかり、10月入学を目標に急ピッチで準備開始。家庭内の決裁(?)は下りたものの、ラボの立ち上げ時ということもあり、職場の決裁がかなり厳しい見通しだった。データライブラリアン職には思い入れもあり、採用いただいた上司にも相談したり結構悩んだ記憶が・・・

そんな中、これまた某先生からの伝手で、現職の募集を知ることに(もはや某先生の厚意には頭が上がりません・・・)。1年も経たない中での決断になったものの、これまで悩んできた経緯もあり、求める研究支援職は転職先の上長と一緒なら作れる気もする、ということで、割とすんなり応募自体は決められた。面接のタイミングで、大学院に行きながら働かせてくれ、という要望を通してくれた皆様には本当に感謝です。

=====

さて、何で博士がとりたくなったのか。前々職の大学図書館では感じなかった肩書の重みは、前職の様々な場面で感じました。特に、データ専門職の認知度が極めて低い現状では、自分が出来ることを思うように伝えられない機会も多く、「図書館での実績」への認識はさらに低い(残念ながら)。第三者としての研究支援職を確立するスタートに立つためには、まず研究者と同じ立ち位置にいく必要がある、が現在の考えです。まあ自分に到達できる能力があるのか、という視点が構想に含まれていない欠点はありますが・・・ともあれ、出来るところまで頑張ろうと思います。

データライブラリアン業務の私的中間整理

 いろいろ一区切りつきそうなので、データライブラリアンについての私的中間整理。下記のほか、
https://b.hatena.ne.jp/y_minami/data%20librarian/
某所による調査報告書、各種セミナーやワークショップ参加記録も参照(とりあえず列挙はしない)。
 働き始めてからも、結局データライブラリアンは何をするのか、しないのかの境界が良く分からずにいたので、何とか自分の方針を立てたいというのが本記事の動機です。
=====
 上記にもある文献を見ていくと、「データライブラリアン」の名のもとにおよそデータに関わる仕事が雑多に集められている様子(国内開催のセッションやワークショップに参加した感想も大体同じ)。このままでは収拾が付かないので、データライブラリアン≒データライブラリーで働く人、としてコレクションに紐づけてとりあえず考えることにする。そうすると、実務レベルでは
①コレクション管理
②窓口サービス(≒レファレンス)
の視点から業務が組み立てられるので、一応これに沿って検討。

~~~~~~

①コレクション管理
 いわゆるデータ管理業務に相当。オープンサイエンスの文脈で重要度が増し、分野横断的に要求が集まりつつある。多分専門分野の知識よりも事務能力のほうが重要。
 既存の業務の延長で考えると、収集指針に沿って集められたデータを
1) 寄託先のリポジトリ決定
2) データの破損チェック、フォーマット変換
3) メタデータ作成
4) ライセンスの設定
5) Accession No.(+PID)の付与
6) 公開
の手順で行っている(もちろん実際はもっと細かいが、大体のプロセスとして)。1) によって実質的に2)~4) は選択肢が制限されてしまうため、研究者の導線に沿った形で、どこに保存されるのが望ましいのかを分野別に考える必要がある。お手軽に選べる基準というかガイドラインが欲しいところ(今のところ一番近いのはDataCiteのRepository Finderか?)

https://repositoryfinder.datacite.org/
 また、業務体系としては「データマネジメント知識体系ガイド(DAMA-DMBOK)」が今のところ一番網羅的に思えるが、実務レベルに落とし込むにはもう少しアカデミア向けに寄せる必要がありそう。

 

②窓口サービス(≒レファレンス)
 データのレファレンスの場面では、どうやら何らかの知見を引き出す手前までを求められている様子。当初は社会科学系を中心にこういった役割が認知されており、最近になって徐々に広まったのではと思っている(聞き及ぶ話の中で社会科学系が一番古かっただけで、根拠はまだ探してない)。こっちは分野別の知識がある程度大事。
 ナビゲート対象としては、
1) データ所在(→ 自前のデータリポジトリのほか、データ交換などしているリポジトリを中心に。その他探すポイントや視点、検索プロセス、ツール)
2) ソフトウェア(→ 分野でよく使われる種類と使い方支援)
3) 解析手法(→ 分析コードや分析スキルを持つ人の紹介)
となるか。研究分野ごとによく使われるものに特化していく必要はあるものの、データの発見・処理プロセスの概念図や、データ解析にありがちなミスは標準的な前提として紹介できると良いかも。

KDD Process/Overview

Common Data Mistakes to Avoid | Geckoboard

 

 さて、こういった実務レベルを踏まえると、研究管理計画支援だとかデータポリシーの話は「③責任者に期待される役割」として位置付けられそう。
・基本的なデータ管理方法の案内(研究管理計画への支援)
・データポリシー制定(収集+組織化方針)
・各フェーズでのマニュアル・ガイドライン制定(ライブラリーがやること、外部に出すべきこと)

~~~~~
 ということで、「データライブラリアン」業務をざっくり整理してみました。暫定的な結論としては、異なるスキルを持つ担当者が最低2人必要そう、という感じか(責任者は一旦置いておく)。この整理が適切かどうか、を見ていく上で、さらに一歩進めて実装が可能かどうかも一応考える。まだ妄想レベルなので今後違うこと書いてもご容赦ください。。。
 日本において、①と②はどちらも研究室レベルで独自に行われてきているので、即戦力としては実質的に業務を担ってきた大学院生やポスドクだろう。業務の標準化、という点で既存のリポジトリ担当者(データリポジトリ、機関リポジトリ)をアサインしつつ、リポジトリ運営部署にリサーチ・アシスタントを配置(あるいは集約)し、「データライブラリアン」の名前をつければ認知度的にも良さそう。
 ③実務レベルを超えた責任者としての役割は職員が担うべきだが、分野固有の知識もないと厳しい場面も多い。②のサービスを経験したRAがURAとして担当すると既存の枠組みとしては良さそうに思えるが、実態としてURAがデータリポジトリに関わる場面をあまり見ておらず、結構距離があるものと予想(というか興味ない方が多いのかも・・・)。図書館に開発室が併設されているような大学であれば、RA→図書館付き専門職員などのキャリアパスが示せると担い手も現れそうな気がするけれども、どうだろうか(そして自分的にそこを目指して良いのかどうか??)

6/21 日本データベース学会セミナー参加メモ

日本データベース学会が主催したセミナー「アカデミアや企業における研究開発のためのデータの収集・提供・利用」@お茶大に参加しました。

http://db-event.jpn.org/dbsj2019/%E6%8B%9B%E5%BE%85%E8%AC%9B%E6%BC%94/

同日のJ-STAGEセミナーに参加できず悲しい気持ちになっていたところに、急遽前日になって飛び込んできたお話。現在進行形で非常にありがたいテーマ。
=====
 本テーマは連続講義の予定で、初回となる本セミナーでは研究開発におけるデータの収集・提供・利用の流れを概観したうえで、データの収集方法や研究開発方法は適切かどうか、研究成果は誰がどのように利用できるのか、を考える上での法的枠組みの解説を行うとのこと。何でも去年から喜連川先生が学会の会長に就任したとのことで、冒頭でデータにまつわる法的枠組みの複雑さについて言及。データベース学会で?と思っていたが、このテーマ設定に妙に納得してしまった。
 さて、ご講演の内容について。データ収集の場面における規制は、データの種類及びデータの取得方法から判断することが可能であり、

i) 法律による規制

ii) 契約による規制

iii) 法律+契約による規制

の3パターンがありうるとのことで(スライドでは iv) 規制なし を含めた4パターン)、対象となる法律は知的財産法(特に特許と著作権)、不正競争防止法、にほぼ限定できるとのこと。
 データの種類について明確なカテゴリ分けはなかった(と思った)が、画像データや機械学習の際の学習用データなどが例として挙げられていた。ケースバイケース、という意味なんだろう。また、データの取得方法については1) 自分で取得、2) 契約によって取得、3) 契約以外によって取得、などの区分が挙げられていた(ここちょっと曖昧)が、この問題は結局のところ契約の有無に帰結する様子。「学習用データを作成するために、前処理としてコピーガードを外してよいか?」など、具体的な事例に基づいた解説は大変勉強になった。

~~~~~~

 後半では、データを用いた研究成果は誰がどのように利用できるのかについての解説。データを利用した研究成果を①データ、②データベース、③プログラム、④パラメータ、⑤ノウハウ、の5種類に分け、

研究成果 = 知的財産 → 知的財産権の対象となる知的財産 or 知的財産権の対象とならない知的財産
対象になるもの:法律が適用される   対象にならないもの:契約で縛る必要あり

という整理が示されていた(あの表はどこかで公開されて欲しい)。「知的財産権の対象とならない知的財産」としては、特許を取得していないアイディアなど。事実データ以外にも保護をきちんと考えるべき対象がありましたね・・・
法的保護があるものはそれで良しとして、契約によって規制の上書きが(ほぼ完全に)出来ることが明確になった点は個人的な収穫。契約によって法的枠組みを変更する際の良くあるパターンとしては、
知財権の譲渡(有償)
・ライセンス(独占・非独占
・発生しない知的財産(データ・データベース・パラメータ・ノウハウ等)
の3パターンとのこと。秘密保持契約書とかだと利用範囲や利用期間を縛ることも良く書かれているようなので、

参考:経産省サイト 営業秘密~営業秘密を守り活用する~
https://www.meti.go.jp/policy/economy/chizai/chiteki/trade-secret.html
素人視点ではデータの種別から判断して使い分けるよりも、法的保護のある/なしに関わらず、すべてオーバーレイする気持ちで契約書を作っておくと安心だろう。

=====

所感。研究データに特化されてはいないものの、相当に近い位置で法的権利関係が整理されたのは寡聞にして初めて。大変勉強になった。研究データの場合はどうか、と思い、先日のライセンスセッションで出たような質問をしてみたが、

https://minamin.hatenablog.jp/entry/2019/05/30/235307

想定するデータ像に齟齬があったようで、残念ながらうまくかみ合わなかった(ので窘められてしまった。。。)。個別の研究の実態に合わせた形での整理はやっぱりまだまだ必要なんだろう。

5/27 JOSS2019 ライセンス小委員会セッションメモ

久々のメモ。今年もご縁があり、JOSS2019の企画を担当させていただきました。 

http://joss.rcos.nii.ac.jp/session/0527/

前回:6/18 ライセンス検討小委員会セッションメモ - みなみの備忘録

今回のセッションは、小委員会で作成したガイドライン草案をたたき台に様々な状況下でのデータの利用条件を議論しよう、という趣旨でした。前回よりも実務に近づいた分、非常に具体的なケースからのコメントを多くいただきつつ、「研究データ」の定義やデータポリシーとの関係(ライセンスで制御すべきか否か)といった枠組みにも立ち返って議論がなされた印象。個人的には大変面白かった(聴衆の方々の意向と離れていたら申し訳ないが・・)。
例によって各登壇者のスライドやセッションまとめは後日公開予定なので、ここでは個人的にポイントだった部分を掘り下げる感じで。ほとんど自分用のメモなので、読みづらいと思いますがご容赦を。

=====

公開/非公開
- データの公開/非公開の境目の判断
登壇者のコメントは、多くがここに重点が置かれていた印象。明言された訳ではなかったものの、やはり窓口及び水際管理をする部署は必須、という共通理解ができつつあるように感じた。現在共有・公開されているデータは、言ってみればコミュニティによる認証(や圧力?)が中心となって進んできた面があり、個別判断を個人に負わせるのは(ガイドラインがあっても)やはり難しい。ガイドラインは窓口・管理担当者の手引書に位置付けていくのが無難かも(もちろん研究者側にやってほしいことは別途抽出していく必要はあるが)。
そのうえで、権利問題がクリアにしやすいこと、条件表示の書き方や問い合わせ対応も含めて豊富な事例があること、が実務的にはカギになりそう。(あとはデータを出してはいけないリポジトリリスト(仮)。いつか見たい。)


- データの種別
取り扱う対象のデータについては、議論の展開も鑑みると
1) 公開が推奨/義務化されるもの(DMPに記載あり、論文のエビデンスデータなど)
2) 公開するとメリットが得られるもの(アクセス数、引用数等)
を仕分ける必要がありそう。スタンスの違いによる議論のずれが、ディスカッションではやや気になった。

 

- エンバーゴ
後はエンバーゴ期間か。「公開しないデータを保存することはあり得ない」という視点から、「廃棄」の選択肢が明確に現れたのにはハッとした。こういう観点でも、アーカイブ資料と同一に考えられるんですね。

 

利用条件
- 多様性
利用条件については、改めて多様な要望があることを認識。「公開」フェーズではデータの性質に依存する面が大きいが、「共有」フェーズで寄託者の意向が強く反映され、それがそのまま公開に持ち越される、が現在の理解。「研究利用」に限定すればある程度は絞れるかもしれないが、教育に使いたい、経済的価値が出てきた、などの要望も研究と不可分なので悩ましい。。。そもそも寄託者にコンタクトが出来なくなった問題も。実態ベースでの整理がやっぱり必要。これは別枠で何とかしよう。

 

- フィードバック
コメントにもあったフィードバックの要望については、後日に某氏と議論した結果出てきたアナロジー※により、「ライセンスの対象にしないほうがよい」という確信を得る。データは公開としても、再利用にはいずれにせよメタデータやデータペーパーによる補完が必要となるはず。そちらの情報をコントロールする方向でフィードバック問題には対応すると良いのでは。


- データポリシーとの関係性
データの公開/非公開や利用条件はコミュニティによる影響を強く受け、それがデータポリシーにも反映してくる。コミュニティの意向が明確な分野であれば個別のライセンスは不要になるだろうし、幅がある(というか関心が薄い)分野であれば個別ライセンスの意義が大きくなる。そのグラデーションをうまく区切っていくのがガイドラインの役割になる・・・かな。

=====

感想。昨年から何回かの公開議論を経て、「分野の事情」といった大雑把な括りから、もう少し深く考えられるようになった気がする。寄託者の要求も基本的にはデータが活用されることによって応えられると考えれば、もうちょっと共有段階から落とし込むべきなんだろう。ただ、公開の議論と共有の議論、近しいようで関係者のモチベーションが大分違うんですよね。。。

 

※BBSのキリ番コメント強制。あるいは、「本命チョコはルールで縛ってもらえるものじゃない」

2/18 RDUF総会及び公開シンポジウムメモ

こちらも大分遅くなりました。2/18に開催されたRDUF総会及び公開シンポジウム@JSTの参加メモ。

イベント | 研究データ利活用協議会 RDUF (Research Data Utilization Forum)

資料は後日ウェブサイトで公開されるはずなので、例によって気になった発表のメモを。

=====

1.RDUF総会(13:15~14:15)

会員からの活動報告として、以下5点の報告があった。

 

1) 海洋研究開発機構JAMSTEC

 データへのDOI管理システムを構築するため、研究者へのアンケート調査を通じ、関連システム機能の強化及びDOI付与ガイドラインの整備を行っているとのこと。アンケートではデータの更新頻度だけではなく、データ保存のミラー状況も聞いたとか・・・各研究者の意識の高さが窺われる。

 

2) 高輝度光科学研究センター(Spring-8
 オープンデータへの参画促進のため、Spring-8内で公開データ、アクセス制限付きのデータを統合的に管理し、ユーザーへWeb UI及びスクリプト処理によるデータ取得を提供する予定とのこと。公開用のデータにはオープンデータへのリンクを含めており、外部ウェブサイトとの連携を志向。オープンデータのメタデータも収集対象にしているところはウェブ的で面白い。データリポジトリは選別された情報の収集に価値があると思う。

 

3) 科学技術・学術政策研究所(NISTEP)
 統合イノベーション戦略の施策へのRDUF活動実装に関する取り組みが紹介された。各小委員会の活動を実装するための道筋整備が今後の課題とのこと。

 

4) 東洋大学(芦野氏)
 こちらは機関としての取り組みではなく、個人の活動成果。CODATA Working Groupにおける活動として、Responsible Research Data Management (RRDM)のほか、社会科学データへの展開を見据えた議論が紹介された。CODATAでも、データポリシーやデータサイテーションに関する議論が重みを増してきているとのこと。しかし、FAIRもそうだが(FAIRerとか)、派生語が多すぎてついていけてない・・・そのうち集約されることに期待(人任せ)。

 

5) 名古屋大学(能勢氏)
 こちらも4) 同様、個人の活動成果。太陽地球科学分野におけるデータ引用の取り組みとして、学会誌でのデータDOIの認知・受容状況に関する報告があった。データへのDOI付与自体は概ね査読者に受け入れられているが、書式の違いやDOIの表示形式につき同一の分野内でも揺れが生じている状況とのこと。そういえば、最近読んだ政治学系のレビュー論文(doi:10.1017/S0003055418000801)でもdataverseへのdoiリンクを発見した。データ公開の文化があるところでは割と当たり前に受容されつつあるんだろうか。

 

2.公開シンポジウム(14:30~18:00)

公開シンポジウムは招待講演のほか、既存の小委員会の活動報告及び新規小委員会の紹介など。100人以上はいたはず。

 

1) 招待講演
 弘前大学の村下氏による、医療情報の活用に関するCOIプロジェクトの紹介があった。大学サイド主導の企画のもと、企業が持つ健康に関するデータを利活用可能な形で取得し、地域にも還元していく枠組みとのことで、およそ大学っぽくない(注:称賛です)交渉や駆け引きの一端を垣間見た。質疑応答では、データの公開ポリシーや社会ステークホルダーの巻き込み方、他企業の関係などポリシー面での実情が中心。
 この事例でもそうだが、産業でのデータ流通の場面においては、データを提供したり、共有したりする各フェーズで必ず対価が求められる(成果のフィードバック、金銭の提供など)。提供条件の「相場」を定めていくことも重要だが、最終的にOpen by Defaultを目指す研究機関との隔たりはそれなりに大きく、何らかの形で対等な関係にならないとオープンなデータ提供は進みそうにない、というのが感想。Openの範疇で要求しうる「対価」はクレジットだけなので、まずはデータ引用の文化が重要としても、加工・公開コストの問題は残っている。恐らく個別のデータ提供条件の整備では解決せず、オープンデータを推進する大学/研究機関への寄附だとか助成機関からの補助金交付だとか、より広い文脈でサイクルを回す解決策にならざるを得ないのだろう、とは勝手な憶測。

 

2) 平成30年度小委員会活動報告
 既存の小委員会(データ管理計画、ライセンス、リポジトリ)の活動報告。報告にも関わらず、各40分(報告30分+質疑10分)の長丁場。自分も何とか担当部分の報告を終えた(残務が終わった訳ではない)。ご質問くださった方どうもありがとうございます。

 このテーマ(ライセンス)、図らずも産業界の方からの反響が大きく、研究データ利活用に関心のある人はむしろ学術コミュニティ外に多いことを実感した次第。来年度も継続できると良いな。