みなみの備忘録

とあるライブラリアンの備忘録です。

2020年の振り返り 2/2

明けましておめでとうございます。今年もどうぞよろしくお願いします。

初っ端から残務処理ですが、振り返りの続きを。

=====

7月

伸び伸びになっていた協会の紹介記事が無事公開される。

【シリーズ学会訪問】~情報科学技術協会~

INFOPRO Plusにも参加。メンバーの方にライセンス小委員会の活動紹介をしていただいた。

研究データの公開・利用条件指定ガイドラインの策定 | Morressier

第一土曜日は一か月遅れの会誌企画会議。何とか対面で出来て良かった。
研究の方向性をまだまだ模索中。この月は(自分が担当する)外向けのアウトプットがなく、じっくり取り組めた・・・と思う。小委員会活動の論文執筆が徐々にスタート。

8月

TRUST原則の概要を執筆。データリポジトリ関係は最近動きが早い・・・

E2296 - データリポジトリの信頼性に関するTRUST原則 | カレントアウェアネス・ポータル
データサイエンス授業の発表にギリギリまで悩む。コードを書きなれていないのがもろに影響。。その他、図書館総合展の企画準備もろもろ。

9月

RDUF小委員会活動の論文をついに投稿。一度すぐに戻されて焦るものの、何とか査読フェーズに持ち込む。職場では図書館総合展の調整に加え、12月予定のシンポジウムとかセッションとかの企画準備が徐々に始まる。共同研究がちょっと進んだ。

10月

初旬は会誌11月号のギリギリ調整に追われる。。。久々に厳しい担当号となってしまった。反省。
参加していたWGの成果物が公開されたので、取り急ぎ日本語訳の準備開始。

COAR Community Framework for Good Practices in Repositories – COAR
12月には日本語訳も公開できた。

リポジトリのグッドプラクティスのためのCOARコミュニティフレームワーク 第1版
中旬にはDA学会のワークショップに顔を出してみる。コメントだけ、というのは意外と緊張した。後半は研究者向けRDM教材の追い込みと公開。何とか無事に公開できて一安心。

教材「研究者のための研究データマネジメント」

11月

4日は総合展の司会1本、発表1本+編集委員会。頭の切り替えに苦労した。

第22回図書館総合展ONLINE NIIフォーラム「誰がやる?研究データ管理サービス」

20201104_JPCOARによる研究データ管理教材の整備状況

RDMサービスのセッションは、ディスカッションをやや誘導し過ぎたかもしれずちょっと反省。後日のアンケート結果で「みなみさんが元気そうでよかった」とのコメントをどなたからかいただく。ありがとうございます、元気にしてます。
次の週にはRDA 16th plenaryが開始。コスタリカタイムのため夜12時スタート・・・BoFセッションではパネルに呼んでいただいた。

Leveraging Shared Expertise for Data Curation and Discovery | RDA
論文のレビューコメント対応→アクセプト!職場での研究の方向性も見え始めたのが嬉しい。
あと、実に3年越しで前々職の活動報告が書籍の1章になった。長かった。。。

Library and Information Studies for Arctic Social Sciences and Humanit

12月

RDUF公開シンポジウムでは、小委員会の活動報告やブレイクアウトセッションの運営など。

研究データライセンス小委員会活動報告
第2期活動の最後となるセッションだったが、次の活動に繋がるような面白い議論になって個人的に満足。今回も含め、登壇いただいたお二人にやや頼りすぎている点は反省点だが・・
第一土曜日は会誌の企画委員会。何とか対面で実施できた。編集委員もとうとう6年目、最後の企画会議となった。無事に終われてよかったです。

次の週では1年ぶりくらいの出張(名古屋)、AXIESに現地参加。RDMセッションではJPCOARとの合同アンケートの紹介などを。

企画セッション2020|イベント2020|2020年度 年次大会|企画セッション2020|年次大会|大学ICT推進協議会 - AXIES
職場のおやつセッション(おやつを食べながら誰かの発表を聞く緩い会)では、始めて自分の研究紹介をした。果たしてどこまで実現できるやら。また、勤務最終日をちょっと過ぎて、アクセプトされた論文が出版されました。こちらも実質3年掛かり。

Investigation and Development of the Workflow to Clarify Conditions of Use for Research Data Publishing in Japan
これまでの活動が形になるのは嬉しいものです。

その他、現在進行形で職場が慌ただしい。。。

=====

いろいろ零れ落ちつつも、何とか振り返り終わりました。

新しい職場に移ってから1年ちょっと、大分じっくり考える時間をもらった感がある。今年の抱負、というほどではないが、(博士課程的な意味でも)考えたことを論文の形にまとめていきたい。それと、毎月1回は振り返り記事を書く習慣をつけたいところ。全然備忘録になっていないので・・・

2020年の振り返り 1/2

ブログを全く更新しないままに2020年が終わりつつあります。

せめて振り返りだけでも、と思い31日の夜に書き始めたものの、間に合いそうになく・・・取り急ぎ半年分を。

=====

1月

跡見学園女子大学「図書館(員)を語る」シリーズにお誘いいただいた。既に図書館(員)ではなかったものの(苦笑)、自分なりのまとめを。大学生に向かってお話する機会は2回目だけれども、いまいち感触が掴めない。。。

COARのリポジトリ評価基準WGが立ち上がり、いろいろ議論開始。アメリカ出張が本決まりになり、慌ただしく準備を。1/17にはシンポジウムに参加していたらしい(昨年唯一書いた記事)。

1/17 パブリックドメイン資料の利用条件シンポジウム参加メモ - みなみの備忘録

2月

データ流通推進協議会にお呼ばれして、ライセンス小委員会の活動紹介など。

20200207_研究データの流通促進に向けた国内の取り組み

小委員会の成果物正式公開は微妙に間に合わなかったものの、濃い議論ができた。

大学院の授業(課題)が思いのほかハード・・その他、アメリカ出張で使う資料作成に追われる。

3月

コロナ騒ぎが徐々に本格化し、やむなく京大出張、アメリカ出張をキャンセル。京大のワークショップとミシガンでの講演は残念ながら取りやめに・・・ほか、予定していた会議発表はオンライン(事前録音)で行うことに。ボストンは行ってみたかった。

研究データ利活用協議会公開シンポジウム 2019年度小委員会活動報告 - YouTube

20200319_Recent trends of social science data in Japan

職場で細々とレコーディングしたところ、一人で喋ると余計なことを話さないのでかなり短くなる模様。
その他、会誌編集委員のメール募集に踏み切った。何気に初だったかも。とはいえ、3月から委員会もオンライン開催となったため顔合わせは当面先に。

4月

3月末より急遽完全に在宅勤務となり、自宅の環境整備にちょっと時間がかかった。ただ、始めてみると通勤がない分睡眠不足が改善され、耳やら皮膚やら悪かった場所がどんどん治り始める。もう通常の通勤には戻れないかも・・・
振り返ると研究の方向性が徐々に固まり始めていた様子(当時はただもがいているだけだったけれども)。ほか、RDUF関係ではガイドラインの報告記事を書いたり7月以降の委員会継続の算段をつけたり。

E2250 - 研究データの公開・利用条件指定ガイドラインの策定 | カレントアウェアネス・ポータル

前の職場から持ち越した分担執筆のお仕事も無事出版された。

自然史・理工系研究データの活用(デジタルアーカイブ・ベーシックス3)

5月

緊急事態宣言が解けないままにオンライン授業が開始。一緒に授業を受けている人の顔が分からないので、仕事との区別が段々分からなく・・・在宅勤務も長引きそうだったので、オンラインで出来ることを増やすべく会誌の一時公開に踏み切る。

新型コロナウイルス感染症対応支援:臨時フリー公開資料一覧

その他、妙に打合せ回数が多い月だった印象。

6月

内閣府のWGにお呼ばれして、ライセンス小委員会の活動報告を行う。いろいろ斜め上からのコメントに苦心するも、データの制度的課題はやはりどこでも難題だと再認識・・・
例年6月は会誌の企画会議を実施しているものの、対面がかなり難しい判断とのことで7月に延期。その他、NIIオープンフォーラムではAXIESとの合同トラックで進捗報告などを行ったほか、下旬にはサンメディアさんの学術情報ソリューションセミナーで喋らせていただいた。

OSトラック4 - NII OPEN FORUM 2020

研究データの価値を再発見する:オープンサイエンスの実現に向けた基盤構築

=====

では、続きは来年に。

1/17 パブリックドメイン資料の利用条件シンポジウム参加メモ

1/17に開催された下記シンポジウムに参加しました。

シンポジウム デジタル知識基盤におけるパブリックドメイン資料の利用条件

#PDシンポ hashtag on Twitter

最近下記のような記事が出ていたこともあり、

Reproductions of Public Domain Works Should Remain in the Public Domain - Creative Commons

どんな展開になるのか興味があり参加。途中までしかいられなかったものの、特に冒頭の渡辺先生ご講演は現状の整理にとても有意義だったので、簡単に記録を。
=====
ご講演の主題(取り扱うテーマ)は以下の2つ。

  • CCライセンスを権利者の立場にはないものが、PD資料につけるということ(CCライセンスの拡大適用)
  • PD資料に利用条件を課すこと

さらに、先生からのメッセージは以下の2つということで、スライドの冒頭で示されていた。

  • 利用者にとって使いやすい環境を作るべき。リーガルコミュニケーションの標準化は重要。
  • 「お願い」+「規範」は検討価値があるのでは?

続いて、上記に至るまでの考察が示される。CCライセンスがデジタルアーカイブについている例は珍しくないが、ライセンスのサポート側としては複雑。必然的に誤解を伴っている可能性が高く、ライセンスを無視しても権利侵害が起こらないという事例が増えることは、CCライセンスにとって良くないのでは・・・との懸念。
さらに、著作権制度について考える立場からは、アーカイブ運営主体も権利者だ、という誤解を招いたり、数値データのように著作物ではないものが著作物だと誤解され、利用の委縮が文化・経済にとっての逸失利益に繋がってしまうのでは。
もっとも、CCライセンスを流用したいとの要望は、オープンデータの世界でもその他の領域でもよくあるとのこと。また、デジタル化やアーカイブの維持にはコストがかかり、料金をとりたい場合もあったり、社会的意義を知りたい/評判を高めたい目的もある、との言及あり。

-----

こういった背景を踏まえた上でどのような視点を重視するかと言えば、利用者にとって使いやすい環境を一番に挙げられていた。利用規約や独自ライセンスはこの観点から難があり、学習コストが高く、乱立すると組み合わせ利用の大きな妨げになる。せめてデジタルアーカイブ共通利用規約(のようなもの)が必要だろう、とのこと。
また、「お願い」と「規範」の意義についてもここで触れられていた。そもそも強制力を持たせることにどれだけの意味があるのか?という疑問から始まり、具体的な人物像の分析に。いわく、CCライセンスであれば、PD資料の権利者ではない人が付したところで強制力はなく、PDなので著作権もない。誰がライセンスを遵守するのかといえば、真面目で丁寧(=きちんと利用規約を読んで要望を理解した人)だが、権利の所在について誤解している人(=CCライセンスがついているので、データ保有機関が権利者だと思っている人)になる。本当にそれでいいのか?

さらに、「利用規約による強制」への分析が続く。利用規約はユーザーフレンドリーではなく、読まれないことも多い。規約は法的に有効性が高いものの、射程が限られる(DAウェブサイトの直接利用者のみ。ウェブサイト外で受け取った人は利用規約に縛られない)。また、著作者の数が多い場合、現実問題として列挙が難しい。表記を指定しても、いろいろ想定できない場面が出てくる(例えば、ポッドキャストでは文字を書けない)。CCライセンスで書かれているように、合理的な記載であればよい、という要件の緩和が必要。
そのうえで、権利情報と利用条件の伝え方はある程度標準化されているrightsstatementsはよいのでは。PDならPDと明記する、利用規約で縛るならそれも伝える。標準化されているので学習コストも低減できるメリットがある。

-----

ここからは「お願い」ベースへの分析。強制力を持たせないのも一案、という前振りから、インターネットは力比べ(≒規約の有無を押し通すやり方)に向く場ではなく、法的にどうあれ、反感を買えば炎上するリスクがある。特に、利用規約は炎上のネタになってきた(権利を召し上げる系の投稿サイトの規約)、との懸念を紹介。
また、「お願い」ベースが実は提供機関の実態に近い本音なのでは?という分析も。つまり、「報告できないなら利用(あるいはクレジットの付与)を断念してほしい」とまでは考えていないし、「無報告利用者を捕捉して利用報告(あるいはクレジットの付与)を強制する」つもりもないだろう、という推察。

続いて、(「お願い」に実効性を持たせるための検討として)アカデミアの規範との関係性について。アカデミアにおけるcitation(またはquotation?)に著作権上の根拠はないが、citationがないと剽窃になりうる。アイディアの借用など許諾が不要な行為であっても同様であり、法規範とは別の要請からきている(先行研究を知っていることを示す、読者による検証・詳細な研究を可能にする:知のトレーサビリティ)。文化全体にそれを期待するのはやや厳しいだろうが、オピニオンリーダーや、利用者コミュニティを巻き込んだ合意形成をすればよいのでは。

-----

中間まとめ。利用者本位のリーガルコミュニケーションという視点が重要。利用規約、rightsstatements、お願い、どれであれ多様な内容や伝え方は利用者の負担。学習コスト削減には標準化、共通化が必要(あるいは有効)。上記を前提にしつつ、どのように実現していくかを考える上で、CCライセンスのデザインから学べることの紹介。「利用条件」のような一般名詞ではなく、固有名詞で名前がついている。サイトやプロジェクトに特有の条件ではないため、多くの資源が同一の条件で使え、かつ見るだけで分かる。アイコンで表現される、略称がある、固有のURLがある、etc...

-----

最後に留意すべき点の指摘がいくつか。非常に人気があることが確実なコンテンツは、利用条件が厳しくても利用される。利用条件が緩くても、他のコンテンツとのアテンションの奪い合いになる。とすると、利用条件よりも他の要素(discoverability、メタデータ、ニーズとメタデータのマッチ度の高さ)が重要なのでは、というコメントがあった。
=====
その後の各機関によるデジタルアーカイブ事例報告も含め、ライセンス(という単語が適切かどうかは一旦置いておき)の共通理解を促進する観点で面白いイベントだった。「お願い」がやはり妥当な線、という方向性が示されたのは結構大きい気がする。

ただ、個人的に気になる点としては、「お願い」はデジタルアーカイブ公開が目的の機関であれば機能するが、利用統計を活用して事業資金の獲得や産業利用に繋げるといった立場からはやや物足りないはず(いざというときの対抗手段を、みすみす手放すことはないと思う)。契約による強制力は、なお必要な場面がありそう。もっとも、デジタルアーカイブの対象資料は一度PDになったものなので、たまたま保有していた機関が「囲い込み」することには相当の反発があるだろうが・・・オープンアクセスの議論に見られたような「最低限の制約」の共有が次の課題だろうか。

2019年の振り返り

今年はほとんど更新できなかったものの、振り返り記事だけでも書いておこうと一念発起。やや書き散らし気味なのはご容赦を。
=====

1月

ラボで世論調査をやりたいとの企画が持ち上がり、どたばたと準備。いろいろ要因が重なり結局延期になってしまったが、良い勉強になった(特にデータ入手の実態を理解する上で)。月末には九大にお邪魔して、研究データ管理のお話をすることに。遠方の来客に驚く。

シンポジウム 「オープンデータと大学」(1/30) | 九州大学附属図書館

2月

NDLにお呼ばれして識別子の話など。一緒に呼ばれたお二方が万能過ぎたため、自分の立ち位置にかなり悩む。RDUFシンポジウムでは活動紹介の後、妙に長い質疑応答(ほぼディフェンス)を行うはめに。。

「研究データのライセンス検討プロジェクト」小委員会活動報告

所内ポータルサイトが何とかローンチに漕ぎつける。
3月

ぼんやり考えていた大学院の話が、某先生に相談して急に具体化。忙しく研究計画などを練る。ラボでは歴史データを扱う話が動き始め、出版物の電子化作業も並行。大図研イベントでのオンライン講演や、

データジャーナルを知る:20190320_data journal
外部小委員会の報告書執筆も重なってあまり記憶がない。

RDUFについて | 研究データ利活用協議会 RDUF (Research Data Utilization Forum)

月末にはお世話になったディレクターが異動になり、重ねてお隣さんがいなくなってしまい、やや意気消沈。
4月

大学院の話も加速し始め、10月入学を目標に設定。「オープンサイエンスのいま」続投決定+即時公開。めでたい。職場ではデータ管理とか可視化系の仕事が動き始め、データ・ライブラリアンっぽい仕事をした(ようやく?)。地味にJOSS2019対応に時間を取られる。
5月

JPCOARへの申請が通り、JAIRO Cloudアカウントの引き渡しあり。黙々とメタデータを作成(300件ちょっと?)。楽しい。ウェブサイトの移行対応支援で、WARPにハーベストされたデータの修正に着手。止まっていた某研究会の再開に向け、人が増えたり戻られたり。JOSS2019のオーガナイズも。

研究データのライセンス表示ガイドラインの実践に向けて

6月

リポジトリの公開準備。大学院の話が暗礁に乗り上げそうな中、新しい職の話が舞い込む。いろいろ悩みつつも、ご縁とチャンスを大事に進めることに。

2019/9/1 転職しました。 - みなみの備忘録

「平成を振り返って」特別寄稿がめでたく公開。結構なページ数になったため、2号に分けて出すことに。

平成を振り返って(平成元年~平成21年)

平成を振り返って(平成21年~平成31年)

7月

現職の面接。迷った末に自分がやりたいことをそのまま話したら通してもらえた。なんとも懐が深い。
INFOPRO2019に初参加し、活動の宣伝や原稿執筆者の勧誘など。ポスター発表もした(喋ったのは自分ではないが)。

研究データのライセンス表示ガイドライン | Guidelines for Licensing Research Data

所属先リポジトリがめでたく公開・・・のはずが直前でいろいろあり、こっそりと出すことに。本記事執筆時点でもまだ本体ウェブサイトにリンクを貼ってもらえない様子(悲)。
8月

転職準備。お世話になっている方から博論が通った旨のご連絡をいただき、自分も大学院に向けたテンションが上がるものの、大学院の面接と某原稿の〆切が被る。早々にお詫びのメールを出して(ほんとすみません)、面接に備える。またしても年休は使いきれず・・・
9月

神保町に拠点が移る。初日は挨拶回り。かなりの数が知り合いだったので新鮮味は薄かったものの(笑)、落ち着く環境に。勤務時間のフレックス制が素晴らしすぎる。初めの週は、初任者研修として各人の業務をみっちり1時間ずつご紹介いただいた(贅沢)。JPCOAR作業部会に久々復帰。中旬には大学院の合格連絡があり一安心。
10月

葉山で大学院の入学式+3泊4日の研修。英語のみということでついていけるかちょっと不安だったものの、終わってみれば意外と楽しく過ごせたような。仕事も手探りながら徐々に自分の所掌が固まり、道筋をつけられるようになってきた(気がする)。急遽小特集を組むことになった12月号の記事の校閲がひたすら続く・・・
11月

図書館総合展は1日だけ参加。フォーラムに参加しなかったのは初めてかもしれない。ひたすらブースで呼び込みと説明をした。新しく立ち上げるプロジェクトの呼びかけと説明で忙しく過ごす。前月に引き続き、主査を務める1月号の校閲案件が多数。
12月

上旬は某委員会の企画会議。1年ぶりだったのでいろいろ要領を忘れている・・・編集委員の皆さんすみません。中旬はAXIES年次大会に参加。一風変わった学会(?)の雰囲気が面白く、そしてなぜか福岡で職場の皆さんとがっつり飲む機会が。来年のJOSS2020企画も練りつつ、年末に向けて外部活動の成果物公開を急ぐ。今更ながら、26日に審議依頼を送りつけたのは事務局に悪いことをしてしまったかもしれない(反省)。年末年始は何としても論文を書く(現在進行中)。
=====
あと、今年は全体的に体調を崩し気味だったのが反省点(運動不足か)。来年はもう少し稽古したい。

2019/9/1 転職しました。

1年も経たずにこのタイトルで記事を書くことになろうとは。とはいえ、職場ブログでも既に挨拶文を書いてしまったので、自分用にも忘れないうちに書き留めておきます。

=====

そもそもの再転職の契機は大学院への進学が具体化したこと。もともとうっすら希望はあったものの、自分は何を研究したいのか、突き詰めたいのかがいまいち見えていなかった。とあるイベントの際に某先生とお話していた際、「希望があるなら相談に乗るよ」と言ってもらったことがきっかけで、3月頃にまずは自分の活動予定をまとめ、見てもらいながら構想を練っていく。その作業が存外に楽しく、また今後のキャリア展開に方向性を模索していたこともあり、何とか形にして試してみたいという気に。

これまた某先生の計らいで指導教官になっていただける方も見つかり、10月入学を目標に急ピッチで準備開始。家庭内の決裁(?)は下りたものの、ラボの立ち上げ時ということもあり、職場の決裁がかなり厳しい見通しだった。データライブラリアン職には思い入れもあり、採用いただいた上司にも相談したり結構悩んだ記憶が・・・

そんな中、これまた某先生からの伝手で、現職の募集を知ることに(もはや某先生の厚意には頭が上がりません・・・)。1年も経たない中での決断になったものの、これまで悩んできた経緯もあり、求める研究支援職は転職先の上長と一緒なら作れる気もする、ということで、割とすんなり応募自体は決められた。面接のタイミングで、大学院に行きながら働かせてくれ、という要望を通してくれた皆様には本当に感謝です。

=====

さて、何で博士がとりたくなったのか。前々職の大学図書館では感じなかった肩書の重みは、前職の様々な場面で感じました。特に、データ専門職の認知度が極めて低い現状では、自分が出来ることを思うように伝えられない機会も多く、「図書館での実績」への認識はさらに低い(残念ながら)。第三者としての研究支援職を確立するスタートに立つためには、まず研究者と同じ立ち位置にいく必要がある、が現在の考えです。まあ自分に到達できる能力があるのか、という視点が構想に含まれていない欠点はありますが・・・ともあれ、出来るところまで頑張ろうと思います。

データライブラリアン業務の私的中間整理

 いろいろ一区切りつきそうなので、データライブラリアンについての私的中間整理。下記のほか、
https://b.hatena.ne.jp/y_minami/data%20librarian/
某所による調査報告書、各種セミナーやワークショップ参加記録も参照(とりあえず列挙はしない)。
 働き始めてからも、結局データライブラリアンは何をするのか、しないのかの境界が良く分からずにいたので、何とか自分の方針を立てたいというのが本記事の動機です。
=====
 上記にもある文献を見ていくと、「データライブラリアン」の名のもとにおよそデータに関わる仕事が雑多に集められている様子(国内開催のセッションやワークショップに参加した感想も大体同じ)。このままでは収拾が付かないので、データライブラリアン≒データライブラリーで働く人、としてコレクションに紐づけてとりあえず考えることにする。そうすると、実務レベルでは
①コレクション管理
②窓口サービス(≒レファレンス)
の視点から業務が組み立てられるので、一応これに沿って検討。

~~~~~~

①コレクション管理
 いわゆるデータ管理業務に相当。オープンサイエンスの文脈で重要度が増し、分野横断的に要求が集まりつつある。多分専門分野の知識よりも事務能力のほうが重要。
 既存の業務の延長で考えると、収集指針に沿って集められたデータを
1) 寄託先のリポジトリ決定
2) データの破損チェック、フォーマット変換
3) メタデータ作成
4) ライセンスの設定
5) Accession No.(+PID)の付与
6) 公開
の手順で行っている(もちろん実際はもっと細かいが、大体のプロセスとして)。1) によって実質的に2)~4) は選択肢が制限されてしまうため、研究者の導線に沿った形で、どこに保存されるのが望ましいのかを分野別に考える必要がある。お手軽に選べる基準というかガイドラインが欲しいところ(今のところ一番近いのはDataCiteのRepository Finderか?)

https://repositoryfinder.datacite.org/
 また、業務体系としては「データマネジメント知識体系ガイド(DAMA-DMBOK)」が今のところ一番網羅的に思えるが、実務レベルに落とし込むにはもう少しアカデミア向けに寄せる必要がありそう。

 

②窓口サービス(≒レファレンス)
 データのレファレンスの場面では、どうやら何らかの知見を引き出す手前までを求められている様子。当初は社会科学系を中心にこういった役割が認知されており、最近になって徐々に広まったのではと思っている(聞き及ぶ話の中で社会科学系が一番古かっただけで、根拠はまだ探してない)。こっちは分野別の知識がある程度大事。
 ナビゲート対象としては、
1) データ所在(→ 自前のデータリポジトリのほか、データ交換などしているリポジトリを中心に。その他探すポイントや視点、検索プロセス、ツール)
2) ソフトウェア(→ 分野でよく使われる種類と使い方支援)
3) 解析手法(→ 分析コードや分析スキルを持つ人の紹介)
となるか。研究分野ごとによく使われるものに特化していく必要はあるものの、データの発見・処理プロセスの概念図や、データ解析にありがちなミスは標準的な前提として紹介できると良いかも。

KDD Process/Overview

Common Data Mistakes to Avoid | Geckoboard

 

 さて、こういった実務レベルを踏まえると、研究管理計画支援だとかデータポリシーの話は「③責任者に期待される役割」として位置付けられそう。
・基本的なデータ管理方法の案内(研究管理計画への支援)
・データポリシー制定(収集+組織化方針)
・各フェーズでのマニュアル・ガイドライン制定(ライブラリーがやること、外部に出すべきこと)

~~~~~
 ということで、「データライブラリアン」業務をざっくり整理してみました。暫定的な結論としては、異なるスキルを持つ担当者が最低2人必要そう、という感じか(責任者は一旦置いておく)。この整理が適切かどうか、を見ていく上で、さらに一歩進めて実装が可能かどうかも一応考える。まだ妄想レベルなので今後違うこと書いてもご容赦ください。。。
 日本において、①と②はどちらも研究室レベルで独自に行われてきているので、即戦力としては実質的に業務を担ってきた大学院生やポスドクだろう。業務の標準化、という点で既存のリポジトリ担当者(データリポジトリ、機関リポジトリ)をアサインしつつ、リポジトリ運営部署にリサーチ・アシスタントを配置(あるいは集約)し、「データライブラリアン」の名前をつければ認知度的にも良さそう。
 ③実務レベルを超えた責任者としての役割は職員が担うべきだが、分野固有の知識もないと厳しい場面も多い。②のサービスを経験したRAがURAとして担当すると既存の枠組みとしては良さそうに思えるが、実態としてURAがデータリポジトリに関わる場面をあまり見ておらず、結構距離があるものと予想(というか興味ない方が多いのかも・・・)。図書館に開発室が併設されているような大学であれば、RA→図書館付き専門職員などのキャリアパスが示せると担い手も現れそうな気がするけれども、どうだろうか(そして自分的にそこを目指して良いのかどうか??)

6/21 日本データベース学会セミナー参加メモ

日本データベース学会が主催したセミナー「アカデミアや企業における研究開発のためのデータの収集・提供・利用」@お茶大に参加しました。

http://db-event.jpn.org/dbsj2019/%E6%8B%9B%E5%BE%85%E8%AC%9B%E6%BC%94/

同日のJ-STAGEセミナーに参加できず悲しい気持ちになっていたところに、急遽前日になって飛び込んできたお話。現在進行形で非常にありがたいテーマ。
=====
 本テーマは連続講義の予定で、初回となる本セミナーでは研究開発におけるデータの収集・提供・利用の流れを概観したうえで、データの収集方法や研究開発方法は適切かどうか、研究成果は誰がどのように利用できるのか、を考える上での法的枠組みの解説を行うとのこと。何でも去年から喜連川先生が学会の会長に就任したとのことで、冒頭でデータにまつわる法的枠組みの複雑さについて言及。データベース学会で?と思っていたが、このテーマ設定に妙に納得してしまった。
 さて、ご講演の内容について。データ収集の場面における規制は、データの種類及びデータの取得方法から判断することが可能であり、

i) 法律による規制

ii) 契約による規制

iii) 法律+契約による規制

の3パターンがありうるとのことで(スライドでは iv) 規制なし を含めた4パターン)、対象となる法律は知的財産法(特に特許と著作権)、不正競争防止法、にほぼ限定できるとのこと。
 データの種類について明確なカテゴリ分けはなかった(と思った)が、画像データや機械学習の際の学習用データなどが例として挙げられていた。ケースバイケース、という意味なんだろう。また、データの取得方法については1) 自分で取得、2) 契約によって取得、3) 契約以外によって取得、などの区分が挙げられていた(ここちょっと曖昧)が、この問題は結局のところ契約の有無に帰結する様子。「学習用データを作成するために、前処理としてコピーガードを外してよいか?」など、具体的な事例に基づいた解説は大変勉強になった。

~~~~~~

 後半では、データを用いた研究成果は誰がどのように利用できるのかについての解説。データを利用した研究成果を①データ、②データベース、③プログラム、④パラメータ、⑤ノウハウ、の5種類に分け、

研究成果 = 知的財産 → 知的財産権の対象となる知的財産 or 知的財産権の対象とならない知的財産
対象になるもの:法律が適用される   対象にならないもの:契約で縛る必要あり

という整理が示されていた(あの表はどこかで公開されて欲しい)。「知的財産権の対象とならない知的財産」としては、特許を取得していないアイディアなど。事実データ以外にも保護をきちんと考えるべき対象がありましたね・・・
法的保護があるものはそれで良しとして、契約によって規制の上書きが(ほぼ完全に)出来ることが明確になった点は個人的な収穫。契約によって法的枠組みを変更する際の良くあるパターンとしては、
知財権の譲渡(有償)
・ライセンス(独占・非独占
・発生しない知的財産(データ・データベース・パラメータ・ノウハウ等)
の3パターンとのこと。秘密保持契約書とかだと利用範囲や利用期間を縛ることも良く書かれているようなので、

参考:経産省サイト 営業秘密~営業秘密を守り活用する~
https://www.meti.go.jp/policy/economy/chizai/chiteki/trade-secret.html
素人視点ではデータの種別から判断して使い分けるよりも、法的保護のある/なしに関わらず、すべてオーバーレイする気持ちで契約書を作っておくと安心だろう。

=====

所感。研究データに特化されてはいないものの、相当に近い位置で法的権利関係が整理されたのは寡聞にして初めて。大変勉強になった。研究データの場合はどうか、と思い、先日のライセンスセッションで出たような質問をしてみたが、

https://minamin.hatenablog.jp/entry/2019/05/30/235307

想定するデータ像に齟齬があったようで、残念ながらうまくかみ合わなかった(ので窘められてしまった。。。)。個別の研究の実態に合わせた形での整理はやっぱりまだまだ必要なんだろう。