みなみの備忘録

とあるライブラリアンの備忘録です。

データライブラリアン業務の私的中間整理

 いろいろ一区切りつきそうなので、データライブラリアンについての私的中間整理。下記のほか、
https://b.hatena.ne.jp/y_minami/data%20librarian/
某所による調査報告書、各種セミナーやワークショップ参加記録も参照(とりあえず列挙はしない)。
 働き始めてからも、結局データライブラリアンは何をするのか、しないのかの境界が良く分からずにいたので、何とか自分の方針を立てたいというのが本記事の動機です。
=====
 上記にもある文献を見ていくと、「データライブラリアン」の名のもとにおよそデータに関わる仕事が雑多に集められている様子(国内開催のセッションやワークショップに参加した感想も大体同じ)。このままでは収拾が付かないので、データライブラリアン≒データライブラリーで働く人、としてコレクションに紐づけてとりあえず考えることにする。そうすると、実務レベルでは
①コレクション管理
②窓口サービス(≒レファレンス)
の視点から業務が組み立てられるので、一応これに沿って検討。

~~~~~~

①コレクション管理
 いわゆるデータ管理業務に相当。オープンサイエンスの文脈で重要度が増し、分野横断的に要求が集まりつつある。多分専門分野の知識よりも事務能力のほうが重要。
 既存の業務の延長で考えると、収集指針に沿って集められたデータを
1) 寄託先のリポジトリ決定
2) データの破損チェック、フォーマット変換
3) メタデータ作成
4) ライセンスの設定
5) Accession No.(+PID)の付与
6) 公開
の手順で行っている(もちろん実際はもっと細かいが、大体のプロセスとして)。1) によって実質的に2)~4) は選択肢が制限されてしまうため、研究者の導線に沿った形で、どこに保存されるのが望ましいのかを分野別に考える必要がある。お手軽に選べる基準というかガイドラインが欲しいところ(今のところ一番近いのはDataCiteのRepository Finderか?)

https://repositoryfinder.datacite.org/
 また、業務体系としては「データマネジメント知識体系ガイド(DAMA-DMBOK)」が今のところ一番網羅的に思えるが、実務レベルに落とし込むにはもう少しアカデミア向けに寄せる必要がありそう。

 

②窓口サービス(≒レファレンス)
 データのレファレンスの場面では、どうやら何らかの知見を引き出す手前までを求められている様子。当初は社会科学系を中心にこういった役割が認知されており、最近になって徐々に広まったのではと思っている(聞き及ぶ話の中で社会科学系が一番古かっただけで、根拠はまだ探してない)。こっちは分野別の知識がある程度大事。
 ナビゲート対象としては、
1) データ所在(→ 自前のデータリポジトリのほか、データ交換などしているリポジトリを中心に。その他探すポイントや視点、検索プロセス、ツール)
2) ソフトウェア(→ 分野でよく使われる種類と使い方支援)
3) 解析手法(→ 分析コードや分析スキルを持つ人の紹介)
となるか。研究分野ごとによく使われるものに特化していく必要はあるものの、データの発見・処理プロセスの概念図や、データ解析にありがちなミスは標準的な前提として紹介できると良いかも。

KDD Process/Overview

Common Data Mistakes to Avoid | Geckoboard

 

 さて、こういった実務レベルを踏まえると、研究管理計画支援だとかデータポリシーの話は「③責任者に期待される役割」として位置付けられそう。
・基本的なデータ管理方法の案内(研究管理計画への支援)
・データポリシー制定(収集+組織化方針)
・各フェーズでのマニュアル・ガイドライン制定(ライブラリーがやること、外部に出すべきこと)

~~~~~
 ということで、「データライブラリアン」業務をざっくり整理してみました。暫定的な結論としては、異なるスキルを持つ担当者が最低2人必要そう、という感じか(責任者は一旦置いておく)。この整理が適切かどうか、を見ていく上で、さらに一歩進めて実装が可能かどうかも一応考える。まだ妄想レベルなので今後違うこと書いてもご容赦ください。。。
 日本において、①と②はどちらも研究室レベルで独自に行われてきているので、即戦力としては実質的に業務を担ってきた大学院生やポスドクだろう。業務の標準化、という点で既存のリポジトリ担当者(データリポジトリ、機関リポジトリ)をアサインしつつ、リポジトリ運営部署にリサーチ・アシスタントを配置(あるいは集約)し、「データライブラリアン」の名前をつければ認知度的にも良さそう。
 ③実務レベルを超えた責任者としての役割は職員が担うべきだが、分野固有の知識もないと厳しい場面も多い。②のサービスを経験したRAがURAとして担当すると既存の枠組みとしては良さそうに思えるが、実態としてURAがデータリポジトリに関わる場面をあまり見ておらず、結構距離があるものと予想(というか興味ない方が多いのかも・・・)。図書館に開発室が併設されているような大学であれば、RA→図書館付き専門職員などのキャリアパスが示せると担い手も現れそうな気がするけれども、どうだろうか(そして自分的にそこを目指して良いのかどうか??)