読者です 読者をやめる 読者になる 読者になる

みなみの備忘録

とある大学(?)図書館員の備忘録です。

3/23 音声レコーディングメモ

3月下旬、音声レコーディングに立ち会う機会がありました。

原稿を作成してプロの方に読んでもらうのだが、これがなかなか難しい。

次回(があるのか分からないが)のために備忘メモ。

・読み原稿はできるだけ短文にすること。一文が長いと(聞く側の都合だけではなく、読む側にとっても)分かりにくい。

・スライド付きの場合でも、喋りで補うのは最小限に。基本はスライドの記述をほぼそのまま読み上げてもらうくらいに作りこんでおく。聞き手のスタンスとして、今どこについて喋っているのか混乱する。

・表は細かく説明しない。後で見るときのポイントだけでよい。

・図は見方の流れを説明するように。ポンチ絵は出来るだけ避けよう。

・強調すべきポイント、特徴的な発音については、事前に読み原稿へ書いておくこと。自然な文章になるように練ってきてもらえる。

2/28 第4回オープンサイエンスデータ推進ワークショップ参加メモ(後編)


後編です。前編はこちら:http://minamin.hatenablog.jp/entry/2017/03/06/175853
4人目は京大の天野さんから、機関リポジトリ推進委員会で開発中のRDM(研究データ管理)トレーニングツール紹介。既に、

AXIES2016(https://axies.jp/ja/conf/conf2016/8r18v2/general-session

第3回SPARC Japanセミナー2016(http://www.nii.ac.jp/sparc/event/2016/pdf/20170214_8.pdf

で一部紹介されているが、アップデートも兼ねてとのこと。
RDMの中核要素を①RDMインフラ、②ヒューマンリソース、③組織体制、④コミュニティ、とした上で、研究支援職という立場から日本語で教材の提供を行いたい、というお話。MOOCで提供予定。
本ブログの中の人も開発に参加しているためコメントしづらいが、国内でのRDMの基礎(たたき台)となる資料はやっぱり必要で、こういった取り組みを元により多くの人が活動に参加してくれれば嬉しいところ。


5人目、こちらも京大の能勢先生からRDMの実践例。
データ取得と解析の具体的な事例紹介は非常に面白かった。1データセットにdoiを付与するまでにどれだけの手間がかかり、維持管理の心配もしなければならない、というくだりは実感が湧いた。
RDMは、一般の研究者にとっては無用な手間が増えるだけ」と思ってしまうのはもっともなので、研究者のみなさんがそう思ってしまう前に何とかしなければならないところ。
能勢先生からはデータ公開やRDMに対する評価体制の構築、利用が容易なシステム構築や図書館との連携などが対策案として挙げられていたが、意外にも(?)フロアの反応は違った角度からきていた。曰く、「初めからそういうものと思って学生に教育を進めるべきでは?」というもの。規範、慣習になる方向性。
確かに、まず取っつきやすいのはこれから研究者になる人だろうし、そこから潮目が変わることも十分に考えられる(そこまで社会的に待ってもらえるか、は別問題として)。
具体的な働きかけを考える際には意識しておきたい。


6人目、NIIの込山先生。NIIの研究データ管理基盤紹介。
研究公正とオープンサイエンスの両立、という問題意識から、既存の図書館員ではカバーできないと思われる、研究プロジェクトを対象としてフォローしたいとのこと。助成機関とも連携して進めており、まずlong tailデータを対象としつつ、Open Science FrameworkをNIIドメインにして開発中。
https://osf.io/
開発元のCenter of Open Scienceとも協働関係をきちんと築いており、NIIで開発したプラグインを提供している、のくだりは(継続性の観点で)結構重要に感じた。
現在は6機関(北大、名大、京大、九大、阪大、NII)で使い勝手のトライアル実施中とのことで、早い実装に大変期待。
なお本家との違いとして、公開基盤としては既にJAIRO Cloudがあるため、公開機能は削っているそう。あくまで非公開部分のデータを管理する基盤、という位置づけになるようだが、どっちがいいんだろうか??


7人目は極地研の門倉先生、極域環境データサイエンスセンターの紹介。
来年度から情報・システム研究機構内で立ち上がるデータサイエンス共同利用基盤施設のうち、極域環境データサイエンスセンターの紹介。ちなみにセンターは現在6つある様子。
https://ds.rois.ac.jp/
極地研の中のデータベースは沢山あるが、各々の分野限定であることや公開の進み方にばらつきがあり、マンパワー、ハードウェア、ソフトウェアのリソースも様々である、という問題意識から、総合的な検索・可視化・解析システムの設計・構築がしたい、という目標のお話だった。最近のトピックであるデータジャーナルの紹介はさらっと流していたが、質問はそこに向かってしまう。。。
https://pdr.repo.nii.ac.jp/
内容は予算の取り方的なお話だったので割愛するが、関心度の高さがうかがえた。


8人目はBernd Ritschelさん、超高層科学分野でのLOD vocabularyについて。
SPASEのメタデータスキーマをSKOS形式に変換するために、vocabularyの整備を行っているとのこと。
http://www.spase-group.org/
※去年、なぜかJAIRO Cloudにこのスキーマ名が搭載されていて驚いた。実装された訳ではなかったみたいだけども。。。
IUGONET、ESPAS、GFZ ISDCといった関連分野のスキーマを統合したいとのことだが、わざわざLODを使う理由が良く分からなかった(ので質問してみたけれど、やっぱり良く分からなかった)。
新しい技術を試すのは有意義だと思うけれども、これだけ分野が近いんだから直接マッピングしたほうが早いし定義のずれも最小限で済むのでは、というのが正直な感想。


9人目はJSTの小賀坂さん、JSTにおけるオープンサイエンス対応。講演部分はこれで最後。
2/14のSPARC Japanセミナーと同じ内容、という前置きで話されたが、
http://www.nii.ac.jp/sparc/event/2016/20170214.html
最後のほうにJST未来社会創造事業の紹介が増えていた。公募テーマ、領域を研究者と一緒に作っていく新たな取組みとのこと。
前回も気になったPID switchboard Japan(次期JaLCシステム構想)がどういう構想のものなのか、についてはやっぱり分からず。
THORとはどう違うんだろう。


最後にNISTEPの林さん、まとめコメント。毎回その場で一日の全体像を振り返りつつメッセージにまとめる、という達人芸を披露されているが、今回はさらに全て英語で行うという離れ業。
Data sharingの文化を醸成していくことによってData drivenな研究を進めたい、では現在とのギャップをどう埋めるのか、という視点で話をされていた(と理解した)。
印象に残ったのは、「あったらいいね(may-have services)」ではなく「なくてはならない(must-have services)」を作ることが重要、というメッセージ。今回の講演からは、collaborate and co-designがキーワードの一つと言えそう、とのことだった(ここは少々聞き取りが怪しいかも)。
図書館絡みでも既に事例はいくつか出てきてはいるので、来年度の展開に期待したい。

2/28 第4回オープンサイエンスデータ推進ワークショップ参加メモ(前編)

2/28に京大で開催された、第4回オープンサイエンスデータ推進ワークショップに参加しました。
2/28~3/1の日程だったけれども、業務の都合上2/28の一日だけ参加。とはいえ不慮の事態により結局1泊(?)することに。。。
まあそれはともかく、このワークショップも4回目。いつの間にかまとめページができていた。
http://wdc2.kugi.kyoto-u.ac.jp/openscws/
今回はデータマネジメントをテーマに、パデュー大学からMichael Wittさん、シカゴ大学からVas Vasiliadisさんがはるばる京都まで来ていらっしゃった。
~~~~~
1日目の講演だけだが、簡単な感想を。
村山先生、オープンサイエンス・研究データ共有の国際的な動向について。
内容としては標題の通り、オープンサイエンスの国際動向、特にヨーロッパを中心とした展開のお話だった。
印象に残ったのはEUDAT introduction to metadataのお話。
https://www.slideshare.net/EUDAT/introduction-to-metadata-57336324
EUDATを進めていくに当たって作成した文書の中に、メタデータの書き方、ガイドラインといったものがあるそうな。図書館的に言えば、research data用のコーディングマニュアルみたいなものの様子。

# slideshareの関連ページを見る限り、user trainingやresearch data managementとかもあってかなり充実している模様。

こういった文書類はあまり日本では見受けられないが、本格的に進めていくに当たっては必要になってくるだろう、という、随分と実装レベルに沿ったご提案が新鮮だった。

 

2人目は京大の梶田先生。京大におけるアカデミックデータマネジメント環境構築構想について、というお題で、

「2030年には京大のインフラがどうなっているか?」という問いかけからスタートした。
このくらいのレベルは実現可能で、実現しないと優秀な人材は集まってくれないよね、じゃあ既存のリソースでどう進めていくか、という非常に現実的な見通しを示された上で、人的リソースと技術インフラの統合、研究支援、研究公開、アーカイブといった各レイヤーでの連携の在り方の考察が展開されていた。
実際に動くのは来年度から、という話だったけれども、本気度が伝わる講演だった。注目しておきたい。


3人目はパデュー大学のMichael Wittさん。1年ぶりに再会。
"Research Data Management funder policies in the United States"として、アメリカの助成機関のポリシーの詳細な紹介、パデュー大学での対応などをご講演されていた。
特に強調していたのはOSTP指令の話。

# OSTP : objectives for dataとして10項目挙げられている、と手元のメモにあるものの、今調べたら全然
# 出てこない。。メモのミスか政権の問題か??
# とりあえず下記が出てきたのでこちらにメモ:
# https://www.icpsr.umich.edu/icpsrweb/content/datamanagement/ostp.html

OSTPの説明からの流れで、各機関のData Management Plansに落とし込むまでに
Open government
 → Public access plan
 → Implementation: publications / data
 → Open Access Policy / Data Management Plan

といった要請をきちんと踏まえていく「構造」を明示していたのが印象的だった(スライドでは樹形図)。
それと、"Motivations for PURR"として、libraryの専門性に触れていた。Wittさん曰く、libraryは長期的なstewardshipのため、学術記録としてのデータアクセス保証が、その専門性にかかる問題とのこと。そのためのガバナンスとスタッフとして、IT部門2名、ライブラリー2名、研究支援職2名、ドメイン研究者3名がlibraryに配置されている。役割は、project director、technologists、HUBZero Liaison、metadata specialist、 digital archivist、 repository outreach specialist、 data curator。Key playerは分野特化のライブラリアンとデータサービスのスペシャリスト。体制を組むのに大体10年くらいかかったとか。
質疑では、「日本のライブラリアンは文化的に機関を推進する立場にないが、library professionはどこに持ってくるべきと考えるか?」といった質問が出ていた。
Wittさんからの回答は、ライブラリーの理念の中心となるのは"openness"、誰にでも開かれた存在であるべきという位置づけから、協調、社会への繋ぎ、メタデータなどがprofessionだろう、とのこと。要はハブのような存在、ということだろう。
#####
以下、Wittさんのご講演についての個人的な感想を。
質疑でもそうだったが、"librarian"の定義がどうもずれている気がしている。
日本だとlibrarian = 大学図書館員なのだが(※1)、海外、少なくともアメリカはlibrarian = libraryに関わる専門職、ということで、研究支援職のみならずIT部門やドメイン研究者ですらも"librarian"になっている。
libraryが物理的な館に紐づいていない、と言い方をしても良いかもしれないが、同じ定義で話すなら、日本でも図書館長をはじめとして専門的なlibrarianはいるだろう。
日本でこの話をすると「海外と比べて」みたいな論調が目立つが、その辺の見せ方も、大学図書館員がハブになって繋いでいけば変わってくるのかも、と思ったり思わなかったり。

(一日にも関わらず)長くなったので2つに分けます。
後編はそのうちに。

 

※1 2017/3/7追記:ご指摘をいただいてはたと気づきましたが、「librarian = 大学図書館員」の文脈について、公共図書館員、専門図書館員を無視した訳ではございません(この話題の文脈で、という意味です)。どなたか不快にさせていたらすみません。。。

2017/2/22 Almaワークショップ参加メモ

久々の更新。実に3か月ぶり。

2月に次世代図書館システム"Alma"についてのワークショップが開催されたので参加してきました。
参加は招待制とのことで、21日は主に360Linkユーザー向け、22日はSFXユーザー向けだったとのこと。自分は22日に参加しました。
ユーザー側の参加者は6名、Ex Libris側は6名とかなり密な感じ。

~~~~

始めに、ユーザー側から利用しているシステム、主要なワークフローの説明、新しいシステムに期待する機能とかを簡単にプレゼン。

# 「プレゼンは日本語でも英語でもOK」とのことだったので日本語で準備して

# いったものの、聴衆が全員外国人(日本語が分からない)という事態。。。

# 適宜フォローしてもらいながら喋りつつも、これは想定しておくべきだったと反省。

大体1時間くらい皆さんで喋ったあと、本格的にAlmaの紹介。

Almaの紹介は実は2度目(9月に職場でやってもらった)なので、今回はかなり細かいところまで余裕を持って確認できた。やっぱり高性能。

サイロをなくす、ということが非常に強調されるだけあり、資産管理システムや発注システムとのAPIによる連携機能が素晴らしい。日本のワークフロー上、大学図書館がデフォルトでは権限(財務会計システムへのアクセスとか)を持っていないところをどうフォローするか、が何とかなれば、業務量自体は劇的に減りそう。

ジャーナルごとのcost per useも簡単に見られるようになっており、data drivenな要素が面白い。また、前回の時点ではE-Alma(電子リソース管理のみを取り扱う)の扱いは不明だったものの、日本向けということで本格的に検討するらしい。

~~~~

質疑応答の中で一番気になった点としては、pay-per-viewの取扱いと外部リポジトリ連携。
pay-per-viewについてはユーザーごとに残件数を把握することは可能であるものの、どれをpay-per-viewで購入するのか、という管理までは難しいとのこと。まあそうだろう。

ただ、コスト計算の結果、年ごとにジャーナル単位で買ったり論文単位にしたり、という運用が想定されるので、pay-per-viewを自動的に管理するような仕組みは将来的に欲しい。Elsevierのように、年ごとにまとめ買いできるところは情報を提供してもらいたいところ。
外部リポジトリ連携は、Almaは内部でトータルな環境を整備する方向性なので、外部リポジトリ連携機能は実装していないとのこと。ここは大規模大学はともかく、中小規模の大学ではかなりのネックだろう。
(逆に既存のリポジトリ(JAIRO Cloud?)をすっぱり諦めるという選択肢もなくはないが。。。)

11/24 「データリポジトリに求められる要件」記事メモ

先週にカレントでも取り上げられてた記事、気になったので読んでみた。

Unified Requirements for Core Certification of Trustworthy Data Repositories(ICSU-WDS,2016/11/25)

https://www.icsu-wds.org/news/news-archive/wds-dsa-unified-requirements-for-core-certification-of-trustworthy-data-repositories

WDS and DSA Announce Unified Requirements for Core Certification of Trustworthy Data Repositories developed through the RDA DSA?WDS partnership Working Group(RDA,2016/11/24)

https://www.rd-alliance.org/wds-and-dsa-announce-unified-requirements-core-certification-trustworthy-data-repositories-developed

※今気づいたけども、WDSの文書なのにRDAのほうがリリース日が早いという。。

 

本文書は、「信頼できるデータリポジトリ」のミニマムな要件につき、RDAのワーキンググループ活動の一部として、WDSとDSA (Data Seal of Approval)のメンバーが共同でまとめたもの、とある。

Core_Trustworthy_Data_Repositories_Requirements_01_00.pdf - Google ドライブ

目的は"Background & general guidance"にもあるように、出来るだけ最低限の要件に絞ったチェックリストを提供し、コンプライアンスのためのデータリポジトリ評価を行うこと(5段階評価)。

0 - not applicable

1 - the repository has not considered this yet

2 - the repository has a theoretical concept

3 - the repository is in the implementation phase

4 - the guideline has been fully implemented in the repository

完成後はWDSのレギュラーメンバー間の認証でも使うようだ。

-----

内容は、

・Background & general guidance

・Glossary of Terms(別ページ)

Core_Trustworthy_Data_Repositories_Requirements_Glossary_2016-11.pdf - Google ドライブ

・Requirements

 - Background information

 - Organizational infrastructure

 - Digital Object Management

 - Technology

の構成で、特に"Requirements"についてはテーマごとにさらに16章に分かれ、全章に丁寧なguidance文がついている超大作。極め付きに、リポジトリは3年ごとに再評価を求められることになる、とある。これ評価を受けるほうも相当大変だろうな。。。

章ごとに細かい注意点は異なるものの、全体を通じた評価基準としては

①明文化されているか

②履歴を残しているか

③専門家のチェックを受けているか

④持続可能性は担保されているか

の4点に集約できそう。信頼性 ≒ 検証可能性+専門性の裏打ち、ということなんだろう。パブコメを経て2機関でテストする、とプレスリリースに書いてあるので、(この評価基準自体の持続可能性も含めて)注目しておきたい。

 

気づけば前回の記事から1か月。。。

Crossref / DataCite / ORCIDの機関IDの記事とか、メモしておこうと思えどなかなか進まず。そのうち遡及して書きます。多分。

ヨーロッパのresearch libraryによるResearch Data Services調査

10/26 SPARC Japanセミナーの際に某氏から教えてもらった記事、やっと探す時間が取れた。ヨーロッパのlibraryでの研究データへの関与方法について。
 LIBERによるヨーロッパ諸国22カ国を対象とした調査で、代表的なAcademic Research libraryで行われている研究データ関連のサービスを調査。結果、
 ・Libraries are currently offering more consultative-type RDS services (eg. how to find information on Data Management Plans, metadata standards, or data citation practices) than technological services (eg. own storage solutions);
→ Libraryが主として提供するサービスはソフト面(データ管理計画、メタデータ、データ引用に関する実践例の提供など)が多い。ストレージなどのインフラ面は次点。
 ・Less than half of libraries say their institutions currently have policies relating to RDS;
→ 少なくとも半分以上のlibraryが、機関として研究データサービスに関するポリシーを持っていると答えている。
 ・Two-thirds of library directors express strongly that libraries need to offer RDS to remain relevant.
→ 3分の2のlibrary directorは、libraryは研究データサービスに関与し続ける必要あり、と強く考えている。
 とのこと(そうとう意訳だが)。
個人的にも(ぼんやりとではあるが)、ストレージとかリポジトリソフトウェアとかの問題は研究者が自分たちがやりやすいようにやるだろう、という実感があったので、一番目の結果には大変納得。日本でポリシーの問題が本格的に検討されるのは結構になりそうな気がするので、ソフト面の展開をまずは考えたい。

9/29 ORCID学会コンソーシアム検討会へ参加しました

最近国内大学の機関参加が出始めたORCID、コンソーシアム参加だと価格も安くなることから「早く大学図書館で始まらないかな~」と思っていたところ、学会で検討会を開く旨を聞きつけて参加してきました。参加者は大体20人くらいだったはず。18:15開始という微妙に非公式設定。

 

当日の資料は以下。村山先生のものは後日もらった。

www.slideshare.net

www.slideshare.net

 

もう一つ、呼びかけ人であるUniBio Pressの永井さんのものはWeb公開されていないので割愛。「学会は、なぜあるのか」という熱意にあふれたスライドだった。

内容としては、ORCIDの宮入さんからコンソーシアム成立条件や事例の紹介、永井さんから学会がORCIDを導入する意義と呼びかけがあり、NICTの村山先生からはオープンサイエンスの潮流の中のORCID+この検討会に期待すること、みたいなお話。

今回は時間が少なかったこともあり、具体的な検討にまでは踏み込まなかった(懇親会で少し話したのか?)。なので感想も書きづらいが、コンソーシアム条件で記憶に残ったこととしては、

 

・コンソーシアムで参加した場合、サポートの窓口が一本化される

→ 参加館は窓口を通してしかORCIDのサポートが受けられなくなる。単なる使い方相談だけでなく、API活用のためのフォロー等もサポートに入ってくるため、窓口の役割は結構重い。これを嫌ってコンソーシアムに参加しない海外事例もあるとか。

・機関参加のための負担額はコンソーシアム内で自由なので、政府機関が一括で払っている場合もある。ただし、きちんと責任を負う意味で全参加機関に契約書を書かせている。(別に契約書名義は一本でも問題ないとのこと)

→ サポート窓口の問題もあり、参加館にはそれなりに自分でやる気概が求められるはず(当たり前の話ではあるが)。さすがに中央集権はきつい。

 

あと、村山先生の「日本では、サイエンスを支える基盤となるべき学会、図書館、研究者等のネットワークが分断されている」といった趣旨の発言は非常に印象的だった。

その意味では、ORCIDやDOIのような識別子を介した繋がりはあっても良いかもしれない。例えば、図書館と学会でコンソーシアム組んで運用の役割分担するとか。

ということを思ったので発言だけはしてみたものの、正直図書館側がどう出るか良く分からない。コンソーシアムの話は出ているようだけども、どんな感じで進むんだろうか。