ソフトウェア工学研究の日々

ソフトウェア工学の学術研究を紹介しています。ソフトウェア開発に関する調査と実験が大好きです。

文献管理ソフトウェアを使いましょう

文献管理ソフトウェアが必要な理由

研究成果を論文にまとめるとき、研究の動機の説明や、既存技術との比較を行うために、参考文献の引用が不可欠です。ソフトウェア工学研究室で修士論文を書く場合、少ない人で10件、多い人だと40件ぐらい、文献の引用を行うことになります。

 参考文献は、研究を進めるにつれて増えていきます。指導教員が知っている最新の研究や、研究室の先輩の過去の発表を最初の手がかりとして、それらの研究に至るまでの過去の経緯を調べたり、国際会議で新しく発表された論文や、検索して見つけた関連技術の情報などを集めていくことになります。

 ここで重要となるのが、参考文献の既読管理です。ソフトウェア工学界隈に限らないのかもしれませんが、最近は論文誌への投稿と同時に投稿版原稿を公開したり、国際会議の開催前にプレプリントとして採録済み原稿を配布する人が多くなっています。そうすると、論文を検索エンジンで見つけてから1年後に実際の論文誌の出版が行われ、その内容をさらに国際会議での発表(Journal-First 発表と呼ばれます)として再発見する、といったことが起こります。自分が読んだものをきちんと記録していないと、論文を読んでいる途中でようやく過去に読んだ論文と同じであることに気づくといった時間の無駄が発生します。また、文献を引用するときになって、実際の記述がどうだったかを再確認したくなることもしばしばありますから、自分が確認した PDF をきちんと保管していなければ、論文誌などの Web サイトからダウンロードしてくるところからやり直しとなってしまいます。

 文献管理ソフトウェアは、自分が集めた論文の PDF と文献引用のための書誌情報を管理し、上記のような作業の負荷を軽減してくれるツールです。本格的に論文を読み進める必要があると感じたら、ぜひ使ってほしいツールでもあります。世の中には複数の文献管理ソフトウェアがありますが、学生が修士論文で集める程度の利用規模であれば、無償で使えるものも多くあります。

おすすめは Zotero と Mendeley

 ツールの利用には、かなり好みが入りますが、筆者は Zotero を使っています。他に勧められるものとしては Mendeley を挙げます。これら2つのソフトウェア、Windows 版での話ですが、共通してできることは以下の通りです。

  • Web ブラウザ用のプラグインを使うと、ACMIEEE などの Digital Library を開いた状態から、直接 PDF と引用のための情報をデータベースに取り込めます。
  • 文献の出自(DOIなど)が分かる PDF をドラッグ&ドロップで放り込んでも、書誌情報を自動で探して取り込んでくれます。
  • 取り込んだ文献をダブルクリックすれば PDF を開くことができます。
  • 取り込んだ文献を選択して「BibTeX としてコピー」といった名前の操作をメニューから選ぶだけで、引用のための文献情報を取り出すことができます。
  • PDF などのデータをクラウドサーバ上に保管し、PC間で同期してくれます(DropboxEvernote などと同様です)。

 これらの機能だけで文献の PDF をいつでも参照できるようになりますし、引用するときに必要な BibTeX も簡単に取り出せるようになります。Zotero には、これに加えて、以下のような便利機能があります。

  • 1つの文献情報に、複数のファイルをドラッグ&ドロップで簡単に関連付けられます。たとえば発表スライドを一緒に保存しておけます。
  • ファイルの関連付けと同じ仕組みで、テキストメモを論文に付けることができます。このメモは、 文献情報(BibTeX 形式)の一部としていつでもツール外に取り出すことができます。
  • 文献に子要素としてテキストメモやファイルがぶらさがっているので、それらをドラッグ&ドロップだけで別の文献情報に移動できます。そのため、たとえばプレプリントに対応する出版された版を発見したときに、論文のテキストメモだけを移動して付け替えるといった編集操作が容易です。
  • ドラッグ&ドロップで PDF を簡単にファイルとして取り出せます。

 研究室では Slack で参考文献の PDF ファイルをやり取りすることが多いため、筆者の場合は、このドラッグ&ドロップでの操作が非常に便利であると感じます。Mendeley は、どちらかというとファイルを取り込んだら Mendeley 利用者間でのみ共有することを想定しているようで、ファイルの取り出しにはエクスポート機能をわざわざ呼びだす必要がありました。

 筆者の場合、Mendeley を使い始めてそれほど時間が経つ前に Zotero を見つけてしまったので使い込むには至りませんでしたが、Mendeley にも特有の強力な機能があります。

  • PDF を全文検索することが可能です。キーワード列を入れると、各 PDF ファイルのどこにマッチしたのか、その文章の内容まで論文一覧画面に一緒に表示してくれるます。これが、蓄えた文献の中から必要なものを探すときだけでなく、英語で論文を書いているときの文例の確認にも使えます(Zotero では書誌情報に書かれた Abstract やテキストメモの検索まではできますが、PDF 内の本文は検索できません)。
  • PDF 内部に注釈を簡単に書き込むことができるので、後から論文を読み直すときに注目すべき場所などにマークをしておくことができます(この注釈は検索の対象外という制限はありますが)。

 Zotero と Mendeley を比べてどちらが良いかというと、どの機能を重視するかによります。また、機能的な違いに加えて、ツールのユーザインタフェースにもかなりの違いがあります。2つのソフトウェアは1つのPCに共存できるので、いくつか手持ちの PDF ファイルをこれら2つに実際に登録してみて、その挙動を確認してみると良いのではないかと思います。個人的には、Zotero のほうが、同期機能でどこに何が保存されるか、データのバックアップをどのように行えばよいかなど、システムとしての挙動が把握しやすいという印象ですが、そういうところまで含めて好みがあるので、自分の判断でしっかり選んでみてください。