引用関係の重要性に基づく重要文献群の推定手法

合田 慎

修士学位論文, 2012

Abstract

近年,情報技術の発展,情報インフラの普及に伴い,研究に関する文献情報をインターネットを介して取得することが容易になっている.一方でその数は急速に増加しており,研究者はその膨大な情報の中から最新の研究動向を把握するとともに,未知の研究領域を開拓していく必要がある.研究動向の把握や新規研究の着手には,現在流行している学術分野やその分野に関する重要文献などについて調査することが必要となる.その手段として従来から文献引用ネットワークを利用した解析が広く行われている.一方で,文献の重要性の捉え方は研究者によって様々である.既存研究の多くは,文献の重要性を評価する指標として最も単純な直接被引用数を用いている.直接被引用数は,他の文献からの注目度を重視する場合に有効な指標であると考えられる.一方で,直接被引用数は,引用元の文献の重要性が均一であると想定しており,さらに間接的に引用された文献に対する影響を考慮できない.そのため,重要な文献を適切に高いスコアで検出可能かという点では疑問が残る.前者の課題に関して,PageRankやArticleRankといった引用関係を元に文献の重要性を規定する指標が提案されている.ただし,これらの手法では文献引用ネットワークの構築方法に起因する潜在的な問題のため適切に文献の重要性を規定できない可能性がある.また,直接被引用数における後者の課題に関して,直接的な引用だけでなく間接的な引用も考慮することで原文献のその分野に対する影響の度合いを測ることが可能となる.一方で,我々の知る限りではそのような視点を考慮した文献の重要性を評価する有効な指標は提案されていない.そこで本研究では,間接的な引用も考慮した指標を新規に提案する.さらにPageRankやArticleRankといった既存指標における問題点の解決策も合わせて提案する.ここで,研究は共通する分野に対して多数の研究者が平行して行うものであり,重要な文献は一つとは限らない.また,分野の中には,着目点やアプローチの違いによりさらに複数の小規模な分野(小分野)に分割できる可能性がある.そこで,本研究では,各重要文献がそれぞれどの小分野に属するかや,その小分野がどの程度流行っているかということを把握するために,クラスタリングによる重要文献群の推定を行う.流行している小分野の特定に関して,既存研究では専門家が手動で分析しているのが現状であるが,本研究ではその部分の自動化についても考慮する.クラスタリングに関しては,既存手法の他に,文献単体の重要性評価の結果を既存手法に応用することで,既存手法では得られない有用性のある小分野構築を行う.本研究では,現実に存在する文献を対象に文献引用ネットワークを構築し解析を行うことで,各重要性評価指標においてどのような重要文献が定義されるかや,流行の学術分野がどのように推定されるかについてケーススタディを行う.

Downloads

    Text Reference

    合田 慎, 引用関係の重要性に基づく重要文献群の推定手法, Ph.D. Dissertation, 大阪大学, 修士学位論文, March 2012.

    BibTex Reference

    @phdthesis{gouda12mthesis,
        author = "合田, 慎",
        type = "{修士学位論文}",
        title = "{引用関係の重要性に基づく重要文献群の推定手法}",
        year = "2012",
        month = "March",
        school = "大阪大学"
    }