P2Pファイル共有システムにおける高頻度流通ファイルの実時間計測

松森 智哉

学士学位論文, 2009

Abstract

ピュアP2P型ファイル共有システムでは,ファイルの検索から取得までの処理を関係するノード間で直接行うことから,クライアントtextendash サーバ型システムに比べてシステム内で負荷を分散でき,また一部のノードの停止に対してもサービスを継続できるという利点がある.しかし,システムを管理するサーバが存在しないため,システム内の状況やシステムの挙動を把握・制御することが非常に困難である.本報告では,ピュアP2P型ファイル共有システムの一つであるWinnyに着目し,Winnyネットワークにおいて実時間でファイルの流通状況を把握する計測システムの設計,実装を行い,実証実験を基に性能を評価した.Winnyでは,各ノードから申告された回線速度(申告回線速度)に基づいて階層的なネットワークが構築される.すなわち,申告回線速度の速いノードほど上位の階層に位置する.さらにこれら上位層のノード群にファイルのメタ情報(キー)が集まりやすくなる仕組みが導入されている.この特徴を利用し,ユーザはファイル名に含まれると予測されるキーワードを指定した検索要求を上位層のノード群まで届けることで所望のファイルの発見を試みる.キーを収集した検索要求は辿った経路を逆順に検索元に返送され,経路上のノードには収集したキーが複製される.本研究では,実測用ノードを実際のWinnyネットワークに導入し,この検索要求に含まれるキーを収集する.収集したキーに対して頻出キーを実時間で検出することで,高頻度流通ファイルの計測が可能となる.その結果,人気ファイルのランキングの時間変化を調べることができるだけでなく,近年Winny内で引き起こされている社会的問題への解決への糸口となる可能性がある.社会的問題の例としては,違法ファイル共有による著作権侵害,ウィルス・スパイウェアの蔓延,機密情報や個人情報の流出などが挙げられる.これら社会的問題に対する対策として,既存研究においてファイルの拡散防止方式が提案されている.もし共有開始直後の高頻度流通ファイルを早期に検出できれば,拡散防止方式と組み合わせることで,ファイルの拡散の規模を大幅に縮小できると考えられる.頻出キーを実時間で検出する計測方式は,データマイニングの分野で提案されているFREQUENTアルゴリズムを基に提案する.さらに本計測方式を含めたシステム全体を設計・実装する.計測システムは,検索要求の送受信・転送,計測方式に基づくキーの分析などの機能からなるが,いずれも計測の実時間性と効率性を考慮し,設計・実装を行う.計測システムを備えたノードを実測用ノードとしてWinnyネットワークに導入し,実証実験を行った結果,計測システムにより定常的にキーを収集できることを示す.さらに,高頻度流通ファイルの時間変化を実時間で詳細に把握できることを示す.

Downloads

    Text Reference

    松森 智哉, P2Pファイル共有システムにおける高頻度流通ファイルの実時間計測, Ph.D. Dissertation, 大阪大学, 学士学位論文, March 2009.

    BibTex Reference

    @phdthesis{matsumori09bthesis,
        author = "松森, 智哉",
        type = "{学士学位論文}",
        title = "{P2Pファイル共有システムにおける高頻度流通ファイルの実時間計測}",
        year = "2009",
        month = "March",
        school = "大阪大学"
    }