研究室配属をひかえた3年次生のみなさんへ

研究室配属をひかえた3年次生のみなさんへ




はじめに
みなさん,こんにちは. 情報数理工学研究室は2008年4月に設立された研究室です (2015年3月までは情報統計力学研究室という名前でした). このページは研究室配属をひかえた3年生のみなさんに 情報数理工学研究室について知ってもらうことを目的としています. 内容は随時充実させてゆく予定ですが, 研究室配属にあたって参考としてもらうため, とりあえず必要最低限の情報を提供します.

研究の概要
物理学の一分野である統計力学で開発された 計算手法を使って情報の問題にチャレンジする研究の枠組みを 「情報統計力学」と呼びます. 本研究室では学習,連想記憶,誤り訂正符号,暗号,信号処理,画像処理などいろいろな 情報の問題を対象に理論的,実験的アプローチを試みています. また,最近はドローンなどを対象に制御の問題にも取り組んでいます. 研究の具体的な作業は などです.高校数学+α程度の数学の知識 (積分計算や確率統計)とプログラミングの基礎知識が必要となりますが, 研究を進めながら勉強していけばいいですし, 各学生の能力に応じた指導を行いますので心配は不要です.

以下,研究テーマに関してごく簡単に書きますが, これだけでは研究内容を十分に伝えることができません. 研究の詳細についてもっと深く知りたい人は 研究業績のページでリンクをたどってみてください. 特に 国内学会口頭発表の比較的最近の発表の pdf,slide,posterが参考になると思います. あるいは三好への直接相談も大歓迎いたします. その場合はあらかじめ miyoshi@ までメールで連絡をください (@の後ろに kansai-u.ac.jp をつけて下さい).


情報統計力学
物理学の一分野である統計力学(統計物理)の計算手法を使って 情報の問題にチャレンジする研究の枠組みは「情報統計力学」と呼ばれ 近年注目されています. 情報統計力学が対象とする情報の問題は 学習,連想記憶,誤り訂正符号,暗号,信号処理,画像処理など多岐にわたります. (参考pdf



学習
観測データだけを使って,その背後にあるデータ生成過程をモデル化すること を学習と呼びます.たとえば,赤ちゃんがだんだん 男女の顔を識別できるようになってゆく過程などがこれにあたります. 本研究室では時間的あるいは空間的な観点で興味深く,また統計的 学習の基礎理論と応用の両面への波及効果が大きいと思われるいろいろなモデル について統計力学的手法を用いた解析を行っています.その結果は 「生徒が集まればどれだけ賢くなれるか ?」, 「生徒は教師より賢くなれるのか ?」, 「教師の数は多い方が良いのか ?」 など統計的学習と人間社会のアナロジーの点からも 興味深いいくつかの問いに対して理論的な観点から 示唆を与えるものです.




連想記憶
コンピュータのメモリはアドレスで管理されています. しかし,生物の脳の中にはアドレスに相当するものはありません. 脳の中では膨大な数の神経細胞(ニューロン)が互いに結合しており, 脳の中の記憶はこの結合の強さとして分散表現されていると考えられています. 本研究室では生物の脳を単純化したモデルについて 想起のダイナミクスや記憶容量に関する研究を行っています. (左はヒトの脳の模型,右は連想記憶モデル)
  


信号処理
自動車の中で音楽を聴く場合を考えると,エンジン音は雑音となります. この雑音を軽減するために,従来はエンジンルームとキャビンの間に吸音材を 詰めるような,いわば“パッシブ”な方法を採っていました. しかし,近年,ディジタル信号処理のハードとソフトの進展により, 雑音と逆位相の音を作って,音で音を消す“アクティブ”な方法も 使われるようになっています.本研究室では適応信号処理と 呼ばれるこのような技術について理論的な性能解析を試みています.


画像処理
あらためて言うまでもなくコンピュータによる画像処理は 長い歴史を持っており,すでに広範な技術が開発されています. 本研究室では人間の視覚に関する知見と統計的手法を用いる 切り口で画像処理に取り組み始めています.

人工衛星による地球表面の画像,電子顕微鏡による分子レベルの拡大画像, CTやMRIによる医療画像・・・,私たちが入手できる観測画像は 大なり小なり雑音の影響を受けて汚れています.本研究室では 統計的学習の手法を用いて観測画像から原画像を復元する研究をしています. 通常,私たちが目にする画像は,隣り合う画素の値はそれほど 違わないという性質を持っています.しかし,物体による遮蔽などがあると 画素値が急激に変化してエッジになります.これらの性質をある種の統計モデルで表し, エッジの復元と雑音の除去という相反する推定作業を同時に行います. エッジの復元を行うと画像がいくつかの領域に分割されますが, その結果は一枚の二次元画像から三次元の奥行き方向を知る大きな手がかりとなります. つまり,我々が取り組んでいる画像処理は,網膜という二次元センサーで得られた 視覚情報から脳がいかにして三次元世界を再構成しているかを深く考察する 研究であるということもできます. また,観測データの背後にある潜在構造を抽出するという科学の普遍的枠組みを 画像処理に適用した研究であるとも言えます. 処理の過程で計算量が爆発する困難に 突き当たるのですが,これを変分ベイズ法や確率伝搬法といった 統計的学習の新しい手法を使って克服します. 紙と鉛筆による解析計算と コンピュータ上での数値実験がしっかりかみあったときに初めて美しい結果が現れ, 知的な喜びと興奮が得られる,そんなところがこの研究の醍醐味でありやりがいです.

画像処理のもうひとつの題材として超解像を扱っています. 超解像とはカメラ等の撮影機器が持つ物理的限界を超えて高解像度の画像を生成すること を言います.本研究室では具体的な作業として,まず原画像を用意し, それに平行移動,回転,ボケ,ダウンスケール(解像度の低下), ノイズの重畳を施すことにより劣化画像を複数枚作ります.その後, この複数枚の劣化画像だけを使って原画像を推定します. 現在は先行研究 (京大・石井研究室の研究) の追試を行っている段階ですが,すでに興味深い結果も得られています. 下の図は左が原画像,真ん中が劣化画像,右が推定画像を表しています.


深層学習による画像生成
生体の脳に学んだ学習機械である人工神経回路網(ニューラルネットワーク) の研究は長い歴史を持ちますが,実問題への応用はなかなか進みませんでした. しかし,深層学習(ディープラーニング)の登場により,音声認識,画像認識, 機械翻訳など多くの分野において実問題への応用が進み, 場合によっては人間の能力をしのぐ性能を達成することが可能になりました. 一方,敵対的生成ネットワーク(GAN)は生成器と識別器が敵対的に学習することで 画像などのパターンを人工的に生成できる興味深い技術です.


下の図は深層学習をGANに適用して,実画像の笑顔化を試みた結果です. まず,GANにより人工的な顔画像を大量に生成します.次に,生成された顔画像から 潜在空間内で笑顔成分を抽出します.この笑顔成分を人工顔画像に 加算することにより人工顔画像と人工笑顔画像のペアを大量に準備します. 最後にこれらをデータとして深層ニューラルネットワークを学習することにより 実画像の笑顔化を実現しています.左が実在の人物の顔画像,右がそれを笑顔化した 顔画像です.


制御と機械学習
多数のドローンを飛行させるときには,ドローン同士が衝突しないような 飛行制御を行う必要があります.下の動画はボロノイ分割という手法を用いて 4台のドローンが互いに衝突することなくそれぞれの目標位置まで移動していく ようすを表しています.


また,最近のドローンはカメラを搭載しているので,飛行中に取得するリアルタイムの動画像を 機械学習(ディープラーニング)と組み合わせることによりリアルタイムの物体検出 を行うことも可能です.下の写真とビデオはその結果を表しています. 画像認識の結果として, 「人間」,「イス」,「携帯電話」が表示されています.ビデオではドローンに 宙返りもさせています.
  





そのほか