丸橋 広夢
日本人の5人に1人が睡眠に問題を抱えているといわれているが、睡眠専門医の不足により専門外の医師が診察することも多い。そのため非専門医の診断を補助するツールの整備が急務となっている。本研究では、太田睡眠科学センターで使用されている初診時アンケートの回答(118項目)と医師の診断結果を用い、機械学習による睡眠障害予測モデル構築と性能向上を目指した。学習用データセットは、特定の疾病の患者数が極端に少ない「不均衡データ」であり、さらに100項目を超える「高次元データ」であるという二つの問題点を有している。これらの問題に対処するため、オーバーサンプリング手法 SMOTENC と特徴量選択手法 RFECV を組み合わせた機械学習を試み、その有効性を検証した。