房 福明, 篠崎 隆宏, 堀内 靖雄, 黒岩 眞吾, 古井 貞煕, 武者 利光
電子情報通信学会技術研究報告. SP, 音声 111(431) 97-102 2012年2月2日
身体的なハンディキャップにより意思疎通が難しい者,特に筋萎縮性側索硬化症(ALS)の患者に対し,代替となる効率的なコミュニケーション手段を提供することを目的として,眼電位を入力とした音声合成インタフェースを提案する.眼電位は眼球が弱い電池であることに起因し,目の周囲に生体電極を配置することで検出できる.提案システムでは,音声認識を応用した認識器を用いて連続した眼球動作を眼電位信号から認識し,その結果をもとに実時間で音声合成を行う.本論文では,このうち認識部について評価を行う.認識器の動作には,予め眼球動作と眼電位の関係を学習した隠れマルコフモデルを用いる.実験では,ユーザ自身から収録したデータを元にモデルを作成することで,平均して95.7%の高い認識精度が得られることを示す.この方法で作成した眼電位のモデルは,基本的にそのユーザ専用となる.しかし実用の観点からは,不特定のユーザに対して動作することが望ましい.そこで,眼電位モデルの個人差による認識性能への影響や,その影響を低減するための適応化手法についても検討を行った.音声認識における話者適応化手法を応用することで,眼電位の認識精度が向上することを示す.