演題番号 | 1E2-02 |
---|---|
題目 | 多方向の唇画像を利用した音声認識 |
著者 | 山口 健 (京都大学大学院情報学研究科知能情報学専攻) 山本 俊一 (京都大学情報学研究科知能情報学専攻) 駒谷 和範 (京都大学大学院情報学研究科知能情報学専攻) 尾形 哲也 (京都大学大学院情報学研究科知能情報学専攻) 奥乃 博 (京都大学情報学研究科知能情報学専攻) |
時間 | 6月2日(水) 11:30〜11:50 |
概要 | 音声認識の問題点である雑音への脆弱性を克服する手段として画像情報を用いる方法がある。本稿では画像情報から口形索を抽出し、音声情報と統合することで音声認識を行う。また画像の撮影方向に関する考察を行う。 |
論文 | PDFファイル, PDFファイル(会場ローカル) |