Blank Cover Image

軽度難聴者との対話支援用音声認識・提示システムの開発

フォーマット:
論文
責任表示:
船田, 哲男 ; Funada, Tetsuo
言語:
日本語
出版情報:
金沢大学自然科学研究科, 2008-05
著者名:
掲載情報:
平成19(2007)年度 科学研究費補助金 基盤研究(C) 研究成果報告書 = 2007 Fiscal Year Final Research Report
巻:
2006-2007
開始ページ:
19p.
バージョン:
author
概要:
本研究は、加齢に伴う難聴などに由来する軽度の聴覚障害者が、音声による対話を行う際に、文字情報を同時表示することにより、聞き返しを減らしてスムーズに対話を進めることを支援するシステムの作成を目的とする研究である。目的からして、システムは小型軽量が望ましく、当初カスタムLSIとマイクロディスプレイの組み合わせで構成することを意図したが、モバイル型の汎用パソコンが小型化されてきているので、マイク内蔵されたモバイルパソコン上でシステムを構築することとした。18年度に行った音声認識は基 本的には単語単位の認識を行っていたのでものであったが、そのため登録されていない単語は認識できない不便性をもつため、特定話者の音声に限定してはいるが、認識対象を任意の音節(かな)も認識できるシステムに拡大した。19年度では、音節の系列を音声指令で「かな漢字変換」する実験を行った。その結果、キーボード操作を介さないで任意の文章をモバイル型のディスプレイ装置に提示できるシステムを開発した。また、音節の誤認識が発生する問題に対処するため、音節認識結果の第2候補まで提示し、音声指令で第2候補の音節を採用できる方式を組み込むことにより、誤認識による煩わしさを軽減することができた。しかし、音節あたりの認識時間と誤認識率にはトレードオフの関係があり、誤認識を低く保ちながら認識時間を短縮できる技法を考案することが実用化に向けての課題である。これらの成果の一部については、通信と情報技術に関する国際ワークショップ(ISCIT07)や電子情報通信学会の音声研究会で発表した。<br />This research is to develop a dialog support system for persons such as age-related hearing loss via speech recognition and character display. For this purpose, the system is expected to be small and light. At the beginning of this research, we intended to design the system with combining custom ISI and micro-displays. However since mobile computers with a built-in microphone recently have come onto the market, we changed to implement the system on a mobile computer.At the beginning in 2006, the system was designed to recognize only the pre-registered words, so it shows inconvenience that unregistered words cannot be recognized. Therefore, we improved the system by making it recognize all Japanese 101 syllables (kana). In this case, dialog partner has to speak syllable by syllable and the system display the recognized syllables one after another. It has also inconvenience that the system can display contents of dining by a sequence of only kana character so difficult to read fir the haul of hearing.In 2007, we improved the system in the following three points. The first is to decrease recognition error by incorporating new algorithm to extract noise-robust speech feature proposed by us. The second is to incorporate the "kana to Chinese character conversion" in the system, the command of which is also ordered by speech The third is to make the system display the ascend candidate of recognition, and can select the second one in case of mis-recognition of the first candidate. This selection command is also acceptable by speech. By making the system be possible to operate only by speech command, it has become convenient to use.Further improvement is desired in recognition speed and recognition error.Parts of these results have been presented at technical committee on speech of Acoustic Society of Japan and the Institute of Electronics, Intimation and Communication Engineers, and International Workshop on Communication and Information Technologies (ICSIT07).<br />研究課題/領域番号:18500127, 研究期間(年度):2006-2007<br />出典:「軽度難聴者との対話支援用音声認識・提示システムの開発」研究成果報告書 課題番号18500127 (KAKEN:科学研究費助成事業データベース(国立情報学研究所))   本文データは著者版報告書より作成 続きを見る
URL:
http://hdl.handle.net/2297/00057105
タイトル・著者・出版者が同じ資料

類似資料:

1
 
2
 
3
 
4
 
5
 
6
 
7
 
8
 
9
 
10
 
11
 
12
 

中野, 智崇, 朴, 虎崗, 船田, 哲男, 北川, 章夫

情報処理学会

金寺, 登, Hermansky, Hynek, 荒井, 隆行, 船田, 哲男

情報処理学会

小畑, 秀文(1943-)

日刊工業新聞社

4 図書 音声認識

篠田, 浩一, 講談社サイエンティフィク

講談社

鹿野, 清宏

オーム社

5 図書 音声認識

今井, 聖(1937-)

共立出版

河原, 達也

オーム社

6 図書 音声認識

新美, 康永, 北川, 敏男(1909-)

共立出版

Rabiner, Lawrence R., 1943-, Juang, B. H. (Biing-Hwang), 古井, 貞煕(1945-)

NTTアドバンステクノロジ