KONDO LAB

近藤研究室は音声や音響、マルチメディアを中心に、 人々をあっと言わせるような、面白いアイデアを実現するべく日夜研究しています。

主な研究テーマ

三次元音響を用いたナビゲーションシステム

近年、カーナビなどの視覚情報を用いたナビゲーションシステムは一般に広く普及しています。 一方で、視覚障碍者や自転車走行中に利用できるナビゲーションシステムは極めて少なく、一般的ではありません。 そこで、ナビゲーション音声に頭部伝達関数を畳込み、三次元音響化することで方向性を持たせ、 音声情報のみでナビゲーションを行うシステムを検討しています。 また、音声を用いるため、自転車で使用可能な、環境音を取得できるイヤホンの研究も行っています。

能動音制御

近年、無線通信網の整備、携帯電話の普及に伴いいつでもどこでも通話が可能となった一方で、 会話音声が周囲に放射され騒音となると共に、会話内容の漏洩も問題となっています。 また、近年音声認識システムがPC等への入力方式として、その精度の向上と共に本格応用される可能性が出てきました。 本研究では能動騒音制御方式を音声信号に応用し、放射音声量を削減することを目的としています。

Bluetoothを用いた屋内測位システム

新しい日本語単語了解度試験方法の開発

日本語で最も一般的な明瞭度評価方法は日本語の単音節を聴取させ、正解を選ばせるものでした。 しかし 100種類もの日本語音節から正解を選ぶのは困難であり、 疲労、個人差、ノイズ混入、伝送特性等の影響を受けやすく、かつ不安定であることが指摘されていました。 これに対して、英語では先頭1音素のみ異なる単語対を聴取させ、正解をこの2つから選ばせることで、安定した評価を得ています。 そこで、日本語においても同様の手法を開発し、安定かつ系統的に明瞭度(単語了解度)を評価することを目標としています。 また、音声認識システムを用いた了解度の客観的推定方法も同時に目指しています。

音声・音響信号への電子透かしの埋め込み

ネット容量の飛躍的な増加等により、音声、画像、音楽等のディジタルコンテンツがネット上を大量に流れるようになりました。 しかし、この中には著作権を無視した違法データも 少なくありません。 そこで、著作権情報を通常は検出できないようにコンテンツに埋め込む技術がが電子透かしです。 また、ここでは外部からの攻撃などに対しても頑強で検出困難な音声用電子透かし埋め込みの開発を目指しています。