東北工業大学経済交流会 東北工業大学

音響工学について


演 題  「音響工学について」
講 師  東北工業大学   通信工学専攻教授 古賀秀昭先生
平成 13年 3月 22日(木)
於:ブラザー軒

◎音響工学について
1.定義:音響学(Acoustics)
   音に関する科学。音の発生、伝搬、および音によって引き起こされる諸現象を含む。
   これらの諸現象を工学的に取り扱う字間。
2.分野:日本音響学会の研究発表会の分科会の数と内容は、
   @超音波
   A水中音響
   B騒音・振動
   C建築音響
   D音声−−>音声分析、音声認識、音声合成
   E電気音響
   F聴覚
   G音楽音響
3.各分野の変遷
   ◎特徴:全体の件数も増えているが、特に音声関係が飛躍的に増えている。
4.各分野の内容
  @超音波:超音波メス、超音波溶接器、超音波断層法、
    超音波治療器、超音波モータ、超音波洗浄器
  A水中音響:ソナー
  B騒音:騒音計、騒音性難聴、新幹線騒音、交通騒音、騒音予測、近隣騒音
  C振動:新幹線振動、自動車による振動
  D建築音響:無響室、残響室、残響付加装置
  E音声:主に人の発する意味のある音波を指す。詳細は後述
  F電気音響:音響機器(マイクロホン、スピーカ、イヤホン、CD、DATなどいわゆるオーディオ、最近はMDやDCCも開発されて実用化されている。切手代の大きさで2時間のディジタル録音再生のできるものが発売されている)、SACD、DVD−A、ステレオ、サラウンドステレオ、音源位置推定、雑音(騒音)制御、 騒音消去(バイクや自動車のマフラーなど)
  G聴覚:5感(味覚、触覚、視覚、嘆覚、聴覚)の内のひとつで音を聞く能力。心理学や生理学等と深い関係がある。:方向知覚、可聴周波数(20〜20kHz)、可聴音圧レベル[O dB(1microW/u)〜120dB(1W/u)]、マスキング効果、カクテルパーティ効果、位相は感知できないという説が有力。
  H音楽音響:ギター、三味線、梵鐘、ピアノの研究などを通じて人工的な音を作ることもある。シンセサイザー、電子ピアノ、エレキギター
5.音声
  @音声認識:音声に含まれている情報を機械的な手段で抽出することを音声認識と呼ぶ。:音声によるコンピュータとの対話、コンピュータ、ワープロ等への音声入力、(将来)自動通訳装置の認識部分、新幹線切符予約、近鉄での音声による切符販売(試作品有り)、音声ダイヤル電話(一部商品化)、犯人の推定、身体障害者の自動車の運転、音声タイプライタ、銀行等の預貯金の音声引き出し。IBMのVia Voice
  A音声合成:電話番号案内、炊飯器、自動車の警告音声、電気洗濯機、(将来)自動通訳電話の音声発声部分、預貯金の引き出し・預け入れ時の対話

◎音声認識について
1.音声認識(Speech Recognition)の必要性
 人間同士の意志疎通の手段として音声は、文字に比べれば非常に負担が少なく、容易なものである。人間は何気なく話し、何気なく理解することができる。しかし、同じ内容を文字列として文書にして行なおうとすると、文字列には正確さや記録性があるとしても、手間と時間が音声のそれよりも何倍もかかり、やっかいである。文字以外の押しボタンやキーボードによる意志疎通も音声に比べれば手間と時間のかかり方は大きく、また、押しボタンやキーボードの換作には、そのための熟練または知識を必要とする。
 このように音声による情報入力速度は他の手段に比べて速いことがわかる。
音声による情報入力の利点を列挙すると次のようになる。
 1)情報の入力速度が速い。
 2)作業の操作性を増す。
 3)マイクロホン、電話機などを入力端末に使えるので、経済的であり、既存の電話網をそのまま用いて、遠隔地から入力することができる。多くの機械、たとえば、ワードプロセッサへの入力、銀行での現金の出し入れ、新幹線の切符の購入(私鉄の自動券売機の試作機がある)、ロボットによる各種の操作、身休障害者の自動車の運転などが音声でできれば、随分と便利になる。更に、通訳電話などが実用化されれば世界中の人々と自由に会話を交わすことができる。
実験例:ATRのアメリカとの間の自動通訳電話(限定話題)、日立の日韓自動通訳電話

2.認識単位

 @音素(音韻とも言う)(Phoneme)
 A音節(Syllable)
 B単詩(Word)
 C連続音声(Sentence)

3.認識対象
 @特定話者限定単語
 A特定話者任意単語
 B特定話者連続音声
 C不特定話者限定単語
 D不特定話者任意単語
 E不特定話者連続音声

4.
 @特定の話者の場合にはあらかじめ声を登録する必要があるが、同じ話者でも心理状態や生理状態、年令で発声が異なり、スペクトルの変化や語長の変化等が生じる。
※特定話者限定単語の玩具がある。  
 A連続音声の場合は文法や言語情報が必要となる。

5.日本語は子音(Consonant)と母音(Vowel)で作られているが、同じ母音あるいは子音でも前後の音素の影響を受けて孤立発声の母音や子音と異なる(調音結合という)。

6.音声の分析方法
 @周波数分析:BPF、FFT
 A線形予測分析(LPC)、PARCORなど。 
 B合成による分析(A−b−S)

7.認識の方法

8.最近の傾向


講師 古賀 秀昭先生プロフィール

昭和17年 9月 6日 佐賀県杵島郡大町町にて生

学    歴

昭和24年 4月  佐賀県杵島郡大町町立大町小学校入学
昭和30年 3月  同校卒業
昭和30年 4月  仙台市立八軒中学校入学
昭和33年 3月  同校卒業
昭和33年 4月  宮城県立宮城県工業高等学校電気科入学
昭和36年 3月  同校卒業
昭和36年 4月  東京電気大学電気通信工学科入学
昭和40年 3月  同学同学料卒業
平成 2年 2月  工学博士(東北大学)
           博士論文r音声スペクトルのローカルピークの音声認識への寄与に関する研究」

職    歴

昭和40年 4月  東北工業大学電子通信工学科助手
昭和43年 4月  東北工業大学電子通信工学科講師
昭和63年 4月  東北工業大学通信工学科助教授
平成 4年 4月  東北工業大学研究科(博士前期課程)通信工学専攻助教授
平成 6年 4月  東北工業大学研究科(博士後期課程)通信工学専攻助教授
平成 7年 4月  東北工業大学通信工学科教授
平成 7年 4月  東北工業大学研究科(博士前期、後期課程)通信工学専攻教授