Voice Activity Detectionを学ぶ

  • 誰かが話していることを検出する
  • Voice Activity Detection
  • Voice Activity Detector
  • 音声通話で使用される帯域幅を抑えるのに役立つ
  • バックグラウンドノイズをある程度押さえることが出来る

http://www.esat.kuleuven.ac.be/~gvanmeer/s&a/oefenzittingen2004-2005/opgave2/node3.html

  • 「誰かが話している」の基準となるのは一定量以上の音量の変化
  • 「話している」と判断したときに拾う音の条件(音量の範囲など)を決定する

気になったところ

  • E1が小さすぎると小さい音量の変化でもVADが反応してしまう
  • E2が大きすぎると語尾が途切れてしまいそう
  • VADが反応しないように音量が少しずつ上がっていくとVADが反応しない
  • E1ã‚’5dB、E2ã‚’2dBとしているが、そういう感覚がつかめません
  • 設定によっては音が全てカットされてしまい命取りになる

どこかにソースコードないかなぁ。