Voice Activity Detectionを学ぶ
- 誰かが話していることを検出する
- Voice Activity Detection
- Voice Activity Detector
- 音声通話で使用される帯域幅を抑えるのに役立つ
- バックグラウンドノイズをある程度押さえることが出来る
http://www.esat.kuleuven.ac.be/~gvanmeer/s&a/oefenzittingen2004-2005/opgave2/node3.html
- 「誰かが話している」の基準となるのは一定量以上の音量の変化
- 「話している」と判断したときに拾う音の条件(音量の範囲など)を決定する
気になったところ
- E1が小さすぎると小さい音量の変化でもVADが反応してしまう
- E2が大きすぎると語尾が途切れてしまいそう
- VADが反応しないように音量が少しずつ上がっていくとVADが反応しない
- E1を5dB、E2を2dBとしているが、そういう感覚がつかめません
- 設定によっては音が全てカットされてしまい命取りになる
どこかにソースコードないかなぁ。