为什么倒谱可以分析回声
一个有趣的现象:倒谱上的第一个峰,恰好对应回声相比原声的延时。
回声 yyy 是原始声音 xxx 延迟 t0t_0t0 秒后的、带有衰减 ααα 的副本
y=αx(t−t0)y = αx (t - t_0) y=αx(t−t0)
方便起见,这里取 α=1α = 1α=1
原始声音 xxx 可以理解成一堆不同频率的正弦波的和:
x=a1sin(f1)+a2sin(f2)+...x = a_1sin (f_1) + a_2sin (f_2) + ...x=a1sin(f1)+a2sin(f2)+...回声 yyy 等价于把上面各个正弦波向后推移 t0t_0t0,表示成附加一个相位 φφφ:
y=a1sin(f1+φ1)+a2sin(f2+φ2)+...y = a_1sin (f_1+φ_1) + a_2sin (f_2+φ_2) + ...y=a1sin(f1+φ1)+a2sin(f2+φ2)+...
最终麦克风接收到的信号记为 z=x+yz=x+yz=x+y
考察 zzz 的任何一个频率成分
fn:ansin(fn)+ansin(fn+φn)f_n: a_nsin (f_n) + a_nsin (f_n+φ_n)fn:ansin(fn)+ansin(fn+φn)
可以看到,向后推移 t0t_0t0 对任何频率成分的幅度影响是不同的。
这个影响将以周期为 1/t01/t_01/t0 的正弦扰动的形式,在幅度谱上被观察到。
举例而言,取 t0=0.01t_0 = 0.01t0=0.01 sss
则 zzz 中 100Hz100Hz100Hz 频率成分的幅度刚好翻倍,50Hz50Hz50Hz 刚好抵消,
因为:
原来的 100Hz100Hz100Hz 正弦波加上延时 101010 msmsms 后的 100Hz100Hz100Hz,刚好峰-峰对齐
原来的 50Hz50Hz50Hz 正弦波加上延时 101010 msmsms 后的 50Hz50Hz50Hz,刚好峰-谷对齐
以此推类,相比 xxx 的幅度谱,zzz 的幅度谱上
200Hz/300Hz/400Hz...200Hz / 300Hz /400 Hz...200Hz/300Hz/400Hz... 都会翻倍
50Hz/150Hz/250Hz...50Hz / 150Hz / 250Hz ...50Hz/150Hz/250Hz... 都会相消
相当于回声给 xxx 的幅度谱上附加一个周期为 100Hz100Hz100Hz 的正弦扰动成分
由上面的讨论可知,迟滞 t0t_0t0 的回声的存在
会使得 zzz 的幅度谱上多出了一个周期为 1/t01/t_01/t0 、频率为 t0t_0t0 的正弦扰动。
那么如何表示这个幅度谱上频率为 t0t_0t0 的正弦波?
可以把幅度谱当作一个信号,对其进行傅里叶变换,观察能量最高的成分。
这样得到的便是倒谱,谱上频率为 t0t_0t0 的高峰,将恰好代表幅度谱上的扰动。