c6000：混响和回声是一样的么？

当前位置博文首页 > c6000：混响和回声是一样的么？

最大化缩小

c6000：混响和回声是一样的么？

作者：c6000 时间：2021-02-12 18:30

在生活中，混响和回声其实都是指的一件事，知乎告诉我们：

通常室内的声音比广阔空间的声音要更加丰满、结实，这是因为广阔的空间只有直达声，声波是直接被人耳接收而没有经过反射，

而在室内因为相对而言是封闭空间所以除了声源的直达声也有经过墙壁以及其他障碍物反射而产生的反射声被人耳接收到。

直达声和反射声被人耳依次听到的过程就叫做“混响”。

直达声和反射声当然不是同时被人耳接收到，它俩到达人耳是有一个时间差，其实我们听到带有混响的声音本身就是多个声音的叠加，

但可能因为听到的多个声音时间间隔非常地短性质又接近所以觉得是同时听到的。那若是直达声和反射声相差50毫秒以上会发生什么情况？

那人就会听到“回声”了。

*来源于https://www.zhihu.com/question/20124311/answer/14058781

但是在语音通信领域，混响和回声是不同的。

1. 混响：

混响是指房间内，墙壁等障碍物对声波反射，使得在同一物理空间内，声源到达人耳的路径，除了直接传到的直达声外，还有经过多个反射路径后到达人耳的反射波。

根据达到时间的早晚，称为早期混响和晚期混响，混响时间公认的定义是：声能密度降为原来的1/10^6时所需的时间，相当于声压级衰变60分贝。某频率的混响时间是室内声音

达到稳定状态，声源停止发声后残余声音在房间内反复经吸声材料吸收，平均声能密度自原始值衰变到百万分之一(声能密度衰减60dB)所需的时间，用T60或者RT表示。混响时

间过短，声音发干，枯燥无味，不亲切自然；混响时间过长，会使声音混杂；合适时声音圆润动听。

混响时间是声学设计中声能定量估算的重要评价指标。适合电影放映的混响时间一般不超过0.8秒，适合音乐厅的混响时间一般是1.5秒。

下面这张图直观地展示了混响：

混响对语音识别的影响比较大，背景噪声和空间内声反射产生的混响是声学信号处理和远场语音识别的两大障碍。

混响消除目前主流的算法是 WPE(Weighted Prediction Error)，主要用于去除信号中的混响成分，此算法基于线性预测估计，这篇帖子介绍的比较全面：

语音去混响算法之WPE( Weighted Prediction Error for speech dereverberation) https://blog.csdn.net/veritasalice/article/details/107417996

这个代码可以参考：WPE Matlab代码 http://www.kecl.ntt.co.jp/icl/signal/wpe/index.html

2.回声

通信中的回声包括声回声和线回声。

声学回声是指接收端扬声器播出的声音在接收端被听到的同时，也通过多种路径被接收端的麦克风拾取到，然后通过网络传输回发送端，使得发送端的通话人在扬声器中听到了

自己的声音。接收端多路径反射的结果产生了不同延时的回声，包括直接回声和间接回声。直接回声是指由扬声器播出的声音未经任何反射直接进入麦克风。间接回声是指由扬

声器播出的声音经过不同的路径 (如房屋或房屋内的任何物体 )的一次或多次反射后进入麦克风所产生的回声的集合。

声回声产生过程如下图所示：

线回声是指电话网络中，二四线耦合器产生的回声，产生过程如下图所示：

无论声回声和线回声，都可以通过自适应滤波器的方式来解决，如下图：

作为通话链路的重要一环，也是互联网音频三剑客 3A 中的AEC，有许多的方法和论文，

这篇文章介绍的比较全面：回声消除中的自适应滤波算法综述 https://www.cnblogs.com/LXP-Never/p/11773190.html

众所周知，谷歌的WebRTC中的语音引擎中包含了AEC模块，这个代码可供参考：https://github.com/ewan-xu/AEC3

有意思的是，在很多场景下，需要增加混响来使得声音更加的真实。而回声消除也被广泛地用于智能音箱在播放音乐时的语音控制。

上一篇：boomworks：《代码统计分析工具 4.0》多国语言实现方案

下一篇：没有了

立即下载 - IIS7 站长工具包