在对讲机的应用项目中,我们会看到各种对讲机的参数,其中VOX和VAD两个参数好像非常类似,但是具体的功能又有差别,总是让人一头雾水。
VOX是Voice Operated Exchange(声控发射)的缩写。这往往是对讲机的一个功能,一般高端一点的对讲机都具备这个功能。
这个功能非常好理解,我们在日常使用对讲机的时候,需要用手去按对讲机的PTT按键,才可以激发呼叫。
所以这种通信方式也被叫做Push to Talk,是对讲机的标准通信方式。

那么在很多场景下,如果我们的双手无法释放,没有办法去通过手按对讲机PTT按键的情况下,就无法通信了。
而对讲机作为各种工作环境下常用的通信设备,一边需要通信,一边需要完成手上的工作的场景是非常普遍的。
对讲机就采用了一个非常直接的功能,增加了VOX功能,通过声控,就可以控制对讲机的PTT,从而发起对讲呼叫。
VAD全称 Voice Activity Detection(语音活动检测),是伴随着IP电话的VOIP通信的一种能力。由于在IP电话系统中,当没有人说话时,IP电话可以不对静音包编码和传输,从而节省带宽。

随着技术的进步,VAD算法的能力更强,可以在语音通信中识别不同的声音,从而实现回声消除,降噪,语音识别等能力。
这一技术在对讲机网关项目中是必须的。可以通过VAD算法,更精准地区分人声,只有在检查到人声时激活对讲网关连接到对讲机。
这样就可以减少调度系统的VOIP通信误激活对讲机,操作不必要的链路占用。

在技术应用上,VOX的设计逻辑比较简单,通过声音的阀值激活对讲机的发射,通过对讲机菜单可以简单设置VOX的检测级别。
VAD的检测更为底层,通过算法分析音频的特征来区分人声和噪声,决定下一步的动作。而这一系列的动作可能包括是否发生数据,打开对讲开关,消除噪音,混音,变声等功能。
VAD相比VOX更为先进,更多的是终端的智能化能力的提升。在更先进的VOX能力中,也会融入VAD的能力,让VOX的语音激活更精准的控制,增强对讲机的应用体验。

