打电话,是每个人最原始的需求,也是移动通信最初的目标。
目前,以微信为代表的各种OTT(Over The Top)语音非常流行。但是,仍然无法取代传统语音电话业务。
传统语音电话业务,作为最基础的通信服务,拥有最高的优先级。在关键时刻,它是我们的救命稻草。
在网络信号不好的时候,上网龟速,微信语音卡成狗,视频根本无法接通。但是,电话肯定是可以打通的,虽然音质可能不好,但可以满足基本需求。这就是基础服务保障的承诺。
当遇到紧急情况时,不管你的手机有没有信号,甚至连SIM卡都没插,照样能打通紧急呼叫电话。这就是传统语音电话业务的优势。
5G,作为最先进的移动通信网络,是如何实现语音业务的呢?
▉ 5G网络怎样支持语音业务?
最根本的方式是:自己动手,丰衣足食。也就是说,5G直接支持VoNR(Voice over New Radio),不看4G甚至3G和2G的脸色。
5G的网络架构其实承袭自4G,只支持分组交换,不支持电路交换,也就是说自身的5GC核心网是没法支撑语音业务的,必须依赖于一个叫做IMS的系统。
IMS又叫IP多媒体子系统,可以在分组交换网络下实现语音业务。5G的无线接入部分叫做NR(New Radio),跟IMS结合之后,独立打电话的问题完美解决。因此基于5G的语音业务就叫做VoNR (Voice over NR)。
这一点跟4G如出一辙,4G在IMS支持下的语音业务就叫VoLTE(Voice over LTE)。VoLTE目前已经在国内广泛支持。
如果5G不支持VoNR,那就只能靠4G的VoLTE,甚至3G和2G支持的电路交换域语音业务,进行兜底。
根据网络部署模式,5G可分为NSA(非独立组网)和SA(独立组网)两类。再根据5G是否支持VoNR,以及4G是否支持VoLTE,分为以下多种方案。
- NSA下的语音业务:
在NSA下,5G网络被称作辅节点,作为4G的流量补充,并不直接参与语音业务,所有语音功能完全由4G完成,因此5G就都不支持VoNR。
如果4G支持VoLTE功能,则直接进行语音,覆盖不好的时候通过SRVCC(Single Radio Voice Call Continuity,单无线语音呼叫连续性)切换到3G或者2G。
如果4G不支持VoLTE,在拨打电话的时候就会直接回落到3G或者2G(这个功能称作CS Fallback,电路交换回落)。
- SA下的语音业务:
在SA模式下,5G语音方案比较复杂,有四种场景。总体思路是,5G网络优先使用VoNR,如不支持,则回落到到4G的VoLTE,最后由3G或者2G进行兜底。
场景1:5G网络支持语音功能(VoNR),则可直接在5G上接通电话,然后在5G信号不好的时候切换到4G的VoLTE。如果用户跑到了4G覆盖不好的地方,还可以通过SRVCC切换到3G或者2G。
场景2:5G网络支持VoNR,则可直接在5G上接通电话,在5G信号不好的时候发现4G信号也不好,直接由5G通过SRVCC把电话切换到3G。
5G到3G的SRVCC刚刚在3GPP R16版本中标准化,目前还没有手机支持。
既然从5G能切换到3G,未来也会支持切到2G吧?实际上没有那个必要,因为一般情况下3G已经覆盖够好,足够用来兜底了,再说2G也没几年就要退网了,不值得再花钱投资。
场景3:5G网络不支持VoNR,则在打电话的时候先通过EPSFB(EPS Fallback)来回落到4G的VoLTE,在4G覆盖不好的时候再通过SRVCC切换到3G或者2G。
场景4:5G网络不支持VoNR,则在打电话的时候先通过EPSFB来回落到4G,结果很不幸,4G也不支持VoLTE,只能再次通过CSFB回落到3G或者2G来打电话了。
可以看出,在这几个场景中,手机打着打着电话,很可能从5G跑到了4G,甚至还很可能从4G再跑到3G或者2G。就打完电话之后,还要继续留在4G,甚至3G或者2G吗?
由俭入奢易,由奢入俭难。习惯了5G/4G的高速率,对于3G和2G的龟速是不可接受的,因此需要尽快让手机返回能力最强的网络,这个过程就叫做快速返回。
▉ 5G VoNR有什么优势?
同样是基于IMS的语音业务,VoNR和VoLTE相比到底有什么优势呢?
首先,当手机驻扎在5G小区时,使用VoNR简单直接,否则还要经过EPS Fallback回落到4G,信令流程增加了,时延也必然增加,影响用户体验。
然后,VoNR下强制支持一种新的语音编解码方案,可以有效提升语音通话的音质到HiFi的级别,这就是EVS(Enhanced Voice Services),也叫超高分辨率语音(Super HD Voice)。
其实EVS早在3GPP R12版本就已经定义了,彼时还是LTE的发展正如日中天,但由于大家对语音质量都不够重视,一直少有手机支持。这一拖,就到了5G时代。
EVS是怎么提升音质的呢?
声音是由振动产生的,在空气中传播就形成了声波。但人的耳朵只能听到有限一段频率内的声波,范围是20Hz到20000Hz。
人的声带能发出的频率范围要更窄一些,为85Hz到1100Hz。
在以前的语音编解码方案中,只包含了人的听觉频率范围中的一小段,有些甚至连人的发声带宽都没有完全编码。
比如最早的标准语音编码的频率范围是300Hz到3400Hz,而人的发声频率范围是85Hz到1100Hz,也就是说,从85Hz到300Hz这一段的声音根本就没有被传输。
这种窄带编码导致了音色的损失。最直观的感受是,在打电话时,虽然对方说的语句是能辨认的,含义也能听明白,但却经常分辨不出谁在说话,像被变声了一样。
EVS直接实现了人的听觉范围全带宽的编码,除了人的声音之外,连背景里汪星人和喵星人的叫声也真真切切,可媲美CD的音质。
总而言之,我们的5G语音,已经默默做到了最好。
—— The End ——