3.5 现有网络的问题和挑战
自2019年以来,5G网络已在全球大规模部署。5G网络与云计算、大数据、AI融合,必将催生更多新的业务和应用,从而推动整个社会的数字化。随着5G网络的发展和新业务、新应用的不断涌现,5G网络将不可避免地面临一些新的问题和挑战。其中一些问题可能会在5G网络的发展中得到解决,但由于5G网络本身的局限性,有些问题可能难以解决,从而成为推动网络演进和变革的重要动力和源泉。
3.5.1 分层协议栈成为新的瓶颈
在5G网络中,空口协议采用分层模型,包括物理层、介质访问控制(Medium Access Control,MAC)层、无线链路控制(Radio Link Control,RLC)层、分组数据汇聚协议(Packet Data Convergence Protocol,PDCP)层和业务数据适配层(Service Data Adaptation Protocol,SDAP)层。所有服务数据都必须经过这些层进行处理,每一层的处理都会引入特定的时延,从而导致时延成为瓶颈。例如,eMBB数据包在空口的典型时延为3ms。在5G网络研究过程中,引入一些可以降低处理时延的方案。
(1)允许在PDCP层进行重排序前先执行数据包解密,以减小包处理量和时延。
(2)去除RLC层的包级联功能,通过解耦自动重传请求和级联/分段功能,实现更多线下包头计算。
(3)在MAC层,允许MAC子头放在MAC有效负载旁边,解决从上行链路授予到上行传输之间大约一个符号时间的潜在需求 [19-22] 。
所有这些修改都是为了通过优化处理顺序来减小时延的,尽管其中一些修改是有益的,并已在5G标准中得到认可,但这些修改仍局限于现有分层体系。如果需要进一步降低空口时延,最直接的方法是突破传统的分层体系,在数据处理通道中创造捷径。
借助IT技术中的服务化思想,我们可以将原有的协议打散,拆分成若干个服务,根据业务的需求,可以动态对这些服务进行个性化的编排和集成,以支撑所需要的能力,满足个性化的用户业务需求,这样不仅可以带来进一步的性能优化空间,还可以进一步提升端到端网络的敏捷和弹性。
3.5.2 持续演进的网络切片
面向垂直行业,5G网络需要具备多样化的网络能力和部署灵活性。为了满足这些需求,5G核心网(Core Network,CN)引入了服务化架构(Service Based Architecture,SBA)和基于SDN/NFV的网络切片。5G系统预期将支持端到端网络切片,然而,在标准设计之初,网络切片的设计和优化主要在CN和传输网(Transport Network,TN)中进行。在5G标准早期版本中,RAN并没有针对网络切片进行特殊设计,而是在Rel-17版本中才开始相关研究。网络切片的标准化涉及六个主要行业组织,它们有各自的工作分工 [23] ,组织间协调进展缓慢,限制了端到端网络切片技术的商业化。
支持网络切片的商用CN设备比较成熟,但是由于RAN切片的技术难度较大,不同设备厂家在RAN切片的实现上存在差异。总体而言,端到端网络切片的实现还存在一些技术挑战,需要多域协调和连接,复杂性较高。
为了更好地挖掘网络切片的价值,有必要在切片管理域对网络切片进行合理的编排和管理。图3-6所示为网络切片管理域示意图,给出了切片管理域与切片网络域的关系。在商业网络中,这些网络切片管理功能(Network Slice Management Function,NSMF)不是独立存在的,而是嵌入到运营商的运营支撑系统(Operation Support System,OSS)和业务支持系统(Business Support System,BSS)中。不同运营商有不同的网络切片管理方案,需要运营商的运维部门、IT部门、政企部门、网络部门一起参与到切片管理域与BSS/OSS系统的集成工作中来。这对运营商来说是一个挑战,在未来的网络设计中应充分考虑这一点。
图3-6 网络切片管理域示意图
3.5.3 固化的网络架构
对移动网络而言,由于用户的移动性,基站间的负载存在显著差异。一般来说,在中国,20%的基站是重载的,而80%的基站是轻载的。但是,每个基站通常配置满容量,造成硬件处理能力和功耗的浪费。由于5G基站具有更大的带宽和大规模MIMO配置,5G基站的成本和功耗约为4G基站的3倍,进一步增加了网络成本和功耗。降低网络部署成本的一个简单方法是,在不同的站点之间动态配置和共享硬件及处理能力,根据每个小区的业务和负载需求,动态调度和配置相应的软硬件资源和功能。
5G系统也尝试共享硬件和处理能力。为支持5G网络的灵活部署,5G NR引入了基站CU和DU分离架构,并讨论了多种可能的CU和DU功能分割选项 [24] ,CU和DU之间的功能分割如图3-7所示。针对不同的功能分割选项,经过多维对比分析,最终标准只支持了一种高层分割选项,即选项2(PDCP/RLC分割)。
采用CU和DU分离架构,CU可以集中部署,不同站点间共享处理能力。但从网络性能的角度来看,集中式CU的好处并不明显,在实际网络中,CU仍然与DU部署在一起。
相反,从节省CU和DU的机房租金的角度出发,移动运营商将多个站点的CU和DU部署在一起,为不同站点间共享容量和硬件处理能力奠定了基础。但是,由于现有5G基站的CU和DU的硬件和软件都是专用的,池中不同站点依然不能共享容量和硬件处理能力。实现共享的一种简单可行的方法是使用基于SDN和NFV的云原生方法来设计CU和DU,CU部署位置示意图如图3-8所示,该方法可以实现物理硬件资源的动态共享,按需提供容量和处理能力。当池的负载较轻时,池中的大部分硬件可以关闭以节省功耗;当负载变重时,可以启动必要硬件来支撑站点需求。
图3-7 CU和DU之间的功能分割 [24]
图3-8 CU部署位置示意图
3.5.4 5G网络的高功耗
如第2章所述,高功耗是5G基站的棘手问题,也是移动运营商最重的负担。除了CAPEX,以能耗为主的运营成本(Operating Expense,OPEX)是影响5G发展的重要因素。2017—2020年期间,在业界共同努力下,基站功耗得以显著降低。但尽管如此,5G基站的功耗仍约为4G基站的3倍。
目前,5G基站满载时的功耗高达3800W,而4G基站的平均功耗约为1000W。在正常负载下,射频单元消耗5G基站的大部分功率。由于大带宽和高数据速率对基带处理能力的要求较高,基带处理消耗了剩余部分功率。
同时,由于目前运营商2G、3G、4G和5G共存,多频段网络部署,加之规模庞大,基站的功耗成了运营商OPEX的最大开支。为此,业界提出了多种基站节能解决方案。目前的解决方案是基于基站设备类型、覆盖场景、节能目标、关机时间等因素,通过AI算法自动生成包括小区关断、载波关断、射频通道关断和符号关断的节能策略。每种策略都有其特定的应用场景和对网络质量不同程度的影响。随着双碳目标的提出,运营商网络节能成为未来网络发展的重要方向,同时绿色能源的使用也是未来网络需要重点考虑的问题。这些目标的实现,除采用已有的技术外,还需要网络在架构设计、多频段协同等基本框架上进行变革和演进。
3.5.5 高度复杂的运维管理
由于网络管理和维护的方法比较传统,目前移动通信网络的运维效率仍然较低,并未随着网络的多次代际更替而产生革命性的变革。据报道,中国、日本和欧洲都曾发生4G网络级关闭事故,大大降低了移动运营商的声誉。对5G网络而言,运维复杂性源于基站的大规模部署、5G与4G/3G系统的互操作、5G与4G网络的动态频谱共享、成百上千个参数的配置、基于SDN/NFV的核心网形态、网络切片、垂直行业多样化业务需求等多个方面 [25] 。
正如本书第2章中所述,运营商已经开始研究使用AI和大数据来支持智能化的网络运营,以提升网络运营的效率,降低网络的运维成本。5G网络智能化主要是将AI等智能化技术与5G通信网络的硬件、软件、系统、流程等进行融合,利用AI等技术助力通信网络运营流程智能化,提质、增效、降本;5G网络智能化也需要促进网络自身的技术和体系变革,使能业务敏捷创新,推动构建智慧网络,包括云网自身智能化、网络运维智能化、网络服务智能化。
5G网络智能化主要面向通信连接进行优化,虽然引入了服务云,但由于5G架构、协议功能和流程已经定型,只能在现有架构方案上做增量迭代,通过打补丁的方式按场景和用例来引入必要的网络改动以获得所需的数据和算力。所以,5G网络智能化大多使用外挂AI的模式,基于外挂设计的AI应用特征,它将面临如下挑战 [25] 。
(1)缺乏统一的标准框架,导致AI应用缺乏有效的验证和保障手段,AI应用效果的验证是在事后进行的,这样端到端的整体流程长且很复杂,中间过程一般需要大量的人力介入,对现网的影响也比较大,这导致了目前AI很难真正应用到现网中。
(2)外挂模式难以实现预验证、在线评估和全自动闭环优化。在外挂模式下,AI模型训练通常需要预先准备大量的数据,而现网集中采集数据困难,传输开销也大,导致AI模型迭代周期较长、训练开销较大、收敛慢、模型泛化性差等问题。
(3)外挂模式下,算力、数据、模型和通信连接属于不同技术体系,对于跨技术域的协同,只能通过管理面拉通进行,通常导致秒级甚至分级的时延,服务质量也难以得到有效保障。
因此,尽管运维自动化和智能化是实现5G网络低成本、高效率运营的重要方向,但是由于在5G网络设计之初没有充分考虑大数据和AI在网络运营中的应用,AI的应用在当前的5G网络架构下难以得到有效支持,也难以达到我们期望的效果。由此,AI的应用也推动着网络架构设计的变革和演进。


