3.4 新技术发展趋势的推动
从技术创新来看,通信、计算、存储、传输技术的不断进步,新材料、新工艺、新器件等的快速发展,云计算、大数据、区块链、人工智能等新技术与通信技术的不断融合,将解锁新的能力与架构,推动移动通信网络的代际更替。
3.4.1 ICDT深度融合
信息技术(Information Technology,IT)的快速发展加快了互联网的普及以及各种应用的不断涌现。云计算的出现和快速发展,加速了这一过程。大型云计算公司可以使用廉价的商用硬件,快速、大规模地部署计算和存储等IT服务能力。企业或个人可以根据业务需求租用云计算公司的IT服务能力,将自己的数据存储在云数据中心,并按需调用。这些计算能力保证了互联网业务的快速部署和应用 [4] 。
通信技术也在以惊人的速度发展和迭代。4G网络和智能手机的普及,给移动互联网服务带来了空前的繁荣,改变了人们的日常生活。智能手机已经成为人们日常生活的重要平台,可以满足人们出行、购物、娱乐等各种需求,这些需求产生了海量数据,包括位置、轨迹、个人偏好、娱乐、购物习惯等行为数据。通过对这些用户行为数据的收集和分析,互联网服务提供商可以获得用户数据,实现个性化服务提供,包括精准的内容推送和便捷的服务获取,从而推动大数据处理技术和应用的快速发展。随着全球移动通信系统、窄带物联网(Narrow Band Internet of Things,NB-IoT) [5] 、增强型机器类通信(enhanced Machine Type of Communication,eMTC) [6] 等物联网技术的快速崛起,通信对象已经从人延伸到物,物联网用户的数量已经超过人的数量,例如,中国移动约有9.5亿人类用户,而物联网用户数量约为20亿。随着5G网络的部署和应用,无线传输速率可以达到吉比特每秒(Gbps)级甚至10Gbps,无线传输时延可以缩短到毫秒级,数据传输可靠性也提高到99.999%~99.99999%,这些都将把移动通信技术的应用推广到社会的每一个角落,实现万物互联。
大数据已成为企业和社会的重要战略资源,是研究人员和业界关注的新热点。随着4G和5G系统的普及和应用,整个移动通信网络及其应用每时每刻都在产生海量数据。这些数据包含整个社会的、大量的、丰富的信息,而智能购物、智能交通、智能医疗、智慧校园、智慧城市等数据技术(Data Technology,DT)的快速发展将使这些数据被应用到人类生活和社会治理中,推动整个社会的信息化和数字化发展。数字化转型将为各行各业带来新的繁荣和发展动力,加速整个社会的数字化进程,实现“5G改变社会”的目标。
随着数字化的加速,每个社会元素都将产生大量的数据,这些数据来自个人、公司、基础设施等。由于这些数据的所有权完全不同,数据存储、数据管理、数据共享、数据安全和隐私以及数据交易等问题变得难以处理。因此,未来必然会出现相关的大数据立法,明确数据的所有权和相关利益分配。与此同时,大数据存储和管理平台将出现,以帮助大家进行数据存储、管理和交易。
大数据可能是继计算机和互联网之后的新一轮技术革命。随之而来的数据挖掘、机器学习(Machine Learning,ML)、人工智能(Artificial Intelligence,AI)等新兴技术,可能会改变数据世界的许多算法和基础理论,实现科学技术的新突破。大数据离不开云计算,云计算是生成大数据的平台 [7-8] 。大数据与云计算自2013年开始紧密融合,预计未来它们的关系会更加紧密。
大数据的大规模部署,推动了AI应用的发展。AI是计算机科学的一个分支,它试图理解智能的本质,并制造一种能够以类似人类智能的方式做出反应的新智能机器。自AI诞生以来,相关理论和技术日趋成熟,应用领域不断拓展。AI可以模拟人类意识和思维的信息过程。目前,AI的研究领域主要包括知识表示、自动推理和搜索方法、ML、知识获取、知识处理系统、自然语言理解、计算机视觉、智能机器人、自动编程等。AI的应用主要包括机器翻译、智能控制、专家系统、机器人、语言、图像识别(如人脸识别和车牌识别)、基于遗传算法的机器人工厂、自动编程和航空航天应用。这些应用深刻地影响着我们的日常生活和工作。
在5G网络设计中,ICDT融合的趋势已经出现。5G服务化的核心网设计充分引入了先进的IT理念,通过软件定义网络(Software Defined Network,SDN)、网络功能虚拟化(Network Function Virtualization,NFV)和服务化架构实现了网络切片,可以提供灵活的差异化业务QoS保证,为5G网络赋能垂直行业提供了重要支撑。5G移动通信网络通常由数百万个基站、路由器、核心网网元和其他基础设施设备以及数十亿用户组成,可以产生大量的数据,包括各网元的运行数据、通信过程中产生的信令数据、事件报告以及用户在网络中移动的相关信息。如果在这些数据中添加时间、位置等标签,将为网络运维的自动化和智能化带来不可估量的价值。因此,基于用户在网络中的位置信息,运营商开始研究基于大数据和人工智能的网络自动化,如大规模多输入多输出(Multiple Input and Multiple Output,MIMO)权值优化、网络异常分析、用户体验分析与优化 [9] 等。与此同时,3GPP已经开始研究无线网络中的大数据采集 [10] 、网络运维中的自动化与智能化 [11] 以及AI在无线资源调度中的应用 [12] 。我们可以看出,在5G标准制定的后期,大数据的应用将进一步与通信技术融合。所以,ICDT融合正在成为一种新的发展趋势,不仅为5G带来了全新的能力和特性,提升网络业务能力和用户体验,也将进一步赋能网络的自动化和智能化运维,降低5G网络的运维成本。
但是,现有5G系统无法与ICDT的深度融合完美匹配,网络数据分析功能(Network Data Analytic Function,NWDAF)就是一个例子。NWDAF是一个基于网络数据自动感知和分析网络的数据分析网元,参与网络规划、建设、运维、优化和运行的全生命周期,使网络易于维护和控制,提高网络资源利用率,并提升用户体验。虽然NWDAF可以有效地提升网络性能,但这种基于补丁式的AI暴露了一些5G系统设计的问题:一个是数据安全问题和大量测量数据上报导致的传输开销问题;另一个是低时延的挑战,因为所有数据都必须上传到集中分析单元(如NWDAF)并在其上进行处理,而该分析单元可能部署在远离数据源的地方。这些问题都会限制其使用的有效性和效率,只有将现有架构进行演进和变革,才能从根本上解决问题。
因此,我们认为ICDT的深度融合必将成为6G网络设计的重要驱动力,云原生、大数据、AI将在未来的网络架构设计中发挥重要作用。
3.4.2 新的硬件及其解决方案
1.摩尔定律带来了芯片集成度和计算能力的不断增长 [13]
1965年,戈登·摩尔在准备一个关于计算机存储器发展趋势的报告中,发现了一个惊人的趋势:每个新的芯片大体上包含其前任两倍的容量,每个芯片产生的时间都是在前一个芯片产生后的18~24个月内,如果这个趋势继续,则计算能力相对于时间周期将呈指数式上升。摩尔的这一观察资料,就是现在所谓的摩尔定律,其阐述的趋势一直延续至今,且仍准确。人们还发现这不仅适用于对存储器芯片的描述,也精确地体现了处理机能力和磁盘驱动器存储容量的发展。该定律成为许多工业进行性能预测的基础 [13] 。
归纳起来,“摩尔定律”主要有以下3种“版本”:
(1)集成电路芯片上所集成电路的数目,每隔18个月翻一番;
(2)微处理器的性能每隔18个月提高一倍,而价格下降一半;
(3)用一美元所能买到的计算机性能,每隔18个月翻两番 [14] 。
在以上几种说法中,第一种说法最为普遍,后两种说法涉及价格因素,其实质是一样的。三种说法虽然各有千秋,但有一点是共同的,即“翻番”的周期都是18个月,至于“翻一番”(或两番)的是“集成电路芯片上所集成电路的数目”,是整个“微处理器的性能”,还是“用一美元所能买到的计算机性能”就仁者见仁智者见智了 [14] 。
虽然理论上晶体管尺寸极限是一个硅原子直径,但热力学极限和量子力学极限设定的阈值都比这个直径要大,研究表明,硅晶体管的极限尺寸为1nm(纳米)左右,这就是单个晶体管器件的理论极限,真正量产的话还会有很多的工程技术难题。现在量产的最先进工艺是台积电的5nm晶体管,两三年后很有希望实现3nm的量产。但之后能不能量产2nm甚至1nm的晶体管,现在还不敢推断。
在过去将近60年的时间里,摩尔定律在集成电路工艺的不断进步中被一再验证,并推动着信息和通信行业的快速发展,我们可以不断地通过复杂度的提升来支持更先进的技术和理念的实现,进而获得更佳的性能,所以这一趋势在摩尔定律终结之前还会继续保持。特别是近些年来,随着计算能力的不断提升和成本的不断下降,云计算和人工智能(AI)开始在众多的场景中发展和应用起来,特别是英伟达推出的图形处理器(Graphics Processing Unit,GPU),更是将AI的研究和应用推向了高潮,通过高复杂度的暴力计算,可以换来性能和应用效果的极大提升,由此也刺激业界纷纷针对特定的应用场景开发出各自专用的计算芯片,各种“XPU
”可以说琳琅满目,大大促进了信息、通信技术的进步。摩尔定律如图3-4所示。
图3-4 摩尔定律 [13]
特别是随着台积电等集成电路制造商的工艺制程从7nm向5nm和3nm挺进,同等条件下,移动通信系统和终端可以支持更加复杂的计算和处理,原本看似复杂和不能实现的技术都将变得可行,由此激发着移动通信研究人员和标准组织开始考虑更先进技术的研究和突破,这必将推动新一代移动通信系统的诞生。
2.异构计算
异构计算是将CPU、协处理器、片上系统(System on Chip,SoC)、GPU、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field Programmable Gate Array,FPGA)等各种使用不同类型指令集、不同体系架构的计算单元组成一个混合的计算系统。异构计算以“CPU+”的形式出现,具有较好的可行性及通用性,并能大幅提升系统性能和功耗效率。不同异构硬件的特点如图3-5所示。
图3-5 不同异构硬件的特点
业务异构的加速需要基于加速平台的软硬件整体解决方案,以实现更强的性能并覆盖更多场景,其包括基于GPU、FPGA即服务(FPGA as a Service,FaaS)及领域专用架构(Domain Specific Architecture,DSA)/ASIC的加速方案。例如,NVIDIA的GPU加速主要通过统一计算设备架构(Compute Unified Device Architecture,CUDA)的编程开发框架实现,FaaS依赖于FPGA提供的硬件可编程性,需要用户或第三方开发者针对特定应用场景完成加速硬件和软件镜像的开发;DSA面向特定应用场景的加速,在ASIC的基础上提供了更高的灵活性,效率要高于GPU和FPGA [15] 。
随着移动通信应用的发展,ICDT的融合成为大势所趋,移动通信网络需要进一步拓展其自身的能力体系,以更好地支持各种差异化和碎片化的应用场景需求,异构计算硬件的发展可以很好地满足这种发展需求,灵活高效地支持通信连接、计算、AI和大数据等融合服务的实现,推动着网络架构和技术的进一步变革和演进。
3.云原生
云计算通过网络把多个成本相对较低的计算实体整合成一个具有强大计算能力的系统,并借助软件即服务(Software as a Service,SaaS)、平台即服务(Platform as a Service,PaaS)、基础设施即服务(Infrastructure as a Service,IaaS)、管理服务提供商(Management Service Provider,MSP)等先进的商业模式把强大的计算能力提供到终端用户手中。云计算的一个核心理念就是通过不断提高“云”的处理能力,进而减少用户终端的处理负担,最终使用户终端简化成一个单纯的输入输出设备,并能按需享受“云”的强大计算处理能力。云计算以其规模大、虚拟化、可靠性高、通用性强、高可扩展性和廉价的优点,迅速在个人和企业中得到广泛应用,云原生的设计已经成为IT系统和信息网络设计的流行趋势,带来了云原生下的业务部署、上线和迭代敏捷、运营简化和成本降低。
云原生是一系列技术、设计模式和管理方法的思想集合,包括DevOps(Development和Operations的组合词)、持续交付、微服务、敏捷基础设施、康威定律,以及公司组织架构的重组。Gartner在对2022年的技术趋势预测报告 [16] 中提到,“到2025年,将有95%的数字化项目采用云原生基础设施,而在2021年这个比例只有不到40%”。在电信运营商网络中,基于云原生技术的核心网网元和边缘计算节点已经得到广泛应用,在无线接入网领域,基于云原生技术的基站单元也开始试点并小范围商用。
云原生的代表技术包括容器、微服务、服务网格、不可变基础设施和声明式应用程序接口(Application Programming Interface,API)等 [17] 。容器技术基于操作系统的虚拟化技术,让不同应用可以运行在独立沙箱环境中以避免相互影响。Docker容器引擎则大大降低了容器技术的复杂性,Docker镜像解耦了应用与运行环境,使应用可以在不同计算环境间一致可靠地运行,加速了容器技术普及。容器技术如今已经发展出全容器、边缘容器、无服务器(Serverless)容器、裸金属容器等多种形态。微服务通过服务化架构把不同生命周期的模块分离出来,分别进行业务迭代,从而加快整体的进度和稳定性。微服务以容器部署,每个微服务可以部署不同数量的实例,实现单独扩缩容、单独升级,使得整体部署更经济,并提升了迭代效率。服务化架构使用面向接口编程,服务内部的功能高度内聚,通过公共功能模块提取增加软件的复用程度。服务网格(Service Mesh)实现业务面和控制面的分离,将服务代理、发现和治理等控制从业务中分离到专用Mesh基础架构层,并实现对业务透明。分离后业务进程中只保留轻量级的服务代理(Sidecar),服务代理负责与Mesh控制面通信。实施Mesh化架构后,大量分布式架构模式(熔断、限流、降级、重试、反压、隔仓)都由服务网格控制面完成,统一的控制面也能保障实现更好的安全性。
Serverless是一种架构理念,其核心思想是将提供服务资源的基础设施抽象成各种服务,以API的方式供给用户按需调用,真正做到按需伸缩、按使用收费。这种架构消除了对传统海量持续在线服务器组件的需求,降低了开发和运维的复杂性,同时降低了运营成本并缩短了业务系统的交付周期,让用户能够专注于价值密度更高的业务逻辑的开发。
在电信领域的云原生标准方面,ETSI NFV ISG在2019年10月发布了面向云原生容器和平台即服务(PaaS)的增强NFV架构研究报告,之后制定了容器层北向接口及管理和网络编排(Management and Network Orchestration,MANO)管理容器的系列技术规范,计划后续开展容器集群管理技术规范(IFA036)、容器网络研究报告(IFA038)和容器安全规范(SEC023)等标准研究或制定工作,并进一步扩展现有的NFV MANO接口功能以支持容器化虚拟网络功能的生命周期管理和编排。在开源领域,CNCF成立了电信用户组(Telecom User Group,TUG),将电信行业需求导入上游开源项目设计,已经完成《电信行业的云原生思维》( Cloud Native Thinking for Telecommunications )白皮书。Linux基金会成立了CNTT工作组研究云原生/容器技术在电信行业的应用方案,主要基于开源Kubernetes定义云原生网络的基础设施架构,分析和电信业务需求的差距以及提供相应基础设施的参考实现和测试验证框架 [18] 。
在5G核心网的设计中,已经引入了云原生的设计,它带来了敏捷、弹性等优势,但还未引入到无线接入网领域,所以端到端的云原生设计将是网络后续发展的方向和新一代网络设计的基本原则。
4.虚拟化
虚拟化是将物理资源在逻辑上进行再分配的技术,将“大块的资源”逻辑分割成“具有独立功能的小块资源”,既能实现资源的最大化利用,又能实现在共享资源基础上的用户隔离。虚拟化技术是云计算的基石,在云上无处不在。
在计算机领域,虚拟化的层次如下。
(1)基于硬件抽象层面的虚拟化:提供硬件抽象层,包括处理器、内存、I/O设备、中断等硬件资源的抽象。
(2)基于操作系统层面的虚拟化:提供多个相互隔离的用户态实例,即容器。容器拥有独立的文件系统、网络、系统设置和库函数等。
(3)基于编程语言的虚拟化,如Java虚拟机(Java Virtual Machine,JVM),是进程级虚拟化。
从虚拟平台角度,虚拟化可以划分为以下类别。
(1)完全软件虚拟化:不需要修改客户机操作系统,所有的操作都由软件模拟,但性能消耗高,为50%~90%。
(2)类虚拟化:客户机操作系统通过修改内核和驱动程序,调用由虚拟机监视器(Hypervisor)提供的超级调用(Hypercall),性能消耗为10%~50%。
(3)完全硬件虚拟化:硬件支持虚拟化,性能消耗只有0.1%~1.5%。
除此之外,虚拟化技术还包括CPU虚拟化、内存虚拟化、I/O设备虚拟化、存储虚拟化、网络虚拟化、容器虚拟化、网络功能虚拟化,也包括5G的网络切片等。
面向ICDT的深度融合,不同的硬件需要支持不同的应用,如GPU支持AI应用,CPU支持普通的云计算,结构化专用集成电路支持实时性要求高的计算,FPGA支持硬件加速等。所以,基于异构硬件的虚拟化来灵活支持多种应用的融合是大势所趋,也将成为移动通信网络发展和演进的新动能。


