数字经济水面下的算力冰川
作者|程心、罗辑 来源|自象限(ID:zixiangxian)
“过去一年我国数字经济规模突破50万亿,占GDP比重提升至41.5%,超过我们经济比重的四成。数字经济正在成为时代的重要增量之一。”
6月20日,在《时代的增量》系列主题沙龙中,多位行业内人士围绕着我国当下数字经济呈现出的爆发趋势进行了不同层面的探讨。
2023年,数字经济迎来了“新奇点”。
“以前谈数字经济、数字化会觉得很空泛,现在上至领导下至员工,都在讨论企业数字化、产业数字化的具体有效的方法,数字化趋势俨然已经成为了一个共识。”某大型企业中层告诉「自象限」。
数字化成为共识,核心来自于国家政策的积极拉动。今年2月底,中共中央、国务院出台的《数字中国建设整体布局规划》,《规划》指出,建设数字中国是数字时代推进中国式现代化的重要引擎,是构筑国家竞争新优势的有力支撑。
对比全球经济趋势来看,当前全球数字经济的规模已经达到了38.1万亿美元,美国占了40%,美国的数字经济规模是15.3万亿美元,占GDP比重是21.6%。中国位居第二。预计2025年中国的数字经济总量会突破60万亿元,占整个GDP的45%,到2030年,中国的数字经济规模可能将超过美国成为全球第一。
同时,我国数据总量正在以50%的速度增长,预计到2025年将占全球的27%;同时受智能化时代到来的驱动,人工智能、物联网、语音识别、视觉识别的数据种类和数量将会迎来一个“数据大爆炸”的时代。
数字经济的大规模爆发,既是企业数字化的一个新开始,也是基础建设的一个阶段性的里程碑。这不禁让人上下求索,数字经济在支撑中国GDP,谁在支撑数字经济?
一
要想富,先修路
答案是算力。
“在算力上每投入1%能带来的价值,数字经济可以提升千分之3.3,GDP增长千分之1.8。全球各个国家算力规模和它GDP的关系中可以看到,排前四的,只要算力规模比较大,GDP比较大,包括美国、德国、日本和中国,说明算力的投入能够获得巨大的回报。”
▲ 中兴通讯副总裁、服务器存储产品线总经理郭树波
中兴通讯副总裁、服务器存储产品线总经理郭树波针对当下数字经济呈现的爆发式增长,认为GDP发展的背后,需要算力作为基础资源,为数字经济发展提供源源不断的动能。
有一个更为直观的数据:算力产业每投入1元,将带动经济产出3-4元。
目前,国家算力指数与GDP已呈现了正相关趋势。IDC数据显示,当一个国家的计算力指数达到40分以上时,指数每提升1点,对于GDP增长的拉动将提高到1.5倍;当计算力指数达到60分以上时,对GDP的拉动将进一步提升至2.9倍。
▲ 图源 IDC
今天的中国,从农田种植到生猪养殖,从24小时运转的自动化工厂到路边行驶的车辆,和红绿灯的信号传输,数字技术正在融入各行各业。过去一年,我国农业生产信息化率超过25%,全国工业企业关键工序数控化率、数字化研发设计工具普及率分别增长至58.6%和77.0%。
多维度数据结果显示,“数据大爆炸”的时代,计算数据的算力将成为重要的底层资源,如同水电对中国经济的支撑作用。
“算力已成为重要的生产力,未来用算力就像用水和电一样自由。”郭叔波讲道。
提起算力,可能大多数人首先会想到芯片或者云计算,但这其实是整个算力产业链的两端。单一的芯片无法直接提供服务,只能通过与处理器、内存、I/O、硬盘、机箱等共同组成一台封装好的服务器,才能够提供算力。而云计算也是建立在由服务器组成的大型数据中心之上,才能够提供云服务。
▲ 图源资产信息网
换言之,服务器才是提供算力的最小硬件单位。算力狂飙,离不开一座座数据中心和一台台服务器,作为底层基础设施,稳定可靠、性能强劲的服务器和存储产品,支撑着我国算力产业规模的快速发展。
正所谓“要想富,先修路”,服务器就如同一条条路,路修好了,才能通车,才能求发展。它既没有芯片的故事那么跌宕起伏,也没有云计算那么广为人知,但却已经形成了近万亿级别的庞大市场。
数据显示,2022年中国市场服务器的规模约276亿美元,2025年预计可以增长到357亿美元。其中,国内厂商占据了中国服务器市场的主流,如中兴、浪潮、新华三等。
从服务器类别来看,x86服务器是目前最主要的服务器种类。2020年,x86服务器市场规模为826.02亿美元,占服务器市场的90.76%;非x86服务器市场规模为84.08亿美元,占服务器市场的9.24%。
我国数字经济之所以得以“狂奔”,离不开这些底层硬件厂商的“默默无闻”。据「自象限」了解,目前中国已经拥有全球门类最全、链条最长、上下游最完整,并且紧密衔接的最先进的产业链和供应链。
以中兴为例,目前中兴在算力层主要布局分为服务器产品和存储产品两部分。服务器主要以主流x86结构为核心,覆盖了英特尔、AMD、海光等平台,完成通用算力的多元化,满足多元化的场景需求。
▲ 图源中兴官网
据IDC发布数据,2022年中兴通讯服务器市场规模已提升至国内前五,蝉联国内电信行业X86服务器发货量第一。
当下国内服务器市场自产率比较高,市场高度成熟,同时基础服务器能力同质化比较严重,通用产品层并没有明显差异。近几年,中兴等部分厂商也在逐渐向高端服务器市场市场扩展,形成更强的竞争力。
二
算力难题,靶向突破
算力基础支撑着数字经济发展的同时,也反向带动着算力产业进入一个新阶段。
中国信通院的数据显示,从2016-2021年间,中国算力规模平均每年增长46%,截至2022年底,我国算力总规模达到180百亿亿次浮点运算/秒,存力总规模超过1000EB。
规模高速增长的同时,国内算力产业也存在许多问题。
首先,在摩尔定律逐渐失效的背景下,算力的增长速度逐渐跟不上需求增长。“过去讲18个月晶体管翻一倍,但现在算力的需求每12个月就已经翻了一倍。”郭树波提到,供不应求,让算力厂商们必须加速奔跑。
同时,我国算力发展也存在区域分布不均衡的状况。郭树波表示,“目前我国算力主要集中在北上广深,区域分布上主要集中在华南、华东、华中,华中也主要集中在北京,其他西北地区、中部地区算力还严重不足。”
在这样的背景下,国家开始推动“东数西算”战略,在京津冀、长三角、成渝、内蒙古等地建设数据中心。目标就是要降低算力成本,实现算力充足供给和区域平衡。
2022年2月,“东数西算”工程全面启动,但要让算力成本下降,成为更普惠的基础设施,仅靠将数据中心迁移到西部并不够,因为数据中心的算力越高,能耗就越高,高能耗又会带来散热问题,并最终推高数据中心的运营成本。
郭树波举了一个例子,英特尔下一代CPU达到了500瓦,再往后可能700瓦,一台NV-Link的GPU服务器11000瓦左右,ChatGPT刚火的时候需要375台,每天的耗电量就是“电老虎”。根据前瞻产业研究院的数据,数据中心计算带来的能耗占比45%,散热占比40%。
▲ 图源前瞻产业研究院
所以解决数据中心的高能耗问题,除了要持续优化计算性能,还要通过改善数据中心的制冷方式,进而降低数据中心能耗,已经成为推进我国数据中心高质量发展的必要措施之一。
随着数据中心算力的提高,传统的风冷散热模式已经无法满足需要,节能需求推动着液冷成为行业中主流的散热方式,分为浸没式液冷、冷板式液冷和喷淋式液冷等等。
顾名思义,沉浸式液冷是将机柜泡到液体里,喷淋式是将冷却液直接喷在发热键上,而冷板式液冷采用的则是用冷板替换原来散热板的方式。
这其中,沉浸式液冷散热效率最高,但这种方式需要将机柜平放,在寸土寸金的机房占地面积大,同时维修复杂,需要专门的机械手进行维护,再加上这种浸泡机柜的液体相当于液体黄金,价格比较贵,且具有一定的毒性。
相比较,中兴所采用的冷板式液冷采用的是用冷板替换原来散热片的方式,机柜仍然立体式摆放,它可以做到服务器与机柜解耦,冷板维护方便,再加上用来冷却的液体只需要水+乙二醇,不仅安全,而且价格便宜。目前我国数据中心液冷技术主要冷板液冷为主。
如同上文所讲,通用服务器同质化较严重,在比拼高性能服务器的路上,散热技术正在成为服务器的的重要优势。去年,中兴通讯在服务器市场的收入超过100亿元,市场份额从3.1%提升至5.3%。其采用的就是冷板液冷,并以此为基础面向数据中心推出全域液冷一体化解决方案,实现液冷机房、液冷服务器设备一体化集成开发、交付,PUE可低至1.13(PUE是评价数据中心能源效率的指标,越接近1,说明数据中心的能耗越低)。
当然,如果要给全国范围内的数字经济提供算力支撑,仅仅建成数据中心还不够。就像发电厂发出来的电需要电网传输到千家万户一样,数据中心的算力也需要“算网”来进行调配,达到随时可用,随处可用的目标。
为此,最近两年国内的几大运营商牵头,为了让算力在更大范围调动,更多消费者和行业提供算力,还需要连点成面,连面成网,算网能够让算力像电力一样随时可用。
数据显示,2023年三大运营商在算力方面的资本开支均保持20%以上增长。
建立数据中心之后,不同的地方要使用算力,还需要低延迟,这需要背后通信技术的努力。
面对算网建设的全方位需求,中兴通讯推出了Real 400G光传输方案,能够满足数据中心间大容量互联和数据长距离传输需求。今年初中兴通讯助力中国移动完成全球首个400G QPSK现网验证,无电中继传输5616KM,可承载“东数西算”长距离、大容量传输。
算力产业二十年磨一剑,为数字经济铸就坚实底座,这是“过去”;全新的液冷、节能服务器以及算网的搭建,这是“现在”;今年以大模型为首的AI技术,带我们更快的走向数智经济时代,这是一片更广阔的星尘大海。
二
AI2.0,算力的进化论
AI 2.0时代,数据规模将会再一次指数级增长。OpenAI近日发布的一份数据显示,2012年以来人工智能训练任务中使用的算力每3.5个月翻一倍,目前人们对算力的需求已经增长了超30万倍。
有研究预估,2030年人工智能的算力需求将比2020年增长500倍。
郭树波提到,目前通用算力已经无法支撑生成式AI等技术。“我们做过一个实验,用通用的英特尔服务器跑大模型,能跑起来,当你问它一个问题的时候,它回答每个字跳出的速度,几分钟可能蹦出一个字。”
单一算力已经无法满足产业发展的需要,算力开启了进化新篇章。
以AIGC为代表的新应用对数据中心的算力、网络、存储、安全都有新要求,数据中心的架构也会随之出现变化,从网络侧会要求更大的带宽,更低的延迟、无损,计算侧则会要求更高的算力密度。
为了应对新的挑战,算力厂商们也在加紧布局。
随着人工智能的发展,涉及到更多语音、图形、非结构数据类型,通用算力到智能算力,这要求底层服务器从同构算力到异构算力的变化,是当下两个最核心的趋势。
当前以CPU+GPU的异构算力得到越来越多的应用,但这只是异构算力的开端。未来随着回归正常的商业和技术模式情况下,NPU、DPU将被逐渐验证,会有更多处理器进入参与AI的计算。
这就需要服务器能够支撑从单一CPU到CPU+GPU、NPU、DPU等等,具备较强的可扩展性。
▲ 图源中兴官网
仍以中兴为例,目前,中兴已经布局R6500G5 GPU服务器,具备超强的异构计算能力,内置10~20个异构计算智能加速引擎,根据不同应用场景,灵活调度各种不同的异构算力资源,实现算力的最佳组合,如CPU+GPU、CPU+GPU+DPU,满足AI/超算等多样性算力场景需求。
预计2023年底,中兴通讯将推出新一代智算中心产品,高性能的AI服务器(R6900G5)将全面支持大模型训练和推理应用。GPU卡之间通过NVlink交换芯片,实现多卡的点对点互联,以及GPU卡之间数据的快速传输。
同时,中兴通讯也开始了进一步布局,推出了DPU(专用数据处理器)智能云卡,最大限度提高算力效率,将网络时延从数十微秒降低到微秒级,具备200Gbps以上的数据收发能力,从而实现了GPU算力的聚合,最大程度地提升了GPU集群的算力。
在产品层面的创新不断推动着中兴从通用服务器厂商跨越到了一个新台阶,未雨绸缪才能有备无患。
用发展的眼光看待算力行业,新时代的发展如同一辆高速飞驰的汽车,算力基础正如同汽车的底盘。
目前,中国数字经济、数智经济正迎来高速发展,这不仅需要有如智源研究院、阿里云、百度云一样的技术突破者,更需要中兴般的“技术筑路者”,二者形成合力,才能稳固向前。
编者按:本文转载自微信公众号:自象限(ID:zixiangxian),作者:程心、罗辑
广告、内容合作请点这里:寻求合作
咨询·服务