需求涌现,行业向着演进产业观察

自从2022年底,ChatGPT的问世,让人工智能技术又一次站在了科技舞台的中间。随着AI大模型的不断发展,对底层支撑算力供给的数据中心也带来了更多新的要求,而IDC行业也向着AIDC方向演进。

IDC与AIDC有何不同?

当AI算力需求呈现出爆发式增长时,传统的IDC显然已经不能满足当下各行业对于智能算力的需求。而在世纪互联创始人、中关村超互联新基建产业创新联盟理事长陈升看来,AIDC可以有两层解读。一方面,AIDC是AI DC,是人工智能计算的数据中心;另一方面,AIDC是代表了数据中心进入了加速计算的时代,即Accelerate(加速)数据中心。

而这个改变的过程中,首当其冲的就是交互界面的改变。原先,数据中心对于用户而言,IDC企业需要交付的是机柜,是底层的“风火水电”的基础设施;而在AIDC时代,用户侧只有30%的投资会投资在“风火水电”等基础设施层面,“用户70%的投资会在GPU与网络等层面。”陈升指出,“这对于IDC行业而言,可以说是‘地动山摇’般的改变。”

而随着用户对GPU、DPU等芯片需求的增加,单机柜的功率也随之变化,机柜功率也呈现出越来越高的趋势。据统计,现阶段,单机柜电力规模已经从原本的十几、几十千瓦,提升至120KW,甚至最高可达200KW,“现在一个机柜的功率,甚至可以达到过去整个机房功率的大小。”陈升如是说。

在这个过程中,加速计算显然已经成为当下炙手可热的市场之一。随着AI技术的快速发展和广泛应用,加速计算服务器在数据处理、模型训练、深度学习等领域发挥着越来越重要的作用。加速计算服务器通过集成高性能的GPU、TPU等AI加速芯片,可以大幅提升数据处理能力和计算效率,满足大规模AI应用的需求。

据统计,在过去10年间,加速算力提高了100万倍。从市场规模上看,据IDC发布的《中国半年度加速计算市场(2023全年)跟踪》报告,2023年中国加速服务器市场规模达到94亿美元,同比2022年增长104%。

而加速计算与高功率机柜带来的能源的改变,也是IDC向AIDC转变过程中重要的一环。对此,数据港相关负责人曾对钛媒体APP表示,建设“源网荷储一体化”供电系统是实现数据中心在满足AI算力需求的同时,向着低碳发展的重要举措。

目前已有多地开展相关探索,但在建设过程中受到电网运行机制的限制,源荷难以对接,需要国家、地方政府给予绿电直供、降低综合供电成本等政策支持。而对于接入电网的数据中心来说,既不能选择也无法鉴别电网输送来的电力是煤电还是风电,导致清洁能源使用率难以评估。

除此之外,AIDC与IDC时代的不同还体现在了包括计算、存储、网络、系统等各个环节的协同方面。传统IDC时代,存算分离的架构较多,而且网络是网络、机柜是机柜、系统是系统,各个板块协同比较少,而这一点,在AIDC时代将迎来改变,对此,中国工程院院士、紫金山实验室荣誉主任兼首席科学家刘韵洁院士表示,面向AI大模型时代,需要计算、网络、存储、系统协同,才能构建高性能算力底座,实现超大规模集群万卡协同。

IDC内外,网络架构是关键

AI大模型的快速发展对IDC基础建设方面的颠覆仅是“冰山一角”,要释放算力真正的价值,更好地服务于AI技术发展,算力传输的网络亦是关键所在。

如果将整个AI产业比作一个人,那么数据中心就是心脏,而网络就是血管,负责将养分输送到人的各个器官。

所以,随着各行业对AI算力的需求与日俱增,原有的互联网已经不足以满足快速、高效输送“养分”,供给AI算力需求。无论数据中心内外,网络架构也已经进入了变革的时代。

在陈升看来,在AI算力需求爆发下,现有的互联网就好比互联网发展初期拨号上网,借由电话线连接互联网一般,效率、速度显然无法满足需求。而当下,行业急需在传统互联网架构上,搭建一条新的网络通道,以满足AI算力传输需求。“大胆设想一下,AI原生世界和互联网是真正相互独立的‘平行世界’,AI不是互联网上的‘超级应用’,AI的终极目标是打造一个超越互联网的下一代全新网络信息空间。”——这是陈升对于未来网络架构范式的展望。

目前的互联网带来的是B2B、B2C,以及C2C的连接,未来的超互联时代,更多是M2M(机器之间)和A2A(数字分身之间)的连接,而他们交互的信息也不再是语言,而是token。

这条网络也必将成为未来AIDC之间的桥梁,陈升将这条桥梁比作哈利波特中的9¾车站,“它将是新一代AI原住民进入AI原生‘魔法世界’的车站入口。”陈升如是说。

对此问题,刘韵洁表示,对于算力网络而言,确定性是一个非常重要的基础,“确定性的网络可以为海量数据远距离无损传输提供关键技术支撑。”

刘韵洁指出,确定性网络首先带来的就是网络架构的变革,“因为要解决AI算力的需求,不是单一技术就能解决的,需求涌现,行业向着演进产业观察整个网络的架构都要进行系统性的设计才能解决。”刘韵洁明确,“但现有的网络架构是服务定制网络,而现在我们要将原先‘尽力而为’的网络架构,转变成一个确保所需的架构,才能满足当下算力对于网络的需求。”

与此同时,在确定性技术不断演进的过程中,还需要整个网络底层跟光通信融合,“无论是数据要素,还是大模型训练、推理,都需要具备不同宽带、不同网络的随时可定制化。”谈及未来AI发展需要的网络基础时,刘韵洁这样认为。

基于该背景,中关村超互联新基建产业创新联盟与世纪互联共同提出了超级互联(UltraCrossConnects,简称UCC)理念。据悉,超级互联包含ICC和DCC,即智能互联(IntelligentCrossConnects,ICC)和分布式互联(DecentralizedCrossConnects,DCC)。ICC是指一个具备AI推理能力,承载各种生成式AI创新应用的智能推理应用入口;DCC是指构成数字新世界的“脑神经网络”,具有无所不在、无时不有的分布式属性。UCC不是简单的宽带升级,而一种全新的万物智能互联方式,一个让人、机器、模型和数据更紧密连接的未来世界的愿景。

陈升表示,中关村超互联新基建产业创新联盟与世纪互联希望UCC理念不仅是网络实验局,而成为新世界的实验局,“由世纪互联长期为创新公司提供后台技术支持,今天既为下一代互联网公司服务,同时也能够为像NVIDIA这样成为世界人工智能革命引擎的芯片公司服务,”陈升表示这是世纪互联接下来努力的方向之一。

而这也不是“独一份”的网络“重建计划”,钛媒体APP了解到,中国信通院也曾提出“算力服务时延圈领航者计划”,力图规范化、标准化算力网络建设。据了解,该计划在1.0标准互联网访问基础上,面向算力节点覆盖、网络时延、传输质量、统一管控等方面,联合产业界持续构建算力服务时延圈2.0标准体系,重点围绕算力服务接入、算间互联、时延地图、管控调度等方面进行标准化,统一算力时延圈定义,规范网络时延测试方法。

套用刘韵洁的一句话:原来企业只关心自己的智能化改造、网络化改造,现在整个上下游的产业价值链,如果不连通起来就会受到制约,所以在人工智能时代,行业大模型的发展就显得尤为重要。

IDC服务商迎来新机会

对于算力平台而言,底层逻辑是对算力资源的分配、调度、削峰填谷,在能效、业务、用户、性能等多维度中寻优。

而随着这一波算力产业的发展,对于IDC服务商而言,也迎来了新一轮的竞争,一方面,各大IDC服务商也争先恐后的布局算力网络和算力平台的相关产品及服务。

普洛斯目前在基础设施层面建立了全面的能效量化与观测指标。在算力平台调度的过程中,追踪基础设施的容量变化,通过建立专家、AI等技术手段动态调整基础设施的运行策略,从而支撑算力平台的快速调度。普洛斯数据中心通过智慧化的运营管理,帮助客户实现从楼栋到园区再到全国的统一管控,并结合各地的情况,更有效地支撑其在当地算力的最高发挥。

世纪互联则是在算力平台、调度、网络底层协议、AI框架、Agent等方面都有大量的投入和积累,世纪互联的目标是构建跨区域、高效、异构、可扩展的AI基础设施。

据了解,世纪互联目前在全国已经运行了多个跨区域的节点,节点间通过创新的AINet连接,实现不同品牌和型号的GPU异构算力和资源的调度协同,实现了在大模型训练、微调、推理、应用全生命周期的应用和落地,满足不同类型的客户需求。

除了IDC服务商的积极布局以外,作为算力重要载体的云计算厂商也纷纷入局算力网络建设,以中国电子云为例,中国电子云基于云原生理念设计了中国电子云专属云CECSTACKV5一体化算力平台,旨在帮助企业实现多元异构算力的统一管理和调度,并提供通用计算、智能计算和高性能计算等类型算力的一体化算力服务。

除此之外,诸如青云科技、Ucloud等众多云计算服务商也都在算力调度方面有着积极的布局。

另一方面,布局具备承接智算项目能力的数据中心也必将成为接下来各大IDC服务商的重点。

展望未来,唯有网络与机房“双管齐下”,才能让IDC更好地服务于AI产业的发展,让IDC走向AIDC。(本文首发于钛媒体APP,作者|张申宇,编辑丨盖虹达)

免责声明:本网站部分内容由用户自行上传,若侵犯了您的权益,请联系我们处理,谢谢!联系QQ:2760375052

分享:

扫一扫在手机阅读、分享本文

圆甄

这家伙太懒。。。

  • 暂无未发布任何投稿。