X
鼓楼区
台江区
仓山区
晋安区
马尾区
长乐区
福清市
闽侯县
连江县
永泰县
闽清县
罗源县
思明区
湖里区
集美区
海沧区
同安区
翔安区
芗城区
龙文区
龙海区
漳浦县
云霄县
诏安县
东山县
平和县
南靖县
长泰区
华安县
鲤城区
丰泽区
洛江区
泉港区
石狮市
晋江市
南安市
惠安县
安溪县
永春县
德化县
金门县
三元区
永安市
明溪县
清流县
宁化县
建宁县
泰宁县
将乐县
沙县区
尤溪县
大田县
仙游县
荔城区
城厢区
涵江区
秀屿区
延平区
建阳区
邵武市
武夷山市
建瓯市
顺昌县
浦城县
光泽县
松溪县
政和县
新罗区
永定区
上杭县
武平县
长汀县
连城县
漳平市
蕉城区
福安市
福鼎市
霞浦县
寿宁县
周宁县
柘荣县
古田县
屏南县
相关链接
低精度计算能否实现智算中心“轻装上阵”? _ 信息化动态 _ 福建省经济信息中心
低精度计算能否实现智算中心“轻装上阵”?
来源:《通信世界》杂志 时间:2025-04-14 10:13 浏览量:

  今年初,低成本、高性的能DeepSeek掀起了大模型狂潮,其在预训练中采用FP8与FP32混合精度技术也成为一项重大技术创新,前者可以大幅减少算力消耗,提高计算速度;后者则针对数据精度关键环节保证了模型的准确性。两者相结合,在不影响模型性能的前提下,实现了算力资源的高效利用。

  类似的思路也被用于智算中心建设,不再像去年行业卷“万卡集群”那样,智算中心从建到用更为注重性价比,低精度计算应势而起,正推动智算中心从“大力出奇迹”转向“四两拨千斤”的进化路径。

  所谓低精度计算是指采用FP8(8位浮点数)、FP6(6位浮点数)甚至FP4(4位浮点数)等低比特数值格式进行运算的技术体系。相较于传统FP32(32位浮点数)计算,其数据存储空间更小、计算能耗更低,不仅能够破解大模型训练和推理的算力难题,也有助于化解智算中心的能效比困境。

  就行业发展来看,智算需求爆发直接促使低精度计算的崛起。近年来,大模型和生成式人工智能推高算力需求,全球智能算力需求呈指数级增长。《2025年中国人工智能计算力发展评估报告》指出,未来两年,中国智能算力规模将保持高速增长。2023年至2028年期间,中国智能算力规模的五年年复合增长率预计达46.2%。然而,传统通用算力中心难以满足AI模型训练的高密度、低时延需求,智算中心作为专用基础设施的重要性得以凸显。

  在低精度计算的作用下,智算中心架构层的芯片技术变革最为明显。在GTC2025年大会上,英伟达发布的BlackwellUltra/Rubin系列芯片展现了算力精度下移的趋势。例如BlackwellUltra在FP4精度下的算力达到15PetaFLOPS,在特定推理场景中效率提升高达40倍。作为同类竞品的AMDMI350X芯片则创新性引入动态精度切换技术。通过支持FP4和FP6,推理性能较前代提35倍,FP8算力突破4.6PetaFLOPS。不仅如此,当前Meta、微软、AWS等巨头早已将低精度GPU列为采购核心指标。

  低精度计算应用于智算中心说到底还是为了突破算力瓶颈,解决算力应用难题,其虽然并非最优解,但已经成为一块“关键拼图”。面向未来智算中心的发展,业界当前探索出了两条关键路径。

  一是异构计算架构,不同于传统方案强调双精度浮动运算性能的超级计算,异构智算更多使用半精度浮动运算、整数运算,甚至更低精度的浮点运算,动态适配不同精度需求。在传统算力的局限与旺盛的市场需求共同作用下,通用算力、智算算力、超算算力、边缘算力等不同类型算力中心的融合发展将成为大势所趋。

  二是“超智融合”,作为异构智算的一种表现形式,“超智融合”即整合超算的高性能并行计算能力与智算的低功耗优化优势,通过软硬件协同提升算力效率。业内专家认为,随着AI应用场景越来越复杂,通过单一芯片平台提供全精度和混合精度计算,已成为“超智融合”发展背景下的算力基础设施发展趋势。

  技术路径找准之余,要想让智算中心“轻装上阵”,生态建设又是另一核心命题。与低精度计算相适配,国内仍需构建自主可控的开源框架,解决编程接口不统一、算子库适配难等问题。因此,智算中心的未来不是一道高精度或低精度的选择题,而是一道如何“恰到好处”协调适配各个环节的思考题。

  可以预见,智算中心走向应用的“下半场”,一定不再是单纯追求数值的堆砌,而是如何在有限资源里找到最优解。

  面向未来,笔者认为智算中心有三大趋势值得关注。一是全精度覆盖,兼顾低精度推理与高精度训练,满足差异化需求;二是超智算一体化,通过全国一体化算力网实现跨区域资源共享;三是AI原生设计,将AI技术深度融入基础设施建设与管理,实现自动化运维与动态优化。

  *本篇刊载于《通信世界》2025年4月10日*

  第4期总965期

扫一扫在手机上查看当前页面