X
鼓楼区
台江区
仓山区
晋安区
马尾区
长乐区
福清市
闽侯县
连江县
永泰县
闽清县
罗源县
思明区
湖里区
集美区
海沧区
同安区
翔安区
芗城区
龙文区
龙海区
漳浦县
云霄县
诏安县
东山县
平和县
南靖县
长泰区
华安县
鲤城区
丰泽区
洛江区
泉港区
石狮市
晋江市
南安市
惠安县
安溪县
永春县
德化县
金门县
三元区
永安市
明溪县
清流县
宁化县
建宁县
泰宁县
将乐县
沙县区
尤溪县
大田县
仙游县
荔城区
城厢区
涵江区
秀屿区
延平区
建阳区
邵武市
武夷山市
建瓯市
顺昌县
浦城县
光泽县
松溪县
政和县
新罗区
永定区
上杭县
武平县
长汀县
连城县
漳平市
蕉城区
福安市
福鼎市
霞浦县
寿宁县
周宁县
柘荣县
古田县
屏南县
相关链接
孙凝晖院士:建设面向智能时代的国家数据基础设施 _ 信息化动态 _ 福建省经济信息中心
孙凝晖院士:建设面向智能时代的国家数据基础设施
来源:国家数据局 时间:2025-02-26 15:42 浏览量:135

  最近,国家发展改革委、国家数据局、工业和信息化部编制和发布了《国家数据基础设施建设指引》,指导推进数据基础设施建设,推动形成横向联通、纵向贯通、协调有力的国家数据基础设施基本格局,打通数据流通动脉,畅通数据资源循环,促进数据应用开发,培育全国一体化数据市场,夯实数字经济发展基础,为数字中国建设提供有力支撑。为此,中国工程院院士孙凝晖著文,题为《建设面向智能时代的国家数据基础设施》,主要内容如下。

  数据已经成为智能时代的关键生产要素

  随着新一轮科技革命和产业变革的深入推进,数据成为继土地、劳动力、资本和技术之后的“第五个关键生产要素”,深刻改变着生产、生活和社会治理方式。在数据驱动的智能时代,数据被赋予了资源要素与价值加工两重属性,数据的资源要素属性包括数据的生产、获取、传输、汇聚、流通、交易、权属、资产、安全与隐私等。数据的价值加工属性是指原始数据需要经过生产、流通和加工等多个环节才能增值,原始数据的价值不大,加工越深入则增值越大,通过加工工艺(即算法)和加工动力(即算力),对数据进行深加工和模型提炼才能实现数据的价值释放。

  纵观人类历史,每一个时代变革都会孕育出新的基础设施,农业时代是交通基础设施,工业时代是能源基础设施,信息时代是互联网基础设施,到如今在数据驱动的智能时代,是数据基础设施。智能的本质是数据的百炼成钢,数据基础设施是面向社会提供公共的数据采集、汇聚、传输、加工、流通、利用、运营、安全服务的一类新型基础设施,它集成硬件、软件、模型算法、标准规范、机制设计等在内,形成一个有机整体,贯穿数据价值释放的全生命周期。

  数据基础设施的参考模型与技术体系

  《国家数据基础设施建设指引》将数据基础设施体系划分为四部分:算力设施,流通设施,网络设施和安全设施,其中,网络设施和安全设施是传统的信息基础设施,算力设施和流通设施是新型基础设施。网络设施提供高速泛在的连接能力,算力设施提供数据深加工的关键计算能力,流通设施提供跨域数据高效流转的流通能力,安全设施保障数据要素关联计算和共享流通过程的安全。四个设施共同支撑数据要素能够“供得出、流得动、用得好、保安全”。

  我们认为,数据基础设施从数据全生命周期的视角也可以将参考模型分为四层:数据汇聚层、数据流通层、数据加工层和数据应用层。第一层是数据汇聚层,进行行业和政府的数据资源建设,实现海量数据的汇聚、标注、清理,建设国家级的数据枢纽与数据战略储备,解决“供得出”的问题。第二层是数据流通层,构建数据流通体系,解决数据“流的动”的问题,其中关键组件包括:数据标识,实现数据空间中的数据入库、全域索引;数据交换,实现数据空间中的全域发现和可信交换;数据访问,实现数据空间中的数据访问与操作、高效传输。第三层是数据加工层,是以数据件等统一抽象封装加工的对象,以算力网提供“无尽”的算力供给,以模型网管理与调度各类Build-in模型,解决数据“用得好”的问题。第四层是数据应用层,基于AI基础大模型、BigData模型和HPC模型等三类模型,构建算法层的基础设施,通过AIAgent等技术实现复杂任务的处理,赋能千行百业。

  “东数西算”工程为数据基础设施建设打下良好基础

  国家发展改革委推动的“东数西算”工程是我国在算力网领域最早的政府行动计划,在推动算力的基础设施化上发挥了先导作用。“东数西算”工程稳步推进两年多取得很大的进展,算力资源集中向八大国家算力枢纽内汇聚,特别是西部枢纽节点充分利用了绿电资源。在技术创新方面也取得了明显的成效,包括:异属算力并网、异构智算统一纳管、算力站间直连网络;算力跨域调度、算网协同调度、广域数据快递;超算互联网应用模式、城市/省域算力网运营等。“东数西算”工程正在形成自己的技术体系。《国家数据基础设施建设指引》的发布,将进一步与“东数西算”工程、全国一体化算力网建设相结合,以人工智能应用为牵引,不断促进各类新增算力向国家枢纽节点集聚,推动算力、算法和数据的融合创新,打通数据共享流通的动脉,夯实我国数字经济的基础。

  对国家数据基础设施建设的建议

  (一)统筹建设数据利用与数据流通两类基础设施数据基础设施中的数据流通和数据利用是两套系统,当前阶段应优先发展数据利用基础设施,做强需求端,由需求端拉动流通端,最终实现整个数据基础设施的互联互通。回顾互联网初期,互联网信息的供给端有动力共享自己的信息,互联网用户建设一个网站,接入互联网,希望全世界的人都来访问和使用。当前阶段数据的需求端有动力利用数据,但供给端没动力提供数据。需要先把数据的利用做好,价值增值做大,才能激发起数据供给端的动力,才有可能推动数据的流通。

  (二)统筹数据基础设施技术体系的统一和差异当前数据基础设施的技术体系五花八门,各成一体。历史上网络协议有OSI七层模型,操作系统有宏内核和微内核两种架构,数据基础设施技术体系的参考架构和关键技术组件应该统一起来。数据具有强大的场景特性,不同场景下数据的增值模式、数据的流通管理方式都是不同的,应针对不同场景分类抽象,构建多个不同的技术体系技术栈,来具体建设不同的数据空间基础设施实例。

扫一扫在手机上查看当前页面