X
鼓楼区
台江区
仓山区
晋安区
马尾区
长乐区
福清市
闽侯县
连江县
永泰县
闽清县
罗源县
思明区
湖里区
集美区
海沧区
同安区
翔安区
芗城区
龙文区
龙海区
漳浦县
云霄县
诏安县
东山县
平和县
南靖县
长泰区
华安县
鲤城区
丰泽区
洛江区
泉港区
石狮市
晋江市
南安市
惠安县
安溪县
永春县
德化县
金门县
三元区
永安市
明溪县
清流县
宁化县
建宁县
泰宁县
将乐县
沙县区
尤溪县
大田县
仙游县
荔城区
城厢区
涵江区
秀屿区
延平区
建阳区
邵武市
武夷山市
建瓯市
顺昌县
浦城县
光泽县
松溪县
政和县
新罗区
永定区
上杭县
武平县
长汀县
连城县
漳平市
蕉城区
福安市
福鼎市
霞浦县
寿宁县
周宁县
柘荣县
古田县
屏南县
相关链接
在工业大模型规模化赋能的路上,还有多少“拦路虎”? _ 政务云资讯 _ 福建省经济信息中心
在工业大模型规模化赋能的路上,还有多少“拦路虎”?
来源:通信世界全媒体 时间:2024-07-24 08:29 浏览量:

  在科技发展的浪潮中,人工智能以其前所未有的力量,正深刻地改变着我们的世界。其中,大模型作为AI技术的重要突破,正逐步成为推动各行各业转型升级的关键力量。大模型,以其强大的数据处理能力、复杂场景下的高适应性以及持续学习的潜力,正逐步渗透并赋能千行百业,开启了一个全新的智能时代。

  大模型赋能千行百业,初见成效

  大模型,顾名思义,是指具有大规模参数和复杂计算结构的机器学习模型,拥有数十亿甚至数千亿个参数。早在1956年,计算机专家约翰·麦卡锡提出了“人工智能”概念,AI发展由最开始基于小规模专家知识逐步发展为基于机器学习。到2022年,ChatGPT横空出世,彻底把这一概念由以往仅限在专业领域传播向了普罗大众。

  在国内,相关领域内的研究也早已开始。2001年中国科学院计算技术研究所成立了机器学习与数据挖掘实验室,开始了对大模型的研究工作。2011年,百度推出了基于大数据和大模型的搜索算法“海量深度学习技术”。此后,国内的互联网公司纷纷加大在大模型领域的研发投入,推动了大模型在搜索、推荐等多个领域的应用拓展。发展到今天,在大模型领域已呈现“百模大战”的景象,截至2024年3月,通过国家网信办备案的大模型就有117个。

  目前,在金融、医疗、教育、农业等多个行业,国内已集中诞生了一批AI大模型应用。在金融行业,金融机构可以利用大模型处理和分析大量的金融数据,提高决策效率和准确性,优化资源配置,降低风险。在医疗领域,大模型可以在医疗文本处理、医疗问答、医疗影像诊断、疾病预测等场景下发挥作用。通过处理和分析医疗记录、临床试验数据和医学文献,辅助医生进行更准确的诊断,提供个性化的治疗建议,提高医疗服务质量。而在教育行业可以利用大模型进行个性化学习、自动评分和教育资源的智能推荐,满足学生的个性化需求,提高教学效果和学习体验。在农业领域,大模型被用于精准农业、资源管理等方面,通过分析土壤、气候、作物生长等数据,为农民提供精准的种植和管理建议,提高农作物的产量和质量。

  这些领域的应用展示了大模型对行业的巨大赋能作用,按照目前的发展速度,随着技术的不断进步和应用的深入,大模型将在更多领域发挥更突出的作用。

  工业领域规模化赋能,道阻且长

  大模型在工业领域的应用,相较于其他行业,进度要稍慢一筹。

  当前,我国工业拥有41个工业大类、207个中类、666个小类,涵盖了联合国产业分类中的全部工业门类,在全球500种工业品种中,‌我国有4成以上的产品产量位居全球第一,具有全、多、大的独特优势。相关数据统计,2023年我国全部工业增加值达到39.9万亿元,占GDP比重31.7%。此外,‌我国制造业规模占全球的30%以上,‌连续14年位居全球第一。庞大的产业规模,为工业大模型的规模化赋能提供丰沃的“土壤“,同样也带来了诸多挑战。

  腾讯发布的《工业大模型应用报告》指出,工业大模型的应用场景集中在研发设计、生产制造、经营管理和产品服务四个环节。目前工业大模型应用存在预训练工业大模型、微调、检索增强生成三种主要构建模式,且三者之间并不独立存在往往会采用多种模式共同发力。那么制约工业大模型的发展,究竟有哪些因素呢?

  一是数据。工业领域虽然场景众多,存在大量数据,但碎片化现象明显。工业数据收集和清洗历来就是一大难点,再加上各个企业之间因为规模、技术实力的差距,也容易造成数据采集、治理水平的参次不齐。当前我国的数据市场,尚处于早期发展,还未建立起比较完善的数据共享、确权机制。此外,大多数企业十分重视数据安全,很多都要求大模型的数据要本地化部署,数据不出企业或园区是基本要求,工业领域存在严重的跨行业、跨场景数据壁垒问题。这就导致工业大模型在构建时难以获得全面、高质量的数据进行深度学习训练。

  二是成本。据了解,大模型的部署成本中,不仅包括算力成本、部署成本,还包括试错成本、人力成本等。模型越大、参数越多,所需的算力成本就越高。这是动辄百万千万甚至上亿的支出。训练大模型还需要大量GPU的支持,这是一笔不小的硬件支出,以微软与英伟达合作推出的MegatronTuring-NLG模型为例,训练中消耗了4480块A100GPU,单次训练的成本就是数百万美元。其他的建设费用、运营成本,人才培养……对于一些企业来说,是不小的负担。在国家统计发布的数据中,以2023年为例,规模以上工业企业平均利润率为5.76%,较低的利润让很多企业在大模型的投入上望而却步。

  三是应用场景和行业知识的限制。工业领域规模庞大范围广,41个工业大类、207个中类、666个小类,涉及千千万万的应用场景,单是做到覆盖这些场景就很不容易。何况在前沿技术与真实应用场景之间也存在较大差异,工业大模型在不同场景下的适配性和泛化性有待提高。大模型在赋能某一行业时,就需要该行业的专业知识,而不同行业的专业知识差异巨大,相关的知识、经验难以复用。目前很多通用大模型缺乏对应行业的深入知识,这使得它们难以解决行业中遇到的复杂任务。

  以上三点,是当前工业大模型在发展过程中遇到的主要痛点,造成现阶段大模型在工业领域内部署率较低,但也说明未来存在着巨大的上升空间。积极去解决这些问题,让工业大模型早日规模化赋能相关产业,将会对我国工业的未来发展产生深远影响,不仅将夯实中国的工业实力,还将为相关产业的未来发展提供新的动力和方向。

扫一扫在手机上查看当前页面