中国储能网欢迎您!
当前位置: 首页 >数智化储能系统>AI与人工智能 返回

行业大模型如何智胜?

作者:记者 王伟 来源:能源评论杂志 发布时间:2025-02-28 浏览:

中国储能网讯:继通用大模型引爆市场“百模大战”后,行业端垂直大模型领域也开始“千帆竞发”,开启赋能升级模式。

与通用大模型、专用小模型相比,行业大模型需要如何创新?

能源行业大模型有何特点?“算力+电力”该如何实现节能降耗、绿色发展?

能源企业在应用大模型技术时,应遵循什么样的节奏科学安排发展路线图,以实现可持续发展?

在本刊与许继电气联合举办的第36次《能源评论》学术沙龙上,学界与业界专家展开了研讨。

专家们表示,行业大模型需结合业务应用场景,更轻量、更专业、更普惠是其未来方向。为此,需要三个层面的智慧:

技术之智:需大小模型协同,通用模型与专用模型结合。

应用之智:需从场景入手,协同联动,统筹推广节奏,超前布置智能体,平衡技术先进性和投入产出比。

战略之智:需要“以人为本”的人工智能,融入核心业务,以更高的准确性和适用性,更低的成本和能耗,实现更科学、更可持续、更绿色发展。

消费端大模型的“百模大战”达到了高潮。蛇年春节前后,现象级产品——深度求索(DeepSeek)公司的大模型以推理能力强、性价比突出的特点引发全球关注。

据DeepSeek报告称,其大模型V3和R1以极低训练成本(同类开源大模型的1%)达到与OpenAI O1模型相近的性能。

DeepSeek的影响力正在不断破圈,其开源的商业模式、相对高维的算法架构、较低的训练成本也给不断走深的行业应用带来震撼,可能引发产业格局重新调整。

据不完全统计,目前已有十几家能源央企推出了行业大模型,分别应用于电网、水电、煤电、核电、煤矿、油气等领域,其中超过一半的产品为2024年推出。从全球来看,咨询机构Indigo的研究显示,人工智能在能源领域的潜在应用已达50余种,相关投资超130亿美元。

与通用大模型不同,行业大模型会针对特定应用场景进行深度优化,将在赋能行业数字化智能化转型和高质量发展方面发挥重要作用。从实践来看,目前的行业大模型同样面临诸多挑战,如成本高、高质量数据搜集难度大、多模态数据融合技术难度高等。在技术层面,行业大模型同样面临一系列短期难以解决的问题,如算法黑箱、灾难性遗忘、认知幻觉等。

2025年将是我国行业大模型取得深入应用的关键一年。部署行业大模型落地应用,赋能产业转型升级和高质量发展,除了需要遵循项目开发的普遍规律,还需要在技术、应用和战略层面具备大智慧,才能解决技术、经济和发展难题,促进人工智能技术真正融入核心业务全流程。

技术之智:创新场景,通专结合

行业大模型如何扬长避短,将“大力出奇迹”与轻量化完美融合?

答案是持续迭代。DeepSeek崛起的案例表明,目前大模型领域格局仍然在动态变化,人工智能技术还没到天花板。业界专家表示,这不仅是简单的技术升级,或者是粗暴的价低者得,而是更新了业界对创新的认知,给国内AI行业注入了强心剂:中国的科技团队有能力创造世界级成果,打破“堆算力+拼资金”的路径依赖,开辟“高效率+低成本+自主可控”的新赛道。

大模型一般是指具有10亿参数的深度学习模型,通常由深度神经网络构建而成,以“预训练+微调”的模式投入应用。

如今,大模型参数量已达数万亿,训练的多模态数据可以扩展到上千TB(太字节)。2024年3月,中国国家数据局局长刘烈宏公开表示,中国10亿参数规模以上的大模型数量已超100个,行业大模型已形成上百种应用模式。

更加高效的基础大模型和可复制、可推广的轻量化智能体,将成为行业大模型的一个发展方向。

中国信通院发布的报告显示,2025年大模型生态将向多元化方向发展,细分场景能力的产品化将成为供应商企业协同提效和盈利增长的关键。

与通用大模型面对的普通用户不同,行业大模型尤其是能源电力大模型面对的是网架交织互联、安全要求极高的物理设施,一方面,需要与物理经济社会系统高度耦合,参数具有较高的专业性和复杂性;另一方面,所需算力资源巨大,安全可靠性和计算时效性要求极高。

以中国石油的昆仑大模型为例,其最近一次更新除了尺寸参数增至700亿,还扩展至43个石油行业的应用和场景。该模型覆盖勘探开发、炼油化工、油气储运、产品销售、工程建设和装备制造等业务领域,具备行业知识问答、物体检测、图文生成等能力,可有效解决能源化工行业各环节业务问题。

网络上有一个比喻:大模型是多功能的军刀,什么都能干,但专业性稍弱;小模型是砍骨刀,专注砍骨100年。

学界和业界专家表示,大模型提出之后,仍需强调大小协同、通专结合。基于大小协同的思路,原来的人工智能小模型也无须一概摒弃,合理的策略应该是,通过大模型统筹调动小模型的能力,例如人脸识别、车牌识别这些比较成熟的小模型,大模型可以直接利用起来。通专结合则意味着,行业大模型作为“底座”,将不同专业场景的模型体系化,像穿针引线一样进行调度,并为专业场景模型提供兜底保障。

融合不同模型,对于提升电力系统运行效率、增强电力系统的安全性和可靠性、促进新能源消纳、优化电力设备维护、提升电力交易和市场管理效率,都具有很高的价值和广阔的空间。从这个角度而言,无论是与传统的电力运行、设备检修、值班调度、功率预测等方面的小模型结合,还是与电力大数据分析的工业增加值预测、企业生产景气度、产业链平衡度等小模型结合,都具有足够的综合价值。

DeepSeek推崇的开源模式也会对现有格局产生冲击。中小企业可以借助开源大模型的技术开发性能先进的小模型,适配各类行业应用场景,进行定制开发,助力大模型在各行业落地。有专家表示,一个时代开始后就回不去了,就像人类会使用火后,对多数人而言,吃过熟食后,就很难再吃生肉了。

应用之智:统筹协同,发力“智能体”

国际咨询机构弗若斯特沙利文发布的《2024年中国行业大模型市场报告》显示:2024年,中国行业大模型的市场规模约为165亿元人民币,同比增长57%;预计到2028年,市场规模有望达到624亿元。

行业大模型需结合业务场景推广应用已成共识。应遵循什么样的节奏安排大模型的演进路线和应用节奏?

大模型参数多、训练数据多,进而导致系统庞大、训练耗时、耗能且费钱。降成本成为大模型发展的重要方向。DeepSeek的技术路线表明,低成本的路线并不是遥不可及。低至数百万美元的预训练成本,或许真的能加速新旧时代的交替。

在应用端,一个好的解决思路是集中训练、分布推理。科大讯飞羚羊工业电力行业解决方案总监王刚认为,大型能源企业需要有顶层设计,统筹考虑如何排兵布阵——集团总部做什么,产业单位和区域公司做什么。从该公司的合作经验来看,较好的方式是总部提供整体的集中式训练环境和技术条件,同时允许多个二级单位自主创新,基于本部门本地区的场景驱动来推广应用场景化的大模型。

国家电网公司对于部署开发大模型明确提出,在企业层面强化模型、样本、算力、平台的统筹,以大模型为核心构建应用体系,拓展应用场景,有计划、分批次推动人工智能在各专业各单位落地。

风投机构A16Z的研究显示,大模型推理成本3年来已降至原来的千分之一。来自阿里云的专家认为,从国内外大模型应用来看,高性价比、高弹性、高可用和就近合理分布的公共云算力支持是必然的选择,更是模型推理成本持续下降、实现技术普惠的基础支撑。

随着应用的逐渐深入,行业大模型也将令行业及企业生产关系产生深刻变化。

OpenAI将通用人工智能的级别划分为五级:聊天机器人、推理者、智能体、创新者、组织者。

目前,企业对于人工智能的主要应用方向逐渐明确:通过智能体优化对外的产品服务,以及内部的流程管理。

美国云计算软件企业Salesforce首席执行官马克·贝尼奥夫认为,人工智能的未来在于智能体,而不是大语言模型驱动的聊天机器人。2024年10月,Salesforce的人工智能定制平台上线,据称一周内达成200个交易,IBM、埃森哲、联邦快递等公司已开始使用。

在360集团创始人周鸿祎看来,实现更多人工智能应用落地的关键是建立信仰、培养素养;如果说2024年是专业大模型应用启动年,那么2025年将是智能体之年,重点是利用智能体全面提升大模型应用场景的自动化、智能化水平。有分析认为,2025年智能体已经成为科技公司、大模型企业、软件企业角逐的重要领域,未来将构建起万亿美元的市场规模。

战略之智:从概率到推理,发挥两大优势

现在的大模型被认为是个基于语言符号和概率统计的大号计算器,未来其如何才能融入行业核心业务?

从科学层面看,大模型的归纳法运作机制依然是一个巨大的黑箱,根本的科学原理仍然难以解释。多位专家表示,目前的大模型的核心技术尚未超出对数据进行压缩和编码的范畴,如果要把智能研究变成科学问题、数学问题,让大模型用人的逻辑进行推理,就要有很好的数学理论框架支撑。

在应用端,行业大模型正在向具有深度复杂推理以及多模态任务进行升级。在推理能力方面,通用大模型依靠的是“大力出奇迹”带来的涌现效应,行业大模型如何从算法、算力和芯片层面进行系统设计正在成为业界探索的新方向。

春节前夕,豆包1.5pro版本、DeepSeek-R1、Kimi k1.5陆续推出,这些升级举措或许指明了大模型领域的竞争方向——全面提升多模态能力、推理能力。据了解,美国谷歌公司也在测试一款推理模型 Gemini Flash 2.0 Thinking。

业界专家表示,从本质层面,人工智能如果只是停留在表面,不能进入核心业务场景建立机理模型,将永远只是辅助角色,只有建立可以科学计算的大模型,才能真正促进行业发展和产业进步。

中国电力科学研究院正高级工程师,电力异构融合类脑计算关键技术研究项目负责人、电力人工智能大模型分布式算力调度与协同训练推理项目执行负责人周飞认为,大模型要安全可靠融入电力系统各业务环节与核心业务,在科研层面,需要构建电力原生时序大模型;在应用层面,可以将具身智能与智能体相结合,构建电力具身智能体,为大模型添加“可行动的躯体”。

以国家电网公司发布的光明电力大模型为例,作为面向电力行业的千亿级多模态大模型,其具备电力知识记忆理解、多模态融合分析、业务逻辑推理、基础数值计算、内容辅助生成等能力,已在电网规划、电网运维、电网运行、客户服务等多个领域得到应用。

算力带来的电力需求激增同样是业界关注的重点。目前,数据中心单机架平均功率从8千瓦升至17千瓦,预计2027年达到30千瓦。据专家介绍,现在的大模型能源消耗达到兆瓦级,人类大脑的能耗只有十几二十瓦。

改进的一个手段是剪枝压缩技术。应用剪枝、量化、知识蒸馏等技术,可以减少模型计算量和算力需求。

另一个改进方向是电力算力协同。对于系统延迟要求不高的大模型训练,将算力布置在西部北部等新能源富集的地区,以充分利用绿色能源,实现可持续发展。

一个需要注意的问题就是杰文斯悖论:当某种资源的利用效率提高后,虽然单次使用消耗更少、成本更低、使用更方便,但是由于需求的增加会导致整体消耗量的上升。典型的案例是, 18世纪瓦特改良蒸汽轮机提升效率后,英国煤炭消耗量持续上升了100余年。

对算力而言,开源模型低成本的技术创新有望加速应用侧的布局,随着成本的降低,人工智能应用的规模可能会呈指数级增长,带来整体算力需求上升。

专家表示,超大规模智算集群是大模型发展的技术基础,在“十五五”谋划阶段,需要做好超大规模智算集群建设规划,强化基础要素保障。

从行业应用角度,中国发展人工智能拥有两大独特优势:一是充足实惠的电力资源的保障,可以让企业降低训练和运行用电成本;二是海量新型应用场景数据的孵化,可以整合海量高质量行业数据,快速提升模型知识密度,让其能力越来越强大。

《全国数据资源调查报告(2023年)》显示,2023年,我国数据生产总量达32.85ZB(泽字节),同比增长22.44%,同时生产总量中只有2.9%的数据被保存。存储数据中,一年未使用的数据占比约4成,数据加工能力不足导致大量数据价值被低估、难以挖掘复用。

从这个角度而言,中国人工智能实现并跑的故事才刚刚开始,领跑只是时间问题。

延伸阅读  

智能体(Agent)是指能够感知环境、作出决策并采取行动的系统。它可以是软件、硬件或一个系统,具备自主性、适应性和交互能力。Agent通过感知环境中的变化(如通过传感器或数据输入),根据自身学习到的知识和算法进行判断和决策,进而执行动作以影响环境或达到预定的目标。

分享到:

关键字:人工智能

中国储能网版权说明:

1、凡注明来源为“中国储能网:xxx(署名)”,除与中国储能网签署内容授权协议的网站外,未经本网授权,任何单位及个人不得转载、摘编或以其它方式使用上述作品。

2、凡本网注明“来源:xxx(非中国储能网)”的作品,均转载与其他媒体,目的在于传播更多信息,但并不代表中国储能网赞同其观点、立场或证实其描述。其他媒体如需转载,请与稿件来源方联系,如产生任何版权问题与本网无关。

3、如因作品内容、版权以及引用的图片(或配图)内容仅供参考,如有涉及版权问题,可联系我们直接删除处理。请在30日内进行。

4、有关作品版权事宜请联系:13661266197、 邮箱:ly83518@126.com