“百模大战”浪潮下,华为携盘古大模型重磅出击。
7月7日下午,华为开发者大会2023(Cloud)在东莞拉开帷幕,证券时报·e公司记者亲历现场。华为在这场大会上披露了盘古大模型的几大重要进展:第一,华为云盘古大模型3.0版本正式发布,包含五个基础大模型、N个行业大模型以及更多细分场景模型;第二,盘古大模型首次明确行业定位,将深耕行业,拟重塑千行百业;第三,盘古大模型迎来首次重大升级。
从能力来看,盘古大模型已具备文生图、文生文、文生代码、文生视频等多模态能力,从调用内容来看,用户可直接调用公开通用大模型,也可以利用自身行业数据训练自己的专属大模型,支持公用云、大模型云专区、混合云等多样化部署。
【资料图】
在当天的媒体沟通环节,华为常务董事、华为云CEO张平安回应证券时报·e公司提问时表示,华为在AI大模型领域投入非常大,而在商业化落地方面也为客户提供了多样化的服务模式,但现在谈AI大模型收益还为时过早。
同时,张平安表示,华为云盘古大模型全栈技术均由华为自主创新的,没有采用任何开源技术,另外,由于华为云盘古大模型定位于赋能千行百业,这里面必将聚集无数行业大数据(涉及行业机密等),因此未来盘古大模型不会开源。
至于盘古大模型是否开放公测渠道,华为云CTO张宇昕回应,华为云盘古大模型一直是开放的,但因为定位于行业大模型,所以不会对个人开放公测。
张平安:盘古大模型不作诗
张平安在会上表示,当前,AI技术从多分支发展进入大模型时代,这让AI支撑上亿的参数,变成了通用技术,“现在是大模型的时代,是创新的时代”。
张平安说,OpenAI发布ChatGPT后,各种大模型层出不穷,全球已发布数百个大模型,中国已发布80+大模型,toC类应用百花齐放。
“目前已经发布的大模型中,不少会作诗,但盘古大模型不写诗,只会做事,因为它要深入到各行各业中去,赋能行业创造价值。”张平安说,盘古大模型聚焦产品研发、软件工程、生产供应、市场营销、客户运营等价值场景,致力于深耕行业,如政务、金融、制造、煤矿、铁路、制药、气象等。
随后,张平安在媒体沟通环节回答提问时表示,写诗、作画是最不应该被AI大模型所替代的能力,因为写诗、画画是人类个性化思想、创作的展现。
在昨日举行的2023世界人工智能大会上,华为轮值董事长胡厚崑也表示,每一轮科技变革都带来了深远的影响,通用人工智能正在开创下一个黄金十年,人工智能的发展,关键要“走深向实”,赋能产业升级,服务好千行百业、服务好科学研究。
华为创始人任正非也曾指出,未来在AI大模型方面会风起云涌,不只是微软一家,人工智能软件平台公司对人类社会的直接贡献可能不到2%,98%都是对工业社会、农业社会的促进。
盘古大模型3.0正式发布
华为云盘古大模型2020年启动研发;2021年4月,华为发布了盘古NLP(中文语言)大模型、盘古视觉大模型、盘古科学计算大模型;2021年9月,华为推出用于药物研发细分场景的大模型;2022年,华为与能源集团合作发布了盘古矿山大模型、盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型。
在本次大会上,华为云正式发布了盘古大模型3.0,此乃盘古大模型发展历程中又一重要进展。
“盘古大模型3.0将围绕行业重塑、技术扎根、开放同飞三大创新方向,持续打造核心竞争力,为行业客户服务。”张平安在会上介绍,盘古大模型3.0是一个面向行业的大模型系列,包括“5+N+X”三层架构。
其中,L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求,提供100亿参数、380亿参数、710参数和1000亿参数的系列化基础大模型,匹配客户多样化需求。同时提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,用户可直接调用这些技能。
L1层是N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型。
L2层则为客户提供了更多细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。
张平安称,盘古大模型采用完全的分层解耦设计,可以快速适配、快速满足行业的多变需求,支持公用云、大模型云专区、混合云等多样化部署形态。
大模型如何赋能行业?
张平安表示,目前盘古大模型已在金融、制造、医药研发、煤矿、铁路等诸多行业发挥着巨大价值。
在政务领域,华为云携手深圳市福田区政务服务数据管理局,上线了基于盘古政务大模型的福田政务智慧助手小福,能够精准理解民众咨询意图,改变传统的一网通办模式,把老百姓的话语转化为政府办事的语言。盘古政务大模型对超过20万条政务数据进行精调,包括12345热线、政策文件、政务百科等,掌握了丰富的法律法规、办事流程等行业知识。
在煤矿领域,盘古矿山大模型已经在全国8个矿井规模使用,一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,让更多的煤矿工人能够在地面上作业,不仅能让煤矿工人的工作环境更加舒适,而且可以减少安全事故。
在铁路领域,盘古铁路大模型能精准识别现网运行的67种货车、430多种故障,无故障图片筛除率高达95%,成为货运列检员身边有力的数字助手,将列检员从每日数百万张的“图海”检测中解放出来。
在气象领域,盘古气象大模型是首个精度超过传统数值预报方法的AI预测模型,同时预测速度也有大幅提升。原来预测一个台风未来10天的路径,需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。现在基于预训练的盘古气象大模型,通过AI推理的方式,研究者只需单台服务器上单卡配置,10秒内就可以获得更精确的预测结果。
在金融领域,盘古金融大模型可以对银行的各种操作、政策、案例文档进行预训练,能根据客户的问题,为柜台工作人员自动生成流程和操作指导,将原来需要平均5次的操作降低为1次,办结时间缩短5分钟以上。盘古大模型让数十万网点柜员都拥有自己的智慧助手。
在制造领域,过去单产线制定器件分配计划,往往要花费3个小时以上才能做齐1天的生产计划。盘古制造大模型学习了华为产线上各种器件数据、业务流程及规则以后,能够对业务需求进行准确的意图理解,并调用天筹AI求解器插件,1分钟即可做出未来3天的生产计划。
在药物研发领域,原来一款新药研发平均需要10年时间、花费10亿美金。盘古药物分子大模型助力西安交通大学第一附属医院刘冰教授团队发现全球40年来首个新靶点、新类别的抗生素,并将先导药物研发周期缩短至1个月、研发成本降低70%。
张平安表示:“盘古大模型要让每个行业、每个企业、每个人都拥有自己的专家助手,我们始终坚持AI for Industries的战略,在深耕行业的道路上不断前行。”
(文章来源:证券时报)