落地与否成检验大模型能力的唯一标准。外界之前普遍认为腾讯在大模型上的动作慢了,但实际上腾讯一直踩在自己的节奏里。
文|徐鑫
(资料图)
编|周路平
经历三个月的行业落地应用探索后,腾讯云行业大模型迎来了三大升级。
底层能力层面,腾讯一方面公布了 自研大语言模型混元的新进展 ,另一方面宣布 MaaS平台全面接入20多个主流开源模型 。这意味着,腾讯云正基于业界的需求和动向,及时做出了自己的反应。
平台能力层面,针对过去大半年国内产业客户在大模型ToB落地摸索中,遭遇成本高、门槛高等普遍难题, 腾讯云继续升级大模型训练、精调工具链,覆盖大模型开发全生命周期 ,进一步帮助企业降低大模型应用落地门槛。
在应用层,腾讯云更新升级了包括腾讯企点分析·AI助手在内的 10款智能应用和解决方案 ,展示了这些产品在用户体验提升和效率升级上的价值。
当下,业界有观点认为大模型在行业化落地缺乏亮眼的应用,价值有待进一步彰显。
腾讯云此次能力升级延续了实用路线,继续 从产业需求和当下的应用实践出发 ,着眼于解决行业内在大模型训练或应用场景中遇到的现实问题。
01
市场需求催生三大升级
企业里的“表哥”“表姐”应该都尝过这种痛,明明只想简单了解“最近业务的销售情况”,却要花费大量精力和时间。对指标、拉数据,链路长,流程复杂,可能还需要拜托隔壁的专业数据分析团队,才能得到结果。
如果有一个智能分析助手,只需在对话框输入想了解的信息,马上就能调取数据、分析,提取结论,并且一键生成报告,显然能大幅提升工作效率。
大模型时代,这样的智能小助手离普通用户并不遥远。9月7日,腾讯全球数字生态大会上,腾讯云宣布,基于行业大模型技术,更新升级近10款智能应用和解决方案,加快大模型在产业落地。上述的腾讯企点分析AI助手就是升级的其中一个应用,目前已向大客户开放内测申请。
它的智能能力来自分析大模型的加持,融入了专业的数据分析知识、不同行业的分析指标体系,可依据行业特点进行意图理解、思路拆解、数据推理并生成结论,大大降低了数据获取和分析门槛。这是腾讯云行业大模型改变软件应用,切实带来效能革命的典型案例。
目前,腾讯云行业大模型在 金融、零售、文旅、政务等各个领域 已初步应用,应用场景涵盖了 对话类客服、营销内容生成、跨模态检索、风控等企业核心 的生产经营环节。
除了智能应用升级,本次大会上,腾讯云沿袭产业应用为先的思路,还从技术底座、平台能力维度升级MaaS能力。
汤道生最近接受采访时提到 ,“很多人知道大模型是个风口,很想抓住这个千载难逢的机会,但 实际上用大模型来解决什么问题,以多大成本来获得什么价值、多少价值,其实还没想得很清楚 。”
大模型ToB如火如荼,当下正从狂飙期向理性应用转变。许多企业在思考大模型能解决什么问题,需要耗费多大的成本,获得怎样的价值等问题。此次腾讯云MaaS的三大升级,实际是从不同层面回应这些问题。
技术底座上,腾讯正式公布了自研通用大模型混元大模型,并宣布全面支持20多个行业最新的主流开源模型。
腾讯混元大模型的参数规模超千亿,预训练语料超2万亿Tokens,具备强大中文创作能力,复杂语境下的逻辑推理能力,以及任务执行能力。目前,腾讯内部的50多个产品和业务已接入,未来行业客户可直接通过API调用,也可将腾讯混元大模型作为基底模型,构建专属大模型应用。
平台能力上,升级后的TI平台工具链性能更强,腾讯云HCC高性能计算节点、星脉高性能计算网络等覆盖大模型开发、应用全生命周期,客户只需加入自己独有的场景数据,即可短时间内精调出专属的模型方案。
外界观察 ,底层模型能力升级,解决了用户对不同场景里大模型的需求和灵活配置的问题。而平台能力升级,则进一步降低用户使用大模型的门槛。
至于一系列智能应用发布,则回应了用大模型获得什么价值的问题。过去几个月里,行业客户经历了挖掘、寻找和适配的过程。一位电力行业的资深人士告诉数智前线,大模型ToB目前场景不少,但缺乏比较亮眼的应用。但在业内看来, 行业落地本就不是一件性感的事,大模型对原有场景的智能化提升效果明显 。
腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声在接受采访时提到,做应用层才能带来直观的反馈。比如在文旅行业场景里,要注入的数据和要理解的东西就不太一样,大模型要具备的能力也不太一样,有些需要有推理能力,有些需要有通用能力。做了应用层后,打穿从客户反馈到模型提升的链路,能针对性解决模型效能的一些问题。
腾讯云智能负责人吴运声
总体来看,腾讯云MaaS的三大升级是围绕大模型如何落地,更好满足客户需求的应时之举。
02
行业落地考验技术储备
过去半年,大模型ToB的落地应用摸索已经度过尝鲜期。
腾讯云副总裁、腾讯企点研发负责人吴永坚介绍,在跟一些金融行业投顾领域的客户接触过程中,他们发现,客户的认知从原来的 “觉得大模型什么都能做” 的阶段,已经收敛到 “大模型能够给自身业务带来什么价值上了 ”。
产业界对模型落地的态度也在逐渐回归理性。模型厂商们察觉到,大模型的应用还在初期,企业在模型选择、模型可靠性、应用成本、使用门槛等层面,存在各种考量和顾虑。
一位电力行业资深服务商告诉数智前线,当下企业基于这些开源或闭源的模型来做行业化落地, 还远没有到开箱即用的程度 ,会遇到不少困难,比如训练行业模型时高质量的数据来源问题,以及如何在提示词工程环节给出高质量反馈等。
腾讯云也服务了不少行业客户,他们基于自身的实践,拆解了整个模型训练链条后发现,从需求判断到模型选择,到最终帮助客户行业化训练落地, 整个过程涉及非常复杂的流程和机制,也需要强大的底层技术支持 。
吴运声用一个 教育行业的案例展示了大模型训练背后的复杂程度 。这位客户希望通过企业的既有录音文件来判断用户是否具备某种属性,从而方便企业定向运营。它涉及拆解需求、选择基底模型、试模型、开始训练、中间评测、训练结束、模型部署和反馈回传等多个环节,其中任何一个节点出问题,都大大影响模型出来的效果。
以基底模型选择环节为例,目前可选的模型很多,要参考因素也不少,比如训练的数据量大小,客户是否自己提供机器,用什么类型的数据(格式、中英文等)训练,预算多少,希望训练时长等多个因素。
有了初步选择,到要“试一试”环节,也很考验模型厂商的能力。“试的过程怎么试?部署要求不能很复杂,要能通过三五个模型,快速验证出初步的观点。”吴运声介绍。
这一复杂流程里,腾讯云并非只是简单从算力层面提供支持。 腾讯云TI平台提供了整个模型训练的完整工具链,来保障训练任务高效、稳定和顺利进行,并能评测和部署调用 。
比如,针对训练时间和成本高的问题,腾讯云升级后的太极Angel大模型加速框架,可通过异步调度优化、显存优化、计算优化等方式,相比行业常用方案,性能提升30%以上。这些能力来自于过去腾讯在深度学习领域多年积累。
高速网络和向量数据库也为大模型训练提供重要的底层支撑能力 。腾讯云此前打造的星脉网络是业内网络传输速度最高的网络之一。今年7月,腾讯云发布了AI原生向量数据库Tencent Cloud VectorDB,也是国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库,最高支持10亿级向量检索规模,延迟控制在毫秒级。吴永坚认为,这些都是相比其他厂商,腾讯云所具备的差异化关键技术能力。
模型的评测也是目前业界关注到的大模型应用的短板点 。一位能源行业人工智能业务的高管提到,行业模型训练时他们发愁从哪里找高质量的问题,来判断大模型的性能。“提示工程做不好,可能会非常影响模型的效果。”另外,业界人士也发现,大模型训练和落地的链条很长,仅评测单点效果,很难评测整体表现。
目前,腾讯云与中国信通院开展了行业大模型标准体系及能力架构的研究,共同发布了行业大模型标准体系,参考腾讯云在行业大模型产业应用领域的实践和经验,为客户构建行业大模型提供了标准化流程、综合评估方法,帮助大模型在产业更快落地。
03
腾讯云的三步走
在腾讯混元大模型正式亮相之前,外界普遍认为腾讯太慢了。但从腾讯云过去半年多的动作,大体能看到腾讯云发展大模型的三条路径。
首先,不难发现, 相比于百度、阿里等厂商先发通用大模型,腾讯云选择了先从行业大模型路径切入 。
这与植根于其基因中的产业视角有关 。技术并不是单一的割裂存在,而是在技术研发阶段就会与产业应用平衡。例如,腾讯云的技术团队在做识别技术研究时发现,栈道识别、山火识别的需求很分散。同时山火这类场景里的数据掌握不够,很难识别出来。 后来腾讯研究了万物识别的思路,构建一个更大的知识图谱,通过发现物体之间的关系来组成事件 。这种抽象方式一方面有很好的学术价值,同时也是从之前的解决场景里问题的视角出发,在解决实际问题积累的经验与研究进步之间形成了良性循环。
产业落地实效是腾讯云评判大模型价值的唯一指标。 吴运声提到,大模型技术要能最终产生价值,才是他们最关注的要素。基于这一标准,他们最先从行业大模型起步,把技术聚焦到行业。随着行业大模型应用经验的积累,垂直场景里深入了解用户的使用方式和需求,还能帮助厂商沉淀出更丰富的解决方案,增加新的产品方向。
其次, 从打造大模型应用商店到接入开源模型。这也是目前行业内的普遍做法。
汤道生在采访中提到,市场上大模型的选择很多,往往有不同侧重的场景,最近各种开源大模型发展也很快,客户需要选择与更新大模型的灵活性。
业界也认识到,不同类型的任务及场景对模型的要求不一样。 以常规的文本摘要任务为例,十亿级和百亿级模型在这些任务上有不错表现 。而一些带强推理属性比如鸡兔同笼为代表的任务,则需要更大的模型。在这一背景下,单一模型已经无法满足客户场景的需求。
行业也在顺应这一趋势。最典型的就是微软,它从最初的投资并提供OpenAI闭源大模型服务,转而和Meta牵手上线开源的Llama 2。国内包括腾讯云在内的云厂商们在上个月也纷纷宣布支持接入开源大模型。
再次, 从打造标杆案例到规模化复制 。随着大模型底层能力日渐完善,目前大模型厂商们面向企业的服务模式也变成了两类:一类是自己的研发能力比较足,通过精调来训练自己的行业大模型;一类是调用API,成本相对更低,能快速使用。
在这两类服务方式下,前一类客户是腾讯云希望作为标杆打造的客户。例如一些金融投顾类客户,他们研发能力强、经费足,对新技术的投入能力和意愿更充分。针对这类客户,腾讯云会与这些客户做更多场景合作打磨,最终形成标杆型的行业样例。
他们是大模型策略上的第一步。随着前一类发展到更成熟阶段,腾讯云的能力沉淀到产品层面,就要面向腰部客户做产品的规模化复制。
随着打法的明晰, 腾讯云在行业场景上的偏好和选择也已经明了 。数智前线获悉,腾讯云目前会综合考量市场空间、腾讯云自身的产品技术积累,同时与已有产品的配合程度等多种因素来选择行业模型的布局领域。最终,他们希望打造的行业大模型, 一方面能形成一定的准入门槛,另一方面能真正解决客户的痛点问题 。吴运声介绍,具有端到端能力的产品,未来会是腾讯云重点发力的方向。
结语
经历了前段时间的大模型狂飙之后,业内已经意识到技术的应用还要面对诸多困难:既有幻觉、成本高、部署难等现实苦恼,也有一些非技术层面的挑战需要克服。
而落地与否成了检验大模型能力水平的唯一标准。只不过,相比于外界的热闹和喧嚣,腾讯一直在保持自己的节奏和做事思路,正在基于客户的真实需求,专心打磨落地场景。