在今天举办的2023世界人工智能大会(WAIC)“大爱无疆·日日新”人工智能论坛,商汤科技宣布旗下“商汤日日新SenseNova”大模型体系迎来多方位全面升级,大模型技术已在智能座舱、交通、金融、医疗、电商、移动终端、产业园区等行业生产实践中的落地应用。
(相关资料图)
商汤大模型日日新于今年4月首次发布,该体系内包含了中文语言大模型“商量”、文生图生成模型“秒画”、AI数字人视频生成平台“如影”、3D背景建筑生成平台“琼宇”和3D物体生成平台“格物”。
作为千亿级参数的自然语言处理模型,商汤商量SenseChat 版本突破了大语言模型输入长度的限制,并推出不同参数量级的模型版本,可完美适配移动端、云端等不同终端及场景的应用需求,降低部署成本。商汤的自研生成式大模型商汤秒画SenseMirage 的模型参数从今年4月首次发布以来的10亿提升至70亿量级,能够实现专业摄影级的图片细节刻画。
商汤如影SenseAvatar 数字人生成平台相较版本的语音和口型流畅度提升30%以上,实现4K高清视频效果,并带来AIGC生成形象及数字人歌唱功能。此外,商汤琼宇SenseSpace 的空间重建效率提升20%,渲染性能提升50%,每100平方公里场景的建图时间仅需38小时即可完成(1200 TFLOPS/秒算力支持);而商汤格物SenseThings 对小物体的纹理及材质还原达到毫米级精细度,并突破对高反光和镜面物体的采集难题。
依托 “商汤日日新SenseNova”大模型体系在底层技术领域的快速迭代,商汤正积极通过大模型的多模态能力组合赋能产业升级,并带来诸多引领行业的全新突破。商汤科技董事长兼CEO徐立在产品发布环节中讲到:“大模型的突破掀起了人工智能的新一轮技术革命,随之而来的是产业需求呈现爆炸式增长,全新的应用场景和应用模式正迅速涌现。”
在金融领域,商汤与银行、保险、券商等客户展开合作,利用数字人进行智能客服、智慧营销等工作,并通过接入大语言模型能力,提供投研分析、研报撰写等新功能,实现降本增效。此外,挂载金融知识库后,还能100%基于客户的产品说明进行内容问答输出,并实现信息及时更新。
在医疗场景,商汤基于海量医学知识和临床数据打造了中文医疗语言大模型“大医”,提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力,未来也即将支持医学图像、文本、结构化数据等多模态综合分析,并可不断提升医疗语言理解和推理能力,持续赋能医院诊疗效率及患者服务提升。
结合商量和秒画的综合能力,商汤还为移动终端客户带来多种智能交互解决方案,包括针对信息获取的问答交互,针对生活场景的知识交互,针对语言和图像生成的内容交互等,依托商汤大模型的轻量化版本,可轻松实现在移动终端的部署和运行。此外,在由商汤以刘慈欣获奖小说《三体》为故事蓝本打造的《三体·引力之外》沉浸式科幻体验空间,商汤通过大模型的能力突破想象力的边界,创作并展现极具未来感的科幻航程。
面向线下场景,商汤通过大模型能力为电网巡检带来长尾故障识别、复杂缺陷判断等智能解决方案。基于琼宇的空间重建,商汤为济南马山镇区域开发、合肥中国视界园区、上海瑞金医院等打造实景空间的数字孪生,提升运营管理效率。
在珠宝行业,依托格物商汤为珠宝品牌进行珠宝首饰复刻,细致展现商品工艺特点,提升顾客购物体验。在线上短视频、直播平台,商汤如影生成的数字人正得到广泛应用,商汤还与多个头部企业达成渠道战略合作,共建“云+AIGC+短视频直播”生态,为行业带来更高效、低成本、便捷易用的AI视频和营销工具。
在智能汽车领域,商汤绝影智能座舱、智能驾驶、车路协同等行业应用也已在大模型的加持下突破创新边界。在智能座舱里,商汤通过视觉、听觉等多模态融合,全方位感知用户需求,通过标签化数据记录用户习惯和偏好,提供专属个性服务。同时,商汤还通过大模型强大的环境理解、逻辑思维和内容生成能力,带来更懂用户的“车舱大脑”,以及可支持形象、语音快速定制的数字人进行拟人化交互,带来集安全、娱乐、教育及效率于一体的智能座舱体验。
作者:沈湫莎
图片:商汤科技提供
责任编辑:任荃
*文汇独家稿件,转载请注明出处。