《投资者网》侯书青
2023年8月23日, “北大光华-度小满金融大模型技术与应用论坛”(下称论坛)在北京举办,清华大学人工智能研究院常务副院长孙茂松,北京大学光华管理学院商务统计与经济计量系教授王汉生,光大信托数据中心总经理祝世虎,度小满CTO许冬亮,度小满数据智能部总经理杨青等嘉宾出席了本次研讨会。
(资料图片仅供参考)
(度小满CTO许冬亮)
通用大模型从问世至今接近一年,围绕在身上的光环也逐渐褪去,人们对它的认知也逐渐趋于理性:强如通用大模型,也有力所不及之处。行业想要依靠大模型产生新变革,首先要解决通用大模型在行业内的落地应用——开发行业大模型,成为AI技术实用化落地的新风向标。
2023年5月,度小满率先发布国内首个金融开源大模型“轩辕”,国内金融行业自此走入大模型时代。大模型如何重塑产业生态,金融大模型如何落地应用等话题成为产学研界的共同关注。
行业需要金融大模型
AI技术经过数十年的发展,逐渐从概念性较强、主要为C端提供新鲜感的“玩物”,转变为在B端、C端都能找到应用场景的工具。其中的商业潜力,在ChatGPT正式发布后显现出来:不计其数的资金入局,众多有技术实力的大企业不甘人后,争相披露自家在大模型领域的技术潜力。
这背后,是市场对AI时代的憧憬。当科幻照进现实,概念变为初具规模的工具后,现有通用大模型的能力,能否满足各行各业对它的期许呢?
腾讯高级执行副总裁汤道生曾表示:“通用大模型可以在100个场景中解决七八成问题,但未必能100%满足企业某个场景的需求”在专业问题方面通用大模型有自身的局限性。”在2023年全球数字经济大会上,度小满CTO许冬亮称:“比起通用大模型能力而言,金融行业非常需要垂直行业大模型。”
许冬亮在论坛上表示:“大模型让机器具有了常识,懂得了逻辑,学会了创作,让人和机器能以更自然的方式互动,通过与周边工具的结合,大模型已经具有了通用人工智能的雏形。金融行业是高价值行业,数字化基础好,高度依赖数据和技术,是大模型落地应用的高潜场景。对于中小金融机构,在大模型的浪潮里,他们也有机会通过应用创新,来加快自身的数字化和智能化进程,跨越数字化鸿沟。”
专业性更强,更细分的应用场景,需要让大模型拥有自己的“社会分工”,用垂直的能力适配垂直的市场需求。而金融行业寻求自己的垂直大模型,是该行业对专业度的需求使然,更是因为,金融行业的头部企业有足够的基础条件。
大模型所需的三大支柱:算法、算力、数据。其中数据决定了大模型的智能范围,而金融行业有许多公司在多年经营中掌握了海量的历史数据和文字资料等,为行业大模型的开发提供了天然的便利。且训练垂直大模型所需的数据量远小于通用大模型,在成本方面更具优势
而诸如度小满等互联网金融、金融科技企业,经过了多年经营,在算法、算力方面都形成了自己的解决方案。此外,当金融企业使用通用大模型解决专业性问题时,如果大模型并非本地部署,需要上传数据到对方服务器。这一过程存在数据泄露的风险,这对金融行业而言尤为致命。
2023年上半年,已经有企业率先发布了自己的金融大模型。
2023年3月,全球领先的商业、金融信息和财经资讯提供商彭博(Bloomberg)发布了BloombergGPT,该模型构建了3630亿个数据集,训练数据总量约为5300亿词,其中金融行业数据占比约为54.2%,但出于数据安全考量,该模型尚未以任何形式对外开放。
就在彭博发布BloombergGPT仅2个月后,国内领先的金融科技公司度小满发布了国内首个开源金融行业垂直大模型“轩辕”。度小满方面称,“轩辕”在金融名词理解、市场评论、数据分析、新闻理解等方面具有明显优势,在任务测试中相较于基座模型效果提升了70%。
度小满CTO许冬亮表示,目前“轩辕”已经面向上百家金融机构开放试用。
除了度小满的“轩辕”外,星环科技也发布了面向金融量化领域的生成式大语言模型“无涯Infinity”,恒生电子也预计在9月开放自研金融大模型LightGPT的试用接口。
行业大模型有何优势?
OpenAI发布的ChatGPT,率先在全球范围内掀起了AI热潮,以及GPT-4的问世,都彰显着它在通用大模型领域的前沿性。而彭博作为国外老牌咨询提供商,训练BloombergGPT的大部分数据来自彭博数据分析师们持续收集、维护了40年的金融语言文件,能够先一步发布金融大模型也是其实力与积淀的表现。
那么国产行业大模型与上述二者相比,是否存在优势?
首先,与主流开源大模型之间的对比,度小满发布的“轩辕”已经在金融相关的专业性问题上展现出了较为明显的优势。
公开资料显示,“轩辕”在金融任务评测中,全面超越了目前主流的通用大模型。在150次回答中赢得了63.33%的胜率。而在通用能力评测中,轩辕有10.2%的任务表现超越ChatGPT3.5,另有61.22%的任务表现与之持平,题目涉及数学计算、场景写作、逻辑推理、文本摘要等13个主要维度。
金融任务的评测成绩意味着,比起目前的主流通用大模型,“轩辕”对于金融相关领域问题的回答会更具专业性;而通用能力评测中有超过71.42%的任务表现与主流通用大模型持平甚至超越,则表明“轩辕”在面对金融领域之外的普通问题时,表现与通用大模型较为接近,“轩辕”也能够实现大部分通用大模型的功能。
从参数的丰富度上看,“轩辕”基于1760亿参数的Bloom训练而来,较彭博发布的大模型参数更丰富。此外,度小满还将自身在实际业务中积累的、规模在千亿级别的tokens的中文预训练数据集加入到“轩辕”大模型的研发中。
为此,《投资者网》根据伙乘平台对“轩辕”大模型的提问结果,就同样的问题向Bing AI提问,以简单测试“轩辕”大模型与主流通用大模型之间的差异。
结果表明对于类似“如果一家公司总资产为500亿美元,总负债为300亿美元,股东权益是多少?”这类涉及简单计算与概念解释的问题,二者均给出了正确答案与计算步骤。差异在于,“轩辕”大模型的回答中,还额外解释了“净资产不等同于股东权益”的概念。
(前者为Bing AI的回答,后者为“轩辕”的回答 《投资者网》研究员收集整理)
而对于“你能解释一下什么是抵押贷款和信用贷款的区别吗?”这一问题,Bing AI和“轩辕”给出的答案内容基本一致,区别在于前者的答案概括性比较强且比较零散,后者的答案条理较为清晰,便于提问者快速找出自己需要的部分。
经过一系列问题的对比,能够明显发现,在通常的名词解释类问题中,二者的表现不相上下。而在回答比较专业的金融类问题时,“轩辕”的回答不仅能够让使用者了解答案本身,还能够根据问题引申出一些容易混淆的概念并给出具体的解释。
在2023年全球数字经济大会人工智能高峰论坛上,“度小满轩辕大模型在金融领域的应用”入选“北京市人工智能行业(大模型类)赋能典型案例(2023)”。
在“轩辕”发布的一个月后,恒生电子也发布了自研的金融大模型LightGPT,国产行业大模型再传佳讯。恒生电子首席科学家白硕介绍称,LightGPT使用了超过4000亿tokens的金融领域数据,辅以超过400亿tokens的语种强化数据,能够满足各类金融企业的业务需求。
与海外企业发布的金融大模型相比,国内企业发布的大模型在训练阶段采用的数据会更贴合国内金融实践,得出的结论也更适合国内金融行业发展的实际情况。与BloombergGPT尚未开放不同,目前“轩辕”已经可以在Huggingface中申请下载,面向上百家金融机构开放试用;恒生电子发布的LightGPT也将于9月份开放试用接口。
国产行业大模型的逐渐铺开,会为国内金融行业带来怎样的改变?是一个值得行业关注的重要趋势。
大模型时代的前夜
眼下,国内金融行业已经来到大模型时代的前夜,天边已经泛起一抹鱼肚白,而当这一缕名为“大模型”的曙光真正照进行业时,我们眼前看到的,将会怎样的一番天地呢?
首先,大模型将极大提升金融机构收集、整理信息的能力。
还是以度小满为例,最新数据显示,度小满已经累计为超过1800万小微企业主和个体工商户授信。整个2022年,度小满为小微企业发放信用贷款超过5200亿元。在长期的业务实践中,度小满在大数据技术的支持下已经建立了较为完善的征信中台。
小微企业常常会因为规模小、质押物不足等问题,在面临资金短缺时找不到合适的融资渠道。而传统的征信报告解读方式,也存在误判企业成色的可能:征信报告干净的客户,或许与黑产有关,部分优质客户,有时也会因为近期资金紧张而无法通过征信评估。
而大数据,作为大模型的前置科技,其海量的专业数据能够保障大模型的专业性、精确度。如今,度小满的征信中台能够结合大语言模型,将征信报告解读出40多万个与风险相关的指标,把银行风控模型的风险区分度提升了26%。
与传统评估方式涉及的几百个指标相比,度小满在大模型的支持下,能够更全面地评估贷款人的基本情况,在降低信贷风险的同时,切实解决优质小微企业融资难的问题。
度小满表示,经过清洗和标注的高质量数据集,不仅在通用性方面与ChatGPT达到持平成为可能,且显著提升了模型在金融垂直领域的性能。轩辕大模型的数据集覆盖了金融研报、股票、基金、银行、保险大多数金融领域中常见的应用场景。
恒生电子发布的LightGPT的功能与“轩辕”相近,能够为投顾、客服、投研、运营、风控、合规、研发等金融业务场景提供底层 AI 能力支持。
随着大模型技术在金融行业各领域的参与度逐渐加深,金融机构的业务也将会朝着更加科学、高效的方向发展。大模型时代的金融业,值得每一个人期待。(思维财经出品)■