腾讯冯宏声:金融大模型的发展路径与落地思考

2023-11-15 17:53:30 浏览数 (1)

冯宏声 腾讯公共事务副总裁、腾讯研究院高级顾问

11月9日,在“构建数实融合新模式,助力产业数字金融新发展”为主题的“2023金融街论坛——第三届全球金融科技大会暨第五届成方金融科技论坛”平行论坛上,中国银保传媒与腾讯研究院联合发布《2023金融业大模型应用报告》,深入解析大模型发展趋势,建立金融业大模型应用体系化蓝图,指引数智金融产业演进。腾讯公共事务副总裁、腾讯研究院高级顾问冯宏声在论坛围绕报告内容发表主题演讲。

以下为演讲全文:

各位领导、各位嘉宾:

大家下午好!特别高兴能有机会向各位金融行业的专家们学习,刚刚很多专家的发言对我们非常有启发。我接下来代表银保传媒和腾讯研究院来向大家做一个汇报。

近一年,我们看到关于大模型技术的研究和产业落地如火如荼,也看到在金融领域已经有很多试验性的探索和单点的尝试。但是总体来看,行业尚没有形成一个比较体系化的应用共识。从这个背景出发,我们几个合作伙伴一起从金融业应用的视角去观察产业的发展现状,思考如何去建立一个体系化的应用建设方向,如何去打造未来生态和明晰对应路径,希望能够帮助更多的金融企业全面地、清晰地看到大模型未来的可能性,以更务实求效的态度来指引大模型的落地。我们想要回答以下四个问题。

第一,为什么大模型

成为了引爆产业的新技术点?

将大模型放在人工智能发展历程当中来观察:从上个世纪50年代开始,图灵最开始提出来机器为什么能够思考这个特别伟大的问题,随后人工智能经过了一个漫长的发展阶段,大概70多年的发展历程,中间起起落落,这一轮是第四次的高潮,引爆这一轮的关键点是大模型底层的技术。最核心的是Transformer模型,这个模型和以往的技术路线的差异在哪里?它的底层是更接近自然语言的语义函数,和以前看到的接近于编程语言的原生函数不一样的。基于这个模型再去叠加大规模的语料库训练形成了预训练语言模型,随着参数量不断地增长,模型会进化出上下文学习等新型特殊能力,出现了所谓技术上的涌现。

特别是OpenAI发布的ChatGPT和GPT4,以及前两天新的发布会,给整个业界带来很大的震撼。这一轮的发布会不仅是技术发布,也暴露了它在未来商业路径上的一些想法,我觉得这场发布会才可以讲是真正的新“iPhone时刻”。在这样的背景下,我们要去考虑不同的行业怎么去应对技术新一轮的变化。

近一年我们观察到企业服务市场上已经出现了海量的以大模型为核心的方案和产品,基于人工智能第四波浪潮带来的这种颠覆式创新正在持续地发生。一方面我们能够看到大模型具有更好的泛化的能力,能够建立拟人化的思维链推理,同时不需要额外的训练和梯度更新。另外一方面,大模型的能力引起了开发范式的转变,以往很多产品的开发是项目制,现在可以直接走产品制、平台制,开发的成本和交付的周期都在降低,场景的精准度在提升。伴随着算力和数据规模的指数级增长,大模型的涌现能力最终使它站在了时代的中心,能够引领这一轮的技术创新。

第二,如何判断什么样的场景

使用哪一类大模型?

大模型的发展比较火热,有很多不同的概念。通过这一段时间的研究,我们高度概括认为,一类是通用基础大模型,一类是垂直行业大模型。基础大模型的定位是通用的技术底座,行业大模型的定位是在不同的专业领域推动行业数字化再升级、进入到智能化的引擎。

以基础大模型作为技术底座的时候,更多的是考虑它的通用性,但是相对来讲它的专业度可能会欠佳。行业大模型会更加专业、更加聚焦,成本也更低。如果要用关键词来总结,基础大模型的关键词是创造性、体验式,更强调体验。它是面向泛知识、泛领域的一个通识性的场景,追求交互体验、更接近人的交流方式。当前更多的是以To C的内容消费为主,核心的工具一般是体验性强、操作简单,可以直接完成价值输出的内容生产工具。

行业大模型的关键词是可控性和高投资回报率,它主要是面向垂直特定领域的专业场景,容错度比较低,追求合理回报,这种更多是To B的企业服务。核心的工具目前可以助力企业以合理的成本来训练一个细分场景的具体模型。基于这样的考虑,大家可以理解通用模型是横向的,行业模型是纵向的,这两类模型要相互衔接、缺一不可。

第三,大模型赋能金融业

会有哪些方向?

大模型将基于原生的场景以不同的技术路径来优化、变革现有的业务逻辑,会以多种方式来融入并带来功能的升级和业态的变革。总的来讲,以大模型的文本生成、知识推理、代码合成等等这些能力为核心的场景赋能会有两个方向。一个是原有场景的升级,原来金融行业的业务场景、业务内容可以借助大模型进一步地去强化,提供更智能化、更人性化的服务方式。受制于原有的一些技术条件,企业的数字化建设只是用于特定业务的流程管理,很难说把技术融入到具体的每一个业务模块。更进一步,持续深入到执行环节就会很难,但是大模型的加持使得我们可以在更多的具体业务场景得到辅助,甚至替代掉原有工作中重复性的部分,包括替代规则化、逻辑化的一些场景。在这样的基础上,还会有新的场景变革。当我们在机器学习的任务中引入大模型的涌现、逻辑推理和多模态抽取提炼能力,可以获得更好的任务表现。这些不同的人工智能的技术,虽然技术路径不一样,但能够在细分任务上做拆解,进行细颗粒度的技术共生。未来我们能看到很多具体的大模型技术的应用,并不是一种互相冲突的关系,而是包括底层思路和技术路径的共存。

另外,新场景会用大模型来重构企业级的智能架构基座,大模型的出现意味着技术路径转换和技术能力的增强,可以在很多场景当中来替换原有的小模型,比如对话、抽取、内容理解,同时也能够基于大模型开发出很多场景。稍微具体一点,我们能看到比如基于大模型的文本交互式可以应用在客服上,这些技术不是单独存在的,可以叠加现在的数字人技术,进而推出数字客服,好处是它回答的问题是稳定的,而且是7×24小时,不需要考虑更多的保障条件。

类似这样的情况下,大家的第一反应是,大模型是不是会替代掉我们原来很多员工,整个行业的职业岗位会不会受影响?这就是我们讲的第二个方向,新的场景一定会出现。当我们一些员工原有的可重复性的劳动被大模型的人工智能产品替代之后,一定会找到更多的、新的服务场景。从金融行业自身的专业角度出发,各位专家都在不断地思考怎么去变化。我相信未来的这些变化会带来细分的大量场景,会有很多新的岗位出来,技术可以在这些领域提供支持。

最后,如何绘制

大模型在金融业应用的蓝图

大模型会催生效率革命,为整个金融行业的提质增效带来四个价值趋势,我们总结为能力更强、效率更高、场景更广、应用更深。通过对金融机构、大模型服务商、腾讯内部技术团队的调研,我们形成了金融业大模型应用体。首先,对于业态复杂的金融产业,结合业态特性,以前中台通用应用、监管科技、业态个性应用、后台应用为一级分类绘制大模型赋能金融产业应用全景视图。我们归类出渠道运营、营销管理、产品设计、资产管理、风险管理、开发与运维、监管科技、办公管理、通识工具等核心应用模块,模块之间是有内在的技术逻辑。

来源:《2023金融业大模型应用报告》来源:《2023金融业大模型应用报告》

基于调研结果,结合对整个行业价值形态和发展趋势的判断,我们还从技术成熟度、需求频次和场景价值三个维度描绘了一张图,希望能够帮助金融企业来找到具体的落地应用路线。我们可以看到营销、渠道、风控,是金融业务高频的价值场景,目前的分析和判断是大模型有希望最早能够落地下来。后台系统开发的过程当中,代码助手和运维管理是我们中后台管理的高频需求,在这些领域的技术应用可以助力中后台管理的增效。再有,我们能看到舆情管理、智能投顾、智能投研、智能理赔、智能客服的ROI(投资回报率)会比较好,以前我们认为这些场景是AI应用的试验田,未来可能很快就转化成一个现实。长期去看,现在AI的技术会叠加一些外设的设备,未来有可能是机器人、脑机接口,这些结合可能会产生更多的Agent(智能体),大家能够感受到有一个实体存在,这也是一个方向,会成为整个大模型为支撑的新一轮人工智能技术的载体。基于Agent的生产力工具正随着技术研究不断重构场景形态定义,是下一代大模型应用体系中不可缺少的原子模块。

来源:《2023金融业大模型应用报告》来源:《2023金融业大模型应用报告》

基于大模型的研发、训练、部署、迭代的技术要求来建立一个金融行业大模型的落地路径,我们认为最底层应该是基础设施,包括强大的计算和存储的性能,这是应用落地的一个重要基础。中间层是通用的大模型作为整个模型的底座,保证通用性和泛化性,满足一般的客户需求,特别是To C的客户服务的需求。行业的大模型来解决特定领域的专业级任务,一方面服务专业客户,另一方面服务内部的专业人员。再往上一层是工具层和平台层,这层会部署一套端到端的人工智能平台,包括数据标注、传统的模型机器学习的框架,模型训练和模型调度的能力。基于大模型的这种能力,可以面向不同的场景来设计更高精度的智慧应用。

来源:《2023金融业大模型应用报告》来源:《2023金融业大模型应用报告》

现在的GPU资源紧俏,而且成本比较高。大模型落地是需要大规模的算力,对于不同的战略目标、不同的数字储备能力的金融企业来讲,场景建设的起步层级是不一样的。企业如果不具备大规模计算算力的条件,可以托管到云上;如果不具备自建能力,可以直接选MaaS(模型即服务)这样的形态。其实包括腾讯在内的国内很多头部互联网企业现在都在打造这样的能力,用行业大模型的精调解决方案来构建每个企业专属的一个模型,来建立细分领域的模型训练平台,进而构建起大模型的灯塔应用。

接下来我讲两个案例。一个是金融行业的典型场景——风控。传统的风控模型会遇到建模效果有限、小样本数据不足的情况下,会导致性能不达标,单点的防御能力和风险预测能力很难适应业务快速发展的需求。基于大模型的风险治理升级会对传统的风控业务流程进行改造,能够实现实现高频率高精度的专家级建模、全流程自动建模自动上线、跨风险类型的能力泛化。但是我们都知道在这个过程当中,技术只是一方面,更重要的是金融领域对于风控经验知识的沉淀,传统的知识图谱的方法仍然有它的价值,未来一定是大模型和原有的知识图谱两个技术路径的叠加,可以更好地推动各个业务的转型。

另外一个案例是中后台场景。金融业的数字化水平在各个产业领域中已经非常领先,数据平台的运行、数据仓库的调用等中后台的能力其实非常重要。代码是金融企业中后台能力的一个最根本的保障,通过基于大模型的AI代码助手,可以建立代码补全、自动化测试、代码诊断、技术对话的能力,减轻人工撰写代码的负担,也能够提升代码质量,进一步提升敏捷开发的效率。

通过回答上述四个核心问题,我们对金融领域的大模型落地有这样的发现:当下大模型已经具备了多模态的能力,从文本交互已经到了音视频生成,下一步可能连游戏的开发都会有一种颠覆式的创新。大模型的生成能力的可控性也在不断地成熟,但是基于大模型的推理能力还不成熟,需要和传统的人工智能技术结合、和各个领域的底层逻辑结合,才能够更好地发挥它的推理效能。对于传统行业领域,在新技术面前首先不能够采取观望的态度,一定要投身进来、拥抱技术,而且要有自信技术其实是为业务服务。数据是核心的资源,但是这些数据如果只在手里头闷着是没有用的,数据和大模型的技术结合才能产生新的价值。

在应用大模型这个过程当中,我们也要采取一种审慎的态度,建议我们可以从外围的一些业务场景开始,逐步渗透到最核心的业务。企业要搭建大模型的能力,要经过基础大模型加上行业大模型的路径,因为基于基础大模型的行业大模型落地能够能够减少泛知识数据量减少的代价,避免专业场景的大模型的“机器幻觉”。另外,我们也需要有一些外挂的知识库来补充行业的Know-how(知识经验)。

最后,我们认为大模型能够催生认知智能跨越式的发展,由碎片化到全局化、由结构化数据到多模态数据。以一个模型能够逐渐拟合现实世界的全维度,跨场景、跨领域的应用能够得到全面地释放。从决策式AI到生成式AI,从简单能力和针对具体任务的专用模型,到复杂能力和面向泛任务的通用模型,为下一步的人工智能奠定了基础。

数智金融将在大模型的加持下加速迈进新时代,实现以新兴技术为核心的金融行业高质量发展,为未来金融行业来夯实技术基础、明晰潜在方向,以大模型为核心的应用体系还将不断健全。我们也相信未来的组织形态和监管条例会加速地演化、不断地优化,以提升ROI为目标的标准化机制将最终形成。以数据为中心、模型为中枢的业务场景需把握监管合规、安全风控和增长赋能的平衡。

最后,我们想说大模型催生的新一轮创新浪潮和行业变革正在开启,一切还都在路上。展望未来,我们也特别期待能够和各个金融企业建立全局化、体系化的智能化赋能建设蓝图,期待金融行业能够加速迈向人工智能驱动提质增效的新阶段,一起共赴数智金融的新时代。

谢谢大家!

0 人点赞