(腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人、腾讯企点负责人吴运声)
吴运声指出,随着大模型技术的快速发展,人工智能已成为企业数字化转型的核心动力。Gartner的调研显示,超过60%的中国企业计划在未来12至24个月内部署生成式AI,反映出企业对大模型技术的迫切需求。
面对企业在应用大模型技术时所需的降低使用门槛、提高平台适配性、保障安全合规等核心诉求。腾讯云正式推出大模型知识引擎、大模型图像创作引擎、大模型视频创作引擎三大工具,旨在通过PaaS接入方式,简化数据工程、模型精调、应用开发的流程,使企业能够更高效、简单地将大模型能力应用于生产、销售和服务等场景。
吴运声特别强调了大模型知识引擎在知识服务场景中的应用,该引擎基于大语言模型,解决了复杂文档解析、任务规划、行业适配等难题。
通过应用模板简化创建流程,企业用户可以在5分钟内搭建出一款知识应用,并通过一站式流程快速验证、投产。此外,其还展示了大模型知识引擎在金融、教育、出行、零售等行业的落地案例,以及在腾讯内部知识管理领域的应用。
在图像和视频创作领域,腾讯云推出的大模型图像创作引擎和大模型视频创作引擎,基于自研腾讯混元模型,提供了图像风格化、AI写真、线稿生图、视频转译、运动笔刷、图片跳舞、视频画布拓展等能力,大幅提高了创作与生产效率。
会上,腾讯混元大模型能力也持续升级,多个版本模型hunyuan-pro、hunyuan-standard、hunyuan-lite通过腾讯云对外开放,满足企业客户、个人开发者在不同场景下的模型需求,落地最优性价比模型方案。
吴运声表示,腾讯致力于开发更多专业、易用的工具,以降低大模型应用的门槛,让更多人能够享受到大模型技术带来的便利。他期待这些工具能够快速普及,为社会创造更大的价值。
以下为吴运声演讲全文:
尊敬的各位嘉宾、媒体朋友们,大家好!
我是腾讯吴运声,今天我分享的主题是《打造大模型时代原生工具链,助力客户低门槛、一站式打造AI原生应用》。过去一年,大模型产业快速发展,以大模型技术为核心,人工智能成为企业数字化发展的关键动力。前不久,Gartner发布一份调研显示,超过60%的中国企业计划在未来12至24个月内部署生成式AI。可以看到,企业对应用大模型技术的迫切感。
那么,如何将想法变为现实,帮助企业打破大模型技术落地障碍?在过去一年和广大客户的共创中,我们发现,要让企业用上大模型,用好大模型,还需要解决三大挑战。
第一,降低使用门槛。只有进一步降低工具使用门槛,减少对技术人才及专业技术能力依赖,让一线生产、经营人员也能“零门槛”用上大模型,才能加速生产经验与模型技术的融合,用技术为企业解决实际问题。
第二,提高平台适配性。未来,企业生产场景都将建基于AI 能力,企业的产品设计、运营流程、管理形式都可能围绕AI 重构。企业选择的大模型工具,既要能匹配、适应不断迭代的大模型技术,也需要满足不断扩大的场景需求,满足可持续的投入产出比。
第三,保障安全合规。生成式AI具有强大的归纳、生成、推理能力,但也面临全新的安全挑战。只有保障生成结果的安全、准确,才能满足企业对稳定性的需求,让企业管理者放心加大投入建设。
5分钟搭建企业级大模型应用
应对上述挑战,需要打造一套大模型时代的原生工具链。为此,我们今天正式发布大模型知识引擎、大模型图像创作引擎、大模型视频创作引擎三大工具,通过PaaS接入大模型,实现数据工程、模型精调、应用开发的流程简化,助力企业更高效、简单地将大模型能力应用于生产、销售和服务等场景。
首先,我们针对知识服务场景,推出大模型知识引擎。这是一款基于大语言模型的知识应用开发平台。他解决了知识服务场景常见的“复杂文档解析”、“复杂任务规划”、“专属行业适配”等难题。
在模型层,它集成了腾讯混元大模型、行业大模型等优势模型能力;在服务层,通过应用模板,简化创建流程。企业用户只需要输入 模型选择、角色设定、知识库管理 等基本信息,5分钟就可以搭建出一款知识应用。同时,我们还提供了 测试-修正-发布-反馈增强的一站式流程,助力快速验证、快速投产,在客服营销、企业知识管理等业务场景落地。
只需三步,企业客户就用自然语言开发出一个知识应用。以API的形式,还可以快速地部署、集成到各类业务环境中,最大化放大企业知识价值和产出。在腾讯内部,与知识管理相关的客服场景,是我们最早投入的领域之一。基于大量产品实践,我们沉淀出大模型知识问答的核心能力,专注解决产业场景难题。
在问答效果上,知识引擎以RAG(检索增强生成)技术架构为基础, 整合了OCR文档解析、向量检索、大语言模型、多模态大模型等多项技术。企业在上载专属知识库与行业专业文档后,会先通过向量数据库,生成大量问答。当用户提问时,系统先匹配相关文档片段,再由大模型基于提取内容来推理,这样会生成准确率远超通用大模型的回答,更好地满足to B场景对准确性的要求。
围绕问答交互,知识引擎集成了多模态大模型的能力,依托高分辨率色彩感知增强技术,支持图文混排、说明书、数据图标等复杂文档识别解析,答案生成,进一步提升用户体验。
针对复杂任务规划,目前业界主要基于agent的框架来做效果预研。但在实际情况中,业务的接口往往非常复杂,为了完成1个业务办理,需要调用多个API 。不同业务场景,调用的接口类型、调用顺序都有很大差别。大模型面临全新任务时,准确率是很低的,距离商用有较大差距。对此,我们采用了更落地的解决方案,由大模型话术自动生成、实体智能抽取、接口缺失追问等能力,结合传统工作流,简化业务流程配置,降低配置成本。
三大AI大模型引擎的多行业、多场景应用
目前,腾讯云大模型知识引擎已在政务、金融、教育、出行、零售等多个行业落地。在金融行业,圆心惠保开发了保险代理人高效惠民智囊,通过大模型技术辅助,自动生成产品知识问答和安抚话术,实现人均提效50%。浙江万榕,用大模型知识引擎打造出在线知识服务平台“榕博士”,实现技术人员提效50%。
在教育行业,河南省数字教育发展有限公司,用大模型知识引擎进行知识梳理配置,导入河南省百万级的中小学教材文档导入,打造出7×24小时在线的教师助理及学生助手。这项应用目前已在郑州、洛阳、许昌的重点中小学上线。
除了与外部客户共建,我们也基于知识引擎升级了多款腾讯应用。我们刚刚提到,用大模型知识引擎可以更好地处理“复杂任务规划”。这个能力已被应用于企点客服大模型文本机器人。在面向账单查询、退换货这类复杂任务时,大模型机器人配置成本,相较传统文本机器人减少50%。
在交互层面,数智人能够更好地理解和处理自然语言,准确识别用户意图,提供更为精准的回答和建议;借助知识引擎“大脑”,数智人将拥有更丰富的知识储备,为用户提供更专业的解答、更个性化的服务。
今年,我们为云南电视台打造3D卡通代言人小彩云,结合大模型知识引擎,小彩云升级为智能助手,针对云南文化、服务、美食等信息,为用户提供个性化交互问答服务。
我们还通过大模型,持续提升数字人的生产效能。在电商场景,小样本数智人支持一键换装,实现快速、批量化商品动态更新;在短视频场景中,真人实景拍摄生成数字人,具有更自然、丰富的表情和肢体语言;面对蓬勃发展的出海业务,数字人通过多语种样本训练,批量化生成多语言播报视频,让海外传播更便捷。
腾讯乐享是服务于企业内部的知识学习协作平台,为企业提供知识管理、学习培训文化建设等服务,目前已经服务了超过30万家客户,用户超过1亿。
在结合腾讯自研大模型和知识引擎后,实现了两大场景的关键革新。围绕“知识生产”,乐享结合大模型知识引擎,为用户升级“智能写作”等能力,可以实现写作前提供思路,写作中辅助润色,写作后辅助修缮,助力企业员工提升创作效率和质量。
围绕“知识问答”,大模型知识引擎解决信息获取链路长、内容利用率低、权限分配不清晰等难题。在常见的文档权限场景,一个拥有薪酬权限的员工提问“员工薪酬怎么算”会获取详细回答,一个没有权限的员工问同一个问题,AI则会回答“抱歉,不清楚”。
湖南旷真律师事务所,将4万多份员工编撰的内部知识文档导入腾讯乐享,构建出专属AI知识库,实现AI智能问答。
针对图像、视频素材生成场景,我们带来了“图像创作引擎”、“视频创作引擎”两款大模型PaaS工具。图像创作引擎,基于腾讯混元的自研图像创作底层模型,具备业界领先的文生图、图生图能力,为企业客户提供AI写真、线稿生图等图像创作能力。
今年,我们通过算法升级,进一步提高了文生图效能,画面风格扩充至18种。同时,增加了提示词自动扩写功能,在输入提示词后,系统可以通过自动扩充、补充细节,丰富画面元素,进一步简化创作流程。
针对商用场景,推出“线稿生图”的能力,用户只需要上传产品设计线稿,通过提示词和参数设定,可以快速将 简单的设计线稿 变为 精美的实物图片,大幅缩短创作与生产周期。未来,在产品营销环节,我们还可以基于背景生成技术,快速、批量产出营销素材,大大提高生产效率。
针对视频创作,我们的“视频创作引擎”,基于多模态算法技术,实现了视频转译、视频风格化、画布拓展等多种功能,助力企业客户快速、高性价比输出各类视频内容,用于不同群体、不同平台的广告投放。
今年3月,我们与《人民日报》,用大模型共创《江山如此多娇》视频,引发大量关注和强烈反响。在这个视频中,我们综合使用了图生视频、视频风格化、视频插帧、艺术字视频等多项视频创作能力,100%依托大模型能力进行创作。
通过图生视频的能力,我们上传一张风景图片,输入提示词“倒影逐渐放大”和相关参数配置,1秒即可生成对应视频;通过视频风格化,选择2D动漫,湖面元素即可实现浮动展现;在这里,我们还采用了视频插帧功能,通过上传多张图片,自动计算图片之间的画面,最终输出一段连贯的创意视频;艺术字视频功能,给艺术字图片输入提示词和参数选择后,即可生成对应内容。
大模型知识引擎、大模型图像创作引擎、大模型视频创作引擎的技术原理有两个特点,一个是功能强大,覆盖了数据处理、模型精调、应用接入等多个流程,二是操作简单,“模板化”的产品结构,通过自然语言交互,即可完成应用开发,即使是不懂技术的生产、经营人员,也能发挥创造性,用大模型提升工作效率,改造生产流程。
多款智能应用升级与行业落地实践
除此之外,我们还带来多款“开箱即用”的产品应用,他们基于大模型技术提升生产效能,在不同场景实现提质增效。在智能座舱场景, 基于混元大模型,车载语音助手完成智能化升级,可以理解、回复复杂提问,响应完成高阶任务,全面提升车主体验,从而帮助车厂、伙伴构建大模型时代的竞争力。
在输入层,把感知用户状态的各种信号源,用户画像特征导入大模型进行训练,大模型会对车主偏好有更深入的理解。同时,大模型通过agent调用各种API接口,让车载语音助手化身执行任务的小帮手,完成车主在行程中的需求。
在应用层,大模型赋能座舱场景,实现三大升级。首先,口语化理解能力提升,与传统对话可以实现无缝切换;其次,应用能力升级,可以实现行程规划,也可以完成车辆知识问答,遇到故障还会主动报告并给出解决方案;第三是交互能力升级,车主可以随时与大模型进行闲聊,还可以进行AI绘画创作。
在营销提效的场景,我们推出“企点营销云AI助手”,为企业客户提供专业、高效、易用、可信的智能分析和营销服务。通过对话式数据分析、智能归因、结论提取及报告生成、异常诊断及预警四大智能分析服务,客户可以实现“轻松提问,秒获洞察”的全新体验。
目前,AI助手已经在零售、出行、泛互、泛政多个行业落地,与10多家客户推进合作共创。但我们也在过程中,发现了两大挑战,并对此进行了能力升级。针对复杂分析问题理解,例如同一提问包含多个问题,我们优化了模型问题拆解和任务编排能力,升级后可覆盖90%以上复杂分析场景,问题整体识别率提升至88%以上。
针对专业领域知识理解,例如“流量”在交通行业特指“车辆ID计数”,在零售行业又被定义为“用户ID计数”,我们采用知识融合外挂方案,一方面通过高质量数据构建行业通用知识,另一方面通过客户特有知识输入,提高准确度,实现分析最优解。
我们为一家品牌零售商客户,提供了营销云以及AI助手的服务,实现门店经营管理快速提效。过去,各层级的销售主管,一线门店店长,往往会面对分析能力短缺、分析需求回应慢等挑战,无法及时通过数据定位经营问题。通过AI助手,现在他们可以随时随地提问,高效获取精准的数据洞察,帮助下一步决策动作。
企点营销云还在持续通过大模型,升级服务能力。未来AI助手在内容生成、对话式人群生成、营销策略生成等智能营销应用上,还会持续推出新功能,敬请期待!
在代码提效场景,我们推出腾讯云AI代码助手,针对代码补全,技术对话,单元测试和代码诊断4个环节进行重点升级。其中,在代码对话、单元测试场景,基于大模型进行指令对齐和强化学习;在私有化补齐场景,进行专业模型训练和推理优化。
在与行业客户共建的过程中,我们挖掘出代码开发的四类共性挑战,包括代码训练挑战、代码评测挑战、IDE插件开发工具版本多,兼容难,细节打磨成本高;以及专业开发人员对产品的高要求。
目前,通过集团内外的大规模实践与打磨,腾讯云AI代码助手的代码生成率达到30%,实现编码时间缩短40%,研发提效20%。在腾讯内部,50%开发人员都在使用AI代码助手编代码。未来,我们也期待与更多企业客户共创,打造更优的研发体验。
以上,就是我为大家带来的大模型工具、产品进展。作为一家科技公司,我们的责任是开发出更多专业、易用的工具,降低大模型应用门槛,让更多人能用得起、用得好大模型。我们真诚地希望,这些工具能为大家所用,让大模型技术以更快的速度普及,为我们的生活创造更大价值。