腾讯混元大模型初体验——真正的全场景下模型

2023-11-21 10:51:01 浏览数 (2)

虽然说之前已经有很多公司发布了大模型,但是腾讯在大模型上还是令人期待的。

随着ChatGPT带来的AI大模型潮流的发展,国内各家大公司都是卯足力气发布自家的大模型。自今年3月份以来,百度发布了文心一言,并在近期发布了文心一言APP。4月份则是阿里发布的通义千问,同时近期也发布了多模态通义千问Qwen-Chat。而此后国内大模型就一直百花齐放,因此又被网友称为“百模大战”。

虽然“百模大战”已经然很多网友感觉到了疲劳。主要原因在于:

  • 利用现有的榜单进行刷榜,其实人们已经很少去关注了,刷榜只会给人们带来麻木在开源模型中,目前只有LLAMA2真正使用了RLHF,其他模型还是欠缺了许多

大模型目前的发力点还在于实用性

从9月7日腾讯全球数字生态大会上,腾讯发布了自家大模型“混元大模型”来看,其实腾讯更倾向于把大模型真正变成生产力,来提高工作效率。这就需要不断依赖于混元大模型与腾讯业务的紧密结合,从而找到更好的发力点。

大模型不仅仅要“参数量大”,更需要在多领域上进行充分应用,把用户的痛点进行充分解决,让更多开发者参与进来进行开发,从而更好的促进自身大模型的生态打造。

从官网介绍,混元大模型在复杂语境下,能够完成很好的“多轮对话”、“内容创作”、“逻辑推理”等大模型的基础能力

从生态大会上得知,腾讯混元大模型更加聚焦于其应用方面,其目前已经在腾讯文档、广告、会议等多个业务上取得明显效果。比如在腾讯文档中,可以有效的做到多种文案的生成,并且已经支持excel公式的生成。

在腾讯文档中,新建智能文档,按下"/"键,就可以快速调出混元大模型进行文本生成:

而在腾讯会议中,混元大模型则可以帮助你快速记录会议内容并生成摘要文档。同时能够根据一定的上下文进行问题回答:

当然,也可以通过混元大模型生成对应的图片,并进行AI广告创作。让你几分钟内制作出好看的图片出来。

混元大模型初体验

申请通过,我们可以通过网页和微信小程序体验混元大模型,这里面提出几个问题对混元大模型进行相应的测试。

数学计算

Q:一个三角形,如果一条边长为4cm,另一条边长为7cm,则第三条边最长可能是多少厘米?(答案为正整数)

本身推理过程算是比较正确,同时在简单的计算能力上能够不算错。,最后得到了正确的答案

逻辑推理

Q:赵三的父母结婚的时候,为什么没有邀请自己参加

在伦理逻辑上,有很好的辨别能力

Q:我妈妈的弟弟的儿子的老婆我叫他

这次的推理还是比较准确,能够准确推理出亲戚之间的关系。

代码能力

本身在混元大模型中,已经集成了多种不同的能力,这里面就包括生成代码。我们也可以生成自己的指令,进行快速的编写。

Q:利用huggingface调用LLAMA大模型代码。

从上面代码上看,基本没有什么问题。还会贴心的给出代码的每个步骤在干什么,应该是初步具备一定的代码水平。

网络热梗

这里直接询问最近很火的“花西子币”是什么。它能够很容易的知道最近的热词。说明本身混元大模型是有联网功能的,可以直接拿到最近的数据进行总结和反馈。

额外的能力

除了上面几个能力之外,它还包括了绘画、营销、角色扮演等等。

在生成的图片上,可以选择不同的风格,每次会生成4张图片,而且出图的速度很快。

比如我这里让它画一个“周杰伦骑马”,它能够理解我的意思进行有效生成。

综合使用:设计你的房间设计图

混元大模型可以很简便的就把自己常用的指令进行保存。合理的指令能够让模型回忆起训练时候的知识。

比如我这里新建了一个“装饰师”的指令,然后让他设计房间。

然后告诉它,我正在设计一个客厅,询问AI的建议。

得到建议之后,我们就可以根据它的回答,让他自己生成图片:

这种能力,优点类似于GPT-4V的视觉能力,它能够根据你的对话进行图片生成。希望后续优化能够加入图文对话,这样能力可能会更好。

总结

从“百模大战”的内卷,也最终让很多大公司意思到只有在具体行业中落地,才能够充分发挥大模型带来的价值。

而混元大模型能力比较全面,同时具体图片生成功能和联网功能,说明模型已经具有多个场景深度融合的能力,如果能够不断拓展更多的场景,相信能够变得越来越好,真正的提升人们的工作效率。

好了,以上就是本期的所有内容了,我是leo,我们下期再见

0 人点赞