最近申请到了腾讯混元助手的体验资格,刚好我们可以回顾一下prompt-engineering课程,通过prompt方式和混元进行一次对话,看混元可以帮我们做哪些事情。
吴恩达教授在课程中提出LLM大致可以分为两种类型:基础LLM和指令微调LLM。
基础LLM就是使用大量的数据无监督训练出来的模型,他可以根据用户的输入续写后文,但是并没有推理和对话能力;
指令微调LLM则是通过给出{指令,输出}数据对进一步对基础LLM进行微调,然后再通过人类强化学习优化模型,他可以很好的理解用户的指令和提问并进行回答。
prompt工程课程就是教大家如何对指令微调后模型的进行应用,最大化挖掘LLM的能力。
那本文我们就结合prompt工程课程,挖掘出混元模型的潜能~
1 prompt的两大基本原则
1.1 给出清晰,详细的指令
策略1:使用分割符清晰的知识输出的不同部分,比如"",<>,<tag>等分隔符
策略2:指定一个结构化的输出,比如json,html等格式
策略3:要求模型自检测是否满足条件
策略4:提供少量示例
1.2 给模型思考的时间
我们不一定要一步得到答案,可以让模型进行一系列的推理,给他推理思考的时间,再最终给出答案。
策略1:指定完成任务需要的步骤
告诉模型完成这个指令,需要执行几步,每步的详细步骤
策略2:明确模型再给出结论之前推理出自己的解决方案
让模型自己推理,写出每一步的步骤,给足够的时间(token-钱)边思考边执行。
2 迭代思维
介绍了原则和思路后,我们就使用课程中的例子,来对混元的基础能力进行体验。
3 摘要和信息提取
代码语言:javascript复制用户:
你的任务是从电子商务网站上生成一个产品评论的简短摘要。
对评论文本进行概括,最多30个字
回答:
请提供您希望进行概括的评论文本,我会尽力为您提供一个简短的摘要。
用户:
这个熊猫公仔是我给女儿的生日礼物,她很喜欢,去哪都带着。
公仔很软,超级可爱,面部表情也很和善。但是相比于价钱来说,
它有点小,我感觉在别的地方用同样的价钱能买到更大的。
快递比预期提前了一天到货,所以在送给女儿之前,我自己玩了会。
回答:
熊猫公仔很可爱,面部表情和善,尺寸略小。
可以看出混元摘要能力不错,但是丢失了价格和快递速度的信息。
这里就要用到迭代思路去优化prompt,以及prompt原则一:给出详细的指令。
代码语言:javascript复制用户:
摘要包含快递信息和价格信息,最多30个字。
回答:
熊猫公仔很可爱,面部表情和善,尺寸略小。价格适中,但可寻找更大尺寸。快递速度提前一天到达。
有时候我们的需求不是进行摘要获取所有信息,而是抽取感兴趣的信息(关键信息提取)。也可以根据需求通过prompt解决。
代码语言:javascript复制用户:
你的任务是从电子商务网站上提取产品评论的物流信息。最多15个字
回答:
提取的物流信息如下:
配送公司:未知
配送速度:较快
配送情况:顺利
产品评价:喜欢
意见:较小,感觉可以买到更大的。
配送时间:提前一天。
4 推理
推理是大模型的一个重要能力,他需要真正理解用户的输入,并执行分析过程,最后得出输出。
按着教程中的例子,我们也让混元模型对商品的评论识别情感类型。
代码语言:javascript复制问题:
以下用三个反引号分隔的产品评论的情感是什么?
```我需要一盏漂亮的卧室灯,这款灯具有额外的储物功能,价格也不算太高。
我很快就收到了它。在运输过程中,我们的灯绳断了,但是公司很乐意寄送了一个新的。
几天后就收到了。这款灯很容易组装。我发现少了一个零件,于是联系了他们的客服,他们很快就给我寄来了缺失的零件!
在我看来,Lumina 是一家非常关心顾客和产品的优秀公司。```
用一个单词回答:「正面」或「负面」。
回答:
正面。
问题:
以下用三个反引号分隔的产品评论的情感类型是什么?用不少于5个词表示,类型之间用逗号分开。
```我需要一盏漂亮的卧室灯,这款灯具有额外的储物功能,价格也不算太高。
我很快就收到了它。在运输过程中,我们的灯绳断了,但是公司很乐意寄送了一个新的。
几天后就收到了。这款灯很容易组装。我发现少了一个零件,于是联系了他们的客服,他们很快就给我寄来了缺失的零件!
在我看来,Lumina 是一家非常关心顾客和产品的优秀公司。```
回答:正面,积极,优秀公司,关心顾客,产品。
这里识别正负情感没问题,但是情感类型不太好,需要进一步调优,让模型知道什么词汇属于情感类型。针对这个问题,我们是可以通过prompt优化的,我们可以提供情感类型词汇,让模型从候选词中选择,因为他知道情感是正向的。
增加难度,我们测试多个任务同时完成的推理能力。
代码语言:javascript复制问题:
从评论文本中识别以下项目:
- 情绪(正面或负面)
- 审稿人是否表达了愤怒?(是或否)
- 评论者购买的物品
- 制造该物品的公司
评论用三个反引号分隔。将您的响应格式化为 JSON 对象,以 “Sentiment”、“Anger”、“Item” 和 “Brand” 作为键。
如果信息不存在,请使用 “未知” 作为值。
让你的回应尽可能简短。
将 Anger 值格式化为布尔值。
评论文本: ```{我需要一盏漂亮的卧室灯,这款灯具有额外的储物功能,价格也不算太高。
我很快就收到了它。在运输过程中,我们的灯绳断了,但是公司很乐意寄送了一个新的。
几天后就收到了。这款灯很容易组装。我发现少了一个零件,于是联系了他们的客服,他们很快就给我寄来了缺失的零件!
在我看来,Lumina 是一家非常关心顾客和产品的优秀公司!
}```
回答:
{
"Sentiment": "正面",
"Anger": "否",
"Item": "卧室灯",
"Brand": "Lumina"
}
完美~
再看看另一个推理主题的例子
代码语言:javascript复制问题;
确定以下给定文本中讨论的五个主题。
每个主题用1-2个单词概括。
输出时用逗号分割每个主题。
给定文本: ```{在政府最近进行的一项调查中,要求公共部门的员工对他们所在部门的满意度进行评分。
调查结果显示,NASA 是最受欢迎的部门,满意度为 95%。
一位 NASA 员工 John Smith 对这一发现发表了评论,他表示:
“我对 NASA 排名第一并不感到惊讶。这是一个与了不起的人们和令人难以置信的机会共事的好地方。我为成为这样一个创新组织的一员感到自豪。”
NASA 的管理团队也对这一结果表示欢迎,主管 Tom Johnson 表示:
“我们很高兴听到我们的员工对 NASA 的工作感到满意。
我们拥有一支才华横溢、忠诚敬业的团队,他们为实现我们的目标不懈努力,看到他们的辛勤工作得到回报是太棒了。”
调查还显示,社会保障管理局的满意度最低,只有 45%的员工表示他们对工作满意。
政府承诺解决调查中员工提出的问题,并努力提高所有部门的工作满意度。
}```
回答:
1. 调查结果,满意度评分
2. NASA 部门满意度
3. John Smith 的评论
4. NASA 管理团队,主管
5. 社会保障管理局,工作满意度
可以看出看出基于prompt编写原则,简单的prompt编写混元就可以给出比较满意的答案。
所以,混元推理能力还是不错的。以上任务如果按传统模型,他包含分类,实体抽取,摘要生成,任务生成等多个子模型部署再结合工程后处理逻辑,而且按需要生成格式这种推理能力传统模型也是做不到的,但是大模型可以一次性推理出结果。
5 转换能力
LLM非常擅长将输入转换成不同的格式,例如多语种文本翻译、拼写及语法纠正、语气调整、格式转换等。
同样,我们通过例子测试下混元在这方面的综合能力。
代码语言:txt复制提问:
针对以下三个反引号之间的英文评论文本,
首先进行拼写及语法纠错,
然后将其转化成中文,
再将其转化成优质淘宝评论的风格,从各种角度出发,分别说明产品的优点与缺点,并进行总结。
润色一下描述,使评论更具有吸引力。
输出结果格式为:
【优点】xxx
【缺点】xxx
【总结】xxx
注意,只需填写xxx部分,并分段输出。
将结果输出成Markdown格式。
```{Got this for my daughter for her birthday cuz she keeps taking
mine from my room. Yes, adults also like pandas too. She takes
it everywhere with her, and it's super soft and cute. One of the
ears is a bit lower than the other, and I don't think that was
designed to be asymmetrical. It's a bit small for what I paid for it
though. I think there might be other options that are bigger for
the same price. It arrived a day earlier than expected, so I got
to play with it myself before I gave it to my daughter.
}```
回答:
【优点】可爱,柔软,便携,亲子共享
【缺点】尺寸较小,价格偏高
【总结】尽管价格偏高,但这款熊猫公仔非常可爱,柔软和便携,非常适合亲子共享。尺寸较小的问题可能是由于设计的原因,但考虑到价格,我认为这是可以接受的。
6 扩展
扩写就是对用户给出的短文本进行扩写,这个功能,混元有很多案例可以直接使用,甚至提供了很多prompt参考,我们直接看一个灵感发现中的示例。
代码语言:javascript复制混元提供的prompt:
我会帮你创作种草文案,请输入要种草的商品名称
输入:
雅诗兰黛小棕瓶
输出:
在这个快节奏的世界里,我们渴望找到一款能让肌肤回到最佳状态,焕发自信的护肤品。经过岁月的沉淀和经验的积累,我终于找到了那个能让肌肤焕发青春活力的秘密武器——雅诗兰黛小棕瓶。
小棕瓶,一个家喻户晓的护肤界明星,它带给我的不仅仅是肌肤的改变,更是对美好生活的渴望。它,渗透着修护力量,让我的肌肤在经历了一天的劳累后,依然能焕发出水润、光滑的青春光彩。
小棕瓶的瓶身设计简约大方,透着高贵的气质。而它所蕴含的科技和成分,更是让它在众多护肤品中独树一帜。它采用了雅诗兰黛独家研发的ChronoluxCB科技,这种科技能有效修复肌肤,让肌肤回到最佳状态。
使用小棕瓶的日子,我的肌肤变得紧致、有弹性,细纹和皱纹也减少了。我不再担心熬夜、压力等因素影响我的肌肤,因为小棕瓶的修护力量让我重拾了信心。
小棕瓶的修护力量不仅仅体现在肌肤的表面,它还让我的肌肤由内而外焕发出青春活力。我能感受到它为我的肌肤注入了源源不断的活力,让我的肌肤在清晨醒来时都能保持水润、光滑。
有了小棕瓶,我不再担心肌肤问题,它让我重拾了自信,也让我更加珍惜生活中的每一刻。我坚信,每个人都值得拥有一个让自己变得更美好的机会,而小棕瓶正是那个机会。
在这个充满变化的世界里,让我们一起与小棕瓶携手,为肌肤注入青春活力,让美丽永驻。
文字工作者们在混元界面的灵感发现功能中可以找到很多灵感,很实用的功能,半天干两天的活...
7 chatBot
chatBot其实就是闲聊了,我们可以和混元聊天,问常识问题,问工作问题,问心理问题,问天气问题,把他当朋友,把他当助手,使用上面介绍的prompt技巧以及大模型具备的能力,大家自行挖掘吧~
8 总结
本文使用prompt教程中的思路和案例,体验了混元大模型,腾讯的混元在信息提取,逻辑推理和问答,转换能力,文本扩展和闲聊方面都有不错的表现。
目前我只申请到界面体验机会,如果有混元的API和模型微调代码,我们也可以借助他的能力,做自己的AI应用~期待混元模型开放更多能力。
番外
几天不见,混元又增加了好多功能:帮你写PPT大纲,设定健身计划,模仿人物。
以及,绘制一个加班的程序员:
参考:
https://www.bilibili.com/video/BV1Z14y1Z7LJ/?spm_id_from=333.337.search-card.all.click
https://juejin.cn/post/7231519213893533754#heading-37
我正在参与2023腾讯技术创作特训营第三期有奖征文,组队打卡瓜分大奖!