前言
我的公众号后台设置了关键词自动回复,但是经常收到很多读者打错别字,导致无法触发,正巧,前段时间刚申请到WeLM的使用权限,于是就想着给公众号升级一下。
WeLM简介
WeLM是腾讯开发的一个擅长理解和生成文本的通用语言模型。 官方文档:https://welm.weixin.qq.com/docs/tutorial/
主要功能如下,输入示例内容即可获得答案
阅读理解
示例:
阅读文章: “经审理查明,被告人张××、杜×、杨2某均为辽宁省辽阳第一监狱五监区服刑人员。2015年11月3日13时许,被告人张××、杜×因无事便跟随去催要生产材料的被告人杨2某一同前往六监区,在六监区生产车间门外,被告人杨2某与六监区送料员于×因送料问题发生争执,被告人杨2某上前拽住被害人于×胳膊并用手击打被害人后脖颈两下,被告人张××、杜×见杨2某动手后,先后上前分别对被害人于×面部、头部及腹部进行殴打,后被赶到的干警制止。被害人于×被打造成面部受伤,鼻子流血,当日下午14时许,到监区内医院就诊,诊断为:鼻部中段向左侧畸形,11月5日经监狱医院X光诊断为鼻骨骨折。2015年11月18日,经辽阳襄平法医司法鉴定所法医鉴定:被害人于×身体损伤程度为轻伤二级。被告人张××、杜×、杨2某共同赔偿被害人于×人民币7000元,被害人于×对被告人的行为表示谅解。” 问题: “被害人于×11月5日经监狱医院X光诊断后的诊断结果为?” 答案:
开放域问答
示例:
请根据所学知识回答下面这个问题 问题:百年孤独的作者是? 回答:加西亚·马尔克斯 问题:二战转折点是? 回答:
文本分类
示例:
判断这条微博的情感是积极的还是消极的 微博:本命年的第一天就把马桶给弄堵了,[泪]添堵 类别:消极 微博:华丽丽闪瞎眼啊![爱你] 类别:积极 微博:很有娱乐精神[嘻嘻] 类别:
文本风格转换
示例:
有这样一段文本,{医生微笑着递给小明棒棒糖,同时让小明服下了药。} 改写这段话让它变得更加惊悚。{医生眼露凶光让小明服药,小明感到非常害怕}。 有这样一段文本,{雨下得很大} 改写这段话让它变得更加具体。{一霎时,雨点连成了线,大雨就像天塌了似的铺天盖地从空中倾泻下来。}。 有这样一段文本,{王老师离开了电影院,外面已经天黑了} 改写这段话让它包含更多电影信息。{这部电影比小王预想的时间要长,虽然口碑很好,但离开电影院时,小王还是有些失望。} 有这样一段文本,{男人站在超市外面打电话} 改写这段话来描述小丑。{男人站在马戏团外一边拿着气球一边打电话} 有这样一段文本,{风铃声响起} 改写这段话写的更加丰富。{我对这个风铃的感情是由它的铃声引起的。每当风吹来时,风铃发出非常动听的声音,听起来是那么乐观、豁达,像一个小女孩格格的笑声。} 有这样一段文本,{我想家了} 改写这段话包含更多悲伤的感情。{
个性对话生成
示例:
李⽩,字太⽩,号⻘莲居⼠,⼜号“谪仙⼈”,唐代伟⼤的浪漫主义 诗⼈,被后⼈誉为“诗仙”。 我:今天我们穿越时空连线李⽩,请问李⽩你爱喝酒吗? 李⽩:当然。花间⼀壶酒,独酌⽆相亲。举杯邀明⽉,对影成三⼈。 我:你觉得杜甫怎么样? 李⽩:他很仰慕我,但他有属于⾃⼰的⻛采。 我:你为何能如此逍遥? 李⽩:天⽣我材必有⽤,千⾦散尽还复来! 我:你都去过哪些地方? 李白:
翻译
示例:
“微信 AI 推出の WeLM 是一个 language model that いろいろなtaskをperformができる”的中文翻译是:
写作或文本续写
示例:
中国地大物博,自然⻛光秀丽,大自然的⻤斧神工造就了许多动人心魄的美景,
总之,尽量输入一些样例,否则语料过短很难输出好结果。
调用接口
WeLM调用接口如下:
代码语言:javascript复制curl -H 'Content-Type: application/json' -H 'Authorization: Bearer your_api_token' https://welm.weixin.qq.com/v1/completions -d
'{
"prompt":"测试",
"model":"xl",
"max_tokens":16,
"temperature":0.0,
"top_p":0.0,
"top_k":10,
"n":1,
"echo":false,
"stop":",,.。"
}'
参数含义:
- model: string 必选,要使用的模型名称,当前支持的模型名称有medium、 large 和 xl
- prompt: string 可选,默认值空字符串,给模型的提示
- max_tokens: integer 可选,最多生成的token个数,默认值 16
- temperature: number 可选 默认值 0.85,表示使用的sampling temperature,更高的temperature意味着模型具备更多的可能性。对于更有创造性的应用,可以尝试0.85以上,而对于有明确答案的应用,可以尝试0(argmax采样)。 建议改变这个值或top_p,但不要同时改变。
- top_p: number 可选 默认值 0.95,来源于nucleus sampling,采用的是累计概率的方式。即从累计概率超过某一个阈值p的词汇中进行采样,所以0.1意味着只考虑由前10%累计概率组成的词汇。 建议改变这个值或temperature,但不要同时改变。
- top_k: integer 可选 默认值50,从概率分布中依据概率最大选择k个单词,建议不要过小导致模型能选择的词汇少。
- n: integer 可选 默认值 1 返回的序列的个数
- echo: boolean 可选 默认值false,是否返回prompt
- stop: string 可选 默认值 null,停止符号
返回状态码含义:
- 超时:504
- 服务不可用:503
- 用户prompt命中敏感词:400, finish_reason: “error: content policy violation”
- 生成结果命中敏感词:200, finish_reason: “error: internal error”
- 用户输入参数不合法:400, finish_reason返回原因
- 配额超限制:429, response body: “quota limit exceed”
- 请求频率超限制:429, response body: “rate limit exceeded”
python调用示例
下面先用python的Requests来调用一下接口,编写测试程序
代码语言:javascript复制# -- coding: utf-8 --
"""
@Time:2022-10-29 23:36
@Author:zstar
@File:te_WeLM.py
@Describe:测试WeLM
"""
import requests
url = 'https://welm.weixin.qq.com/v1/completions'
prompt = "“I am a programmer in Tencent”的中文翻译是:"
data = {
"prompt": prompt,
"model": "xl",
"max_tokens": "16",
"temperature": "0.0",
"top_p": "0.0",
"top_k": "10",
"n": "1",
"echo": False,
"stop": ",,.。",
}
header = {
"Content-Type": "application/json",
"Authorization": "自己的token"
}
if __name__ == '__main__':
response = requests.post(url, json=data, headers=header)
result = eval(response.text) # str -> dict
# print(result)
print(result["choices"][0]["text"])
这里的替换成Authorization
自己的token
微信公众号开发
本地测试完成,那么接下来就来部署到微信公众号上。 微信公众号官方文档:https://developers.weixin.qq.com/doc/offiaccount/Getting_Started/Getting_Started_Guide.html
这里顺便吐槽一下,微信公众号官方给的python例程是基于python2.7的,我采用的版本是python3.8,部署起来有很多坑。
设置服务器配置
微信公众号开发需要一台有公网ip的服务器,我手上正好有一台云服务器。首先需要在公众号后台绑定服务器。
现在服务器上进行配置,先安装web库
代码语言:javascript复制pip install web.py
然后编写main.py
,进行测试:
# -*- coding: utf-8 -*-
# filename: main.py
import web
from handle import Handle
urls = (
'/wx', 'Handle',
)
if __name__ == '__main__':
app = web.application(urls, globals())
app.run()
终端输入:
代码语言:javascript复制 python3 main.py 80
正常运行如下图所示,如果报错,则说明80端口可能被其它程序占用,需要手动进行调整
测试完成,进入到微信公众号后台这个位置,设置自己的URL
:服务器域名/wx,Token需要自己设置,建议用工具生成,太短容易和别人重复,造成后面其它错误,然后随机生成Key。
直接点提交会失败,还需要在服务器端进行设置:
新建handle.py
,token修改为自己设置的token
# -*- coding: utf-8 -*-
# filename: handle.py
import hashlib
import web
class Handle(object):
def GET(self):
try:
data = web.input()
if len(data) == 0:
return "hello, this is handle view"
signature = data.signature
timestamp = data.timestamp
nonce = data.nonce
echostr = data.echostr
token = "自己的token" #请按照公众平台官网基本配置中信息填写
list =[token, timestamp, nonce]
list.sort()
sha1=hashlib.sha1()
sha1.update(list[0].encode('utf-8'))
sha1.update(list[1].encode('utf-8'))
sha1.update(list[2].encode('utf-8'))
hashcode= sha1.hexdigest()
print("handle/GET func: hashcode, signature: ", hashcode, signature)
if hashcode == signature:
return echostr
else:
return ""
except Exception:
return ""
然后重新运行:
代码语言:javascript复制 python3 main.py 80
这时候再去公众号后台点提交,提交成功则设置完成。
开启自动回复
在嵌入WeLM之前,先来实现一个自动回复的功能,即输入任何内容,公众号会自动回复设定好的内容。
修改handle.py
代码语言:javascript复制# -*- coding: utf-8 -*-#
# filename: handle.py
import hashlib
import reply
import receive
import web
class Handle(object):
def POST(self):
try:
webData = web.data()
print("Handle Post webdata is ", webData)
#后台打日志
recMsg = receive.parse_xml(webData)
if isinstance(recMsg, receive.Msg) and recMsg.MsgType == 'text':
toUser = recMsg.FromUserName
fromUser = recMsg.ToUserName
content = "test"
replyMsg = reply.TextMsg(toUser, fromUser, content)
return replyMsg.send()
else:
print("暂且不处理")
return "success"
except Exception:
return "fail"
编写receive.py
代码语言:javascript复制# -*- coding: utf-8 -*-#
# filename: receive.py
import xml.etree.ElementTree as ET
def parse_xml(web_data):
if len(web_data) == 0:
return None
xmlData = ET.fromstring(web_data)
msg_type = xmlData.find('MsgType').text
if msg_type == 'text':
return TextMsg(xmlData)
elif msg_type == 'image':
return ImageMsg(xmlData)
class Msg(object):
def __init__(self, xmlData):
self.ToUserName = xmlData.find('ToUserName').text
self.FromUserName = xmlData.find('FromUserName').text
self.CreateTime = xmlData.find('CreateTime').text
self.MsgType = xmlData.find('MsgType').text
self.MsgId = xmlData.find('MsgId').text
class TextMsg(Msg):
def __init__(self, xmlData):
Msg.__init__(self, xmlData)
self.Content = xmlData.find('Content').text.encode("utf-8")
class ImageMsg(Msg):
def __init__(self, xmlData):
Msg.__init__(self, xmlData)
self.PicUrl = xmlData.find('PicUrl').text
self.MediaId = xmlData.find('MediaId').text
编写reply.py
代码语言:javascript复制# -*- coding: utf-8 -*-#
# filename: reply.py
import time
class Msg(object):
def __init__(self):
pass
def send(self):
return "success"
class TextMsg(Msg):
def __init__(self, toUserName, fromUserName, content):
self.__dict = dict()
self.__dict['ToUserName'] = toUserName
self.__dict['FromUserName'] = fromUserName
self.__dict['CreateTime'] = int(time.time())
self.__dict['Content'] = content
def send(self):
XmlForm = """
<xml>
<ToUserName><![CDATA[{ToUserName}]]></ToUserName>
<FromUserName><![CDATA[{FromUserName}]]></FromUserName>
<CreateTime>{CreateTime}</CreateTime>
<MsgType><![CDATA[text]]></MsgType>
<Content><![CDATA[{Content}]]></Content>
</xml>
"""
return XmlForm.format(**self.__dict)
class ImageMsg(Msg):
def __init__(self, toUserName, fromUserName, mediaId):
self.__dict = dict()
self.__dict['ToUserName'] = toUserName
self.__dict['FromUserName'] = fromUserName
self.__dict['CreateTime'] = int(time.time())
self.__dict['MediaId'] = mediaId
def send(self):
XmlForm = """
<xml>
<ToUserName><![CDATA[{ToUserName}]]></ToUserName>
<FromUserName><![CDATA[{FromUserName}]]></FromUserName>
<CreateTime>{CreateTime}</CreateTime>
<MsgType><![CDATA[image]]></MsgType>
<Image>
<MediaId><![CDATA[{MediaId}]]></MediaId>
</Image>
</xml>
"""
return XmlForm.format(**self.__dict)
再次运行:
代码语言:javascript复制python3 main.py 80
在公众号后台设定“启用”,然后就可以进行实机测试:
解析收到的信息
上面的例子只会回答固定的语言,那么是否能再进一步,获取用户所发的信息呢?
方式也很容易,修改handle.py
如下:
# -*- coding: utf-8 -*-#
# filename: handle.py
import hashlib
import reply
import receive
import web
class Handle(object):
def POST(self):
try:
webData = web.data()
print("Handle Post webdata is ", webData) # 后台打日志
recMsg = receive.parse_xml(webData)
if isinstance(recMsg, receive.Msg) and recMsg.MsgType == 'text':
toUser = recMsg.FromUserName
fromUser = recMsg.ToUserName
recmsg = recMsg.Content # 获取收到的信息内容
recmsg = recmsg.decode() # 将二进制编码信息解码为字符串
content = "收到消息:" recmsg "n本公众号暂时升级维护中,请等维护结束后再发关键词"
replyMsg = reply.TextMsg(toUser, fromUser, content)
return replyMsg.send()
else:
print("暂且不处理")
return "success"
except Exception:
return "fail"
整合WeLM
现在我们把之前编写好的WeLM改成一个函数,就能整合进去 编写WeLM.py
代码语言:javascript复制import requests
def run(prompt):
url = 'https://welm.weixin.qq.com/v1/completions'
data = {
"prompt": prompt,
"model": "xl",
"max_tokens": "16",
"temperature": "0.0",
"top_p": "0.0",
"top_k": "10",
"n": "1",
"echo": False,
"stop": ",,.。",
}
header = {
"Content-Type": "application/json",
"Authorization": "自己的Token"
}
response = requests.post(url, json=data, headers=header)
result = eval(response.text) # str -> dict
answer = result["choices"][0]["text"]
return answer
修改handle.py
代码语言:javascript复制# -*- coding: utf-8 -*-#
# filename: handle.py
import hashlib
import reply
import receive
import web
import WeLM
class Handle(object):
def POST(self):
try:
webData = web.data()
print("Handle Post webdata is ", webData)
#后台打日志
recMsg = receive.parse_xml(webData)
if isinstance(recMsg, receive.Msg) and recMsg.MsgType == 'text':
toUser = recMsg.FromUserName
fromUser = recMsg.ToUserName
recmsg = recMsg.Content
recmsg = recmsg.decode()
answer = WeLM.run(recmsg)
content = str(answer)
replyMsg = reply.TextMsg(toUser, fromUser, content)
return replyMsg.send()
else:
print("暂且不处理")
return "success"
except Exception:
return "fail"
关注自动回复
值得注意的是,开启服务器配置之后,公众号以往的关注自动回复和关键词自动回复都会失效,那么能否将关注自动回复
也添加进去呢?
官方文档在基础消息能力/接收事件推送
一节中,给出了关注事件的XML数据格式:
<xml>
<ToUserName><![CDATA[toUser]]></ToUserName>
<FromUserName><![CDATA[FromUser]]></FromUserName>
<CreateTime>123456789</CreateTime>
<MsgType><![CDATA[event]]></MsgType>
<Event><![CDATA[subscribe]]></Event>
</xml>
因此,可以把关注事件和收到消息事件整合成一个类
修改receive.py
代码语言:javascript复制# -*- coding: utf-8 -*-#
# filename: receive.py
import xml.etree.ElementTree as ET
def parse_xml_sub(web_data):
if len(web_data) == 0:
return None
xmlData = ET.fromstring(web_data)
return Sub_Msg(xmlData)
class Sub_Msg(object):
def __init__(self, xmlData):
self.ToUserName = xmlData.find('ToUserName').text
self.FromUserName = xmlData.find('FromUserName').text
self.CreateTime = xmlData.find('CreateTime').text
self.MsgType = xmlData.find('MsgType').text
self.Event = xmlData.find('Event').text if xmlData.find('Event') is not None else None
self.EventKey = xmlData.find('EventKey').text if xmlData.find('EventKey') is not None else None
self.MsgId = xmlData.find('MsgId').text if xmlData.find('MsgId') is not None else None
self.Content = xmlData.find('Content').text.encode("utf-8") if xmlData.find('Content') is not None else None
修改handle.py
代码语言:javascript复制# -*- coding: utf-8 -*-#
# filename: handle.py
import hashlib
import reply
import receive
import web
import WeLM
class Handle(object):
def POST(self):
try:
webData = web.data()
print("Handle Post webdata is ", webData) # 后台打日志
recMsg = receive.parse_xml_sub(webData)
if recMsg.MsgType == 'text':
toUser = recMsg.FromUserName
fromUser = recMsg.ToUserName
recmsg = recMsg.Content
recmsg = recmsg.decode()
answer = WeLM.run(recmsg)
content = str(answer)
replyMsg = reply.TextMsg(toUser, fromUser, content)
return replyMsg.send()
# 获得关注信息
elif recMsg.MsgType == 'event':
if recMsg.Event == 'subscribe':
toUser = recMsg.FromUserName
fromUser = recMsg.ToUserName
content = "欢迎关注本号,本号已上线Ai语言机器人,使用攻略可查阅精选推文n公众号资源整合在该文档:nhttps://docs.qq.com/sheet/DQ0NIY0JERmRTVVBP?tab=BB08J2"
replyMsg = reply.TextMsg(toUser, fromUser, content)
return replyMsg.send()
else:
print("暂且不处理")
return "success"
except Exception:
print('报错了')
print(Exception)
return "fail"
这样就配置完成了。
最后,为了让服务器端程序能够持续运行,使用nohup
来后台挂载程序:
nohup python3 main.py 80 > nohup.log 2>&1 &
最后,欢迎到我的个人公众号去体验WeLM。
参考
[1]微信公众号官方文档:https://developers.weixin.qq.com/doc/offiaccount/Getting_Started/Getting_Started_Guide.html [2]WeLM官方文档:https://welm.weixin.qq.com/docs/tutorial/ [3]公众号获取token失败_微信公众号token验证失败: https://blog.csdn.net/weixin_30005929/article/details/113028773