一、材料准备
1、树莓派一个
2、免驱动USB麦克风
3、耳机
二、教程开始
1.录音
插上麦克风
我用到的是使用了arecord* 测试是否麦克风能否使用。
使用录音输入如下命令
代码语言:txt复制arecord -D "plughw:1" -f S16_LE -r 16000 -d 3 /home/pi/Desktop/voice.wav
2.语音识别
建立语音识别文件夹输入如下程序
代码语言:txt复制sudo nano yuyinshibie.py
去百度语音官网申请语音识别
img
写代码进去 将上面申请的ID和secret写进下面红色区域
代码语言:txt复制# coding: utf-8
代码语言:txt复制import sys
代码语言:txt复制 import json
代码语言:txt复制 import urllib2
代码语言:txt复制 import base64
代码语言:txt复制 import requests
代码语言:txt复制reload(sys)
代码语言:txt复制 sys.setdefaultencoding(“utf-8”)
代码语言:txt复制def get_access_token():
代码语言:txt复制 url = “https://openapi.baidu.com/oauth/2.0/token”
代码语言:txt复制 body = {
代码语言:txt复制 “grant_type”:”client_credentials”,
代码语言:txt复制 “client_id” :”此处填写自己的client_id”,
代码语言:txt复制 “client_secret”:”此处填写自己的client_secret”,
代码语言:txt复制 }
代码语言:txt复制r = requests.post(url,data=body,verify=True)
代码语言:txt复制respond = json.loads(r.text)
代码语言:txt复制return respond["access_token"]
代码语言:txt复制def yuyinshibie_api(audio_data,token):
代码语言:txt复制 speech_data = base64.b64encode(audio_data).decode(“utf-8”)
代码语言:txt复制 speech_length = len(audio_data)
代码语言:txt复制 post_data = {
代码语言:txt复制 “format” : “wav”,
代码语言:txt复制 “rate” : 16000,
代码语言:txt复制 “channel” : 1,
代码语言:txt复制 “cuid” : “B8-27-EB-BA-24-14”,
代码语言:txt复制 “token” : token,
代码语言:txt复制 “speech” : speech_data,
代码语言:txt复制 “len” : speech_length
代码语言:txt复制 }
代码语言:txt复制url = "http://vop.baidu.com/server_api"
代码语言:txt复制json_data = json.dumps(post_data).encode("utf-8")
代码语言:txt复制json_length = len(json_data)
代码语言:txt复制#print(json_data)
代码语言:txt复制req = urllib2.Request(url, data=json_data)
代码语言:txt复制req.add_header("Content-Type", "application/json")
代码语言:txt复制req.add_header("Content-Length", json_length)
代码语言:txt复制#print("asr start requestn")
代码语言:txt复制resp = urllib2.urlopen(req)
代码语言:txt复制#print("asr finish requestn")
代码语言:txt复制resp = resp.read()
代码语言:txt复制resp_data = json.loads(resp.decode("utf-8"))
代码语言:txt复制if resp_data["err_no"] == 0:
代码语言:txt复制 return resp_data["result"]
代码语言:txt复制else:
代码语言:txt复制 print(resp_data)
代码语言:txt复制 return None
代码语言:txt复制def asr_main(filename,tok):
代码语言:txt复制 try:
代码语言:txt复制 f = open(filename, “rb”)
代码语言:txt复制 audio_data = f.read()
代码语言:txt复制 f.close()
代码语言:txt复制 resp = yuyinshibie_api(audio_data,tok)
代码语言:txt复制 return resp[0]
代码语言:txt复制 except Exception,e:
代码语言:txt复制 print “e:”,e
代码语言:txt复制 return “识别失败”.encode(“utf-8”)
代码图示根据图改缩进
识别完成之后呢 我们就要开始第三步了 我们要和机器人对话
那么它一定得回复我们,对吧。为了能够智能点,我们就用到了图灵得接口图灵真的非常好用能够 查天气语音**讲故事**讲笑话 下面附上第三步的代码
3、“图灵回复"
(1)去图灵机器人官网注册创建一个微信机器人
在这里插入图片描述
(2)创建图灵机器人文件输入代码
代码语言:txt复制sudo nano Turling.py
(3) 写入代码,在红色处写自己申请的API KEY
代码语言:txt复制# coding: utf-8
代码语言:txt复制import requests
代码语言:txt复制import json
代码语言:txt复制import sys
代码语言:txt复制reload(sys)
代码语言:txt复制sys.setdefaultencoding("utf-8")
代码语言:txt复制def Tuling(words):
代码语言:txt复制 Tuling_API_KEY = "此处填写自己的Turling KEY"
代码语言:txt复制 body = {"key":Tuling_API_KEY,"info":words.encode("utf-8")}
代码语言:txt复制 url = "http://www.tuling123.com/openapi/api"
代码语言:txt复制 r = requests.post(url,data=body,verify=True)
代码语言:txt复制 if r:
代码语言:txt复制 date = json.loads(r.text)
代码语言:txt复制 print date["text"]
代码语言:txt复制 return date["text"]
代码语言:txt复制 else:
代码语言:txt复制 return None
根据图片改代码缩进
4、语音合成
图灵回复了之后 我们要让它播放出来 就用到了百度的语音合成
(1)创建语音合成文件
代码语言:txt复制sudo nano yuyinhecheng.py
(2)写代码
代码语言:txt复制# coding: utf-8
代码语言:txt复制import sys
代码语言:txt复制 import urllib2
代码语言:txt复制 import json
代码语言:txt复制 import os
代码语言:txt复制 import yuyinshibie
代码语言:txt复制reload(sys)
代码语言:txt复制 sys.setdefaultencoding(“utf-8”)
代码语言:txt复制def yuyinhecheng_api(tok,tex):
代码语言:txt复制 cuid = “B8-27-EB-BA-24-14”
代码语言:txt复制 spd = “4”
代码语言:txt复制 url = “http://tsn.baidu.com/text2audio?tex=“ tex ”&lan=zh&cuid=” cuid ”&ctp=1&tok=” tok ”&per=3”
代码语言:txt复制 #print url
代码语言:txt复制 #response = requests.get(url)
代码语言:txt复制 #date = response.read()
代码语言:txt复制 return url
代码语言:txt复制def tts_main(filename,words,tok):
代码语言:txt复制 voice_date = yuyinhecheng_api(tok,words)
代码语言:txt复制f = open(filename,"wb")
代码语言:txt复制f.write(voice_date)
代码语言:txt复制f.close()
根据图片改缩进
5、播放
语音合成之后我们要播放出来用到了mpg123为什么我会用这个呢因为它可以直接播放网页上的音频非常的好用
安装mpg123:
代码语言:txt复制sudo apt-get install mpg123
安装好了之后 我后面等用到了再说怎么用 现在先不说
现在录音 语音识别 语音合成 播放 所需要的工具 代码都准备好了 下面就开始整合在一起
6、整合
创建最终文件
代码语言:txt复制sudo nano yuyin.py
写代码
代码语言:txt复制# coding: utf-8
代码语言:txt复制import os
代码语言:txt复制import time
代码语言:txt复制import yuyinhecheng
代码语言:txt复制import Turling
代码语言:txt复制import yuyinshibie
代码语言:txt复制tok = yuyinshibie.get_access_token()
代码语言:txt复制switch = True
代码语言:txt复制while switch:
代码语言:txt复制 os.system('sudo arecord -D "plughw:1" -f S16_LE -r 16000 -d 3 /home/pi/Desktop/voice.wav')
代码语言:txt复制 time.sleep(0.5)
代码语言:txt复制 info = yuyinshibie.asr_main("/home/pi/Desktop/voice.wav",tok)
代码语言:txt复制 if '关闭'.encode("utf-8") in info:
代码语言:txt复制 while True:
代码语言:txt复制 os.system('sudo arecord -D "plughw:1" -f S16_LE -r 16000 -d 10 /home/pi/Desktop/voice.wav')
代码语言:txt复制 time.sleep(10)
代码语言:txt复制 info = yuyinshibie.asr_main("/home/pi/Desktop/voice.wav",tok)
代码语言:txt复制 if '开启'.encode("utf-8") in info:
代码语言:txt复制 break
代码语言:txt复制 url = "http://tsn.baidu.com/text2audio?tex=开启成功&lan=zh&cuid=B8-27-EB-BA-24-14&ctp=1&tok=" tok "&per=3"
代码语言:txt复制 os.system('mpg123 "%s"'%url)
代码语言:txt复制 elif '暂停'.encode("utf-8") in info:
代码语言:txt复制 url = "http://tsn.baidu.com/text2audio?tex=开始暂停&lan=zh&cuid=B8-27-EB-BA-24-14&ctp=1&tok=" tok "&per=3"
代码语言:txt复制 os.system('mpg123 "%s"'%url)
代码语言:txt复制 time.sleep(10)
代码语言:txt复制 url = "http://tsn.baidu.com/text2audio?tex=暂停结束&lan=zh&cuid=B8-27-EB-BA-24-14&ctp=1&tok=" tok "&per=3"
代码语言:txt复制 os.system('mpg123 "%s"'%url)
代码语言:txt复制 continue
代码语言:txt复制 else:
代码语言:txt复制 tex = Turling.Tuling(info)
代码语言:txt复制 url = yuyinhecheng.yuyinhecheng_api(tok,tex)
代码语言:txt复制 os.system('mpg123 "%s"'%url)
代码语言:txt复制 time.sleep(0.5)
根据图改缩进
img
7、运行
最后就可以运行机器人了
输入代码
代码语言:txt复制sudo python yuyin.py