语音对话机器人

一、材料准备

1、树莓派一个

2、免驱动USB麦克风

3、耳机

二、教程开始

1.录音

插上麦克风

我用到的是使用了arecord* 测试是否麦克风能否使用。

使用录音输入如下命令

代码语言：txt复制

arecord -D "plughw:1" -f S16_LE -r 16000 -d 3 /home/pi/Desktop/voice.wav

2.语音识别

建立语音识别文件夹输入如下程序

代码语言：txt复制

sudo nano yuyinshibie.py

去百度语音官网申请语音识别

img

写代码进去将上面申请的ID和secret写进下面红色区域

代码语言：txt复制

# coding: utf-8

代码语言：txt复制

import sys

代码语言：txt复制

 import json

代码语言：txt复制

 import urllib2

代码语言：txt复制

 import base64

代码语言：txt复制

 import requests

代码语言：txt复制

reload(sys)

代码语言：txt复制

 sys.setdefaultencoding(“utf-8”)

代码语言：txt复制

def get_access_token():

代码语言：txt复制

 url = “https://openapi.baidu.com/oauth/2.0/token”

代码语言：txt复制

 body = {

代码语言：txt复制

 “grant_type”:”client_credentials”,

代码语言：txt复制

 “client_id” :”此处填写自己的client_id”,

代码语言：txt复制

 “client_secret”:”此处填写自己的client_secret”,

代码语言：txt复制

r = requests.post(url,data=body,verify=True)

代码语言：txt复制

respond = json.loads(r.text)

代码语言：txt复制

return respond["access_token"]

代码语言：txt复制

def yuyinshibie_api(audio_data,token):

代码语言：txt复制

 speech_data = base64.b64encode(audio_data).decode(“utf-8”)

代码语言：txt复制

 speech_length = len(audio_data)

代码语言：txt复制

 post_data = {

代码语言：txt复制

 “format” : “wav”,

代码语言：txt复制

 “rate” : 16000,

代码语言：txt复制

 “channel” : 1,

代码语言：txt复制

 “cuid” : “B8-27-EB-BA-24-14”,

代码语言：txt复制

 “token” : token,

代码语言：txt复制

 “speech” : speech_data,

代码语言：txt复制

 “len” : speech_length

代码语言：txt复制

url = "http://vop.baidu.com/server_api"

代码语言：txt复制

json_data = json.dumps(post_data).encode("utf-8")

代码语言：txt复制

json_length = len(json_data)

代码语言：txt复制

#print(json_data)

代码语言：txt复制

req = urllib2.Request(url, data=json_data)

代码语言：txt复制

req.add_header("Content-Type", "application/json")

代码语言：txt复制

req.add_header("Content-Length", json_length)

代码语言：txt复制

#print("asr start requestn")

代码语言：txt复制

resp = urllib2.urlopen(req)

代码语言：txt复制

#print("asr finish requestn")

代码语言：txt复制

resp = resp.read()

代码语言：txt复制

resp_data = json.loads(resp.decode("utf-8"))

代码语言：txt复制

if resp_data["err_no"] == 0:

代码语言：txt复制

  return resp_data["result"]

代码语言：txt复制

else:

代码语言：txt复制

  print(resp_data)

代码语言：txt复制

  return None

代码语言：txt复制

def asr_main(filename,tok):

代码语言：txt复制

 try:

代码语言：txt复制

 f = open(filename, “rb”)

代码语言：txt复制

 audio_data = f.read()

代码语言：txt复制

 f.close()

代码语言：txt复制

 resp = yuyinshibie_api(audio_data,tok)

代码语言：txt复制

 return resp[0]

代码语言：txt复制

 except Exception,e:

代码语言：txt复制

 print “e:”,e

代码语言：txt复制

 return “识别失败”.encode(“utf-8”)

代码图示根据图改缩进

识别完成之后呢 我们就要开始第三步了 我们要和机器人对话

那么它一定得回复我们，对吧。为了能够智能点,我们就用到了图灵得接口图灵真的非常好用能够查天气语音**讲故事**讲笑话下面附上第三步的代码

3、“图灵回复"

（1）去图灵机器人官网注册创建一个微信机器人

在这里插入图片描述

（2）创建图灵机器人文件输入代码

代码语言：txt复制

sudo nano Turling.py

(3) 写入代码，在红色处写自己申请的API KEY

代码语言：txt复制

# coding: utf-8

代码语言：txt复制

import requests

代码语言：txt复制

import json

代码语言：txt复制

import sys

代码语言：txt复制

reload(sys)

代码语言：txt复制

sys.setdefaultencoding("utf-8")

代码语言：txt复制

def Tuling(words):

代码语言：txt复制

  Tuling_API_KEY = "此处填写自己的Turling KEY"

代码语言：txt复制

  body = {"key":Tuling_API_KEY,"info":words.encode("utf-8")}

代码语言：txt复制

  url = "http://www.tuling123.com/openapi/api"

代码语言：txt复制

  r = requests.post(url,data=body,verify=True)

代码语言：txt复制

  if r:

代码语言：txt复制

    date = json.loads(r.text)

代码语言：txt复制

    print date["text"]

代码语言：txt复制

    return date["text"]

代码语言：txt复制

  else:

代码语言：txt复制

    return None

根据图片改代码缩进

4、语音合成

图灵回复了之后我们要让它播放出来就用到了百度的语音合成

(1)创建语音合成文件

代码语言：txt复制

sudo nano yuyinhecheng.py

(2)写代码

代码语言：txt复制

# coding: utf-8

代码语言：txt复制

import sys

代码语言：txt复制

 import urllib2

代码语言：txt复制

 import json

代码语言：txt复制

 import os

代码语言：txt复制

 import yuyinshibie

代码语言：txt复制

reload(sys)

代码语言：txt复制

 sys.setdefaultencoding(“utf-8”)

代码语言：txt复制

def yuyinhecheng_api(tok,tex):

代码语言：txt复制

 cuid = “B8-27-EB-BA-24-14”

代码语言：txt复制

 spd = “4”

代码语言：txt复制

 url = “http://tsn.baidu.com/text2audio?tex=“ tex ”&lan=zh&cuid=” cuid ”&ctp=1&tok=” tok ”&per=3”

代码语言：txt复制

 #print url

代码语言：txt复制

 #response = requests.get(url)

代码语言：txt复制

 #date = response.read()

代码语言：txt复制

 return url

代码语言：txt复制

def tts_main(filename,words,tok):

代码语言：txt复制

 voice_date = yuyinhecheng_api(tok,words)

代码语言：txt复制

f = open(filename,"wb")

代码语言：txt复制

f.write(voice_date)

代码语言：txt复制

f.close()

根据图片改缩进

5、播放

语音合成之后我们要播放出来用到了mpg123为什么我会用这个呢因为它可以直接播放网页上的音频非常的好用

安装mpg123：

代码语言：txt复制

sudo apt-get install mpg123

安装好了之后我后面等用到了再说怎么用现在先不说

现在录音语音识别语音合成播放所需要的工具代码都准备好了下面就开始整合在一起

6、整合

创建最终文件

代码语言：txt复制

sudo nano yuyin.py

写代码

代码语言：txt复制

# coding: utf-8

代码语言：txt复制

import os

代码语言：txt复制

import time

代码语言：txt复制

import yuyinhecheng

代码语言：txt复制

import Turling

代码语言：txt复制

import yuyinshibie

代码语言：txt复制

tok = yuyinshibie.get_access_token()

代码语言：txt复制

switch = True

代码语言：txt复制

while switch:

代码语言：txt复制

  os.system('sudo arecord -D "plughw:1" -f S16_LE -r 16000 -d 3 /home/pi/Desktop/voice.wav')

代码语言：txt复制

  time.sleep(0.5)

代码语言：txt复制

  info = yuyinshibie.asr_main("/home/pi/Desktop/voice.wav",tok)

代码语言：txt复制

  if '关闭'.encode("utf-8") in info:

代码语言：txt复制

    while True:

代码语言：txt复制

      os.system('sudo arecord -D "plughw:1" -f S16_LE -r 16000 -d 10 /home/pi/Desktop/voice.wav')

代码语言：txt复制

      time.sleep(10)

代码语言：txt复制

      info = yuyinshibie.asr_main("/home/pi/Desktop/voice.wav",tok)

代码语言：txt复制

      if '开启'.encode("utf-8") in info:

代码语言：txt复制

        break

代码语言：txt复制

    url = "http://tsn.baidu.com/text2audio?tex=开启成功&lan=zh&cuid=B8-27-EB-BA-24-14&ctp=1&tok=" tok "&per=3"

代码语言：txt复制

    os.system('mpg123 "%s"'%url)

代码语言：txt复制

  elif '暂停'.encode("utf-8") in info:

代码语言：txt复制

    url = "http://tsn.baidu.com/text2audio?tex=开始暂停&lan=zh&cuid=B8-27-EB-BA-24-14&ctp=1&tok=" tok "&per=3"

代码语言：txt复制

    os.system('mpg123 "%s"'%url)

代码语言：txt复制

    time.sleep(10)

代码语言：txt复制

    url = "http://tsn.baidu.com/text2audio?tex=暂停结束&lan=zh&cuid=B8-27-EB-BA-24-14&ctp=1&tok=" tok "&per=3"

代码语言：txt复制

    os.system('mpg123 "%s"'%url)

代码语言：txt复制

    continue

代码语言：txt复制

  else:

代码语言：txt复制

    tex = Turling.Tuling(info)

代码语言：txt复制

    url = yuyinhecheng.yuyinhecheng_api(tok,tex)

代码语言：txt复制

    os.system('mpg123 "%s"'%url)

代码语言：txt复制

    time.sleep(0.5)

根据图改缩进

img

7、运行

最后就可以运行机器人了

输入代码

代码语言：txt复制

sudo python yuyin.py

语音合成语音识别机器人

0 人点赞