最近在做一个文本转语音TTS(Text to Speech)的第三方软件封装,使用的是国内语音技术龙头安徽科大讯飞公司提供的离线引擎AiSound5.0,主要用于汽车导航用途。科大讯飞还提供了AiTalk用于语音识别,AiWrite用于手写识别服务等。另外还有针对6种平台的SDK和开发示例。
其中AiSound5.0只提供TTS接口(即将文本字符串合成PCM格式的音频数据),不提供播音功能,至于播放音频数据我采用的是pulseaduio。
一、科大讯飞语音平台
科大讯飞目前有不少产品应用在移动终端上了,比如说用在手机上的讯飞语点,可方便语音拨打电话和发送短信,查天气、股票等信息。
在下面讯飞语音云这个网站可以找到科大讯飞针对6种平台的SDK,http://open.voicecloud.cn/download.php,包括Android、Iphone、Windows、Linux、Java、Flash这些平台的语音合成、语音识别和语音听写的开发文档和SDK下载,不过使用之前需要申请AppID(每个语音应用程序需要一个Appid来唯一标识,您需要通过注册帐号来获得自己应用的Appid,未注册的语音应用将无法正常获取语音服务。),通过审核后就能下载响应的开发文档和SDK并用于自己的软件系统中了。
二 、科大讯飞语音合成、识别-在线文档和应用程序示例网址
从这里可以查看在线的开发文档http://open.voicecloud.cn/developer.php?column=aW50ZV9zZGs=
Android平台的开发文档和应用程序示例:http://open.voicecloud.cn/developer.php?category=YW5kcm9pZA==&column=ZG9jdW1lbnQ=&type=d2lkZ2V0#a38
Windows和Linux平台的开发文档和程序示例:http://open.voicecloud.cn/developer.php?category=b3RoZXI=&column=ZG9jdW1lbnQ=&type=YXBp
三、科大讯飞语音产品的移动应用
这里有一个科大讯飞的在线语音合成系统演示程序:ViViVoice 2.1在线演示系统
http://www.iflytek.com/TtsDemo/viviVoiceShow.aspx
1、讯飞语点的应用,官网下载网址如下:http://yudian.voicecloud.cn/yudian.htm,支持Android和Iphone两大平台。
2、讯飞输入法应用:http://ime.voicecloud.cn/index.html
3、讯飞语音输入法应用:http://kouxun.voicecloud.cn/index.html
4、开发者社区:http://open.voicecloud.cn/index.php
四、官网的Windows平台-语音合成和识别示例代码
网址如下:http://open.voicecloud.cn/developer.php?category=b3RoZXI=&column=c2FtcGxl&type=YXBp
以Windows下的开发为例,给出了语音合成、语音识别和语音听写的编程示例。
五、Tizen(泰泽)提供的TTS和STT语音合成、语音识别接口
泰泽是三星和英特尔合作开发的一款操作系统。
1、Tizen SDK官网:https://developer.tizen.org/downloads/tizen-sdk
2、Tizen项目:https://review.tizen.org/git/
3、tts-api:https://review.tizen.org/git/?p=framework/api/tts-api.git;a=summary
其对应的tts.h头文件api接口在线网址为:https://review.tizen.org/git/?p=framework/api/tts-api.git;a=blob;f=include/tts.h;h=636470d923555a30d164cc09ceff841b72187e20;hb=98aee0bab00a418af162a0314ef931f8fd620892
4、stt-api:https://review.tizen.org/git/?p=framework/api/stt-api.git;a=summary