没天总是不停的开会,会议内容又多又发散!音频文件整理困难,搜索不到终点,占用空间大,不利于分享和传达!
想把语音转换成文字,但是转写太耗时了,稍不留神又要倒回去从新听,每天好累!
怎么办?试试腾讯云的语音转文字功能呀!
语音识别功能入口
https://console.cloud.tencent.com/asr
什么是语音识别?
语音识别,就是把听到的内容用文字表达出来。
腾讯云语音识别(Automatic Speech Recognition,ASR) 为企业提供极具性价比的语音识别服务。被微信、王者荣耀、腾讯视频等大量内部业务使用,外部落地录音质检、会议实时转写、语音输入法等多个场景。
什么时候会用到语音识别?
对学生党来说,课堂内容的转写会用到语音识别,对行政党来说,领导的每次讲话也会用到语音转写。
语音识别支持哪些形式?
可以实时转写,也可以将录音文件转写。
语音识别支持哪些语音?
中文✅,英文✅,日文✅,韩文✅,方言✅
说到这里,想不想体验一下语音识别的功能?
进入小程序,使用语音识别,试一试识别中文【你好,世界】
再试一试英文【哈喽,卧得】
最后试一试粤语【磊吼,色盖】
神不神奇~
我们再试一下文件的转写以及接口的调用。
接口说明在此处:https://cloud.tencent.com/document/product/1093/37822
最简单的实现方法:发一个 POST 请求就好了~
直接上代码
代码语言:javascript复制POST / HTTP/1.1
Host: asr.tencentcloudapi.com
Content-Type: application/json; charset=utf-8
X-TC-Version: 2019-06-14
X-TC-Region: ap-shanghai
X-TC-Action: CreateRecTask
X-TC-Timestamp: 1599142560
Authorization: TC3-HMAC-SHA256 Credential=AKIDYu6A16GdCxUlnbTSVItxvhOr6B2xxxxx/2020-09-03/asr/tc3_request, SignedHeaders=content-type;host, Signature=524ed61a4a71de417f4fa41249dcb428a0c51013890f24f3492068ca7cd16953
{
"ChannelNum": 1,
"EngineModelType": "16k_zh",
"ResTextFormat": 0,
"Data": "eGNmYXNkZmFzZmFzZGZhc2RmCg==",
"SourceType": 1
}
注意几个参数:
SourceType = 1 代表使用语音数据,这时候需要加 Data 参数,而 Data 参数就是录音的文件内容。
把这段请求发到哪里?
这里 ↓↓↓
代码语言:javascript复制asr.tencentcloudapi.com
最后你将得到这样的输出:
代码语言:javascript复制{
"Response": {
"RequestId": "3c140219-cfe9-470e-b241-907877d6fb03",
"Data": {
"TaskId": 1396665
}
}
}
请保存好 TaskID 的值,稍作等待,我们就可以去服务端索取刚刚转写的内容了。
继续发送请求:
代码语言:javascript复制POST / HTTP/1.1
Host: asr.tencentcloudapi.com
Content-Type: application/json; charset=utf-8
X-TC-Version: 2019-06-14
X-TC-Region: ap-shanghai
X-TC-Action: DescribeTaskStatus
X-TC-Timestamp: 1599142563
Authorization: TC3-HMAC-SHA256 Credential=AKIDYu6A16GdCxUlnbTSVItxvhOr6Bxxxxx2/2020-09-03/asr/tc3_request, SignedHeaders=content-type;host, Signature=6647fa852c9329ac5aa355c68c838358139c2d941f4ed175dd5858978f5d79c8
Content-Length: 21
{
"TaskId": 1396665
}
得到结果:
代码语言:javascript复制{
"Response": {
"RequestId": "a73b14a6-5044-41cb-bf32-e735d5bd69de",
"Data": {
"TaskId": 1396665,
"Status": 2,
"StatusStr": "success",
"Result": "[0:0.020,0:2.380] 腾讯云语音识别欢迎您。n",
"ResultDetail": [
{
"FinalSentence": "腾讯云语音识别欢迎您。",
"SliceSentence": "腾讯云 语音识别 欢迎 您",
"StartMs": 20,
"EndMs": 2380,
"SpeechSpeed": 5.9,
"WordsNum": 4,
"Words": [
{
"OffsetStartMs": 120,
"OffsetEndMs": 780,
"Word": "腾讯云"
},
{
"OffsetStartMs": 780,
"OffsetEndMs": 1530,
"Word": "语音识别"
},
{
"OffsetStartMs": 1530,
"OffsetEndMs": 1860,
"Word": "欢迎"
},
{
"OffsetStartMs": 1860,
"OffsetEndMs": 2250,
"Word": "您"
}
]
}
],
"ErrorMsg": ""
}
}
}
至此,咱们的语音转写调用就完成啦~
是不是很简单~
更多功能咱们慢慢去挖掘~