【玩转腾讯云】语音转文字,轻松写笔记

2021-05-07 10:07:04 浏览数 (1)

没天总是不停的开会,会议内容又多又发散!音频文件整理困难,搜索不到终点,占用空间大,不利于分享和传达!

想把语音转换成文字,但是转写太耗时了,稍不留神又要倒回去从新听,每天好累!

怎么办?试试腾讯云的语音转文字功能呀!

语音识别功能入口

https://console.cloud.tencent.com/asr

什么是语音识别?

语音识别,就是把听到的内容用文字表达出来。

腾讯云语音识别(Automatic Speech Recognition,ASR) 为企业提供极具性价比的语音识别服务。被微信、王者荣耀、腾讯视频等大量内部业务使用,外部落地录音质检、会议实时转写、语音输入法等多个场景。

什么时候会用到语音识别?

对学生党来说,课堂内容的转写会用到语音识别,对行政党来说,领导的每次讲话也会用到语音转写。

语音识别支持哪些形式?

可以实时转写,也可以将录音文件转写。

语音识别支持哪些语音?

中文✅,英文✅,日文✅,韩文✅,方言✅

说到这里,想不想体验一下语音识别的功能?

微信扫一扫微信扫一扫

进入小程序,使用语音识别,试一试识别中文【你好,世界】

普通话

再试一试英文【哈喽,卧得】

视频内容

最后试一试粤语【磊吼,色盖】

视频内容

神不神奇~

我们再试一下文件的转写以及接口的调用。

接口说明在此处:https://cloud.tencent.com/document/product/1093/37822

最简单的实现方法:发一个 POST 请求就好了~

直接上代码

代码语言:javascript复制
POST / HTTP/1.1
Host: asr.tencentcloudapi.com
Content-Type: application/json; charset=utf-8
X-TC-Version: 2019-06-14
X-TC-Region: ap-shanghai
X-TC-Action: CreateRecTask
X-TC-Timestamp: 1599142560
Authorization: TC3-HMAC-SHA256 Credential=AKIDYu6A16GdCxUlnbTSVItxvhOr6B2xxxxx/2020-09-03/asr/tc3_request, SignedHeaders=content-type;host, Signature=524ed61a4a71de417f4fa41249dcb428a0c51013890f24f3492068ca7cd16953

{
    "ChannelNum": 1,
    "EngineModelType": "16k_zh",
    "ResTextFormat": 0,
    "Data": "eGNmYXNkZmFzZmFzZGZhc2RmCg==",
    "SourceType": 1
}

注意几个参数:

SourceType = 1 代表使用语音数据,这时候需要加 Data 参数,而 Data 参数就是录音的文件内容。

把这段请求发到哪里?

这里 ↓↓↓

代码语言:javascript复制
asr.tencentcloudapi.com

最后你将得到这样的输出:

代码语言:javascript复制
{
  "Response": {
    "RequestId": "3c140219-cfe9-470e-b241-907877d6fb03",
    "Data": {
      "TaskId": 1396665
    }
  }
}

请保存好 TaskID 的值,稍作等待,我们就可以去服务端索取刚刚转写的内容了。

继续发送请求:

代码语言:javascript复制
POST / HTTP/1.1
Host: asr.tencentcloudapi.com
Content-Type: application/json; charset=utf-8
X-TC-Version: 2019-06-14
X-TC-Region: ap-shanghai
X-TC-Action: DescribeTaskStatus
X-TC-Timestamp: 1599142563
Authorization: TC3-HMAC-SHA256 Credential=AKIDYu6A16GdCxUlnbTSVItxvhOr6Bxxxxx2/2020-09-03/asr/tc3_request, SignedHeaders=content-type;host, Signature=6647fa852c9329ac5aa355c68c838358139c2d941f4ed175dd5858978f5d79c8
Content-Length: 21

{
    "TaskId": 1396665
}

得到结果:

代码语言:javascript复制
{
  "Response": {
    "RequestId": "a73b14a6-5044-41cb-bf32-e735d5bd69de",
    "Data": {
      "TaskId": 1396665,
      "Status": 2,
      "StatusStr": "success",
      "Result": "[0:0.020,0:2.380]  腾讯云语音识别欢迎您。n",
      "ResultDetail": [
        {
          "FinalSentence": "腾讯云语音识别欢迎您。",
          "SliceSentence": "腾讯云 语音识别 欢迎 您",
          "StartMs": 20,
          "EndMs": 2380,
          "SpeechSpeed": 5.9,
          "WordsNum": 4,
          "Words": [
            {
              "OffsetStartMs": 120,
              "OffsetEndMs": 780,
              "Word": "腾讯云"
            },
            {
              "OffsetStartMs": 780,
              "OffsetEndMs": 1530,
              "Word": "语音识别"
            },
            {
              "OffsetStartMs": 1530,
              "OffsetEndMs": 1860,
              "Word": "欢迎"
            },
            {
              "OffsetStartMs": 1860,
              "OffsetEndMs": 2250,
              "Word": "您"
            }
          ]
        }
      ],
      "ErrorMsg": ""
    }
  }
}

至此,咱们的语音转写调用就完成啦~

是不是很简单~

更多功能咱们慢慢去挖掘~

0 人点赞