产品文档: https://cloud.tencent.com/document/product/460/46224
实操开始:
首先到达数据万象控制台,找到对应存储桶开启配置:
https://console.cloud.tencent.com/ci/bucket
找到内容识别--语音识别并开启:
开启之后发现出现队列信息:
第二步,提交一个语音识别任务
参考:https://cloud.tencent.com/document/product/460/46228
请求示例参考:
代码语言:javascript复制请求体:
<Request>
<Tag>SpeechRecognition</Tag>
<Input>
<Object>mp3/test.mp3</Object>
</Input>
<Operation>
<SpeechRecognition>
<EngineModelType>8k_zh</EngineModelType>
<ChannelNum>1</ChannelNum>
<ResTextFormat>0</ResTextFormat>
</SpeechRecognition>
<Output>
<Region>ap-chengdu</Region>
<Bucket>bucketname-125666666</Bucket>
<Object>mp3/test.txt</Object>
</Output>
</Operation>
<QueueId>pf390d4681c61466d860e547998f8aef2</QueueId>
</Request>
具体解释参考文档参数说明即可,不做赘述。
这样就已经把test.mp3音频文件识别为对应文字写入到test.txt
这里识别准确度还需要提高。