腾讯云语音识别之录音文件识别.net-sdk使用

2020-08-18 19:03:33 浏览数 (1)

接口:https://console.cloud.tencent.com/api/explorer?Product=asr&Version=2019-06-14&Action=CreateRecTask&SignVersion=

EngineModelType

必填: 是.

类型: String.

描述:

引擎模型类型。 电话场景: • 8k_zh:电话 8k 中文普通话通用(可用于双声道音频); • 8k_zh_s:电话 8k 中文普通话话者分离(仅适用于单声道音频); 非电话场景: • 16k_zh:16k 中文普通话通用; • 16k_zh_video:16k 音视频领域; • 16k_en:16k 英语; • 16k_ca:16k 粤语; • 16k_ja:16k 日语;

这个接口理解,其实就是

ChannelNum

必填: 是.

类型: Integer.

描述:

语音声道数。1:单声道;2:双声道(仅支持 8k_zh 引擎模型)。

这个因为是电话场景,所以我选择双通道。

ResTextFormat

必填: 是.

类型: Integer.

描述:

识别结果返回形式。0: 识别结果文本(含分段时间戳); 1:仅支持16k中文引擎,含识别结果详情(词时间戳列表,一般用于生成字幕场景)。

SourceType

必填: 是.

类型: Integer.

描述:

语音数据来源。0:语音 URL;1:语音数据(post body)。

我的选择是黑体注明的,选择语音URL,那么语音数据(post body)要怎么传入呢

我这里将mp3文件上传转为base64编码之后

0 人点赞