接口:https://console.cloud.tencent.com/api/explorer?Product=asr&Version=2019-06-14&Action=CreateRecTask&SignVersion=
EngineModelType
必填: 是.
类型: String.
描述:
引擎模型类型。 电话场景: • 8k_zh:电话 8k 中文普通话通用(可用于双声道音频); • 8k_zh_s:电话 8k 中文普通话话者分离(仅适用于单声道音频); 非电话场景: • 16k_zh:16k 中文普通话通用; • 16k_zh_video:16k 音视频领域; • 16k_en:16k 英语; • 16k_ca:16k 粤语; • 16k_ja:16k 日语;
这个接口理解,其实就是
ChannelNum
必填: 是.
类型: Integer.
描述:
语音声道数。1:单声道;2:双声道(仅支持 8k_zh 引擎模型)。
这个因为是电话场景,所以我选择双通道。
ResTextFormat
必填: 是.
类型: Integer.
描述:
识别结果返回形式。0: 识别结果文本(含分段时间戳); 1:仅支持16k中文引擎,含识别结果详情(词时间戳列表,一般用于生成字幕场景)。
SourceType
必填: 是.
类型: Integer.
描述:
语音数据来源。0:语音 URL;1:语音数据(post body)。
我的选择是黑体注明的,选择语音URL,那么语音数据(post body)要怎么传入呢
我这里将mp3文件上传转为base64编码之后