上周末的腾讯WE大会上,
中国脑计划领军人物、中科院神经科学研究所所长蒲慕明说到,
“未来人工智能要进一步发展的话,就需从脑科学得到启发,包括机器学习过程,怎么从脑启发的这个概念来设计新的计算模式,新的类似人脑的神经元结构的器件、芯片,甚至是机器人”。
腾讯在“人工智能” “医疗”领域,
打造“救命的AI”。而这个“救命的AI”,
已经开始早期筛选食管癌、糖尿病、视网膜病变、乳腺癌等病症,
对700多种疾病风险进行预测诊断。
辅助医生阅读医学影像超1亿张。
服务超百万患者。
提示高风险病变15万例。
AI能救人,亦能育人。
比起“救命的AI”,本文谈谈绝大多数人,都可能接触,甚至能够自己动手开发的AI教育应用
第一次开发英语学习的AI应用,比如口语评测,
需要踩哪些坑?
▽
1
打分的标准是什么?
查阅API接口文档,看见以下参数
参数名称
必选
类型
描述
ScoreCoeff
是
Float
评价苛刻指数,取值为[1.0 - 4.0]范围内的浮点数,用于平滑不同年龄段的分数,1.0为小年龄段,4.0为最高年龄段
@热心网友提问:
ScoreCoeff评价苛刻指数,年龄段划分范围是什么?
@技术支持回复@热心网友:1.0到4.0为婴幼儿到成年人的平滑划分,可以认为4.0就是一个完全具备标准发音的成年人说话的标准,1.0是可能刚刚掌握的婴幼儿水平。能够完整,标准的说清普通话则调用成人的。根据使用者的发音标准调用对应的接口,接口不会区分使用者的岁数,只会根据发音标准拍判断。
我传了个语音文件,里面有我刚刚网上搜的句子
The price of the shirt is 9 pounds and 15 pence, so you should choose B.
(衬衫的价格是9磅15便士,所以你应该选B)
程序返回了一条error
WordLengthTooLong-文本单词超过限制
被评估语音对应的文本过长
▽
2
被评估语音对应的文本过长。
@热心网友提问:
检测文本能长一些吗?否则里面一个小段落,都要拆的支离破碎。而且因为音频大小已经有限制了,为什么检测文本还要做限制呢?
@技术支持回复@热心网友:
客户您好,您这个是段落评测,目前段落我们还没有上线,目前当前支持的是单词和句子。后面会针对段落进行优化,感谢您的反馈。
@热心网友回复@技术支持:
如果不能变长的话,如果一段语音很长(我们没办法按断句把语音再切分划片,但没有超出),我们应该怎样处理呢?
@技术支持回复@热心网友:
我们的口语评测已经更新,句子的最长长度是支持20s以上。
可能是我尾音太重,念太长?
不,这锅我不背!
还是等平台出“段落评测”功能再来耍耍
我提了提语速,在20s内念完了那句9磅15便士。
发音数据传输中……
在这个环节,
我遇到不一样的报错,
得到一样的答复,
特此祭出这3个基本都会踩到的坑
▽
3
发音评估初始化报错
@热心网友提问:
我是在一个接口按顺序调用[发音评估初始化]和[发音数据传输接口], 然后报错, 错误码:InternalError.CannotFindSession-评估之前没有初始化或已过期。
@技术支持回复@热心网友:
session是不是过期了?
4
调试口语评测时,数据传输接口频繁出bug
@热心网友提问:
智聆口语评测API功能接口发音数据传输接口
InitOralProcess可以正常返回,
TransmitOralProcess这个接口总是报错,请问这个接口是可以工作的吗?我们改如何解决呢?
[TencentCloudSDKException]message:InternalError-内部错误requestId:3bc0fc4e-e09c-4ec2-bbe5-9f283ea3b35e
atcom.tencentcloudapi.common.AbstractClient.internalRequest(AbstractClient.java:172)
@技术支持回复@热心网友:
session是不是过期了?
5
调用transmitOralProcess接口报错
@热心网友提问:
requestId:d2c718b8-9705-4719-ba56-87d71b820a9d
麻烦帮忙看下智聆口语评测接口调用的问题,报错信息如下:
com.tencentcloudapi.common.exception.TencentCloudSDKException: InternalError.InitialParameterError-初始化参数错误
at com.tencentcloudapi.common.AbstractClient.internalRequest(AbstractClient.java:172) ~[tencentcloud-sdk-java-3.0.20.jar:na]
atcom.te ncentcloudapi.soe.v20180724.SoeClient.TransmitOralProcess(SoeClient.java:80)~[tencentcloud-sdk-java-3.0.20.jar:na]
这是调用transmitOralProcess接口报的错
@技术支持回复@热心网友:
session是不是过期了?
终于,消灭完所有bug,
我用代码完成了1次AI实践
以下是发音评估初始化的代码示例
▽
代码语言:javascript复制https://soe.tencentcloudapi.com/?Action=InitOralProcess
&SessionId=stress_test_956938
&WorkMode=0
&RefText=again
&EvalMode=0
&ScoreCoeff=3.5
&<公共请求参数>
输入示例
代码语言:javascript复制{
"Response": {
"RequestId": "xxxxxx"
}
}
输出示例
传输语音进行发音评估
▽
代码语言:javascript复制https://soe.tencentcloudapi.com/?Action=TransmitOralProcess
&SessionId=stress_test_956938
&VoiceFileType=1
&SeqId=0
&VoiceEncodeType=1
&IsEnd=0
&UserVoiceData=VWtsR1JxeUpBd0JYUVZaRlptMTBJQkFBQUFBQkFBRUFnRDRBQUFCOUFBQUNBQkFBVEVsVFZCb0FBQUJKVGtaUFNWTkdWQTRBQUFCTVlYWm1OVFl1TVRrdU1UQXdBR1JoZEdGbWlRTUF5
&<公共请求参数>
输入示例
代码语言:javascript复制{
"Response": {
"PronAccuracy": 0.99,
"PronCompletion": 0.99,
"PronFluency": 0.99,
"RequestId": "xxxxxxx",
"Words": [
{
"MatchTag": 1,
"MemBeginTime": 1,
"MemEndTime": 2,
"PhoneInfos": [
{
"DetectedStress": false,
"MemBeginTime": 1,
"MemEndTime": 2,
"Phone": "b",
"PronAccuracy": 52,
"Stress": true
}
],
"PronAccuracy": 65,
"PronFluency": 0.3,
"Word": "xxx"
}
]
}
}
输出示例
口语评测只是AI之于教育应用的冰山一角
如果您对腾讯智慧教育感兴趣,请扫码关注公众号“腾讯智慧教育”,聊天窗口发送关键词0,我们会尽快与您联系!