腾讯大讲堂走进新加坡南洋理工大学

2018-02-11 15:34:24 浏览数 (1)

腾讯大讲堂在9月18日走进新加坡南洋理工大学与师生分享微信背后的智能技术,以及如何更好应用智能技术开发移动应用。本次讲座作为首届在狮城新加坡鸣响战鼓“WeMage 视觉搜索挑战赛”的启动活动。在本次讲座上分别对微信背后的智能技术、语音技术在微信中的应用进行了详细的解读。

首先由来自微信模式识别中心的肖斌给大家介绍了《微信背后的智能技术》。在肖斌的讲座中,他提到,微信已经成为非常流行的社交工具,但微信的潜能不仅仅局限于此。基于智能技术,微信的图像扫一扫可以识别书籍、CD、电影海报、商品,微信摇一摇不仅可以摇到朋友,还可以摇到音乐、电视节目等内容。本次讲座将分享微信背后的智能技术以及向广大开发者开放的微信智能平台。

微信4.5版本上线摇一摇搜歌功能,语音提醒功能;

微信5.0版本上线扫一扫扫封面,扫单词功能,语音输入功能;

微信在变的越来越智能,在这智能化的背后离不开微信智能技术的支撑。

Figure 1微信智能技术

在微信5.0版本上线的扫一扫扫封面功能,在业内第一次实现以“扫”的方式来实现图像识别,通过扫封面用户可以识别图书封面,直接购买图书、查看豆瓣书评,也可以扫电影海报,观看电影预告片、购买电影票,还可以扫CD封面,播放、收藏自己喜欢的专辑。微信模式识别团队在视觉检索算法上不断优化更新,在未来微信扫一扫将会“扫”出更多东西。

Figure 2微信扫封面

通常一个图像视觉检索系统包括1)线上识别2)线下索引建立和更新两大部分。微信扫一扫扫封面系统,索引百万量级图书、海报和CD封面数据,线上识别系统响应时间小于1秒,识别准确率达到90%以上。

Figure 3扫一扫扫封面系统

微信4.5版本上线了摇一摇搜歌功能,次功能深受用户喜爱,每天有上百万次的用户使用率,在微信朋友圈的分享率搞到10%,识别效果上讲,我们的“摇一摇搜歌”也丝毫不逊色于上述的一些专业的音乐识别软件专。已经使用过我们功能的同学们大概都已经发现,只要环境不是太嘈杂,“摇一摇搜歌”最快只要3-5秒钟就能给出准确的歌曲识别结果。而即便在较差的2G网络环境下使用,我们的识别功能也毫无压力,完全感觉不到和WiFi下的流畅度有什么区别。更有趣的是,我们在给出音乐识别结果的同时,直接在客户端同步呈现了实时歌词,这让用户玩起来更加的有爽的感觉。

Figure 4音频指纹识别系统

微信的智能技术远远不至于扫一扫扫封面识别和摇一摇搜歌,微信模式识别团队在人脸识别,OCR文字识别和虚拟现实等都有一定的技术积累,将来我们将会用更多的智能技术来武装微信,是微信变的越来越智能。

接下来,同样来自微信模式识别团队的饶丰给大家介绍了《语音技术在微信中的应用》。

腾讯语音识别团队成立于2011年底,至今约两年左右,专注语音识别方向. 我们提供一套完整的语音开放平台服务来支持微信以及其他公司内外产品。

我们通过统一接口,个性定制来提供多种类的语音识别服务。 其中包括产品层面上,支持定制不同语境下的语音识别, 技术层面上,支持多种技术实现方式,来满足不同的技术需求,包括语法定制,语音评估等。

图一

图二

经过两年多的积累, 我们的语音识别技术达到业内领先水平。 我们的识别准确率达到 94%, 日访问量在千万级别,

我们提供了丰富的产品形态

1.语音输入, 微信以及QQ语音转文字

2.领域的应用, 包括QQ音乐和腾讯地图

3.微信通讯录搜索

采用语法解码框架,同时解决了名称中中英文混合的问题

4盲胞读书项目

众包方式采集有声读物,语音识别鉴定录制语音质量

5 语音唤醒

通过语音来代替滑动解锁,解放你的双手。

在这次讲座上负责国际业务的曹溪也给大家介绍了自2011年发布以来,作为全球使用率第五、IM类第一的移动应用。微信如何重新定义了人们社交的方式,并且影响了很多行业的营销模式。通过案例与大家分享微信公众号是如何为企业提供商业营销的机遇,并介绍腾讯、微信的总体情况。

总结

随着微信智能平台于2014年7月向国内开发者开放,将有越来越多第三方开发者可以借助公众平台为用户提供丰富的移动互联网服务。腾讯大讲堂也将继续关注这一领域发展,为大家带来最新前沿的知识,敬请关注。

0 人点赞