科大讯飞:我们和华为基因相似,板凳能坐十年冷,如今向C端强劲发力

2019-05-22 16:22:10 浏览数 (1)


新智元报道

编辑:木青、金磊

【新智元导读】To B业务已稳,科大讯飞瞄准利润更大、规模更广的C端市场开始发力。在5月21日的年度发布会上,讯飞重磅发布了5款面向消费者的硬件产品,其中讯飞翻译机3.0能实现0.5秒闪译。坐穿十年冷板凳,不断积累技术经验,这支“AI国家队”终于要实现AI应用红利兑现。

向C端强劲发力,瞄准用户规模更大的消费者市场,AI应用红利得以兑现。

这是“AI国家队”科大讯飞正在探索的新路。与互联网不同,在人工智能领域中,To C业务反而未经大范围开拓。

不变的是,先布局的玩家,先占据优势。

5月21日,在上海世博举办的年度发布会上,科大讯飞大秀技术肌肉,针对用户痛点发布6款新品,其中5款为面向消费者的硬件产品。

其中包括能实现0.5秒闪译、支持四大方言与英文互译的讯飞翻译机3.0,售价3499元;以及一小时录音5分钟出稿的讯飞录音笔,分为1999元和2999元两个版本。

今年是科大讯飞成立20周年,恰逢国际贸易摩擦升级的历史关卡,讯飞表示要在技术上未雨绸缪,做好十年磨一剑的准备

科大讯飞董事长刘庆峰:20年不断累积,AI技术价值今年将开始兑现

与往年发布会流程相似,发布新品前,科大讯飞董事长刘庆峰进行开场演讲。

与往年发布会有所不同,这是全球首场人工智能多语种直播发布会

开场的“AI虚拟主播”主持人便吸引了不少人的眼球。不仅如此,这位虚拟主播还同时支持多语言同步报道。

AI虚拟主播进行韩语报道

虚拟主播藏语报道

技术肌肉秀不止于此,随后科大讯飞董事长刘庆峰亲自表演了一场类似“柯南领夹”的AI变声秀。

刘庆峰登场进行自我介绍,一开口,现场却传出来的是“老罗”罗永浩的声音,“大家好,我是科大讯飞刘庆峰”,刘罗难辨。

不一会儿,他的声音又开始变成清脆的女声,虽然是志玲姐姐的声音,但说活语气、节奏却和刘庆峰本人完全一致,来看下视频:

刘庆峰现场演示AI变声秀

这背后正是运用科大讯飞的音色转换技术,可通过提取原声语音中的内容信息,包括原声的节奏和情感,再结合特定人的音色进行转换结合。

该项技术在voice conversion Challenge 2018国际音色转换大赛中获得全部指标第一名,也是音色和相似度上唯一一家超过4.0MOS分的系统。

另外,在嘉宾的同时,舞台旁边都有“讯飞听见”直接进行现场实时语音识别并准确呈现出来,同时机器自动将讲话内容翻译成英文。

嘉宾演讲过程中,讯飞听见一直进行实时语音识别和英文翻译

这其中的技术又有了革新——科大讯飞采用自主研发的新一代语音识别模型,实现了中英文语音混合输入,识别无缝切换,且识别率达到95%以上

关于所谓的中英文语音混合输入,举个例子:

“看最后一集Game of Thrones了吗,囧雪竟然做出了这样的事儿,很bad很sad很drama。”

有了这项技术,不管“讯飞听见”有没有被剧透,它都能准确识别并且翻译你说的话。

除此之外,刘庆峰还介绍了科大讯飞在国际上取得的技术突破:

  • 语音识别:语音识别准确率全面超过速记员。目前,科大讯飞的中文语音转写准确率已经突破98%,英文达到95%。
  • 机器翻译:系统通过CATTI全国翻译专业资格(水平)测试,达到专业资格合格标准;让更多“语言间的高效沟通”成为可能,让机器翻译能力确有保障。
  • 机器阅读理解:2019年3月,机器阅读理解国际权威评测SQuAD 2.0任务科大讯飞再次登顶冠军,并同时在EM和F1两个指标上全球首次均超越人类水平,一举创下比赛的全新纪录。

2019年伊始,不少人认为这将是大量人工智能创业倒闭的时候,大潮退去,泡沫破灭,因为人工智能并没有核心技术。

对于这样的论调,刘庆峰在现场明确表示:“2019年就是人工智能的应用价值兑现年,今年开始真的红利已经到来。”他提出了A.I.技术价值兑现的三大标准:

一、真实可见的实际应用案例

二、能规模化应用的核心产品

三、能够统计数据的应用成效

技术肌肉已秀,接下来让我们看看实际落地、将要帮助讯飞获得红利的硬件新品:

新品强劲发力C端:讯飞翻译机3.0实现“0.5闪译”,售价3499元

讯飞此次一口气发布5款消费者硬件产品,覆盖生活、工作、学习等方面,每一款都针对消费者痛点。

先来看下讯飞翻译机3.0。

说话是世界上最常见的事情,又是世界上最不简单的事情,不同国家之间语音不同,不同的省份地区也有着各自的方言。

然而一个人精通多种语音需要花费大量的时间和精力,就像刘庆峰在现场所说的那样“不可能每个人都是钱钟书转世”,但AI让不可能变成可能。

讯飞翻译机3.0全新升级,翻译速度达到“0.5秒闪译”,实现清楚拾音、响亮外放和智能识别多音多义词。

讯飞翻译机3.0

对消费者更实用的是支持多种语言互译,讯飞翻译机3.0支持普通话与粤语、东北话、河南话、四川话等翻译,及粤语和英语互译、维吾尔语与普通话互译、藏语与普通话互译

其中的英语,不仅限于标准的英文发音,在现场演示中,讯飞翻译机3.0能将带有咖喱味的、法国奶酪味的、德国啤酒味的、俄罗斯伏特加味的英文统统翻译成标准的普通话。

另外,继去年首发行业A.I.翻译功能后,讯飞翻译机3.0实现金融、医疗、外贸、计算机、法律、体育、能源七大领域的A.I.行业翻译。

除此之外,翻译机3.0还优化了拍照翻译功能,升级高清摄像头和视网膜屏,出国旅游看不懂菜单的尴尬将不再出现。

拍照翻译采用科大讯飞最新国际领先的OCR技术,该技术去年包揽ICPR 2018国际大赛全部三项冠军。刘庆峰表示,科大讯飞为何开始做图像识别?因为语音识别和图像识别的底层算法是相通的。

相比于讯飞翻译机2.0(售价2999元),翻译机3.0售价为3499元

接下来是另一重磅产品:讯飞智能录音笔,这也是讯飞5款硬件新品中,价格最低的一款,分为1999元标准配置和2999元两款,来看下性能:

  • 采用2 6麦克风阵列顶级配置,2颗哈曼大直径麦克风和6个矩阵麦克风位列机身;
  • 收音距离可达15米;
  • 语音识别准确率达到98%,1小时录音5分钟出稿
  • 支持语音实时转文字、中英边录边译、要点标记、语音搜索、多平台同步和后端编辑功能。

除此之外,还有针对办公所出的讯飞转写机、讯飞办公本,以及针对教育所处的讯飞学习机,这三款价格均高于3000元:

新品展示:左上为讯飞智能办公本、左下为讯飞转写机、右上为讯飞录音笔,右下为讯飞学习机

商务人士的专属:讯飞转写机是一体化的专业语音转文字设备,面向会议、培训、讲座等场景下可实现实时转写、纯离线识别、识别内容翻译成英文投屏展示,同时可为视频会议实时生成配套字幕输出,会议、演讲结束后可自动生成二维码回看PPT、文稿和录音。

可书写的智能办公本:讯飞智能办公本拥有10.3英寸E ink高清柔性护眼墨水屏,即时语音转写文字、智能语音搜索、一键分享查看编辑、收发邮件手写亲笔信等功能,售价4999元

辅导数理化的学习机:讯飞学习机,针对数理化、英语听说读写进行提升,售价3999元。

iFLYOS 2.0来了:开放超200项核心技能,未雨绸缪以备十年磨一剑

除5款针对C端的硬件产品外,科大讯飞在本次发布会发布iFLYOS 2.0,开放超200项核心技能。

iFLYOS是什么?它是科大飞讯于2018年推出的一套基于云端的智能物联网操作系统。

2018 年讯飞开放平台相继发布了人机交互界面 AIUI3.0和iFLYOS形成端到端解决方案和实现路径。

到现在,全新升级的iFLYOS 2.0将AIUI与iFLYOS融合为一体,打造出以语音为主要交互形式,以智能硬件为载体,融合云端与终端的AI Agent(智能物联网操作系统)。

当谈到日前美国将华为列为“实体名单”一事,讯飞表示华为早就未雨绸缪,有“备胎”顶替。身为国内AI代表企业,讯飞认为中国企业应该为未来备战,除了智能通讯,AIoT也是其中一个方向。

科大讯飞在2017年就同BAT并列为“国家新一代人工智能开放创新平台”四大金刚,入职“国家队”。这次iFLYOS2.0的亮相亦是讯飞为维持原创技术系统、先行布局AIoT买的一份“保险”。

全新升级的iFLYOS 2.0将AIUI与iFLYOS融合为一体,打造出以语音为主要交互形式,以智能硬件为载体,融合云端与终端的AI Agent(智能物联网操作系统)。

科大讯飞轮值总裁胡郁介绍,它具备“人性化交互”、“深度自定义”、“端到端集成”、“高效率开发”四大特点

为解决接入方SDK集成慢,语音能力接入复杂,硬件设计链条过长的问题,iFLYOS直接提供SDK和API,并有芯片、PCBA公版和整机参考设计等解决方案供接入方选择。

一方面为开发者提供高度集成的软硬一体化智能硬件解决方案和强大的集成开发环境;另外一方面,也能为消费者提供流畅的交互体验和多样的场景服务。

讯飞即将“弱冠”:出鞘消费者市场,技术成熟才能做C端产品

此次科大讯飞全面发力C端市场,事实上早在去年就有迹象。

今年4月,科大讯飞公布2018年度财报,其中一大亮点就是该公司业务赛道加速奔跑,To C业务增长迅猛。

科大讯飞2018年度财报

2018年,讯飞TO C业务开始发力,占比显著提升,全年实现营收收入25.17亿,同比增长96.54%,在整体营收中占比达31.80%;实现毛利12.96亿,同比增长70.77%,毛利占比达32.72%。

在产品方面,讯飞翻译机2018年卖出30万台,占据品类销售额70%,品类份额第一;讯飞输入法活跃用户超过1.3亿;以讯飞听见为代表的移动网产品及服务较上年同期增长369.36%。

如果说移动互联网的主战场正从上半场的消费互联网(To C),向下半场的产业互联网(To B)方向转变。

那么,AI领域正好相反,被称为“人工智能国家队”的讯飞早早就布局To B业务,实现智慧政法、智慧医疗、智慧教育等业务的突破。

科大讯飞轮值总裁 胡郁

而人工智能To C市场此前难以进入的僵局如今正有被打破的迹象。据科大讯飞轮值总裁胡郁透露,当科大讯飞刚成立的时候,他们也做过一款面向C端的统一输入法,但结果很不成功。

胡郁解释称,要做C端产品的,基本上都是做产品创新和模式创新的公司,所用的技术一定是成熟的。就像当年的互联网创新,技术上都是成熟的。但如果是做核心技术创新的公司,一开始就做C端的话是很困难的。

那么科大讯飞决定发力C端的真正原因是什么?

人工智能技术已经走向成熟,AI将实现应用红利兑现。

胡郁具体解释了其中原因:

  • C端有足够大的利润空间,有更广泛的市场规模,而在人工智能方向的To C,目前市场潜力仍非常大,讯飞跟很多的公司处于同一个阵地、同一个起跑线;
  • 想要把最好的技术展现给用户时,需要做完整的事情,讯飞有足够的技术积累,将技术从软件到硬件、完整地呈现给用户。

20年的技术累积终于将讯飞强势带入了C端的战场。

科大讯飞轮值总裁胡郁:我们和华为有着相似基因,都曾坐十年“冷板凳”

最后当谈转向C端面临的挑战时,胡郁表示:科大讯飞在源头核心技术、系统创新上都占据优势,但最终做成C端的最重要一环——模式创新上,讯飞仍面临着挑战。

胡郁表示,相比于互联网产品,我赞成互联网的创新模式思维,但是我并不赞同很多互联网公司去通过烧钱的方法去做推广,这种推广效果并不一定能呈现刚需。

作为一个技术创新型的AI公司,而不是一个互联网公司,科大讯飞要用互联网思维来优化我们的核心技术,来优化产品,迭代产品

胡郁提到为何华为可以把消费者业务做成功:

首先,华为拥有一群学习能力极强的员工,去学习钻研如何从To B向To C转变;

其次,能够耐得住寂寞,保持定力,朝你自己认为正确的方向坚持下去,华为与讯飞的一些基因上是比较类似的,都是做那种板凳能坐十年冷、十年磨一剑的公司

最后,不断地吸引业界最好的知识经验与血液。

在发布会现场谈到AI应用红利兑现的基础——AI核心技术鸿沟的突破时,科大讯飞董事长刘庆峰表示这不是一蹴而就,需要源于热爱的长期坚守。

这是任何一家成功的AI公司都必须拥有的基因

0 人点赞