从诺基亚、Symbian到环信,马晓宇一直在通过通过技术拉进人与人直接的距离。2013年联合创立环信,从IM开始到实时音视频,不断为开发者和企业提供易用可靠的通信服务。马晓宇说,团队要提供全场景的音视频社交能力,“TC”只是一个开始。
文 / 马晓宇 生曦
策划 / LiveVideoStack
LiveVideoStack:马晓宇你好,非常开心邀请到您接受LiveVideoStack的采访。能否向我们的读者介绍下自己?
马晓宇:大家好,我是马晓宇,当前在环信任职首席技术官,负责及时通讯相关的研发工作。
我工作的20多年里,先后经历了电信行业、互联网、开源软件以及移动互联网这四个业务发展的高峰期。在1998年我加入诺基亚,从事短信中心的开发,见证了诺基亚,摩托罗拉,整个通信行业在中国爆发式的发展。
到2001年互联网的发展第一次到达了顶峰,我也随着这波浪潮去美国继续做软件开发的工作,在此期间也不幸看到了互联网的第一次破灭。在此之后我回国开始做eclipse和apache 基金会的开源软件,在其中我们更多的工作是面对电信、银行这类的客户做服务器的中间件。
2008年我开始觉得整个大环境的技术方向应该会向移动端发展,所以在那年我加入了Symbian(塞班),主要工作是做手机操作系统和移动端应用。
2013年发现移动互联网开始出现大量的创业公司,所以从2013年开始做为移动开发者提供技术通信的平台。到目前为止即时通讯依然是环信的主要业务,我个人最近比较关注人工智能以及5G的热门话题。
LiveVideoStack:目前IM通讯的市场在国内和国际上大概的格局是怎样的?
马晓宇:2014年4月我们上线了第一个即时通信云服务,在做即时通讯云服务方面环信是国内第一家。最初这只是几个人聊天当中的一个想法,变成了企业服务里一个细分行业,很多公司都共同在做这个事情,大家也都是为了更好的服务用户和开发者。之前整个行业是以像环信这样的创业公司为主,但从近两年开始,可以看到腾讯、网易都在重点投入这个方向,因为大家都觉得这是云服务里PaaS平台的基础服务,并且是开发者生态闭环中一个重要组件。所以目前即时通讯服务的竞争相对比较激烈,既有互联网公司和创业公司,也有像腾讯这样的TOP企业。
整个市场还处于快速发展的阶段,从环信自己的业务出发,包括已经上线的应用本身来看,我们注意到两个比较大的趋势,一是从去年开始,开发者更多的从原生应用开始转向做一些小程序和流量入口,这是目前逐渐显现的趋势。在环信的后台也能看到越来越多的用户不再去做Native而是转去做小程序,不管是在IM还是客服方面。另外从后台数据也可以看到,越来越多用户从基本的文字、图片聊天逐渐趋向实时语音和实时视频,在环信即时通讯云服务上我们也感受到了这中沟通方式上的变化。
LiveVideoStack:即时通讯从单纯的文字、图片向实时视频的转变,对于公司和后端处理能力的要求自然也相应提高,环信针对这种变化做了哪些工作,又为用户提供了哪些产品和服务?
马晓宇:目前环信主要提供两个产品,一个是音视频云(PaaS服务)以API的形式提供底层和一对一、一对多的音视频能力。在PaaS服务中也包括一些基于移动端的远程控制和桌面共享,白板等功能,都是和音视频相关的底层能力,用户在此基础上可以开发不同的包括社交、企业会议、互动直播,甚至是手表、医护、看护设备场景。
另一个是用环信音视频的能力在客服行业落地的完整产品——视频客服,其中太平洋保险、南方航空、广东电信都已经陆续上线了这个系统,包括公有云上的中意人寿也在使用环信的视频客服。
视频客服有两个主要的场景,一个是可以对VIP客户提供更好的服务,比如你是南方航空的VIP客户,那么在APP里你的客服就具有视频客服的功能,在后台有专业的视频坐席对服务进行保障。太平洋保险已经上线了一千个视频坐席,包括中意人寿也在逐步上线一些涉及视频技术的功能,这已经是目前企业发展的必然。在保险行业,我们在也在支持保险远程勘察等业务。
LiveVideoStack:我们知道环信发布音视频2.0的版本,在此次更新里有哪些新的特性、功能,以及在用户体验方面有哪些提升?
生曦:我是生曦,目前在环信任职IM产品经理,对IM技术与使用场景的整体产品方案非常感兴趣,最近这段时间一直在调研市场各行业中受5G影响以后的发展趋势,近几年我们会面临行业上的巨大挑战,这其中行业中的多数竞品企业在不断的推新以及功能不断的完善,未来将会是人人都是开发者的时代。每个团队都有更多的资源和可以直接利用的一些技术来服务自己的产品,在这些前提之下我们需要做出更多才能够脱颖而出。我们调研中发现,很多应用尤其是社交类型应用所需要的技术服务越来越多样,只有做到把社交类用户的使用场景全面覆盖,再从部分垂直领域深挖场景,才能提高我们未来的产品竞争力。就如同之前所说的保险业务和VIP视频客服服务,在垂直行业里找到我们核心的商业模式。整个音视频在社交场景的全覆盖只是一个开始,以后会不断地为更多的场景服务,在其中找到更多的突破口,这也是环信在2.0版本所做出的改变。
LiveVideoStack:既然环信是为开发者服务,那一定会涉及到工具友好性和学习曲线的问题,开发者在使用前是否需要熟悉大量的开发文档,针对调试过程中出现的问题环信做了哪些准备?
生曦:环信已经成立了很多年,IM作为我们最底层PaaS平台的基础,在音视频领域也会有同样的底层基础支持,我们有丰富的SDK开发工具包,在此基础上用户作为开发者不需要对太多的技术底层有过多的了解,反而会更像IM一样根据需求调用相应的接口调试,以此来完成移动端、移动设备、Web端、Web设备和服务端的集成工作。
同时环信现在有大量的TC项目(一款语音连麦体验App),在2.0版本中推出了很多新功能,比如频道的广播控制远端其他主播的视频技术,丰富了RestAPI服务端的功能,这些都可以通过服务端直接去调用。我们也针对开发者的问题形成了接口功能梳理的文档,让用户能够通过文档来理解和调用接口,真正做到从用户的角度出发,模拟用户的思想,明确用户的最终需求,围绕这些来形成更高意义上的集成方案。
马晓宇:补充一下,项目的功能具体到音视频方面的开发门槛较高,环信一直想做对开发者有足够友好度的SDK,比如处理通话的不同状态以及网路情况,我们把诸如此类的功能都尽量添加到SDK里。具体来说,我们在SDK里会有网络自适应和带宽自适应的模块,在网络状况不好的环境下视频会自动降低分辨率,不需要集成工程师额外的处理。另外对于部分低端安卓设备在录音时会有的回声问题,我们针也对这些安卓设备做了一定的回声消除适配,在不同的设备上调整不同的参数,这就是环信站在开发者角度去思考,节省用户的工作量,主动来负责相对较为复杂的部分。接下来环信会将TC以开源的形式发布,在此之后也会陆续发布一系列和音视频应用相关的资源,包括服务端、客户端的Demo和完整应用,对开发者和创业者来说可以参考Demo来实现需求的应用场景,相应的软件友好度也会上升。
LiveVideoStack:在使用过程中有两个场景,第一个是开发者可以作为一个最小MVP测试,通过调用接口可以快速实现产品Demo,开发者可以仅在内部上线并收集用户反馈,如果得到的反馈良好便再继续跟进做一些更详细的功能,能够很大程度上降低创业团的的开发成本。环信提供了很多文档,如果开发者在运行过程中出现问题或是难点,怎么快速检测这个问题,环信有没有类似的应用支持,快速为开发者做出反馈和解决?
马晓宇:基于环信一直在为开发者服务,所以有一套完整的技术支持体系,从QQ群、工单再到社区,以及VIP客户的专属群有着明确的分级体系,针对不同的客户有不同的响应办法,普通客户也可以通过提交工单,通过我们的技术交流群和社区提出问题并得到及时的响应和反馈。并且我们在内部设有不同的SLA,不同的问题分多长的时间处理,都有明确的体系去做规定。
生曦:针对公司服务来说,由于常年的经验积累,我们有IM和客服,所以不管是PaaS还是SaaS公司都有比较完善的销售链条。部门和部门之间处理用户的问题,比如说前置和销售的问题我们有咨询电话和销售的支持,中间过程的技术支持会以提交工单的形式予以解决或反馈,对于VIP用户处理速度相对要快一些。其余有关线上报错或者故障的问题我们在15分钟内就能及时修复,包括技术性或者产品性的问题,在CSM团队以及产品团队都会用相互沟通和交流的方式,将用户的问题拆分成当下可以解决和未来才能解决两个方面,以此来对用户进行更好的反馈。
LiveVideoStack:TC的开发团队正在做哪些具体的工作,未来开发者会有哪些新功能或体验上的改进?
生曦:目前新推出的2.0版本是面向未来所有场景全覆盖的开始,要完全实现这个目标还有很长的一段路要走,以下我主要介绍一下未来环信发展的五个关键点。
第一是环信现在在做的语音连麦聊天室,语音的玩儿法有很多,目前我们已经能完全构建和覆盖例如陌陌这样的场景。但这只是一个开始,后面还有像狼人杀和剧本杀这种,同一个聊天室当中有不同的角色,这些角色之间在某一个场景下是互相隔离并且能够区分出不同的玩儿法和场景,我们会在下一阶段很快的对这部分内容做出补充和提出解决方案,让用户在聊天室玩儿法层面不再是广播式的统一得到信息,而是变成非对称式,每个人得到的信息都不完整,互相通过语音结合信息会产生很多有意思的点。
第二点是视频连麦,从语音连麦聊天室开始陌陌就一直在占有主流的社交市场,其他类似的应用也会逐步完善场景,达到向主流聊天室推进的目的,新生代的一些泛娱乐化应用会追随着脚步不断地推广自己的应用。随着流量以及带宽的逐渐升级,像YY中视频PK的娱乐场景变得非常火爆。站在环信的角度来看我们应该进一步的完善和攻克这个场景,做到两个或两个以上的所有视频主播,通过连麦和服务器混流直播,实现五千到一万人以上的大群连麦直播。让每一个观众都有机会申请和主播连麦并开通视频。
第三点是连麦之后我们可以对接不同的CDN厂商并进行大范围的直播和广播,这其中也包括IM和音视频的一些工作,以此来支持五千到一万人以上甚至有些内部项目已经能够支持18万人以上的大型直播间,这是第三点在广度、承载量以及并大量上都能有显著的提升。
第四点有关视频和音频的处理,AI变声和FaceAI的模拟图像就是其功能上的最佳体现。这些其实是在交友娱乐过程当中必不可少的一些成分,环信也会对实时音视频的数据源进行一些开放性的处理,让用户可以对接各种各样的音频变声和视频变声,再把这些实时变化的效果、音频、音效反馈到IPC,通过实时音频再去和连麦直播做融合。这样做能够使整个产品丰富起来,用户的互动体验也会得到相应的提升。
第五点更多是关注于社交领域的一些更深层次的玩儿法,例如能够使两个或多个直播间实现实时合并以及拆解功能,让多个主播和粉丝群能够快速的打通和拆解,让整个用户关系从一点对多的广播室关系变成双点直播以及交叉式的合作关系,使得用户的社交行为发生更深层次的改变。目前抖音和微博都是通过点赞和关注实现关系链的推荐与到位,实时关系链的推荐和融合可能是未来更快建立社交关系的一种方式。
以上五点可能是环信现在正在进行推进或者之后可能会跟进的一些事情,之后版本推出的一些改进将会改变玩儿法上的一些东西。对我们来说,不能总是依赖客户去思考未来应用产品的需求以及定义IM环境的技术,而是应该主动去发现未来社交情况的改变并及时做出底层的技术支持,帮助用户构建未来的应用场景。这在所有的社交场景基本往下或者是覆盖的足够全面的情况下,另一条线将会找到我们从PaaS转成SaaS的核心竞争力,或是为某些专属客户提供底层更高性能的企业级服务,为航空、教育类的企业带来基本的特性。
LiveVideoStack:目前有很多独立的SDK,但在功能上具有局限性,环信目前是想把部分功能集成在一起,提供更为完整的体验场景和玩儿法吗?
生曦:这其实是一把双刃剑,一方面我们需要把音视频这部分做的足够专精,又需要把IM做的足够广泛。如果音视频只局限于部分使用场景,无法更好的覆盖客户更多的业务,就会造成用户在很多厂家中无法做出选择的局面。另一方面,好处是我们能够提供一个完整的用户体系,用户不需要对用户体系对接深入理解,只需要用一个就可以完成音视频和IM通讯以及对接用户自己的服务,这些功能随着业务量的发展在使用时就会具有一定的优势。
LiveVideoStack:环信在5G的发展趋势下,有哪些需要把握的机会?
马晓宇:5G也是我们一直在关注的方向,中国5G的牌照已经发放,比我们预想的时间还要早一些,明年年底经过一年半的换代时间,主流人群应该都能使用5G手机,整个技术也是完全成熟的。在4G时代经历了几个场景,一个是图片社交,当时有大量图片社交类的应用爆发,这其中包括我们的用户,但这波热度随着直播应用的兴起很快便冷却下去,之后抖音这批短视频社交应用又使得用户数量到达巅峰。环信在2015年开始服务的一个应用Musical.ly就是做短视频社交,仅用一年的时间就做到了上千万的海外日活,抖音的场景界面在一定程度上参考了环信的Musical.ly。
我们的确看到4G时代发展和应用爆发用一年时间就席卷全球,而5G的带宽是4G的几十倍,达到真正的千兆级带宽,这本身是非常好的底层基础设施。环信目前看到有几个需求,一个是基于高清的视频社交,另一个是一些比较有价值的企业级应用,例如企业远程协助和企业会议,这些我们都有在做开发和相关的技术铺垫,还有一个场景和环信的业务紧密结合,这其中包含5G和人工智能这两个快速成熟的关键点,目前可见技术上的大趋势是基于AR、5G以及最新人工智能技术的虚拟客服。
在此之外有几个和环信有关的技术我们在跟进,3G/4G时期环信主要做即时通讯和推送,这其中必然会产生大量的业务成本,相反5G在核心网设计的时候就考虑到如何低成本的支持物联网。目前环信还在观望5G真正落地之后如何与现有的技术相结合,有没有可能大幅度降低通知和推送的业务成本,以及5G的低时延应用场景实现等问题。
LiveVideoStack 招募
LiveVideoStack正在招募编辑/记者/运营,与全球顶尖多媒及技术专家和LiveVideoStack年轻的伙伴一起,推动多媒体技术生态发展。了解岗位信息请在BOSS直聘上搜索“LiveVideoStack”,或通过微信“Tony_Bao_”与主编包研交流。