1.人工智能基础数据服务业务流程和壁垒
分四步流程,壁垒体现在经验、渠道、能力、管理和技术上
AI基础数据服务行业的产品形式主要为数据集产品和数据资源定制服务,二者在业务流程方面基本相同,都按照数据库设计→数据采集(或需求方提供)→数据处理→质检的步骤执行, AI基础数据服务商凭借多年的服务经验,在各环节中均可建立壁垒,以巩固行业地位。通过对需求方和供应方样本的调研分析,发现拥有对计算机视觉、智能语音、NLP等算法训练需求的深刻理解能力、拥有更专业的数据库设计能力、拥有更具前瞻性的数据集产品设计能力,以及参与过更多探索型项目的公司在获取新客户和新任务时具有明显优势;拥有更丰富的方言,小语种,全球各地人脸采集渠道、场景搭建能力,特殊场景数据采集能力和如语音合成、3D点云等高门槛数据标注能力的公司业务更加稳定;拥有稳定的供应链团队、实时量化的可视化管理系统,以及AI算法加持的公司在精细化管理和利润把控方面更具优势。
2.管理和执行系统平台化融合能力
集数据标注、项目管理和质量把控于一身,以平台管理替代人员管理,是该行业科技化转型的关键一步
随着AI基础数据需求多样化,以及复杂程度的提升,以往项目经理“人管人”的管理方式和使用单一工具应对单一需求的执行方式在能力和效率上都显得捉襟见肘,尤其对于品牌数据服务商而言,客户类型丰富、数据需求多样、并发项目众多,仍使用传统方式,将会因产能天花板的压力,而限制发展规模,如单纯扩大人员团队又会陷入重资产运营和边际效益低的漩涡,难以快速确立行业地位以面对下一阶段的竞争。因此,拥有一套自主研发贯通数据库设计、数据采集、数据处理、质量检测、质量控制和数据安全管理等各环节于一体,并且能对图像、文本、语音、视频以及点云数据做到一站式加工处理的管理和执行一体化平台,能在提升人机协作效率,扩大产能,灵活可变地增加标注能力之外,准确地把控每一环节的数据安全和质量问题,将全公司综合实力集中体现出来,是实现人力驱动向技术驱动的关键一步。
3.人工智能算法预处理能力
在数据采集和处理环节中应用感知智能,进行人机协作,能降低标注难度,提升生产力
如果说人工智能是加速数字化革命的发动机,那数据资源服务行业就在为其生产汽油,同时这台发动机也在反哺行业。AI在数据标注领域主要应用于数据采集和数据处理环节,在数据采集中无论是图像或是语音数据都会出现重复样本和不合格样本,人工通过抽查或是遍历每一个样本的方式校验,在准确率、成本把控和时效性方面都大有不足,而通过使用计算机视觉和语音识别技术对采集到的样本进行初步识别,可以在短时间内达到90%以上的校验正确率,实现几倍于人力的工作效率,更有如海天瑞声的应用案例,将其研发的语音识别设备直接用于声音收录阶段,省去了校验后的返工流程,进一步减少执行阻力。在数据处理环节中,标注员需要对图像数据中每一个目标元素进行拉框或标点,目标边界需要勾描的十分精准,进行语音标注时需要聆听每一个词语的发音,判断并转写其语义,这对于标注员在长时间多任务下的专注力有着极高要求,在此环节应用人工智能可以对图像数据进行场景分割、人脸和物体识别,对于语音数据进行语音识别、文字转写和自然语言理解的预处理操作,自动完成标注后,再由人工进行校对,不仅降低了标注难度还变相增加了生产力。目前人工智能尚不能取代人力,清楚认识其价值,并积极应用到人机协作中,将成为AI基础数据服务行业精细化管理中鲜明的竞争壁垒。
4.语音合成数据处理能力
专业门槛高而鲜有服务商涉足,从而形成排他性竞争壁垒
语音合成技术已经广泛应用于人们的日常生活中,如手机助手、智能客服、智能音箱、语音导航都是其应用场景。目前语音合成的主流方式可以分为波形拼接合成和参数合成两种,其中参数合成是利用文本参数和声学参数间形成映射模型,从而完成文本内容向语音转化的过程,所以在有限样本数据的情况下,参数合成语音成为了众多智能语音算法团队的首选,随着深度学习在语音领域的突破,利用神经网络取代传统映射建模的参数合成方式,在合成效果上更进一步,逐渐减少了合成语音的机械感。在语音合成中AI公司着重于映射模型算法的创建和训练,而语音片段数据和相应的声学参数标注则交由数据服务商提供,其间数据服务商需要对录制的发音人语音片段进行音素、韵律、音节边界、音素边界、词性、重音、声调等内容进行标注,然后切分、截取音素边界;并且在项目初期需要向客户展现合成demo,在项目交付时需校验合成效果,这就要求数据服务商不仅要掌握专业的声学知识、数据标注经验,还要拥有语音合成的算法能力,目前该领域主要由海天瑞声和标贝科技两家数据公司提供服务,未来随着物联网的普及,将会有更多交互设备出现,语音合成需求将会持续增长,在此趋势下,拥有语音合成数据处理能力,将成为具有排他性的竞争壁垒。