乾明 发自 凹非寺 量子位 报道 | 公众号 QbitAI
没想到,滴滴开源的自然语言理解(人机对话)模型训练平台,就这样登上了GitHub热榜。
这一项目名为DELTA,是一个深度学习模型训练框架,基于TensorFlow构建,滴滴自己内部也在使用,在ACL 2019上宣布开源。
滴滴表示,它可以用于加快实验进度,部署用于文本分类、命名实体识别、自然语言推理、问答、序列到序列文本生成、语音识别、说话人验证、语音情感识别等任务的系统。
这是滴滴开源的第22个项目,也得到了谷歌AI大牛、Keras创始人François Chollet转发支持。
GitHub链接: https://github.com/didi/delta
模型从论文到产品部署无缝衔接
滴滴介绍称,DELTA主要基于TensorFlow构建,能同时支持NLP(自然语言处理)和语音任务及数值型特征的训练。
整合了包括文本分类、命名实体识别、自然语言推理、问答、序列到序列文本生成、语音识别、说话人验证、语音情感识别等重要算法模型,形成一致的代码组织架构,整体包装统一接口。
使用过程中,用户要准备好模型训练数据,并指定好配置Configuration,模型训练pipeline可以根据配置进行数据处理,并选择相应的任务和模型,进行模型训练。
在训练结束之后,可以自动生成模型文件保存,而且模型文件也能够形成统一接口,可以直接上线使用,快速产品化。
此外,DELTA在多种常用任务上也提供了稳定高效的Benchmark,可以简单快速复现论文中的模型结果,也可以在此基础上扩展新的模型。
模型构建完成后,用户可以使用DELTA的部署流程工具,迅速完成模型上线,实现从论文到产品部署无缝衔接。
滴滴如何用?
现在,滴滴已经在产品中应用了NLP和语音技术。最核心的产品,是滴滴自建的智能客服系统,能辅助人工客服,提高人工客服处理问题的效率,并减少人工客服在重复、简单问题上的处理量,就使用了包括自然语言处理、深度学习、知识图谱、语音、推荐等在内的技术。
此外,基于语音识别以及自然语言理解技术,滴滴也构建了驾驶员语音助手。在日本和澳洲,滴滴实际语音直接“免接触”接单的功能即将上线。
滴滴表示,将来这一语音助手会支持全方位的语音交互服务,包括影音娱乐、信息查询、车内环境调节,到乘客通信、客服,甚至是加油、充电或维保服务。
与此同时,滴滴也宣布,将推进相关能力的开放,通过提供一站式自然语言处理工具、一站式机器人开放平台,帮助行业合作伙伴更好地实现AI应用落地。
今年5月,滴滴发布群雁智能出行开放平台,宣布将滴滴积累的AI技术、服务、算力以及多元化的解决方案进行全面开放。
据悉,“群雁智能出行开放平台”包括滴滴的AI基础平台、AI服务能力以及滴滴在出行领域积累的解决方案。
将重点为城市交通管理者、智慧交通企业、汽车产业链上下游合作伙伴、企业开发者及技术极客、高校及科研机构、社会机构和公益组织等提供定制化开放服务。
滴滴一下,AI去哪里
滴滴的AI历史很早。
2015年5月,滴滴成立机器学习研究院,就开始将机器学习大规模应用在出行领域,特别是数据挖掘、实时计算等,更是场景天然,应用直接。
当时滴滴创始人还专门从浙江大学挖来AI大牛何晓飞。
次年4月,滴滴机器学习研究院升级为滴滴研究院, 何晓飞担任创始院长,后来何晓飞离职创业,则由副院长叶杰平和弓峰敏共同掌舵。
研究方向包括机器学习、计算机视觉、人工智能、数据挖掘、最优化理论、分布式计算等。试图通过机器学习理论和方法,最大化利用交通运力,缓解城市拥堵。
2017年,成立滴滴美国研究院,将以云安全、 深度学习、人机交互、计算机视觉及图像学、智能驾驶等领域的技术开发及应用为主要课题,重点发展大数据安全和智能驾驶两大核心领域。
坐拥海量数据,招揽众多大牛,滴滴AI开始在行业内展露锋芒,屡屡在行业顶级赛事中斩获冠军。
比如今年4月,滴滴AI团队联合北京邮电大学PRIS团队提出的人脸检测DFS算法,在世界人脸检测公开评测集WIDER FACE的Easy、Medium和Hard三个评测子集的六项评估结果中, 超过了国内外众多科技公司和高校院所,取得了五项第一、一项第二。
而且,滴滴的AI活动,不仅仅只是立足研究,也涉足AI行业顶级活动。刚刚落幕的AI顶会KDD 2019上,滴滴就是铂金赞助商。
实际上,无论是数据挖掘、机器学习还是自动驾驶,滴滴在这些领域都有场景,也有技术投入。
只因为业务太“社会”,反倒是让人谈论其技术实力的时候少了些。
— 完 —