飞桨TOP案例集锦 | AI可以改变更多

2019-07-02 14:38:07 浏览数 (1)

深度学习技术已经具备了很强的通用性,正在推动人工智能进入工业大生产阶段,人们也逐渐的感受到了AI对生活的改变。下面,小编就带领大家了解一下飞桨怎么在现实生活中发挥作用的。

AI识虫——红脂大小蠹虫情监测系统

飞桨助力林业病虫害监测落地

红脂大小蠹是危害超过35种松科植物的蛀干害虫,自1998年首次发现到2004年,发生面积超过52.7万平方公里,枯死松树达600多万株,且在持续扩散,给我国林业经济带来巨大损失。传统监测方式依赖具有专业识别能力的工作人员深入林场实地检查,专业要求高,工作周期长。北京林业大学、百度、嘉楠、软通智慧合作的面向信息素诱捕器的智能虫情监测系统,通过飞桨训练得到YOLO v3目标检测模型识别红脂大小蠹虫,远程检测病虫害情况,识别准确率达到90%,与专业人士水平相当,并将原本需要两周的检查任务缩短至1小时。

标准高尔夫球场自动检测

飞桨助力土地资源监测治理

高尔夫球场,长期以来的高端社交地,但其存在的背后,却是对资源环境的侵袭。不仅大量占用土地资源、耗费水资源,而且在维护草坪的时候大量使用化肥农药,会造成严重污染。从2004年开始,有关部门就开始制定一系列相关政策限制球场建设,并在2017年前后开展了专项清理整治。

球场相对分散,且占地面积比较大, 通过遥感图像来检测,是较优方案,高分辨率光学遥感影像的普及也为场检测提供了有力数据支持。但是有了这些数据,检测起来却不容易。利用遥感图像监测地表,是一个持续的过程。中科院遥感地球所研究人员说,其中最大的难点就在于,同一个地方的环境和气候,每年都会发生变化。这会对理解遥感图像的算法造成极大的影响。一个熟练解译人员从这样的遥感图像中检测出来所有的高尔夫球场,需要15分钟左右。

中科院遥感所的研究人员借助飞桨的支持,使用了Faster R-CNN目标检测模型,结合特征提取网络VGG16及区域建议网络(Region Proposal Network)实现高尔夫球场的检测。在专业、标准的高尔夫球场遥感数据集中,只需要10秒,就能够检测出遥感图像中的所有球场,让工作效率提高了90倍,检出准确率也能够达到84%。

AI变革家居软装——以图搜商品

飞桨助力线下家居实体业「进化」

随着消费互联网流量红利的逐渐殆尽,移动互联网的主战场转向产业互联网,家居行业3D数字化进程高歌猛进,行业开始沉淀下了大量的与真实商品对应3D模型数据,如何应用真实商品的3D数据的多维度特点,来改善消费者的购物体验具有重要意义。

从家居行业商户角度看,线上销售渠道虽然逐渐丰富,但随之而来的也是大量卖家涌入线上平台,线上流量争夺激烈、红利减少,产品大概率为2D图片,用户体验差。从消费者角度看信息大爆炸时代内容庞杂,很难利用效果图在线上直接搜索到,或在线下快速找到想要家居产品。即使搜索到,也难以想象其实际的大小、摆放效果等。而逛实体店“按图索骥”,又会有店铺分散、产品分散,费时费力的问题。

次元视界应用飞桨,将Faster R-CNN应用于效果图真实商品检测,并结合可视化技术(Web3D、混合现实、全景云图),为消费者带来高品质的视觉感知服务,实现以图搜商品。经过一周的训练,模型轮廓识别准确率已达到89%。

百度多项核心业务使用的领先视频理解技术

飞桨发布业界首个视频分类工具包

目前互联网视频数据日益增多,用户观看短视频、小视频的需求也愈来愈强,如何对海量的视频资源快速准确地分析、处理、归类是一个亟待解决的问题。视频理解技术可以多维度解析视频内容,理解视频语义,自动分类打标签,极大节省人工审核效率,节约成本;同时精准用户推荐,提升体验效果。

基于飞桨,采用two-stage训练策略,涵盖2D/3D-CNN模型,序列模型等,对视频自动分类、打标签,提取视频语义向量。已在百度Feed流,百度搜索,百度云VCA系统等多个产品线应用。百度Feed流视频已实现全流量自动分类,可全免人审。

百度核心业务验证的推荐解决方案

飞桨为百亿数据规模推荐业务提供分布式训练及预测支持

为了尽可能多的抢占用户使用时长,千人千面的个性化推荐能力在市场上被广泛应用并在优化用户体验方面发挥着极其重要的作用。而个性化点击率预估模块是实现个性分发的重要手段。但对于拥有超大规模用户体量、海量内容库及所伴随的最高可达百亿级别用户点击日志的推荐系统,如何处理拥有自膨胀特点的海量特征数据及需要高频率迭代的模型,成为了推荐系统是否成功的核心关键。

飞桨通过提供一种高性价比的多机CPU参数服务器训练方法,可有效地解决超大规模推荐系统、超大规模数据、自膨胀的海量特征及高频率模型迭代的问题,拥有超大吞吐量及高效率。在百度搜索、百度糯米、好看视频、百度地图、百度翻译等多个产品线都有效果优异的实践。

基于真实的推荐场景的数据验证(1.4亿总样本数中统计得到1.8亿独立特征,平均每条样本117个特征,单条样本平均1k稀疏特征量),飞桨在100节点*10线程/节点的情况下,吞吐量可达60万~140万/s,每小时可处理20~50亿数据,且达到batch size为512的情况下90%的加速比。

以上只是飞桨解决实际问题的几个范例,飞桨有着全面的官方支持的工业级应用模型,涵盖自然语言处理、计算机视觉、推荐引擎等多个领域,行动起来,让飞桨实现你的脑洞!

0 人点赞