智能存储 :一站式AI内容识别加速内容生产

2022-11-28 16:41:23 浏览数 (2)

导语

数据万象内容识别基于深度学习等人工智能技术,与对象存储 COS 深度融合,底层直接调用COS的数据,实现数据存储、流动、处理、识别一体化,提供综合性的云原生 AI 智能识别服务,包含图像理解(解析视频、图像中的场景、物品、动物等)、图像处理(一键抠图、图像修复)、图像质量评估(分析图像视觉质量)、图像搜索(在指定图库中搜索出相同或相似的图片)、人脸识别、文字识别、车辆识别、语音识别、视频分析等多维度能力。用户可使用数据万象提供的自动化工作流或批量任务处理串联业务流程,大幅减少人力成本,缩短产出时间的同时保障业务质量。

智能抠图

电商场景中,经常出现需要对商品图片进行统一抠图处理,以符合平台的页面样式规范,并同时构建图片素材库。数据万象的商品抠图功能支持识别出图像中的商品主体,背景信息予以去除,生成透明背景的商品图片素材。商品抠图可结合数据万象批量海报生成使用,大幅缩减创作时间,快速产出各类型商品海报。

适用场景:电商平台

双11大促等活动时,电商平台往往需要在短时间内制作大量的活动海报进行引流。如果使用人工制作,不仅费时费力,还缺乏个性化定制。行业内广泛应用的解决方案是通过获取用户近期的商品浏览记录,并对其中的商品进行排列组合,再通过机器自动生成样式精美的海报,对用户进行定向营销。而在自动生成的过程中,就需要用到大量透明背景的商品图片作为素材。数据万象的商品抠图功能的可一站式生成透明背景的商品图片,构建商品图片素材库,用于智能合成“千人千面“的活动海报。

海报展示(可前往COS控制台智能工具箱体验批量海报制作)

同时,透明背景图片可以更好地融入移动端深色模式,减少平台人工适配的成本。

Logo 识别

在一些图床、电商平台等场景中,平台方经常需要对用户上传的图片进行审核,避免用户直接搬运其他平台的图片造成侵权。而判定是否侵权的核心指标就是图片上是否带有特定平台的 Logo 水印。数据万象的Logo 识别功能当前支持对图片内的电商 Logo 进行识别(后续会扩展至其他行业类型),并返回图片中 Logo 的名称、坐标、置信度分值。

适用场景:电商平台

可避免商家上传带有其他平台 Logo 的图片,构成侵权,减少人工审核成本。

图像修复

图像修复功能支持指定图像中需要修复的区域,并对其中的主体进行识别,通过 AI 算法智能填充与周围区域相似的图片纹理。

适用场景1:电商平台

可对商品图像中的杂讯(例如水印、LOGO 等)进行抹除,构建商品图片素材库。

修复前

修复后

适用场景2:摄影后期

可用于 UGC 平台或修图软件,用户可一键框选照片中的人物、建筑、车辆等,进行定向抹除。

修复前

修复后

车辆车牌识别

随着AI技术的成熟,市面上出现了许多“无人值守”的停车场,能够自动识别车牌信息,并在缴费后对车辆实现自动放行。而在这些智能停车场系统的底层,很有可能使用了数据万象的车辆车牌识别服务。数据万象的车辆车牌识别支持检测图片中的车辆,并识别出车辆的品牌、颜色、位置、车牌位置等信息。考虑到国内市场现状,我们还针对国产新能源车型进行了针对性训练,能够更好地识别出新能源车牌以及近期新增的新能源车型。

车辆车牌识别示例:

您可使用文末的“数据万象体验馆”,体验车辆车牌识别。

适用场景1:停车收费平台

可智能识别出入场车辆的车牌,实现智能计算停车时间,并在缴费成功后自动放行车辆。

适用场景2:车辆养护与维修平台

可识别当前待服务车辆的型号、颜色等,节省人工录入成本,便于数据统计。

适用场景3:二手车交易平台

可在用户上传车辆照片后自动填写相关型号、颜色等信息,简化用户接入流程。

您可使用数据万象体验馆,体验车牌识别能力。

语音识别

可针对录音文件进行识别,返回识别文本,目前支持语言类型包括中文普通话、英语和粤语。同时,数据万象支持对识别结果进行处理,包括脏词屏蔽、语气词过滤、阿拉伯数字智能转换等,满足多种语音识别需求。

适用场景1:呼叫中心语音质检

数据万象语音识别服务支持对电话场景下的录音文件进行识别,通过对通话双方语音内容进行分离,可实现客服服务评级打分,提升电话客服服务质量。

适用场景2:视频字幕生成

针对音频文件,可生成单个词语及对应时间戳列表,可便捷地为对应视频增加字幕。

适用场景3:会议语音资料转写

大型会议记录工作内容繁杂,若会议时长较长、参会人员较多,则更加难以完整记录。数据万象语音识别服务可对中文普通话、英语和粤语进行识别,减少与会人员会议记录工作量,提升会议效果。

视频标签

视频标签通过对视频中视觉、场景、行为、物体等信息进行分析,结合多模态信息融合及对齐技术,实现高准确率内容识别,自动输出视频的多维度内容标签。可应用于视频智能分析、视频审核、视频搜索、视频个性化推荐等场景,助力视频智能生产。

适用场景1:短视频分类

在短视频平台、电商、社交应用等场景下,我们都可以看到精准匹配用户需求的标签推送。同时,因为有了精准细致的视频分类,用户省去大量时间过滤无效信息。

适用场景2:热点推荐

适用于视频平台、电商平台中识别热点明星、商品、情景出现时间,标记后进行推荐。

如果您想了解上述AI能力的接入指引等更多信息,请点击[阅读原文],查阅官网文档。

数据万象体验馆入口:https://cloud.tencent.com/act/pro/ciExhibition

免费体验车辆车牌识别

点击“阅读原文”了解更多信息

0 人点赞