腾讯云AI团队联合腾讯优图、AILab、微信智聆、微信智言等实验室,帮助合作伙伴和客户高效打造针对性的解决方案,助力各行各业的数字化和智能化转型。
7月,腾讯云慧眼、腾讯云OCR、腾讯云神图、语音识别、NLP自然语言处理推出全新功能;腾讯云OCR、腾讯云神图、TTS语音合成优化了核心性能。
腾讯云慧眼
身份证识别及信息核验
通过OCR识别或手动输入姓名和身份证号或传入身份证人像面照片提供所需验证信息,校验姓名和身份证号的真实性和一致性。可应用于游戏、直播、电商、运营商等场景。
身份证人像照片验真
传入身份证人像面照片,识别身份证照片上的信息,对身份证信息的真实性进行验证。
独家支持身份证人像面照片抠图识别,并且OCR支持复印件告警、边框和边框内遮挡告警、翻拍或PS告警和临时身份证告警,验证身份证照片的真实性。可应用于游戏、直播、电商、运营商等场景。
腾讯云OCR
营业执照核验
提供营业执照的识别及信息准确性核验服务。支持对所传入营业执照关键字段或图片信息的智能化识别及企业工商信息的比对核验。
营业执照平均字段准确率达到90%,重点字段准确率95%以上,核验准确率达100%。
可应用于企业信息电子化存档、商家资质审查、银行金融信贷等服务。
增值税发票核验
提供增值税发票的识别及信息准确性核验服务。支持多种支持多种类型的发票核验,包括增值税专用/普通发票、机动车销售统一发票、货物运输业增值税专用发票、二手车销售统一发票。同步完成信息的准确性核验,核验效率高。可应用于企业费控报销管理、供应链发票核验、财税代理记账等场景。
OCR SDK
目前提供身份证识别、名片识别和银行卡识别三种OCR能力,支持自动识别和拍摄识别两种识别模式。SDK已支持Android和iOS两大平台,可快速集成到应用中使用。可应用于用户身份认证、商务职场社交、银行业务等场景。
腾讯云神图·人像分割
在人像前后景分割的基础上优化多分类分割,支持对头部、头发、五官等的分割,既可作为换发型、挂件等底层技术,也可用于抠人头、抠人脸等玩法,独家支持人像细粒度分割。可应用于证件照、线上合影、图片特效编辑等场景。
ASR语音识别
1.录音文件识别产品支持3人及以上话者分离功能,电话场景支持单声道2人话者分离,非电话场景支持单声道2-10人话者分离,可应用于会议纪要、视频双录等有多个发言人并且需要进行多说话人分离等场景。
2.实时语音识别支持自定义设置静音断句阈值,用户可根据自己的业务场景需要自主设置静音断句阈值,支持范围为150ms-2000ms;可应用于智能客服、外呼、手机助手等需要对静音断句阈值进行自定义设置等场景。
3.一句话识别上线微信服务市场,提供服务端调用和小程序调用两种方式,适用于微信开发生态的开发者,如公众号、小程序等,可更便捷的接入语音识别服务。
NLP自然语言处理
新增NLP服务开通步骤,腾讯云NLP产品的新用户在首次使用NLP服务时,需要先登录NLP控制台开通服务,方可进行接口调用和控制台使用,开通服务同时会赠送每日50w免费调用量资源包。
腾讯云OCR·卡证识别
身份证接口优化
1.上线新版接口,支持区分多张卡证在同一个图片中,并进行错误提示。 2.新增身份证边框不完整告警阈值字段,同时收集微众对于边框遮挡的识别需求,推动引擎优化。
3.支持生僻字识别。
通用印刷体识别优化
1.支持PDF单页识别,可指定需要识别的PDF文件页码,得到对应页的文字识别内容。 2.支持阿拉伯语识别。
腾讯云神图
人体分析、人脸识别、人脸试妆、人像变换等多个产品官网demo发布。
TTS语音合成
新增11个新音色,补充更多音色数量,覆盖客服、阅读、新闻、方言等场景。
合成音频优化,优化音频文件下载和播放体验,方便客户下载和使用生成所有音色的音频。
更多关于腾讯云AI的产品体验,欢迎大家点此前往
产品资讯、行业动态欢迎关注腾讯云AI公众号!