DAS 2020 Keynote Speech | Adobe 文档分析技术介绍

2020-08-10 16:07:58 浏览数 (1)

DAS 2020 (Document Analysis System,文档分析系统研讨会) 于 7月26-29日在武汉召开,本次研讨会中有不少精彩的内容,昨天向大家推荐了来自华南理工大学金连文老师的 keynote Speech :Optical Character Recognition in Deep Learning Era.

点击这里查看:

DAS 2020 Keynote Speech | 深度学习时代的 OCR

不少同学反馈很有帮助。

今天向大家推荐在该会议上来自 Adode 研究院 Sun Tong 博士的分享:The Future of Documents:A New Frontier in the Post-Pandemic Era.

Sun Tong 博士的分享从工业界文档分析的时代趋势出发,总结出当前文档分析技术的发展要以 3C 的维度深度服务业务。如下图:

即 Content 、Components、Consumer。

并分享了文档分析技术在 Adobe 研究院的研究与开发实践,主要内容包括:

1. 跨域的文档目标检测;

文档的类型和风格差异很大,跨域的研究很有必要。

2. 通过显著区域图对目标检测算法解释;

3. 文档分析中表格、图表、信息图的提取;

4. 基于文档中图表的问答;

5. 智能文档识别:文字区域提取,文档数据扭曲增广;

6. 专门面向合同文本的NLP理解(ContractBERT、条款识别)等。

Sun Tong 博士的分享向我们展现如何从业务的角度驱动技术研究,欢迎大家参考。

以下为完整PDF,52CV 获得授权发布。大家也可以在我爱计算机视觉公众号后台回复“文档AI”获取PDF文件全文。

0 人点赞