DAS 2020 (Document Analysis System,文档分析系统研讨会) 于 7月26-29日在武汉召开,本次研讨会中有不少精彩的内容,昨天向大家推荐了来自华南理工大学金连文老师和 Adobe 研究院的Sun Tong 博士的分享:
DAS 2020 Keynote Speech | 深度学习时代的 OCR
DAS 2020 Keynote Speech | Adobe 文档分析技术介绍
今天向大家推荐在该会议上来自 印度国际信息技术学院(IIIT)C. V. Jawahar 教授的分享:Documents Understanding Beyond Text Recognition.
该分享指出文档分析技术正从文本识别向着更高级的文档理解发展,文档理解含有丰富的内涵:
1. 文档的布局检测分割;
2. 结构化信息提取,比如表格检测与识别等;
3. 基于文档识别的内容视觉问答。
包括相关技术和数据集的介绍,相信对从事OCR领域的朋友有帮助。
以下为完整PDF,52CV 获得授权发布。大家也可以在我爱计算机视觉公众号后台回复“文档理解”获取PDF文件全文。