2016年2月11日,欧盟委员会宣布在未来三年半内投资800多万欧元开展READ项目研究,携手档案管理员、人文学者、计算机科学家和志愿者共同推动前沿技术的研究、创新、开发与应用,实现手写档案文件的自动识别、转录、索引。这种基于信息通信技术的信息化基础设施(e-infrastructure)将解决“处于不断变化的世界中的欧洲”所提出的社会挑战,即欧洲文化遗产的传播,这是社会的核心需求之一。
READ项目的实施措施如下所示。
(1)开发并运行一个原型开放平台,以便用户能够上传文件、使用软件即服务技术、开发所需的手写文本识别相关技术、共享研究成果。
(2)在数字人文、模式识别、布局分析、自然语言处理等领域中开展协作研究。
(3)开发一些创新应用,如电子学习组件和移动设备等。
(4)组织研究竞赛,推动涵盖“真实世界数据”的大型数据集相关领域的研究。
(5)推出具体的行动计划,拓展技术的用户群体。
(6)携手档案馆、图书馆等机构收集手写/档案文件。
READ项目将以欧盟第七框架计划下的TranScriptorium项目研究成果为基础,由具有计算机科学、模式识别、机器学习、图像处理和人文主义专业知识的跨学科协会管理。