近年来在国家政策推动以及各监管机构的要求下,政企单位对数据治理的关注度不断提高,而数据质量的提升就是体现数据治理成效的指标之一。今天和大家分享一下政务服务行业从不同业务角度出发,如何解决数据质量问题的案例。
一、依照标准数据,智能识别匹配准确信息
业务痛点:各街道委办局进行统计工作或上门工作前,接受的基础数据大部分都为excel表格或是线下填写补充到excel的,由于没有很好的限制,数据质量经常会不太乐观。核查工作需要按街道社区下派任务,由于收集到的地址没有完全按照省市区街道街路巷的标准格式填写,而无法简单进行分配。
解决问题:在某数据治理项目中,为了处理该数据质量问题,通过亿信华辰睿治数据治理平台与标准地址库各类信息做匹配比对,得出所属的标准地址,最终实现了标准地址规范化的补充,如此方便了工作任务的下派,减轻了人工核对大量数据负担。
二、多数据来源,明确数据可信度
业务痛点:目前政务数据存在比较大的问题是信息分散,且信息不一致的情况,导致数据质量差。
解决问题:之前做某区数据治理项目时人口库的建设就涉及到了这一数据质量问题,为保证数据质量一致性原则,进行了调研,针对不同类型人员、不同类型信息进行了信息取值优先级的设定,整合成了一份数据质量相对较高、较为稳定的人口数据,为后续进行信息核查,信息关联准确性打下了坚实的基础。
三、数据质量校验,定位权责部门整改
业务痛点:政务行业逐步信息化进程已持续多年,由于数据的规章制度是在不断完善的,历史系统可能存在着数据质量较差,例如户籍表的户籍地址存在空值,身份证号为非合规的,性别身份证校验不一致等问题。
解决问题:要整改历史数据质量差的问题,首要是发现问题。在某政数局数据治理项目上,通过收集国标、行标的元标准,配置进亿信华辰睿治数据质量模块质检规则模块,定期对各部门系统的数据库表进行数据质量的检查,产出数据质量报告提供给各部门,协助定位问题数据,为他们整改数据提供了有利依据。
四、接入实时,保证数据及时性
业务痛点:疫情初期政府部门对于人员信息的查询的及时性需求变高,比如某些排查人员的健康码状态,是否有高风险地区的行程(车票,机票等信息)。 解决问题:为了保证数据状态的准确,通过亿信华睿治数据治理平台图形化配置界面进行了接口数据的接入,需要查询数据时,即时调用接口查询数据最新信息。与传统数仓的T 1抽数方式比起来,有效防止了旧数据对开展工作产生的误差,提高了这种对时效性要求高的数据的可用性。
五、教育无纸化入学报名应用
业务痛点:面对教育入学,家长跑各部门打印相关证明、盖章,带齐各种证件到现场报名,教育部门审核各种证件要1个月,1个月后通知家长审核结果,还存在假材料,影响公平。能否借助信息化解决这个问题,让群众不跑路、数据多跑路,并要求系统比对成功率提高。
解决问题:为确保报名数据的准确无误,校验数据准确性,提示报名数据的质量。通过报名数据落地,对问题数据进行多规则的清洗转换以及校验,对可自动修复的数据进行自动修复,对无法自动修复的数据,返回校验结果要求重新报名。
某区政务数据管理局就为提高该项数据质量,通过亿信华辰睿治数据治理平台进行了相关校验流程的实现;完成了如身份证好末尾的x的大小写不一致,判断出问题数据,统一转换为大写X;校验报名信息中的房产信息或身份信息与公安/不动产系统中数据是否一致;对字段中码值不一致的情况进行转换等有利于提升数据质量的工作。
上述实践案例都离不开亿信华辰睿治数据治理平台,其提供数据质量管理模板,以数据标准为数据检核依据,以元数据为数据检核对象,通过向导化、可视化等简易操作手段,将质量评估、质量检核、质量整改与质量报告等工作环节进行流程整合,形成完整的数据质量管理闭环。系统主要功能包括质量检查规则管理、绩效管理、工作流管理、质量分析报表查询、质量报告等。
如今,基于体系化的数据治理产品、日益完善的方法论,亿信华辰结合对数百家政务机构的服务经验,通过技术、场景和服务能力,帮助政府单位突破难点,快速实现政府治理能力的数字化转型。未来,我们也将持续探索,不断为用户提供更好用的软件产品和全面深入的优质服务,推动企业和政府的数字化转型。