数字档案馆建设方案

2022-06-10 16:17:42 浏览数 (2)

数字档案馆建设实施方案

1适用范围

本方案适用于XXXX各级各类档案信息管理与服务机构。

2相关术语释义

2.1数字档案馆

在分布式计算机网络环境中,利用数据库技术、数字技术、多媒体技术和计算机网络技术创建、获取、存储、处理、交换与发布数字档案信息的档案信息管理与服务机构,是各级政府和各单位信息化建设的有机组成部分。

2.1.1 广义数字档案馆

基于网络环境,采用面向对象分布式网状结构管理模式,由众多档案资源库和档案信息资源管理与服务机构组成的数子档案馆群体。

2.1.2狭义数字档案馆

拥有特定的档案资源库及专业管理人员,借助现代技术履行和拓展传统档案馆档案信息管理与服务功能,为广义数字档案馆提供数字档案信息资源和技术支持的档案信息资源管理与服务机构个体。

2.2数字档案馆基础设施

档案信息管理利用所需的硬件环境和软件环境。具体包括网络、主机、存储设备、操作系统、数据库、应用服务器等。

2.3数字档案馆应用系统

各种数字档案信息管理与服务机构的应用系统,是数字档案馆的核心部分。具体包括:市综合档案馆、区县综合档案馆、专门档案馆、部门档案馆、企事业单位档案馆以及其他数字档案信息管理与服务机构的应用系统。

2.4数字档案馆集成

利用数字档案馆基础设施建立数字档案信息资源库,综合利用各类数字档案管理与服务机构的资源库为用户提供各种与档案信息管理与利用有关的公共基础服务。具体包括信息集成、信息交换、应用集成。

2.5档案管理数字化

为档案管理人员的日常工作提供数字化辅助工具,以数字化手段配合现实档案机构开展档案信息管理与利用工作,提高工作效率,拓展服务内容,优化服务手段。

2.6档案管理门户

为数字档案馆用户提供多种档案信息访问方式与途径。基本功能包括分类浏览检索、个性化服务、主题发布与订阅、存取控制等。

2.7档案用户

通过数字档案馆应用系统对数字档案馆进行访问的档案形成者、档案工作者和档案工作服务对象。具体包括各级党政机关、部队社会团体、企事业单位和社会公众等。

2.7.1 政务网用户

通过政务网对数字档案馆进行访问的档案形成部门人员、档案工作者和档案工作服务对象等。

2.7.2 公网用户

通过公网对数字档案馆进行访问的档案形成部门人员、档案工作者和档案工作服务对象等。

2.8安全

为数字档案馆提供的机密性、完整性、可靠性、可用性鉴别和抗抵赖等技术服务。主要包括:安全管理(防病毒、防非法侵入、数据备份等)、安全协议、数据加密、数字签名与数字认证、密钥管理、安全测评、公钥基础设施等.

2.9管理

对数字档案馆基础设施、数字档案馆集成、数字档案馆应用系统、数字档案馆门户、数字档案用户各层次的技术和运营进行管理,保证各层次系统的有效性和良好运作。具体包括系统管理、标准策略制定与调整,市场化运作、人员培训等内容。

3建设目标与基本原则

3.1建设目标

3.1.1.有效控制和科学管理不断生成的数字档案资源加强对各级各类档案信息资源管理与服务机构资源建设的监督与指导,实现对XXXX各级政府和各单位电子文件与数字档案的有效控制和科学管理,不断丰富和优化XXXX数字档案资源,确保档案事业的可持续发展。

3.1.2积极推进重要档案信息数字化,丰富数字档案资源

加快对XXXX重要档案信息的数字化处理,确保重要档案的长期保存与有效利用,促进档案信息的增值利用,提高档案工作服务全局、服务社会、服务公众的能力与水平。

3.1.3 实现XXXX档案信息的社会共享

根据XX城市建设和档案事业发展的要求,以XX市档案馆为核心,整合全市各类档案信息资源,使之成为社会信息资源的有机组成部分。在此基础上,依托各级政府与各单位网络环境和现代信息技术,实现XXXX档案信息资源的社会共享。

3.2基本原则

3.2.1需求导向原则

用户是数字档案馆存在的基础,数字档案馆建设应充分理解用户当前和未来的需求,努力满足用户要求并努力争取超越用户期望。数字档案馆用户既包括所有数字档案馆的服务对象--数字档案信息的利用者,也包括内部业务管理过程中每个接受前一个业务工作环节输出的部门、岗位或个人。需求导向原则要求数字档案馆建设者在制定方针战略时,必须十分清楚用户及其他相关方的需求。在制定目标时,要确保与用户的需求和期望相吻合。在组织运作管理时,要能够改进各业务层面,以期满足用户需求和期望的业绩。在人力资源管理方面,要确保全体人员具有满足用户需求和期望所需的知识与技能。

3.2.2系统管理原则

系统是指相互作用和相互关联的一组要素。系统管理原则就是要通过数字档案馆的各个分系统协同作用,互相促进,使总体的作用大于各分系统作用之和。对狭义数字档案馆建设项目而言,系统管理原则应贯穿于数字档案馆建设的全过程。即要以系统分析的有关数据、资料或客观事实为起点,确定要达到的目标;然后通过系统工程,设计或策划为达到目标而应采取的措施及步骤,以及需配制的资源,形成完整的方案;最后在实施过程中通过系统管理来确保建设项目的高有效性和高效率。对广义数字档案馆工程建设项目来说,贯彻系统管理原则就要打破地域、行业、条块分割,以及档案馆(室)之间的界限,加强统筹与规划,减少重复建设与开发。要在技术创新的基础上,重点研究建立科学、高效的数字档案馆群体管理体制与机制,通过加强对各级各类数字档案馆建设项目的协调与管理,提高数字档案馆工程建设项目的辐射面和整体效应。

3.2.3持续改进原则

持续改进是指数字档案馆增强满足用户要求能力的循环活动。数字档案馆建设是一个系统工程,不可能一蹴而就,需充分兼顾前瞻性与可行性、先进性与实用性。但是,为了满足数字档案馆用户日益增长和不断变化的需求和期望,数字档案馆应不断改进信息服务的质量,注重提高质量管理体系及过程的有效性和效率。要将持续改进作为一种工作目标和工作制度,并将其纳人对数字档案馆建设项目的绩效评估,纳人工作人员的工作目标、业务培训和奖励机制。

3.2.4多方互利原则

在专业化和协作日益发展、供应链日趋复杂的今天,数字档案馆与数字档案资源形成者、利用者的关系对数字档案馆建设具有重要的影响。数字档案馆建设应坚持走专业化、市场化道路,充分利用社会各方资源,吸引相关行业的技术力量,参与法规标准.应用系统和数字化加工等关键技术的开发与研究,通过各级各类数字档案馆之间的协作,组织和建设高质量、规范化、可共享的数字档案资源,建立一门式数字档案信息发布平台。

3.2.5安全性原则

数字档案馆应用系统属于涉密系统,其资源的管理与利用必须严格按照《中华人民共和国保密法》、《中华人民共和国档案法》规定进行。要正确处理档案信息保密与开放的关系,从管理与技术两个层面,落实涉密信息的保密措施,构建完善的数字档案馆信息安全保障系统,确保档案信息的真实、完整、可靠、可读、可长远利用。

4主要功能与建设途径

4.1 主要功能

广义数字档案馆是狭义数字档案馆的集合体,除应具有某个狭义数字档案馆独有的功能以外,还应具有信息集成(参见4.2.5. 1).信息交换(参见4.2.5.1.2)和应用集成(参见4. 2.7)三大功能。

狭义数字档案馆是广义数字档案馆的基础,其应用系统应具有以下功能。

4.1.1档案信息采集

对馆藏档案信息资源进行数字化加工和接收征集、搜集各类数字档案及资料。

4.1.1.1 馆藏档案及模拟视音频资料内容数字化

在完成馆藏纸张等传统档案价值鉴定与开放鉴定的基础上,对各种载体的、内容重要、需求广泛的档案信息进行数字化加工,形成数字档案信息,具体应包括档案内容信息的检索、扫描(转换)、校对、修正、备份以及内容数据信息与目录数据库信息的自动关联等功能。

4.1.1.2电子公文采集

接收在计算机应用系统中直接形成的电子公文及相关元数据。

4.1.1.3计算机共享系统中专业数据库文件采集

接收各单位业务活动中可共享的各类专业数据库数据及相关元数据。

4.1.1.4网站档案信息采集

通过网络在线采集各种组织和个人在网站上发布的各种形式的、具有档案性质和价值的资料。

4.1.2档案信息存贮

4.1.2.1 存储

通过将采集到的符合标准规范的数字档案信息及其元数据有序地存储到系统中,或对非规范数字档案信息进行整理、转换和存储,构建规范的可交换、可共享的数字档案资源,并确保其可被长远保存与利用。

4.1.2.2备份

数字档案馆的重要设备、软件系统、档案数据等都应备份。服务器一般采用镜像备份,档案数据可采用光盘、磁带等载体进行异地备份。数据库备份--般可利用关系数据库自身提供的功能,对元数据和存储建实时异地网络灾备与恢复中心。

4.1.2.3迁移

是为应对软硬件环境变化,保持数字档案长期可读而采取的技术手段。主要包括档案信息资源变更登记、资源变更受理.数据迁出/人.等功能。

4.1.3档案信息管理

对采集到的数字档案进行分类、编目、鉴定、统计等,使之有序化。

4.1.3.1 分类

按照一定的分类标准和用户需求,将采集到的数字档案信息分成若干类别与主题,使其进一步条理化、系统化。

4.1.3.2著录

对反映数字档案内容、结构、背景的元数据进行真实性、完整性审核,完成缺项补著录,建立元数据库。

4.1.3. 3编目

通过接收和编制数字档案目录建立可共享的综合目录库,以目录链接内容信息,实现对全部数字档案资源的有序管理。

4.1.3.4 鉴定

对数字档案进行批量的内容鉴定和技术鉴定。

4.1.3.4. 1内容鉴定

从档案文件的来源、类别、责任人、形成时间、利用情况等方面人手,制订鉴定规则,采用计算机智能技术,建立专家智能鉴定系统,进行档案内容的批量辅助鉴定。然后,由档案鉴定人员对辅助鉴定的结果作进一步的审核与调整。具体包括档案信息的价值鉴定和开放鉴定。

4.1.3.4.2 技术鉴定

从文件的形成、流转、使用.归档等环节出发,对电子文件的技术状况进行全面检查。具体包括对文件信息真实性、完整性、唯一性和可读性分析的鉴定。

4.1.3.5统计

对数字档案的数量、种类、利用情况等信息进行基本登记和综合统计,根据用户需要灵活、准确地形成和输出各类统计资料及统计报表。

4.1.3.6编研

构建数据仓库并应用其强大的分析工具,分析潜在的用户需求、确定档案编研的专题与形式,对多种数据源进行抽取、整理和转换,形成系统、完整、形式多样的档案编研成果。

4.1.4档案信息交换

不同的数字档案馆应用系统之间、数字档案馆应用系统与电子政务应用系统和各类纵向业务系统之间通过统-的标准语言进行交互,完成对数据的转换处理,使不同的系统均可共享授权范围内的所需信息。

4.1.5档案信息查询

数字档案馆采用以用户为中心的服务模式,通过单位局域网/政务网/公众网,为本单位/社会利用档案提供跨平台.一门式的数字档案信息查询服务,使具备上网条件的用户可以在任何地点、任何时间通过数字档案馆门户迅速获取其权限范围内的各种档案信息,实现数字档案信息共享。具体包括综合智能查询、个性化服务、主题发布与订阅、存取控制等。

4.1.5.1综合智能查询

根据检索项目提供多条件组合查询和多种检索功能(基于概念的搜索、内容挖掘、全文搜索等)。满足用户远程查阅和调用各数字档案馆档案目录元数据以及全文信息的需求,提供数字档案图文声像信息一体化检索和利用,以及检索结果的显示排序、转存、输出等技术处理功能。

4.1.5.2个性化服务

提供个性化和定制功能。通过收集用户信息,构建用户模块,对用户进行聚类分析,推测符合用户需求的信息,确定个性化服务的策略与内容,为用户提供合理的相关内容链接排序,提高查询效率。具体包括个性化推荐、个性化定制、个性化信息检索等方式。

4.1.5.3 主题发布/订阅

用户可使用发布/订阅机制,通过定义agent对特定主题进行跟踪搜索。

4.1.5.4存取控制

具有完善的网络安全级别管理、数字签名与认证管理.进程管理等安全服务机制。数字档案馆一般应采用三网物理隔离的方式来保证系统安全,运用导出/导人功能实现不同系统之间数据的转移。

4.1.6档案信息发布

4.1.6.1网上发布.

根据数字档案的不同密级,主动将经过编辑的相关数字档案信息分别通过单位局域网/政务网/公众网上的数字档案馆门户进行发布,提供浏览、复制、下载等功能。在单位局域网上运行的内部信息发布系统应纳人本单位综合信息系统,实行统- -身份认证。信息发布的内容包括用户指南、现行文件查询、档案(包括案卷/文件目录、全文信息、照片、录音、录像等)查询、档案文献汇编、网上档案展览、档案工作者园地(包括法规标准、专业培训、工作动态、学术活动、研究成果)等。网上信息发布应提供英文版本或英文导航,拓展档案利用范围。

4.1.6.2光盘发布

对于不允许上网的涉密数字档案信息,应将有关信息复制到光盘上,提供给具有使用权限的用户在指定场所阅读使用。

4.1.7网上交流

为用户提供上载个人信息和感受的平台,除了一般网页都提供的上载功能外,可开辟博客领域,通过一定的申请及登记手续,为特定用户提供个人写作区域,记录和发布个人收集的专题档案信息、研究成果及感受,为进一步收集个人档案信息和专题档案研究资料开辟新的途径。

4.1.8网上收费

网上收费功能往往需要与相关行业合作才能实现,且主要用于向社会开放的大型数字档案馆。

4.1.8.1手机支付

与电信部门合作,通过手机注册的方式进行收费服务。服务费记人电信通话费。数字档案馆为用户提供有偿服务。具体的价格及收费方式可标明在网站相应的页面上,由用户根据需要选择。

4.1.8.2支付平台

利用支付平台完成用户刷卡支付功能,通过提供支付平台的营运商向银行收款,然后由营运商将款项转给数字档案馆。

4.1.8.3银行转账

数字档案馆在网上提供档案信息增值服务,同时提供开户银行的账号,用户若要求获得收费的信息服务,可先完成申请单,然后按标明的金额,根据网上提供的开户银行和账号将货款通过银行汇人数字档案馆账户内,数字档案馆确认后根据申请单提供相关信息服务。这种支付方式一般用于金额较大的支付项目。双方先应签定网上预订合同。

4.1.8.4邮局汇款

这是一种传统的方式,款到后即按要求提供相关档案信息服务。用户支付的金额一般比银行转账的金额要小。

4.1.8.5购上网卡

用户通过购买上网卡进行网上档案信息收费服务项目的消费活动,并可随时续费,即续既通。

4.1.9库房智能化管理

4.1.9.1库房管理

运用条形码技术对数字档案馆馆藏档案实体出入库情况进行管理与控制。配备电脑密集架,自动显示档案实体在库房中的存放位置。

4.1.9.2库房环境自动控制

运用智能化技术检测、存储、显示、打印库房内的温湿度及其他各种数据。通过对数据的设置、采集、比较、处理,控制受控设备工作,确保档案库房的恒温、恒湿。具有防盗、防火、防烟雾等多种自动报警功能和远程控制功能,使库房管理人员可在异地对档案库房环境进行实时监控。

4.1.10内部行政事务管理

4.1.10.1馆内信息公告栏

数字档案馆项目的成功离不开全员参与,馆务信息公开对数字档案馆建设项目的推进具有十分重要的作用。

4.1.10.2设备管理.

软硬件设备是数字档案馆运转的基础条件。设备的采购、登记、使用、维护、报废都应有专门的记录,并可根据需要进行查阅与统计。重要设备的随机文件应纳入数字档案馆文件管理系统。

4.1.10.3 人员管理.

人才队伍建设和员工培训是数字档案馆持续发展的根本保障。人员管理一是要建立员工个人基本情况数据库,方便人员管理;二是要建立人事管理工作流程,人员录用、技能培训、岗位设置、任务安排、质量控制、绩效考核工作都应纳人内部行政管理系统,在网上进行处理。

4.1.10.4 文件管理

建立单位内部的OA模块,在数字档案馆建设中形成的管理性文件、标准规范、合同协议等都应纳入内部行政管理系统统一管理。

4.2建设途径

4.2.1广义数字档案馆总体框架

4.2.2 理论建设

4.2.2.1数字档案及数字档案馆定义及边界研究

4.2.2.2数字档案馆管理体制、机制研究

4.2.2.3 数字档案采集、鉴定、存储、利用策略研究

4.2.2.4数字档案资源共建、共享法规政策研究

4.2.3标准建设

4.2.3.1电子公文格式标准研究

电子公文/文件从创建到归档或销毁的-般过程包括了创建、显现、办理、交换、归档、销毁等多个步骤,其中的“办理”和“交换”之间可以有循环过程。在整个生命周期内,按照国家电子政务标准《基于XML的电子公文格式规范》中“第-部分:总则”和“第二部分:公文体”的内容,完整的电子公文基本要素包含:

(1)公文体信息

(2)公文式样信息

(3)公文办理信息

(4)公文安全信息

(5)公文交换信息

(6)公文归档信息

文件的所有数据应由档案信息数据元组成。要制定文件格式规范以实现信息交换。数据元是信息交换的最小数据单元标准,文件格式必须建立在数据元的基础上才能进行有效的信息交换。目前档案信息的文件格式只是对文件体的一种规范,对于版式信息、安全信息、交换信息等并未规范,应用系统可以根据自己特定的需求进行设计和实现。但是根据数字档案馆业务的发展,将来应考虑制定文件的版式交换等方面的规范。

4.2.3.2电子文件目录与全文元数据著录标准研究

数字档案馆档案信息资源标准化的基础是建立信息资源库的元数据标准,在数字档案馆应用技术标准中,信息资源的元数据标准包括档案信息主题词、档案信息数据元、档案信息代码、档案信息文件格式等。

(1)主题词

参照《中国档案主题词表》,借鉴国家电子政务主题词概念,范畴词的选词定词应从国家电子政务范畴词表中进行借鉴和扩展。在选择范畴词和主题词时应尽量重用中央和地方已存在的主题词和范畴词标准。同时建立主题词词目内容更新机制,及时为数字档案馆的发展提供服务。

(2)信息代码.

档案信息代码规范是档案信息数据元的值域确定标准。数据元的值域有枚举型和非枚举型两种,其中枚举型的值域通常是应用某代码标准。在档案信息代码规范中应当尽量重用已有的国家标准或者行业标准。对于同一种代码出现多项标准的应当根据数字档案馆的具体需求确定一种代码标准。在数字档案馆中如果需要代码,而目前尚无标准,则应允许进行代码自定义。在代码自定义时应当遵循GB/T7027-2002《信息分类和编码的基本原则与方法》。

(3)数据元

档案信息数据元规范中,数据元的概念、表示结构、设计方法、分类原则部分应当遵循国家电子政务数据元的第-部分。在数字档案馆中数据元的规范是档案信息数据元条目的规范,这些条目可借鉴国家电子政务数据元中的提取方法,从数字档案馆的常用业务模块中提取出来。在数据元的提取中,首先需要检索已有的数据元。如果已有的数据元能够满足新的需求,则不必提交和产生新的数据元,可重用已有的数据元。数据元词目的提取结果与选定的数字档案馆业务模块范围是密切相关的。数字档案馆业务本身或者业务模块范围发生变化时需要对数据元词目集合进行修改。因此,需要对数据元的词目提供统一的维护和管理机制。国家电子政务数据元规范计划构建一个全国范围的数据元注册机构,地方可以向该机构提交有必要上升到国家范围的数据元。需要提交到国家范围的数据元应当是一-些全国通用的数据元或者是国家职能部门内通用的数据元。

4.2.4基本设施建设

4.2.4.1网络

包括本单位局域网建设、政务网接人和互联网连接等。在数字档案馆网络的建设和规划过程中,需要充分遵循以下网络集成原则:

(1)标准化及规范化:为确保不同厂家设备、不同应用连接的互操作性,应选择支持国际标准的网络接口和协议,以提供良好的开放性环境。网络互联要遵循传输控制协议/互联协议(TCP/IP),遵循国家制定的IP地址分配方案,有利于互联互通。

(2)整体规划与安排:从广义数字档案馆建设的全局和全面工作需要出发,考虑各数字档案馆的地理分布和通信条件及整体规划网络建设方案,对网络系统的总体结构、服务功能.经费预算、建设步骤作出具体安排。

(3)可扩展性:为适应系统不断扩展的需要,有利于工程的分步实施,在经济合理的前提下,系统要预留功能扩展的接口。

(4)可管理性和可维护性:数字档案馆管理系统使用应强调方便、实用和安全,具有优异的可管理性和可维护性,能满足实际使用的要求。

(5)经济实用性:各狭义数字档案馆要因地制宜,在充分整合现有资源的基础上,鼓励使用公共基础网络资源进行馆间互联,建设统一管理传输平台,并选用性能价格比高的产品。

4.2.4.2主机

主机在选择中要兼顾CPU运算能力、内存及硬盘容量诸方面因素对系统应用的影响,考虑可靠性、可用性、可扩展性及安全性等方面的因素。

4.2.4.3应用服务器

应用服务器应既具有稳定与可扩展的架构,又可提供一个易于开发和管理的应用环境。

4.2.4.4输入输出设备

包括高速扫描仪、胶片扫描仪、视频采集卡、数码照相机、数码摄像机激光打印机、光盘刻录机等。

4.2.4.5数据存储设备

包括磁盘阵列、磁带机、光盘塔等。要考虑存储体系的容量、应急能力.兼容性,便于保护重要资源。可以根据各数字档案馆的物理位置分布、存储对网络总体性能的影响、档案利用的特点、网络现状来选择合适的存储方式。

4.2.4.6数据库

鼓励服务器端使用高可用数据库软件。

4.2.4.7 操作系统

建议选用稳定、安全、友好、兼容性强的操作系统。.

4.2.5 数字档案馆集成

4.2.5.1信息集成

数字档案馆中的信息集成提供档案利用所需要的各种基础信息,形成档案目录信息和全文信息共享平台,是整个数字档案馆的核心所在。它为数字档案馆中的档案利用提供数据信息基础。良好的信息集成能够缩短数字档案馆项目的开发周期,规范数字档案馆的系统数据结构。其目标是:采集各业务系统中具有档案价值的信息,整合完善各数字档案馆的信息资源,减少数据冗余,消除数据信息表示之间的差别,为整个社会的档案利用提供标准的、可扩展的、性能良好的数据共享平台,实现数字档案馆系统与各业务系统之间以及业务系统相互之间信息交换的顺利畅通。数字档案馆信息集成以不影响现有的、处于运行中的纵向业务系统内部实现为原则,要求业务系统应为数字档案馆信息集成过程中的信息采集和信息交换提供接口。信息采集和交换的方式,由信息采集/交换双方约定认同。经确定后,任何更改都需要告知与信息采集和信息交换相关的单位,以确保信息采集和信息交换的顺利进行。数字档案馆中的信息资源不仅涉及各级数字档案馆本身的馆藏.管理和服务信息,也涉及党政机关以及各行各业的纵向业务系统的相关信息。采集各纵向系统中有档案价值的信息,不断丰富数字档案馆的信息内涵,进而实现数据档案信息的交换与整合,是信息集成的一项重要任务。

4.2.5.1.1信息采集

信息采集包括数据抓取和数据净化两个部分。数据净化是对数据抓取获得的数据进行数据重构与整合。根据系统的需要,数据抓取分为物理抓取和模拟抓取。物理抓取是将获得的数据信息存放在本地数据库或者本地数据文件中。模拟抓取则依然将抓取的信息存放在数据抓取对象中,也就是处在远端的业务系统的数据库环境中。

(1)数据抓取

提供统一的数据采集框架,定义统-的数据采集接口,接入各个业务系统,完成业务系统数据的采集。数据抓取主要由采集框架和采集模式两部分组成。采集框架独立于业务系统,对于任何业务系统而言都是相同的。数字档案馆通过采集模式和业务系统进行连接。业务系统通过向采集框架注册特定的采集模式实现来完成本业务系统的数据采集流程。系统应能提供多种数据采集方式,包括:

①被动采集:数据采集框架提供数据同步接口,业务系统采用批量方式或在数据发生变化时将变更的数据发送到数据同步接口。

②主动采集:业务系统提供数据源,采集框架采用定时轮询或人工触发方式调用采集模式查询业务数据源,如果数据源更新,则将新的数据同步到系统当中。数字档案馆应用系统可根据实际需要,通过提供一种或者多种数据采集方式完成数据抓取任务。

(2)数据净化

数据净化包括数据重构和数据整合。数据重构是根据电子政务、电子商务数据源规范、整理和完善数据信息。通过数据抓取获得的数据通常未经处理,其名称和内容由各个被抓取系统制定,不利于数据的理解和交流。数据重构把数据抓取获得的数据信息与电子政务、电子商务数据元规范进行比照和匹配,规范数据信息的名称和内容,使抓取到的数据可被理解和交流。根据数据是否被采集复制到本地数据库或数据文件中的实际情况,数据整合可分为以下两种情况:

①实整合:提出信息内容上相关的数据,把它们放入相关的库表中,并不断对这些库表进行数据维护。实整合需要对数据字典进行整合,能提供不同的整合规模(增量、海量)和多种整合的触发机制(自动和手动)。

②虛整合:提供中心数据模式转换服务,中心数据模式转换服务根据数据处理请求,负责处理分析.确定所请求的数据信息,返回诸求的数据信息结果。即只对数据的处理请求进行加工处理,不对数据进行物理上的整合。

4.2.5.1.2信息交换

在信息集成过程中,数字档案馆信息管理系统与各纵向业务系统之间的信息交换是必须的。但是,各纵向业务应用系统与数字档案馆信息管理系统的数据库、开发和运行环境不尽相同,有各自不同的格式。为保证信息交换的畅通,数字档案馆档案信息管理系统和各纵向业务系统或业务单元通过一-种标准语言进行交互,形成双方共同遵守的信息交换格式。由于XML的自定义性及可扩展性,它足以表达各种类型的数据。客户收到数据后可以进行处理,也可以在不同数据库间进行传递。总之,在这类应用中,建议采用XML解决数据的统-接口问题,使用

XML作为数据交换的文件格式,并辅之以XMLSchema。通过此种转换使得不同系统获得所需要的数据形式。

4.2.6 资源建设

4.2.6.1档案目录数据库

内容包括各种媒体档案资料的案卷级、文件级目录。主要数据来源包括市区两级20个综合档案馆馆藏档案目录数据、各级专门和部门档案馆目录数据、市区两级政府机关档案室及大型企事业单位未进馆档案目录数据。

4.2.6.2档案全文数据库

内容包括对纸质档案资料进行数字化处理后形成的数字图像全文数据、缩微胶片数字化形成的数字图像全文数据、移交进馆的电子档案全文数据。

4.2.6.3档案专题信息数据库建设

内容包括保存在各级各类档案馆(室)中的与政府各部门、各单位业务管理活动及社会公众维护个人权益密切相关的专题档案信息。例如:信用档案、公证档案、税务档案、房产档案、户籍档案、婚姻档案、独生子女档案、知青档案、学籍档案、高级专业技术人才档案等。

4.2.6.4声像档案资料数据库建设

内容包括对银盐感光材料照片、模拟记录中的录音、录像资料进行数字化加工后形成的数字声像档案资料和直接接收、征集进馆的数字声像档案资料及相关的文字说明。

4.2.6.5档案编研成果数据库建设

也可视为特色数据库。内容包括重要文件汇编、年鉴、史志、大事记、组织沿革、基础数据汇集、专题概要(例如名人、历史建筑、优秀传统文化介绍等)、地图、画册等。

4.2.6.6档案数字化加工中心建设

为减少重复投资,降低建设成本,可依托企业及大型档案信息管理与服务机构的设备与技术,采用市场运作机制,在XXXX建立若干档案数字化加工中心,为参与数字档案馆建设的机构提供纸质档案、照片档案、缩微胶片以及音视频档案数字化服务。

4.2.7 数字档案馆应用集成

通过对与数字档案馆资源管理和利用相关的业务进行整合,使其以一个整体形象对外提供服务,统一用户管理,实现Single Sign On,减少用户验证;统一服务人口,避免多次提交;统一对外口径,防止数据或内容的相互矛盾;整合内部资源,杜绝重复投资;完善系统架构,增强系统的可扩展性能;规范办事流程,提高工作效率。应用集成是流程集成的基础.只有将各个提供应用的狭义数字档案馆整合起来,纳人广义数字档案馆的框架内,以整体的形象提供对外的各种服务功能,流程的集成才成为可能。将各个已具有狭义数字档案馆并提供对外服务的应用系统或业务模块按照功能划分为不同的业务单元,数字档案馆集成系统除提供部分对外服务的功能之外,需要提供基础的业务单元注册框架,供各非数字档案馆系统原生的提供对外服务功能的业务单元在数字档案馆系统中注册,而经过注册的业务单元由数字档案馆系统统-调度。通过业务单元注册和统-调度,达到服务集成,从而使各个对外提供服务的应用系统整合成为一个整体,具有统一的对外服务出口,提供的服务不再是单一的,而是成为一个能处理复杂业务和服务的架构。数字档案馆应用系统利用由业务实施单位或已存在的应用系统提供的业务单元,为公众或其他应用系统提供应用服务。鉴于不同的业务实施单位或应用系统,其业务单元是不相同的,要使数字档案馆应用系统能完成对各种不同的业务单元的调用,必须制定一套统一的业务单元规范,只要是遵从规范的业务单元,就能被系统使用。

4.2.8 应用系统建设

应具备本方案4.1所列举的广义数字档案馆及狭义数字档案馆的各项功能和良好的开放性,支持各类主流操作系统.提供多种层次的应用开发接口,为系统的二次开发提供方便。同时,系统应由诸多功能模块构成,可以方便地进行组合,以便各馆根据实际需要选择相应的功能模块。系统还应能实现与各类业务信息系统及政府电子政务信息资源管理系统的平滑衔接。

4.2.9 门户网站建设

包括外网门户网站和内网门户网站(具体功能参见4.1.5与4.1.6)。分别通过因特网和政务网构建起XXXX统--的数字档案信息共享平台。

4.2.10 用户信息库建设

内容包括用户基本信息和需求信息。

4.2.11信息安全体系建设

4.2.11.1技术体系

4.2.11.1.1物理安全

应将数字档案馆系统设备放置于较安全的场地。物理安全上应考虑采用防盗、防毁、防电磁信息辐射泄漏抗电磁干扰措施,建议采用适当的重要设备电源保护手段。

4.2.11.1.2网络安全

根据档案管理的特点,制订安全策略,对跨越安全域边界的网络访问进行管理。采用合适的术,实现广义数字档案馆系统内部各级网络层次间的访同控制,实现局域网内不同信任区之间的隔离和访问校制,实现对公开服务器的安全保护。可以使用以下网络安全手段:

1)防火墙

防火墙可以是硬件自身的一部分,将因特网连接和计算机都插入其中,也可以在一个独立的机器上运行,用该机器作为它背后网络中所有计算机的代理和防火墙。对于直接连在因特网上的机器,可以使用个人防火墙。

2)网络入侵检测

入侵检测系统可分为两类:基于主机和基于网络。基于网络的人检测玉阳平安员公限时监控网络关键路径的信息。基于主机的入侵按物系统用于保护关键应用的服务器,实时监视可疑的连接,系统日志检查、非法访问的阿人等,并且提供对典型应用的监视,如Web服务器应用。入侵检测过程分为三部分:

①信息收集。入侵检测的第一步是信息收集,收集内容包括系统、网络、数据及用户活动的状态和行为。由放置在不同网容的限型或不同主机的代理来收集信息,包括系统和网络日本文作的传照器非正常的目录和文件改变,非正常的程序执行。

②信息分析。收集到的有关系统、网络、数据及用户活动的状态和行为等信息,被送到检测引擎,检测引擎驻留在传感器中,一般通过三种技术手段进行分析:模式匹配、统计分析和完整性分析。当检测到某种误用模式时,产生-个告警并发送给控制台。

③结果处理。控制台按照告警产生预先定义的响应采取相应措施,可以是重新配置路由器或防火墙、终止进程、切断连接、改变文件属性,也可以只是简单的警告。

3)网络漏洞扫描

使用网络扫描器预防黑客入侵、进行安全评估,可以通过对网络安全弱点全面和自主

地检测与分析,迅速找到并修复安全漏洞。

4)网络加密

包括癌码技术 和网络加密方法两个方面。密码技术又可分为常规码密和公钥密码,分别可用于加密信息和传递会话密钥,实现防止非接权用户窃取文件和验证文件真实性的双重功能。

5)网络审计

采用专门细致的协议分析技术完整的跟踪能力和数据查询过程回访功能,通过旁路侦听的方式,对网络数据流进行采集、分析和识别,实时监规网络系统的运行状态,记录网络事件,发现网络隐患,并对网络活动的相关信息进行分析、存储和审计回放。

4.2.11.1.3系统安全

(1)操作系统。加强操作系统的安全,应从物理安全、登录安全、用户安全、文件系统和打印机安全、注册表安全方面制定强化安全的措施。建议采用安全性较高的网络操作系统,并对其进行必要的安全配置,关闭一些不常用却存在安全隐患的应用或者服务;对存有用户信息及其口令的关键文件使用权限进行严格限制;加强口令的使用(增加口令复杂程度,不使用与用户身份有关的、容易猜测的信息作为口令);及时进行系统升级;不对外公开系统内部的相互调用。

(2) 数据库系统。对于数据库系统,应重点进行用户权限的管理,对常见安全漏洞进行检查和补救,进行数据库的操作审计,同时成加效据备份管理的建设定期对数据信息进行备份处理,防止发生意外事故而导致数据失。

4.2.11.1.4应用安全

(1)身份认证。可以采用身份认证技术加强涉密信息的获取和使用安全,避免合法用户的身份被他人冒用。根据档案管理的特点选择合适的认证手段或纳人单位综合信息管理系统进行一身份认证,达到不可否认性目的。

(2)数据安全。对核心等银化对理安全。对核心数据采用对称或非对称的形式进行加密.摘要

意生,年正数者的安全性、不可篡改性。重要的档案网站,应通过系统实现主页的防篡改.并且能在事故发生后尽快地进行备份数据恢复。

(3) 病毒防护。在数字档案馆管理网络内部建立一个完整的计算机病毒防护体系,防止计算机病毒在用户网络系统内部的传播和扩敏对各类网络服务.主要是邮件服务,进行病毒监测和杀灭处理,同时在终端上安装桌面病毒防护软件,确保信息安全。在数字档案馆中.置病毒管理服务器.提供病毒定义更新和病毒疫情道告服及时区病毒库,以使其具有最新的杀毒能力。

和病毒疫情通告服务,及时更新病毒库,以使其具有最新的杀毒能力。

(4)应用审计。借助适当的软件,对从应用层面进行审计,中计内的软件,对某些重要的应用系统和功能模块行为等,以便从中发现可明效包括操作人员、操作对象操作时间、机器、行为等,以便从中发现可疑行为,或在事故发生时进行取证或分析操作。

4.2.11.2管理体系

4.2.11.2.1 组织架构

为加强广义数字档案馆管理系统的统一管理和控制,应建立一个覆盖整个系统的安全管理小组,全权负责内部的安全管理工作。在其统一领导下,配备管理员,具体负责系统的运行安全保密管理;同时应配备系统应急处理人员,负责对系统运行过程中发生的安全事故进行应急处理。

4.2.11.2.2 管理制度

数字档案馆管理的安全管理制度包括机房管理、保密制度、操作培训管理、岗位责任追究、内网分级管理、数据库维护管理、外网授权管理、网络运行管理、硬件设备管理、紧急情况处理等。

4.2.12人才队伍建设

4.2.12.1信息主管

档案信息管理与利用机构的负责信息化建设的领导,具有决策、指挥和控制的职责和权力主要任务是制定工作目标、技术规范,管理制度和缋效考评估指标;组织落实数字档案馆建设所需的资源;协调数字档案馆与协作方、用户之间的关系;采取各种措施营造良好的内部工作环境,充分调动全体工作人员的主动性、积极性和创造性,组织和领导员工为实现数字档案馆建设目标而积极有序地工作。

4.2.12.2应用系统开发与维护

负责档案信息管理系统的需求调查、分析、设计及实现,数字档案馆项目的管理,按照要求指导、参与应用系统或模块的开发和测试,根据技术支持需求,进行软件代码维护等。

4.2.12.3 硬件维护

负责管理及维护本单位网络及相关设备,包括主机、应用服务器、输人输出设备和存储设备等,对系统进行有针对性的设置及优化,进行网站流量的监测与管理。

4.2.12.4网页编辑

负责策划井编辑档案门户网站内容频道,维护网页各栏目信息。

4.2.12.5数据处理

负责数据采集、加工、整编、存储、迁移、交换等。

4.2.12.6信息鉴定

负责档案信息的内容鉴定和技术鉴定等。

4.2.12.7在线服务

负责接受咨询、答复咨 询、查档预约、资料预订、信息代查、查询结果通知、需求分析、信息发布、利用收费及统计等。

5业务管理模式

根据国内网络建设现状,考虑采用以下两种数字档案馆业务管理模式来协调狭义数字档案馆和广义数字档案馆的职能,达到为用户提供档案信息一门式服务的最终目标。

5.1统一标准下的对等式业务管理模式

这种模式与Internet的业务管理模式相类似.即各狭义数字档案馆根据统一的标准,通过相互交换元数据和对象数据来实现档案信息一门式服务的模式,主要适用于对政府公开信息和开放档案的管理。用户可登录到统--的档案资源利用平台上进行信息利用,而不必在意信息的来源和实际物理位置。具体实现方式如下:

(1)由一个标准制订发布机构(一般为区域内最高级别的档案局)来组织制订或选择确定各类数字档案馆系统的接口标准、互联协议及元数据和全文数据交换规范。

(2)各档案实体管理与服务机构根据统一标准分别建设各自的狭义数字档案馆。每个狭义数字档案馆的应用系统都应含有信息交换模块,可依照统- - 的标准完成相互之间元数据和对象数据的交换。各狭义数字档案馆之间呈相互等同关系。

(3)各狭义数字档案馆之间通过Internet实现互联,元数据检索等可参照数字图书馆最新研究成果HandleSystem加以实现。其结构框义数字档案馆之间呈相互等同关系。

如下图所示:

(4)统-检索平台可设在国家综合数字档案馆门户网站上,为利用者提供零距离、全天候的档案信息利用服务,各专业、部门、企事业单位数字档案馆作为节点,负责为统一检索平台提供本馆的开放档案资源。

(5)统一检索平台的信息利用服务可分为两个层次,一是元数据或目录检索,二是全文信息检索。前者可帮助利用者获知所需要的档案信息存于何处,是否有数字化全文,后者可让利用者通过网络直接获取所需档案信息全文。获知是基础,获取是目的,两者可分步实施,但应当兼而有之。

(6)用户可以通过Internet登录到国家综合数字档案馆门户网站上的统一检索平台上,利用权限可以通过用户名和密码进行控制。

5.2分布等级制业务管理模式

这种模式与Internet中域名管理模式相似,即根据各类档案馆的性质,按照一定的等级进行分层次管理的模式。在这种模式下,信息流分层次进行流动,比较适合对部分具有一定保密性、不适宜直接在Internet网上进行传输的数字档案进行管理。具体实现方式是由一个中心机构,一般由区域最高级别的档案局(馆)来管理其下属的分中心机构,分中心机构再去管理各狭义数字档案馆实体。如果需要,分中心机构和狭义数字档案馆之间还可以增加若干层次,每个下属机构负责把自己的元数据集中到上一级管理机构中。用户可以到任何一个节点上提出档案信息的利用需求。当某一节点收到用户需求信息后,需要先将请求通过上级机构递交到最高级别的中心机构,先由中心机构负贵进行查询,确定所需对象数据在哪个分中心,然后相应的分中心机构再进行查询,最终确定拥有需求信息的某- -具体狭义数字档案馆并获取相应的对象数据后,按原查询路径的逆路径返回提出信息利用需求的节点,向用户提供其所需要的信息。各中心机构、分中心机构以及狭义数字档案馆之间通过政务内网来实现物理联接。其主要结构如下图:

根据这一管理模式,一方面,综合数字档案馆的网管中心要以各种类型狭义数字档案馆的局域网为独立的节点网,建立节点网的网管中心;另一方面,还要负责向属于它管理范围的下级节点网的网管中心提取网管信息,完成集中管理的要求。每个节点网管中心由网络管理进程和网络通讯代理进程组成。网络管理进程的基本任务是按照ISO/OSI 网络管理标准负责管理本节点网络,具体包括网络管理的四大主要功能:网络配置管理、网络故障管理、网络性能管理和网络安全管理。网络通讯代理进程的任务是响应上级节点网管中心的指令,将网络管理进程获得的本节点网的网管信息传输给.上级节点网管中心。根据上级节点网管中心的指令要求,一次性地向上传输本节点网的网管信息,有效地节省数据交换网的流量带宽,使上级节点网管中心无需再一一访问它的下级节点网的其他计算机就能获得它的网管信息。从总体上看,节点网管中心有上下级之分,它们的网管职责不尽相同,但是网管软件结构相同。这种同一性能方便灵活地动态配置广域网的网管系统结构。这种新模式也为管理可移动网络和虚拟网络提供了有效的手段。

6质量控制

数字档案馆建设项目投资大,建设周期长,技术要求高。为确保建设项目的有效运行,应加强对项目建设质量的有效控制。

6.1建立质量体系

6.1.1业务流程的建立及编制业务流程图

业务流程是贯彻数字档案馆建设质量目标的基础。编制要点如下:

(1) 全面分析数字档案馆主要业务职能,正确选择主要业务流程的各个环节。例如:档案数据鉴定、分类、采集.交换、整理、标引、著录,存储、编研、检索、发布等。

(2)清晰地表达主要业务流程各业务环节之间的关系与衔接方式。

6.1.2 设定质量目标

质量目标应以满足用户需要为重点,这是数字档案馆生存和发展的基本点。用户的需求是多样的和不断变化的。因此,质量目标的制定应以充分收集归纳内部(资源与现状)、外部(用户类型、满意度、需求)的相关信息为前提。

6.1.3分解质量目标

质量目标包括数字档案信息产品质量目标和管理体系运行质量目标。通常情况下,数字档案馆用户更关注数字档案信息产品的质量目标,即数字档案信息产品的品质;而数字档案馆建设单位为保证数字档案信息产品的良好品质,必须使数字档案馆应用系统的运行达到最佳状态。因此,两者既不同又相关。质量目标还需分解到各个部门和每个岗位,并按总体目标的实现过程再分解成每个过程的目标,即阶段性目标,使之成为每个工作岗位的工作目标和考核标准。例如,数字档案馆建设初期,就应建立健全档案数据质量目标。在应用系统设计阶段应将质量管理的要求嵌人软件功能之中,以最大限度地保障档案数据的质量。在数据采集阶段,以具体的、可操作的形式提出数据库建设的质量管理目标,包括制定数据质量考核指标,定期检查,责任到人。

6.2编制质量体系文件

根据Iso90002000国际质量管理标准,结合数字档案馆建设项目的特点,提出下列质量控制程序文件的目录供选择。

6.2.1 文件控制程序

即有关数字档案馆建设项目质量管理体系文件的控制和管理程序,是质量管理运行体系的基础。文件控制程序主要用于确保在数字档案馆建设项目质量管理体系运行中,所有业务环节都参照现行有效的文件(包括本单位质量控制文件,国家及上级机关颁发的有关法规、法令、政策、标准,国内外可直接引用或执行的规范、规则、技术标准,协作方及用户的资料、协议、函件、传真、电话记录等)执行,避免在数字档案馆建设过程中使用失效或作废的文件作为系统设计和开发的依据。具体要求是:文件编制要科学,发放要到位,修改文件应履行批准、登记手续。文件系统在网上运作的,应根据公文处理办法、文件管理制度和数据库建设标准编写文件从生成、流转到归档的相应程序。

6. 2.2质量记录控制程序

即有关数字档案馆建设项目质量体系运行记录和数字档案馆应用系统及数字档案信息产品实现记录的管理程序,是确保和验证质量管理体系有效运行的基础工具。质量记录控制程序主要用于确保数字档案馆建设项目质量管理体系的持续改进及数字档案馆应用系统和数字档案信息产品质量的可追潮性。

按使用要求,可分为两类:

质量管理体系运行中要求的记录(如:管理评审,内部审核等)。项目运行过程中为确保达到项目质量要求建立的记录(如;过程控制、应用系统和信息产品质量检测控制等)。

质量记录控制程序内容必须能涵盖数字档案馆全部业务流程以及流程上的关键环节和环节上的关键信息。记录格式要简便、易操作,能准确反映问题,方便各环节之间的沟通、衔接和综合统计。实际操作中,可统--编制,采用表格形式,并就所有记录的标识、流转、存储、检索、保护.保管期限确定等问题建立相应的管理程序。

6.2.3内部质量审核控制程序

即有关数字档案馆内部质量体系审核活动实施和管理的控制程序,是质量管理体系有效运行的重要工具,也是对数字档案馆应用系统和数字档案信息产品进行自我评价的手段和环节。

内部质量审核控制程序主要用于验证数字档案馆质量管理体系的规定要求与实施要求的一致性和质量管理体系运行的持续有效性,为质量管理体系的改进及管理评审提供依据。内部质量审核控制程序包括制定《年度质量审核计划》,确定审核时间(一般为半年或一年一次)、审核重点、审核方法(编写检查表)和审核依据(查阅文件规定的质量目标),组织审核实施,编制审核报告,提出不合格处理方法、纠正措施和验证方法,审核记录存档等工作环节。例如,鉴于数字档案馆资源建设的重要性,应定期对数字档案内容准确性、完整性进行质量审核,审核数据校对制度、备份制度数字档案馆建设理论与实践执行情况,跟踪验证数据采集部门的纠正措施,提高数据的完整性准确度。

6.2.4 .不合格品控制程序

即对数字档案馆应用系统及数字档案信息产品不合格品的认定、纠正及处置质量控制程序。

不合格品控制程序主要用于对数字档案馆硬件设备供应方、系统开发商、数据建设协作方、数据共享协作方提供的不合格产品和在数字档案馆应用系统与数字档案信息产品实现过程中的,最终检验时、交付使用时发现的不合格品的控制。不合格品是关系数字档案馆建设的重大问题,必须予以重视。建立不合格品控制程序,有利于及时发现和解决问题,降低建设成本,减少不必要的损失。程序内容主要包括制定不合格品的认定标准(合同、协议中规定的产品应达到指标,数据标准等),不合格品的处置、纠正和验证记录等。

6.2.5纠正措施控制

即当数字档案馆建设和运行过程中发生不合格情况后,用于消除不合格原因.防止不合格再度发生的管理程序,是数字档案馆建设项目持续改进的重要方法之一。纠正措施控制程序主要用于数字档案馆建设中防止不合格重新出现和发生,杜绝不合格产生的根源。程序内容主要包括:不合格信息收集,不合格原因分析,形成纠正措施建议,明确纠正措施采用时间、步骤和责任人,产品不合格与质量管理运行体制不合格原因识别,执行结果认定和评审等。

6.2.6预防措施控制程序

即数字档案馆质量管理的预警系统,是数字档案馆质量管理的主要手段和最高目标。

预防措施控制程序主要用于消除数字档案馆建设项目中潜在的不合格原因,防止不合格发生。其关键在于识别和认定潜在的不合格原因。

程序内容主要包括收集分析相关数字档案馆项目出现不合格情况的原因作为预警(例如,因数据录人、校对不到位,出现所提供证明信息有误等),组织全员分析、研究和寻找潜在的不合格现象,统计预测潜在的不合格趋势,确定预防措施以及对预防措施进行评审和认证

0 人点赞