档案之窗-馆室综合
点击加入->档案管理交流QQ群(708132784):
功能需求分析——数字档案馆系统设计之一
2018-11-29  浏览:690

 

    1. 引言

    我国关于数字档案馆的研究起步较迟,据不完全统计和文献分析,我国学术界对数字档案的研究主要体现在对数字档案馆的认识、概念定义、作用、模式、如何建设和发展趋势以及数字档案馆建设介绍等方面,对数字档案馆理念、建设目标、功能需求及其实现方法、标准规范等都未形成统一的认识[1]。相比之下,我国数字档案馆建设实践却走在理论研究的前面。然而,由于缺乏理论指导和相关标准滞后,我国目前已经在建的数字档案馆项目呈现出各自为政的现象,同时我国大多数数字档案馆项目仍处于观望阶段。鉴于此,本文旨在为成功建设数字档案馆而提出其概要的功能需求,以作为制订数字档案馆系统设计方案的基础。

    2. 数字档案馆概念

    关于数字档案馆到目前为止还没有一个比较统一的定义。何嘉荪教授认为:“数字档案馆不仅仅是馆藏得到数字化以及管理工作实现了信息化的档案馆和档案馆群体;它实质上是一个通过计算机互联网络有序处理和集成管理在结构各异的多种信息平台上产生的多样的电子文件、档案以及其他信息,确保这些数字信息资源的真实性、完整性和持久有效性,并实现上述信息资源跨库共享的超大规模、分布式和可扩展和数字信息系统。”[2]为实现建设上述数字档案馆的目标,首先应该了解数字档案馆所面临的信息环境、管理对象和目标。

    2.1 复杂的信息环境。

    随着社会信息化进程的加速发展,数字档案馆将面临复杂的信息环境,这种信息环境的复杂性集中体现在电子文件系统的分布式和异构性。所谓分布式是指数字资源及其所依赖的系统并非存储于同一个场地的计算机存储设备上,而是分散地存储在各个相关的不同场地上,并可通过网络将它们连结在一起。所谓异构性是指电子文件所依赖的系统是异构的,不仅表现为系统平台与应用平台的异构性,而且表现为数据结构、数据模型、数据格式等方面的结构各异。造成信息环境复杂性的主要原因在于缺乏统一的建设标准和系统模型,致使各地各部门如雨后春笋般涌现出来的办公自动化、电子政务工程形成了各自为政的局面,直接导致了分布式异构系统的急剧增加,并对档案部门实施电子文件管理带来了诸多的难题。具体而言,这些难题表现为在电子文件的捕获、真实性保障、电子文件长期保存、存储管理和一体化检索服务等方面的系列问题。

    2.2 多样化的管理对象。

    如前所述,数字档案馆不仅仅是馆藏得到数字化以及管理工作实现了信息化的档案馆和档案馆群体;它实质上是一个通过计算机互联网络有序处理和集成管理在结构各异的多种信息平台上产生的、多样化的电子文件、档案以及其他信息。因此,它的任务,在提倡政务信息公开和向整个社会提供现行文件服务的今日,不能如以前的传统档案馆一样,仅仅负责管理“运动到最后阶段藏入档案馆的文件”——档案。因而,数字档案馆馆藏的来源主要应该有以下渠道:

    (1)传统管理的档案目录数据库;

    (2)已经储存在传统档案馆中的传统载体档案文件的数字化;

    (3)在电子政务系统、电子商务系统以及各种业务信息系统中形成的电子文件。

    除第1、2 种渠道的信息资源之外,目前数字档案馆必须面对和加以管理的是大量的、在馆外多种多样结构各异的计算机技术平台中形成的现行电子文件、档案和其他信息资源。这些文件和档案不可能具有统一的结构,有些是非结构化数据(如WORD 文件),有些是结构化数据(如数据库文件),有些又是半结构化数据(如邮件文件),就是说这些电子文件既具有异构性,同时又具有多样性,而且是分布存放在上述结构各异的信息系统平台之中。

    2.3 多元化的建设目标。

    关于数字档案馆的理论研究与实践,国外起步较早,而且发展很快。以欧、美为代表的发达国家从20世纪90年代初就开始从理论和概念上对数字档案馆进行了研究与探讨[3]。以美国为例,20世纪90年代中期,作为美国数字化图书馆建设项目的组成部分,美国国家档案与文件管理局(National Archives and Records Administration,简称NARA)启劝了数字档案馆建设计划,并成立了数字档案馆特别工作小组,开始进行数字档案馆的研究和建设工作,并于2000年建立了数字档案馆系统[4]。据文献分析,国外关于数字档案馆的建设目标主要在于3个方面:首先是保证数字信息的真实性、权威性和完整性;其次是确保数字信息的长久有效性,不因时间的移转、技术的改变而无法持续长久地提供利用;第三,确保每一个公民都有平等使用数字信息的能力和权力[5]。

    除上述3个目标之外,笔者认为,面对复杂的信息环境和多样化的电子文件,数字档案馆还应具有以下目标:

    (1)数字档案馆应具有传统档案辅助管理功能。笔者认为,数字档案馆是从传统档案馆发展而来,因而,数字档案馆必须具有辅助管理传统档案的功能,而且这些管理功能在数字档案馆中应得到极大的优化,使管理更为科学、有效。

    (2)集成管理分布式存储的、具有多样性和异构性的是电子文件。集成(integration)含综合、融合、整合成为整体和一体化的意思,其哲学内涵是指由系统的整体性及系统核心的统摄、凝聚作用而导致的使若干相关部分或因素合成为一个新的统一整体的建构及其有序化过程[6]。对数字档案馆而言,集成可以分为3个层面,即系统集成、数据集成和服务集成。“系统集成”指的是形成、运行、管理、储存和输出电子文件的系统平台相互之间的集成; “数据集成”指的是多样性的电子文件(包括元数据)以及其他信息资源在内的集成。这两种“集成”综合起来又可以称为对电子文件的集成管理,我们认为,它是依托系统的运行特点、模式和目标,以现代IT技术为手段,对系统运行全过程进行的全方位的有效管理。这种管理,具体而言是对多种系统平台以及产生于其中的电子文件——具有分布性、自治性和异构性的电子文件运动全过程施行的,足以保障电子文件真实性的,动态的、有效的和全方位的综合统一管理。

    (3)通过集成管理和建立电子文件实时捕获和共享机制,消除信息孤岛现象,根据特定权限和保密规定有效实现为整个社会提供现行文件服务以及档案信息资源的共享, 并能够为不同类型的用户群体提供有效的档案信息资源服务。

        3. 数字档案馆功能需求

    3.1 根据“前端控制”原则,促进在电子政务系统和各种业务系统中实现电子文件的“档案化”管理,从而在源头确保自己管辖和即将管辖的电子文件的真实性、完整性和有机关联性。

    电子政务的实施势必产生大量的电子文件,档案馆有责任完整地捕获这些电子文件,并确保这些电子文件的真实性、完整性和有机关联性。然而由于电子文件的特性以及所处信息环境的复杂性,按传统档案的收集方法(事后收集)难以确保电子文件的真实性、完整性和有机关联性。根据电子文件管理国际标准ISO15489,对电子文件的管理应该采用“全程管理”原则,保证电子文件在整个生命周期内都能受到档案部门统一、严密的控制。为此必须利用元数据,实现对电子文件的全程管理。具体而言,应该采用“前端控制”原则,在电子政务系统中实现对电子文件的“档案化”管理,也就是说,以元数据为控制工具和采取网络实时捕获等手段,在电子文件形成或处理过程中就确保并且能够证明电子文件的真实性、完整性和有效性。可以说“前端控制”是实现电子文件全程管理的重要保障,是全面、系统、优化思想的集中体现;是确保电子文件真实可靠、完整安全、长期可读的有效策略;也是优化管理功能,提高管理效率的科学理念。

    3.2 传统档案信息资源的数字化。

    传统档案信息资源数字化是数字档案馆的基础,是国家档案信息化的重要组成部分。数字化应包含两个层面的含义,一是指传统档案通过数字化技术(如扫描、OCR技术、多媒体技术等)形成可供网络浏览或检索的数字资源;二是为这些数字资源建立相关的元数据信息。数字档案馆系统必需包含将传统档案信息资源数字化的相关工具。

    3.3 自动实时捕获现行电子文件及其元数据。

    在传统档案管理中,档案馆档案的收藏一般情况下是在它们形成以后10年到20年以后进行的,并且必须采取相关立档单位上交、档案馆接收的模式。档案部门在这种模式中扮演的基本上是一种“事后”以及“被动”的角色。也就是说,只能在文件形成若干时间以后接收;以及如果相关立档单位不交,也就无法接收。然而,把这种模式移植到电子文件管理和数字档案馆建设中,却是无法接受的。这是因为一方面,数字档案馆必须也能向用户提供现行文件服务;另一方面也是因为计算机网络系统的脆弱性,使得数字档案馆无法完全排除来自网络的各种危害;再加上数字信息对系统的依赖性、易逝性和易篡改性等特征,尽管在电子政务中实现了前端控制和档案化管理,也很难保证档案部门在这种事后接收模式中收到的所有电子文件都具有真实性。所以,文件管理国际标准ISO15489规定,档案部门有责任实时主动捕获现行电子文件及其元数据,即在文件正式形成或(立档单位外来收文)收到时就由档案部门捕获,并对其实施统一、严密的控制。国家标准: GB/T 18894-2002(电子文件归档与管理规范)第713款也规定,电子文件的“逻辑归档可实时进行”,国家档案局2003年7月下发的《电子公文归档管理暂行办法》第六条规定电子公文一般应在办理完毕后即时向机关档案部门归档。可以说实时主动捕获电子文件及其元数据是优化档案管理功能和提高管理效率的科学理念,也是实现电子文件“前端控制”和“全程管理”的又一措施。它既有利于保障电子文件的真实性,使档案部门能够在第一时间掌握电子文件的最权威版本,从而对电子文件实施统一严密的控制,同时也打破了传统档案管理被动接收的模式。

    3.4 对分布存储的具有多样性、异构性的电子文件进行集成管理并且确保其长期有效。

    数字档案馆管理的电子文件、档案和其他信息资源,必须采取集中式与分布式相结合的储存方式。集中式储存的一般情况下是需要永久保存的电子档案;分布式储存的则是现行电子文件和不需要进档案馆永久保存的电子档案。有鉴于此,数字档案馆必须大量面对和加以管理的,是在多种多样结构各异的计算机技术平台中形成的电子文件、档案和其他信息资源。它们不仅没有统一的结构,而且具有多样性和异构性、甚至是复合的文件并且分布存放在上述结构各异的信息系统平台之中。为此,数字档案馆系统必须能够支持对分布存放在外部多种异构信息系统平台中和集中存放在数字档案馆自身存储器中的数字对象的集成管理。

    所谓长期有效性是指电子文件在整个生命周期中都能够有效利用和阅读。为应对电子文件的“范式转换”(软硬件环境的升级换代),数字档案馆系统应能支持两种存储模式;“位”存储和“功能”存储。位存储保证电子文件没有任何改变,即每一位(bit)均保持原样。功能存储的实现是通过随着时间的变化改变存储内容的格式,以保证当旧有格式淘汰后,电子文件还能够被随时调用(可浏览、可运行、可检索等),即保证电子文件的长期有效性。对于档案馆而言,位存储保证了电子文件的原始性,而功能存储则是保障电子文件长效性的理想的存储状态。

    3.5 对档案信息资源进行深层次开发利用。

    档案信息资源的深层次开发利用是档案馆面临的一项重要工作。数字档案馆除了必须具备对档案信息资源进行组织分类、标识和统一检索的功能之外,还应具备强有力的、能够建设专题档案信息资源库和进行管理的编研工具。

    3.6 对电子文件保管处置的业务流程进行智能化处理。

    档案保管处置是档案馆的日常工作。在传统档案管理中,档案的保管处置是被动进行的,工作人员必须亲自查询(哪些档案保管期限或者保密期限已经届满等等……),否则很难详细完整地了解档案保管处置的实际状况,以便及时进行处置。为应对这个问题,在数字档案馆系统中,必须实现对电子文件保管处置业务流程智能化处理的功能,即由系统自动判别并形成档案保管处置工作任务和自动发送消息通知工作人员进行相应的处置。

    3.7 实现对分布式、异构信息资源的跨库检索。

    由于数字档案馆处理和集成的电子文件、档案具有分布性、异构性和多样性,这就要求数字档案馆系统本身具有高度的可扩展性。由于这些信息资源分布在不同的数据库中,而且这些数据库具有分布性和异构性,对实现档案信息资源的共享利用带来了极大的障碍,因而跨库检索极为必要。

    3.8 以用户为中心的网络信息服务。

    为用户服务是建设数字档案馆的目的,为此必须根据档案信息化建设的要求,采取以用户为中心的网络信息服务模式,对用户群体进行分类,针对不同的用户提供不同的网络信息服务。

    3.9 建立完善的数字档案馆安全保障体系。

    安全保障体系是数字档案馆正常运行的关键环节,可以划分为4 个部分:第一,为切实保证保密文件和档案的绝对安全,从物理上区隔保密网、内部网和公众网是完全必要的。数字档案馆系统必须适应这一要求,并且在确保所有保密文件绝对安全可靠的前提条件下集成管理3个网上所有电子文件和档案的机制。第二,确保数字档案馆系统和各种档案信息资源内容的安全可靠。由于网络技术、数字化技术的快速发展与广泛应用,以及病毒与黑客的泛滥,网络特别是互联网已被视为“最不安全”的区域。为保障档案信息的真实性、完整性、可靠性、可用性,防范病毒与黑客的攻击,成为数字档案馆安全保障体系建设应首先考虑的问题。第三,应该能确保恰当的档案信息资源在恰当的时间和地点内传递给恰当的用户使用。档案馆与其他信息部门(如图书馆)有较大的差异,其保管的档案信息资源并非完全对外公开,而是具有相应的密级。事实上我国大多数档案信息是不对外公开的,因此如何保障这些档案信息的机密性,并且可以实现“有向”服务,设置各种级别的利用权限,使恰当的档案信息资源在恰当的时间和地点内传递给恰当的用户使用,也成为安全保障体系建设应考虑的重要问题。第四,在档案信息化实践中,虽然对数字档案馆采取众多的安全措施,但仍难免因各种原因出现故障导致档案信息的严重破坏,其严重程度不亚于前两个问题,而解决这一问题的最好方法则是数据维护、数据备份,因此建立完善的数据备份和恢复机制是数字档案馆安全保障体系建设的另外一个重要问题。

    4 结束语

    随着社会信息化成为国家现代化建设的战略举措,加强档案信息化建设,是档案事业发展的必然选择。在全国掀起的档案信息化浪潮中,“数字档案馆”建设实已成为我国档案事业发展的战略目标。目前,我国已有多个地区实施了数字档案馆工程,其中较有影响的有深圳数字档案馆工程、青岛数字档案馆建设项目、萧山数字档案馆建设项目,这3个项目的建设模式分别称为深圳模式、青岛模式和萧山模式。然而根据我们的调研和分析,由于我国理论研究和相关标准规范的滞后,大多数数字档案馆项目建设仍处于“数字化档案馆”建设阶段,通常以档案目录数据库建设为核心,对部分数字档案信息资源进行了收集、管理、有选择地对部分档案信息进行了数字化,并通过互联网络提供档案信息资源的利用,其主要作用是实现了档案信息资源管理和信息利用,而在集成管理分布式存储的、具有多样性和异构性的电子文件、保障档案数字信息的真实性、完整性、持久有效性和信息利用的平等性等方面却涉足不深。因此,希望本文所探讨的数字档案馆功能需求能为今后数字档案馆建设起到参考作用。尽管如此,笔者认为上述项目的启动已为我国数字档案馆的研究开创了新局面,标志着我国档案信息化建设全面提速。

参考文献:


[1] 黄志文:《我国数字档案馆研究评述》,《上海档案》2002年第2期。

[2] 何嘉荪:《保存电子文件背景信息的重要手段——再论全宗、案卷形态的异化》,《档案学通讯》2001年第5期。

[3] 杨公之:《档案信息化建设实务》,中国档案出版社2003年版。

[4] NARA(National Archives a nd Records Administration) ,ht tp :/ / www. a rchive s. gov/ .

[5] A Comprehensive Assessment of Public Information Dissemination (U . S. National Commissio non Lilbraries and Information Science,final report,Volume 1,January 26 ,2001)

[6] 李宝山、刘志伟:《集成管理———高科技时代的管理创新》,中国人民大学出版社1998年版,第32~38页。

文章来源: 《档案学研究》 作者:金更达 何达多 何嘉荪

                                                  
相关阅读
发表评论
0评