本文对当前国际上电子档案著录的发展现状进行了深入分析,针对其局限性,结合新近面世的编码档案背景信息著录(Encoded Archival Context,EAC)标准提出了若干电子档案著录新理念,同时指明了我国电子档案著录的发展方向。
《国际档案著录规则(总则)》(General International Standard Archival Description,ISAD[G])将档案著录定义为:“通过捕获、核对、分析和组织有助于确认档案及说明其背景和产生该档案的文件系统的各种信息这一过程,形成对所描述单位及其构成部分的准确表述。”①综观国内外多部档案著录规则,笔者发现,现代档案著录工作一直都是以档案整理为基础,在来源原则指导下以分级著录方式进行的。此种著录方式在各国长期的档案工作实践中得到了检验,具有很强的科学性,具体来说,可以归纳为以下几方面准则:
(1)来源原则
来源原则是国际档案界公认的档案工作基本原则,它在著录工作中的具体作用是,档案著录必须含有关于档案文件来源和背景的信息。这一原则反映了档案的本质特征和性质,将档案著录与图书等其他信息资源的著录区别开来。
(2)尊重全宗
这一准则是来源原则的进一步引申,在档案整理与著录实践中,同一全宗的档案不得分散,不同全宗的档案不得混淆。其实质是为了保持档案的来源联系及其真实准确地还原历史原貌的能力。需要指出的是,某些联系密切但来源不同的档案仍然可以进行联合著录,只要著录时在总体上使具有相同来源的档案得到集中反映即可。
(3)分级著录
分级著录要满足以下几个条件:②
①档案著录应表现为一种分级的、从整体到部分的关系,即从对整个馆藏的总体性著录逐步细化到对馆藏各组成部分的更加具体的著录。
②档案著录可以延伸到各个层级,也可以在任一层上终止。例如,档案工作者可以根据档案材料的实际情况以及用户的需求来决定著录的细节程度。
③著录信息应与其所处层级相一致。例如,当描述材料的生成者是某机构的下属部门或分支机构时不应将它的历史状况著录在全宗级,因为全宗层级负责提供的是整个机构的行政史。
④在最高层级著录馆藏各组成部分的共有信息。不要在较低层级上重复那些已经在高层级中提供过的信息。
⑤为了明确某个著录层级在整个分级体系中的位置,应把每个著录层级都嵌套在它的上一级之中,并加以固定标识。
电子档案著录是档案信息资源著录的一种具体形态,它们之间是部分与整体的关系,所以电子档案著录也应该服从来源原则、尊重全宗和分级著录这些档案著录一般准则。与此同时,电子档案著录又有其特殊性,编码档案著录(Encoded Archival Description,EAD)这一电子档案著录标准正是为满足这种特殊性而制定的。③
EAD起源于1993年伯克利检索工具项目(Berkeley Find Aid Project,BFAP),是一种元数据结构标准,具有良好的兼容性,可与MARC及ISAD[G]等国际标准配合使用。它规定了描述数字档案信息资源的统一结构和语义,可以使档案文献以与平台无关的方式被检索、显示和交换,从而为世界范围内数字档案信息资源的无障碍交流与共享提供了基础性保障。
最新版本的EAD以可扩展标识语言(eXtensible Markup Language,XML)为编码标准,由EAD文件类型定义、EAD标签库、使用指南和实施概要4部分组成,共含146个元素,能多角度地揭示档案信息资源的内容和结构特点。
EAD通过先对馆藏单位(如全宗)进行整体著录,再对其各级组成部分进行更加具体的著录这样一种方式为档案提供元数据,使元数据得到了分级,并形成了一种从整体到部分的关系。同时,其灵活的结构,还允许著录人员根据实际情况使用各种著录层级,具体操作中应用到的层级数取决于著录材料排列的复杂度以及编制人员对检索工具提供档案材料细节程度的期望。
综观以上功能与特点,EAD能够满足来源原则、尊重全宗和分级著录的要求,在保持档案来源联系的同时深入地揭示档案信息资源,实现电子档案著录的功能和目的。历经Alpha版、Beta版、1.0版及目前2002版的发展与演进,EAD已成为了在世界范围内获得广泛应用的电子档案著录标准。
当前的电子档案著录工作虽有以上准则和标准提供理论上的指导和实践上的保证,但仍存在一些局限性:
(1)未能突出档案来源信息的重要性
来源原则要求档案著录必须含有关于档案文件来源及背景的信息。美国档案著录标准化研究工作组于1989年指出,档案著录信息应能解释档案的背景以及产生档案的文件系统。④美国档案学者佛来觉·米勒在其专著《档案及手稿的整理与著录》中提到,档案著录信息应包括:文件的原文、背景和来源、文件的文档结构、文件的格式和内容、文件之间的相互关系以及如何查找与利用的方式。⑤我国学者张正强认为,现代档案著录 “不仅仅局限于档案本身,而扩展到产生和使用档案的背景信息及产生档案的系统(或文档系统)信息。”⑥可见,中外档案界一致认为描述档案来源的背景信息在现代档案著录中占有至关重要的地位。然而当前的电子档案著录标准并没有给予其足够的重视,例如,EAD仅以元素<来源>(<Origination>)描述档案材料进馆前负责创建、积累和保管这些材料的组织或个人,未能突出档案来源信息的重要性。
(2)未能充分反映事物间的相互联系
任何事物都不是孤立存在的,而是相互联系的。简要来说,档案文件生成者与其他生成者、组织行为及职能、档案文件等之间均存在联系。如何在档案著录活动中充分体现这些联系,以增强档案信息资源真实完整地还原历史事实的能力,一直是档案著录实践中有待解决的难题。例如,EAD以<参考资料>(<Ref>)及<相关资料>(<Relatedmaterial>)等元素指向或描述检索工具内外的相关资源,在著录信息内部存储这些关联信息,虽然客观上描述档案的部分关联信息,但并未全面地反映事物间的相互联系。
(3)未能实现资源共享的全部价值
对大多数档案文件来说,确定其来源是比较容易的,但也有档案文件具有多个机构(或个人)组成的联合来源,同一来源的档案文件被分散开来的情况也时有发生。现有的著录体系需要在多份著录文件或检索工具中多次重复同样的生成者及背景信息(也可能包括关联信息),属于对网络环境提供的共享能力的浪费,也是对档案信息资源的一种浪费。例如,我国国家档案局中央档案馆办公室2008年3月颁布的《电子文件元数据标准(征求意见稿)》就明显存在这些不足。⑦同时,若对某一处著录错误的更正又可能会导致多家档案机构中多份著录信息的更新,进而造成信息建设中大量人力、资金及时间上不必要的消耗。
为了克服以上局限,国际档案界进行了一系列的探索。其间,人们意识到,背景信息著录可以使档案的获取和理解变得更加容易,是电子档案著录整体中不可分割的重要组成部分,制定电子档案背景信息著录标准应该有助于解决上述问题。
通过国际档案协会的努力,一种新的电子档案背景信息著录标准——编码档案背景信息著录(Encoded Archival Context,EAC)得以在近期面世,它是一种基于XML来对档案背景信息进行编码著录的标准。⑧EAC的制定起源于1993年开始的由国际档案理事会(ICA)著录标准特别委员会支持制定的《组织机构、个人及家庭著录的国际标准》(International Standard Archival Authority Record for Corporate Bodies, Persons and Families,ISAAR[CPF])。1998年,多伦多大学的文迪·达夫(Wendy Duff)和耶鲁大学的理查德·扎利(Richard Szary)正式提出了应制定一种档案背景信息著录编码标准。⑨其后,在美国数字图书馆联盟的支持下,他们于1999年至2001年间举行了三次会议,与其他档案著录专家及技术人员一道开始了有关EAC的研究。目前EAC的发展还处于初级阶段,通过广大档案工作者的努力,EAC DTD Alpha版即将面世。
按照其临时版本的规定,每个EAC文件包括两个部分:<EAC头标>(<Eacheader>)和<环境描述>(<Condesc>)。<Eacheader>提供背景描述,<Condesc>则包含生成者描述。<Eacheader>和<Condesc>还包括一些必需的或可选的子元素。每个元素又可包含一些属性,如<Eacheader>含有的属性包括创作者类型(Type):个人、团体或家庭;版本(Status):草稿、正本或废稿等。
EAC与EAD采用相同的编码语言,二者可以实现充分兼容,将EAC作为EAD的延伸及扩展与其配合使用,可以使电子档案的著录标准更趋完善。
根据电子档案著录的特殊性及EAC等著录标准带给我们的启示,可以得出下列电子档案著录新理念。
(1)独立著录背景信息
档案文件具有法律凭证和历史凭证的双重功能,所以其生成过程中的背景信息是至关重要的。为了鉴定、理解和诠释档案文件,用户需要了解这些档案文件在其生成和使用过程中所处的环境。背景信息恰能确定档案的生成者、记录它们使用过的名称、描述它们的主要功能、行为、特点及发挥效力的时间和地点,从而满足用户的信息需求、实现档案信息资源的功能和价值。
以往背景信息的著录一直作为整个档案文件著录的一个下属部分而存在,其重要性未能得到应有的突出。网络环境下电子档案的出现,为独立的背景信息著录提供了可能。如果能够将档案文件的背景信息析取出来、单独著录,具有相同来源的档案文件就可以“共享”这些背景信息。如此一来,微观层面上,可以允许用户利用背景信息批量地选取自己所需的档案文件,无须再逐一阅读每份文件的内容,从而节省大量的时间和精力;宏观层面上,通过对背景信息和档案文件之间对应关系的利用,可以使其发挥出档案信息门户的作用,进而能够促进机构、行业、国家乃至世界范围内档案信息资源共享数据库的建立。
EAC充分突出了档案背景信息的重要性,它所提供的语义及结构标准,使背景信息的精确表达变得更加容易,还可以对生成者实体进行唯一标识,以防止由于生成者使用不同名称生成档案所造成的混淆。此外,它对生成者实体重要特征信息的描述,也进一步增加了档案文件的检索点,从而可以帮助实现档案信息资源的导航。这一专门的电子档案背景信息著录标准为背景信息的独立著录提供了坚实的基础。
(2)建立动态关联信息
作为档案著录的一个组成部分,背景信息著录必须与其他组成部分建立联系,一定要与对应的档案文件建立联系,同时也要与生成者行使的职能和生成了该份档案文件的行为之间建立联系。需要注意的是,这些联系应是独立的、动态的,可以被更改、添加或删除。除了极为特殊的情况,联系都是产生于实体之间而非实体内部。因此,每一份关于档案文件、生成者或是组织职能及行为的著录信息都可以看做是广泛联系网中的一个节点。在这些节点之间建立并独立保存动态的关联信息可以更加深刻地揭示档案信息资源的本质内容及特点,同时大大简化了信息更新的复杂性,使得整个著录体系更具效率。
EAC提供了三种描述各类联系的元素:<生成者关联群>(<Eacrels>)描述的是背景信息中有关生成者的联系;<信息资源关联群>(<Resourcerels>)描述的是背景信息中有关其他信息资源的联系;<职能及行为关联群>(<Funactrels>)描述的是背景信息中有关组织行为及职能的联系。元素<Eacrels>还可包含<生成者关联>(<Eacrel>)、<原始材料关联群>(<Sourcerefs>)、<原始材料关联>(<Sourceref>)、<附注群>(<Notes>)或是<附注>(<Note>)等子元素来保存那些描述联系本身的信息资源。<Resourcerels>与<Funactrels>也具有相似的结构。
利用EAC中这些“关联著录元素”可以实现背景信息著录与其他各类信息资源的链接,从而可以在档案著录中充分体现事物之间的相互联系。
(3)充分共享著录信息
计算机及网络通讯技术的发展为档案信息资源的交流与共享提供了前所未有的便利条件,然而,如上文所述,当前电子档案著录体系中对背景信息的共享并不充分。实际上,具有相同来源的档案文件经常分散存储在不同的档案保管机构内,对电子档案背景信息的著录往往又是一个耗费巨大时间、人力及财力的过程。若能实现档案背景信息的充分共享,档案保管机构就可以通过网络共用这些背景信息,从而分摊著录成本。
EAC为背景信息著录提供了统一的语义和结构,从而为电子档案背景信息的广泛交流共享提供了一个平台。
进一步讲,不单单是档案背景信息,对所有著录信息中具有相同或相似特质的内容都可以而且应该实施共享。如此,才能够完全发挥出网络环境下信息交换的便捷性,才能使整个著录系统及档案管理系统更加高效。
我国于1985年颁布了国家标准《GB/T3792.5-85 档案著录规则》,并于1999年对其进行了修订。该标准主要是针对传统手工环境下的纸质档案著录而设计的,没有全宗级别的著录项目,只适用于案卷或文件等低级别的著录,也没能体现分级著录的思想,更无法满足电子档案著录的要求。⑩为此,我国于2006年颁布了《GB/T20163-2006 中国档案机读目录格式》,这一国家标准弥补了《档案著录规则》的种种缺陷,结束了以前我国档案计算机机读目录格式上的无序局面,并从机读目录方面为我国档案信息化建设提供了一个可靠的与国际及国家标准相适应的标准化基础。但实际上,手工著录——机读目录格式——档案置标著录是档案著录现代化的不同发展阶段。机读目录只是由传统纸质档案手工著录向现代电子档案著录的一个过渡。
目前我国并没有相应的电子档案置标著录正式标准出台,为了加快档案著录现代化的发展进程,我国应在深入研究档案信息化理论和技术的基础上遵照电子档案著录准则抓紧制定自己的电子档案置标著录标准,在制定标准的同时,应注意对国外同类标准的借鉴以及与ISAD[G]、ISAAR[CPF]、EAD及EAC等国际上通用标准的兼容,在结合本国实际情况与需求的同时注重对上述新理念的体现以弥补当前的不足,少走弯路。
各国档案学者的不断努力,成功地推动了电子档案著录现代化的发展,然而由于种种限制因素的影响,当前电子档案著录在理论和实践方面依然存在一定的局限性,我国的档案著录现代化进程更是停留在手工著录及机读目录格式标准化阶段。如今EAD及EAC等档案著录相关标准的制定与实践研究为我们提供了很好的范本和诸多启示,相信其中独立著录背景信息、建立动态关联信息以及充分共享著录信息的理念定能进一步促进我国乃至世界范围内档案著录整体的完善。
The authors have declared that no competing interests exist.