, 2008, 22(5): 54-57
新思路:档案信息网格构建方案
裴友泉
合肥市,合肥师范学院,邮编:230061
 引用本文:
裴友泉. 新思路:档案信息网格构建方案[J]. , 2008, 22(5): 54-57.

摘要:

无数事实告诉我们,档案工作也要高度重视新技术的应用,任何对科学技术的傲慢与无知,都可能造成无法弥补的损失。档案信息传递中的网格技术实际应用问题,应该引起我们的特别关注。本文提出档案信息网格及其构建的新思路,并给出技术方案等相关研究成果,同时对档案信息网格研究的立项等问题提出了建议。

关键词: 新思路 ; 档案信息网格 ; 构建 ; 方案

Abstract:

The management of archives attaches much importance to the use of new technologies, as we are constantly reminded of by innumerable facts. Any ignorance or arrogance to science and technology would bring lost beyond repair. The utilization of grid technology in transfer of archives information requires special attention. The essay puts forward archives information grid and new thoughts on its construction scheme, gives some related research achievements on archives information grid such as technologic schemes, and also makes proposals on the establishment of research projects on archives information grid.

一、 网格技术研究的回望

思路决定出路,技术推动发展。网格新技术的实际应用不仅直接关系到当前的国家档案信息资源整合与管理机制改革,同时还深刻地影响着国家信息化发展战略的实施。因此,我们对档案信息传递中的网格技术应用问题,进行了3年多的研究。此处,提出一些技术思路并给出档案信息网格构建方案等相关研究成果,请档案同仁多予关注,亦请计算机专家多提改进意见。

首先,为全面了解我国网格技术发展趋势、避免重复研究,有必要回望一下已走过的路。

1999年~2000年,国家863计划实施了国家高性能计算环境重点项目,建立了由5个高性能计算中心构成的国家高性能计算环境,形成了网格的雏形。

在国家863计划中把高性能计算和网格作为重要的研究方向,进一步设立了“高性能计算机及其核心软件”重大专项。该项目历时4年(2002年~2005年),国内有23家单位、700多名研究人员参加,在网格环境、网格软件和网格应用等几个方面,完成了一批重要的研究课题,中国国家网格的建立和应用是该重大专项研究成果的集中体现。

我们看到,中国国家网格不仅像美、欧网格那样支持科学研究,而且还强调了对多领域应用的支持。这些领域应用不仅需要高性能计算能力,而且需要对异地、异构数据的访问、交换和处理。中国国家网格正是希望通过对各类应用系统的支持,体现网格作为新型基础设施的支撑作用,以新的理念和方法,指导信息化应用系统的规划、部署和集成。显然,这是我国立足于国情,力争赶超国际水平的具有自己特色的高起点。

目前,中国国家网格以中科院计算机网络信息中心结点、上海超算中心结点、清华大学结点、华中科技大学结点、中国科技大学结点、北京应用物理与计算技术研究所结点、中科院深圳先进技术研究院结点、山东大学结点、西安交通大学结点、香港大学结点等分布在全国的10个网格结点为主体构成,集成了分布在全国8个省市10个网格结点上的计算、存储、软件和应用服务等多种资源,包括重大专项研制的曙光4000A和联想高性能计算机及其他高性能计算系统。依托国家网格环境开发和集成了100多个工具软件和应用软件,向全国的科学研究用户和行业用户提供了开放共享的高性能计算和数据处理等多种服务,为我国的科学研究和信息化建设提供了新型的环境和平台。

这里值得档案工作者特别关注的是,网格技术应用在我国的许多领域和行业实现了突破。中国国家网格遵循以网格技术支持多领域应用的思想,以行业信息化应用为突破口,在资源环境、科学研究、服务业和制造业等4个领域,第一期成功地研制了航空制造应用网格、中国气象应用网格、科学数据应用网格、新药发现应用网格、生物信息应用网格、数字林业应用网格、仿真网格、油气地震勘探应用网格及交通信息服务应用网格等10个重要的行业应用网格。第二期的应用网格是:中国气象应用网格、水利应用网格、天体大规模并行数值计算软件平台、中医药数据网格、高性能计算化学应用系统、药物研发网格、基于网格的铁路货运信息综合应用系统及科学数据网格。

这样的形势,对于作为国家信息资源基础的档案部门来说,应该如何应对呢?笔者认为,虽然档案部门存在着信息技术人员短缺的客观情况,但我们千万不能以此为由,错过档案事业发展的历史机遇,要主动参与和融入网格技术研究。在时间紧任务重的情况下,果断借调技术人员对口解决技术难题,是比较实际可行的办法。西方国家许多知名的档案学者都是非档案学专业出身的,而我国却很少有档案界以外的学者关注档案学问题。所以从现在起,我们就应该强调档案学科的技术创新宣传,以此牵引其它学科的科研力量加盟档案学科的研究。

无数事实告诉我们,档案工作也要高度重视新技术的应用,任何对科学技术的傲慢与无知,都可能造成无法弥补的损失。网格技术带给档案工作的不仅是新技术学习上的困难,更多的是发展机遇。

二、关于档案信息网格构建的新思路

随着我国信息化建设的深入,档案信息资源的核心地位得到越来越广泛的认同。然而让有关专家深感忧虑是,在电子文件的管理上已经出现了灾难前兆——信息孤岛显露出了冰山一角。目前,我国政府机关电子文件存在着“有人办,无人管”的现象,政府机构中有多少个部委办就可能有多少个信息系统,每个信息系统都有自己的数据库、自己的应用软件,各自为政、不联不通,政府大小部门间最终形成了一个个信息孤岛,隔断了部门业务上的内在联系,致使丰富的信息资源难以得到共享。如何解决这些难题?在网络环境下长期工作的我们,终于想到了网格,并由此产生出了一些设想。

思路一:

与因特网相比,网格的优势显而易见。第一,网格比因特网具有更宽的带宽;第二,网格的体系结构将比因特网更能有效地利用资源;第三,因特网上信息垃圾成堆,网格将有效地解决此问题;第四,网格不再像因特网那样有数百万个网站让用户自己苦苦寻找,它可以提供极为方便的服务。

由网格的技术特性,我们可以将它假设为一个规模巨大的超级计算机。无论它覆盖了多大区域,连接了多少万台电脑,在逻辑上它仍只像“一台”计算机。因此我们设想,在这台巨型计算机中可以方便地实现资源共享,消灭信息孤岛,全面提高我国档案信息化应用水平,为电子政务的畅通提供源源不断的需求信息。在网格环境下,上述政府部门间信息交流通畅,偷税漏税、造假售假将被记录在案,难逃应有的惩罚。

思路二:

网格与因特网最大的区别在于智能化,其中包括使用方便、界面一致、“积极主动”等特性。用户输入和操作可以很少,但获得的服务却非常灵活,且极具个性化。从信息存储到用户的浏览服务,网格为用户提供集成一体的方案。它不需要程序员进行二次开发,只需要做简单的配置,就可建立服务平台,电子档案的查阅者只需“一键就能解决问题”。

假定某位市民驾车外出,无意中违反了交通规则,通常他只能被动地等待警察的处罚。然而在网格环镜下,该市民将不再被动。他只需拿出具有关联应用功能的手机,输入“交通事故”,手机屏幕上就会立即出现应急办法,同时还会高亮显示“法律顾问”等关联词语,并可获得一系列与该主题相关的电子档案页面。让他真正体会到“法律面前人人平等”不是一句空话,“公平、公正”才是和谐社会的新风尚。

思路三:

由于网格的互操作技术远远好于因特网,将为人们带来了极大的方便。互操作技术主要解决不同地理位置的异构系统之间的互操作问题,以确保来自不同地方的电子档案信息选择最近的途径,及时发送到有信息使用权限的用户手中。

假如要用电子邮件的形式发给张某所要求复制的档案,目前网上通行的方式是必须键入张某的邮箱地址,但不知道张某是否已经变动了地址,最后能否收到。如果在网格环境下,事情就好办多了。只要输入“张某”,网格就会根据它所掌握的你与张某的情况,自动判断是哪一个张某,以及是不是最新的邮箱地址,瞬间就能准确地把你所要发的邮件送到张某处,让查档变得更加轻松和快捷。

三、关于档案信息网格构建的技术方案

基于上述思路,本文给出构建档案信息网格的技术方案如下。

(一)档案信息网格的主要技术指标

在网格环境下,人们不仅可以向网格发出请求信息资源消息,由网格接收请求并做出响应,而且客户提出的请求能够同时驱动多个信息资源工作。多个请求可以向多个服务器请求连接。客户程序资源可以被其他客户请求作为资源使用。网格的目的是无论地理位置的远近、设备类型的异同,都可以为用户提供统一且简单的共享网格资源的环境。为达到网格的目的,首先需要建立相应的网格体系结构。对我国档案工作现状而言,网格体系结构的主要技术指标则要求:

1、由于目前我国电子档案存放在不同地点、不同管理域的节点,因此实现异构设备间的合作和转换是首要问题。

2、电子档案及相关信息资源总是在增加,要在信息资源规模不断扩大、应用需求不断增长的情况下,不降低性能,网格必须具备可扩展性。

3、信息资源提供者和信息资源使用者可能毫无关联,要建立他们之间的信赖关系,在资源共享的同时保护他们的机密和利益,就需要网格计算的绝对安全。由于现在的互联网结构并不是针对网格计算设计的,为了使网格计算和现有的结构兼容,一个可扩展的中间件是必需的,也就是基于操作系统之上的网格管理软件。

4、由于网格规模巨大,某一资源出现故障或失败的可能性较高,资源管理必须能动态监视和管理,从可利用的资源中选取最佳资源服务,所以要考虑其动态自适应性。

(二)档案信息网格的体系结构

根据上述4点技术要求,本文提出由网格资源层、网格中间件服务层和网格应用层等构成档案信息网格的三层体系结构。其中:

1、网格资源层由分布在Internet上的各类资源组成,包括各类主机、工作站,它们是异构的,可以放置在不同地点,可以运行在Unix、NT等各种操作系统下,也可以是上述机型的机群系统、大型存储设备、数据库或其他设备(涵盖目前各单位能上网的信息与电子档案数据库)。

2、网格中间件服务层包括一系列工具和协议软件。其功能是屏蔽网格资源层中异构资源的差异和地理上的分布性,管理分布的计算、储存、网络等资源,提供实现应用之间的可交互性和互操作性,包括电子档案使用者登录、安全和服务质量控制,提供必要的网格信息供网格浏览器查找所需资源,向网格应用层提供透明、一致的使用接口。

3、网格应用层是网格上用户的应用程序。用户对网格系统提出自己的要求,包括所需资源和相关信息,如索取资料条件、时间限制等。网格应用层是用户需求的具体体现,在网格操作系统的支持下,网格用户可以使用其提供的工具或环境开发出各种应用系统。

(三)XML语言的应用

目前网格上最常用的数据交换表示形式中最重要和最常用的就是XML。XML是Extensible Markup Language的缩写,实际上是Web上表示结构化信息的一种标准文本格式,它没有复杂的语法和包罗万象的数据定义,允许文档制作人员创建新的标记,以便更准确地描述数据。XML几乎可以描述所有领域的数据,它用严格的嵌套标记表示数据信息,适合在国际互联网的多点数据交换环境下使用。

我们选择XML语言的主要想法有2点:

一是因为它特别适合网格在档案信息传递中的实际应用。XML搜索是明确的、无二义性的,但我们仍然需要注意的是,在交换保密信息时,发信方及收信方必须建立安全的通信机制。为确保安全性,在使用XML交换数据时,需要在数据上使用加密及签名技术。

二是因为目前我国的国家标准(GB/T 19667)规定了基于XML的电子公文的通用要求和基本原则。它立足于我国各级党政机关电子公文处理的需要,广泛借鉴现有的国内外相关标准,应用XML及其相关技术,制定了一套科学实用的“基于XML的电子公文格式规范”。该标准适用于党政机关制发的基于XML的电子公文,其他机关电子公文亦可参照执行。

在网格环境下,由于XML文档的结构化和可读性,XML数据可以作为公文或流程数据,以合作的形式流转,因此需要用加密和签名来保证基于XML的数据交换活动中信息的安全性。XML语言的安全是网格上信息交换的基础,为保障XML数据交换的安全性,国际标准化组织W3C提出了一系列XML安全服务的新标准,为以XML作为数据交换载体的应用提供安全性保障。这些标准包括:XML加密(XML Encryption)、XML数字签名(XML Sigllature)、XML密钥管理规范(XKMS)、XML访问控制标记语言(XACML)等。

(四)档案信息网格的标准

在网络环境下,我们已经深受信息孤岛之害,所以一些同志对标准和资源共享问题十分敏感。而在网格环境下,这种考虑依然是非常必要的。现实的情况不断地提醒我们,属于不同组织的、安放于不同位置的信息资源构成了目前的异质资源集合。如果没有通用的架构和互操作性协议,不同供应商的解决方案就不会实现相互对话,从而形成新的、孤立的“网格孤岛”。处理多样性是一项复杂的工作,通过采纳标准可减轻其复杂性。如果标准得到广泛的接纳,会对互操作、客户灵活性和可选范围等产生推动作用,从而直接提高档案信息网格的高效利用。

因此,档案信息网格要想走向实用,必须建立一个大家共同遵守的有效标准,只有这样,才能完成已有系统的网格化改造,才能将新开发出来的系统方便地融入到已有的网格系统之中,避免由于标准不一而造成的效率、性能、共享等方面的问题。迄今为止,网格计算还没有正式的标准,但在核心技术上,相关机构与企业已达成一致:由美国Argonne国家实验室与南加州大学信息科学学院(ISI)合作开发的Globus Toolkit已成为网格计算事实上的标准。

此处需要特别说明的是,本文所给出的档案信息网格技术方案,已经考虑了Globus 的相关标准。

四、关于档案信息网格的立项建议

电子技术的飞速发展,已经改变并正在继续改变人们的生活,同样也不可避免地要影响到各学科的探索与创新。档案学的基础理论和现代技术在揉合、撞击中,正在裂变、呼唤着新的研究模式的诞生。档案学理论与相关信息学科理论的相互交叉、借鉴乃至融合是不可避免的,档案信息网格要走向实用,就要走多学科联合研究的道路。

一般情况下,人们总是通过项目的科研来为大面积推广提供经验和数据的,以上档案信息网格的设想与技术方案也应该通过必要的项目来实施。对于此项新技术的研究,我们应下决心及早投资。据悉,美国政府近十年来,累计用于网格的基础研究经费已近5亿美元。美国军方更为积极。美国国防部已在规划实施一个宏大的网格计划,叫做“全球信息网格”(Global Information Grid),预计在2020年完成。

档案信息网格的立项研究,既要考虑信息资源共享,又要考虑国家信息资源的战略安全,所以首先要尽快从国家信息化的角度对其进行研究。这比等全国档案信息化建设到一定程度,再回过头来研究档案信息网格要节省开支,而这种节省又往往是惊人的数字!此外,网格计算走向实用还存在着一些关键的技术问题有待解决,比如网格资源的有效管理、网格自由而有序的运行秩序以及网格安全等等。因此,笔者以十分焦急的心情建议档案科研管理部门:务必在进行项目规划的时候,对档案信息网格的研究和实施给予充分考虑。

我们知道,目前国家正在启动“金档工程”等大型攻关项目,对档案信息网格研究和实施来说,这是一个不可错失的大好时机,如果档案信息网格的研究能与“金档工程”实现对接,不仅将为国家节省大量人力、物力,还将深刻地影响当前国家档案信息资源整合与管理机制改革。因为,档案信息资源整合与管理机制改革,是为了档案更好地利用,而档案信息网格的强项,正是让档案信息的社会化利用更加安全、方便。

The authors have declared that no competing interests exist.

参考文献

[1]
1、中国网格:《关于CNGRID》.
URL
[2]
2、陈玉华、 黄凯锋:《利用网格技术实现GIS的资源共享》,《计算机与数字工程》2007年第8期.
[3]
3、吴家菊等:《基于XML的信息集成研究》,《计算机工程与设计》2007年第20期.
[4]
4、李晓明:《基于XML/HTTP架构的数据通信安全技术研究》,《通信与信息技术》2007年第5期.
[5]
5、Miguel Rio, Andrea di Donato, Frank Saka, Nicola Pezzi, Richard Smith, Saleem Bhatti, Peter Clarke: Quality of Service Networking for High Performance Grid Applications, Journal of Grid Computing Volume 1, Number 4 /2003年12月.
Resource
PDF downloaded times    
RichHTML read times    
Abstract viewed times    

Share
Export

External search by key words
新思路     
档案信息网格     
构建     
方案     


External search by authors
裴友泉     


Related articles(if any):