目前正在兴起的云计算技术给数字档案馆的建设带来了新机遇、提供了新思路。云计算模式能够对分散的、异构系统中的档案数字资源、计算资源进行有效集成和共享,开发新型的存储与计算共享架构,能够建立起区域内联动的运行机制。 基于对相关问题的分析和研究成果,本文提出了区域性数字档案馆的理念,明确了云计算是区域性数字档案馆建设的实现路径,阐述了区域性数字档案馆的建设思路、原则,并分析了区域性数字档案馆的基础架构、运行场景及运行机制。 云环境下的区域性数字档案馆建设的必要性 1.区域性数字档案馆的含义 区域性数字档案馆是在目前建设的单体数字档案馆基础上提出的,是指通过运用云计算技术等各种现代信息技术,将一定区域范围内的处于分散、异构系统中的档案数字资源完整收集、妥善管理、长久保存,将各类型档案信息系统有效整合,通过集中与分布相结合的信息生成与网络共享系统,提供不同层次的利用和服务的档案信息综合管理系统。 区域性数字档案馆的建设,可由某一区域内级别最高且综合实力最强的综合档案馆作为主要建设者,以发展的视角来制定区域内数字档案馆的战略规划和建设目标,对整体架构、规范标准进行统筹设计和实施;区域内各级档案馆、档案室作为区域性数字档案馆的用户,可以按不同权限级别便捷地使用各种设施,包括档案数字资源综合管理系统;系统通过统一的规范标准、运行机制、运维管理、安全保护等来保障运行,以达到区域性数字档案馆内成员协作共享、优化整合,合理保护与使用档案数字资源,满足各类利用者多方位的需求目标。 2.建设区域性数字档案馆的优势 与一般单体的数字档案馆相比,区域性数字档案馆的优势体现在: (1)避免重复建设。能够实现区域范围内档案数字资源的统一建设,利用有限的资金争取区域内最多的档案数字资源,有效避免了重复建设,大幅降低运维成本。 (2)引导均衡发展。避免每个单体数字档案馆的小而全,避免了因经济基础、资金投入等客观条件而带来的发展不平衡。同时,建设方向更强调业务工作的协同与联合,利用服务的共享与共通,合理引导均衡发展。 (3)资源集中、集约管理,有效利用。将区域范围内各类档案数字资源进行整合,构筑起一个信息存贮量大、覆盖面广、尽可能完善的区域性数字档案馆,通过在区域内的协调,使得档案数字资源得到多角度使用,使资源产生最大效用。 (4)优势互补,应用广泛。区域性数字档案馆是跨系统整合所有资源,弥补了单体数字档案馆难以做到的档案信息资源的互联互通和网络共享,能够提供出覆盖各级档案馆、档案室的档案数字资源服务,达到利用时档案数字资源总量增加的效果,推进了资源共享。在规模、深度和影响力等方面都使得利用档案数字资源得到进一步发展,从而达到实现公共服务一体化的目标。 (5)标准统一规范。区域性数字档案馆作为一个有机整体,在各层级档案馆之间、立档单位之间,遵循整体统一的标准和规范,从而达到行业层面、各级机构层面以及用户层面的统一。 云计算是区域性数字档案馆实现的技术保障 云计算为区域性数字档案馆提供了技术保障和有效支撑。云计算技术应用于区域性数字档案馆,能够很好地解决数字档案馆建设中存在的问题,一方面通过区域内计算资源的协同工作,将分布式存储的档案数字资源进行整合,由集成的搜索界面实现不同“云”之间的互操作,达到区域性数字档案馆各用户之间档案数字资源的共享;另一方面云计算提供了强大的数据存储和网络服务功能,云计算的标准化服务和多方协同的优势,可以解决数字档案馆技术上的异构问题,减低数字档案馆存储空间的成本,提供更加完善的用户服务功能。通过档案数字资源的聚合,云计算可以提供更加多样化、个性化、全方位的智能信息共享模式,提高整个区域的档案数字资源利用效率,提升数字档案馆的信息服务能力。 区域性数字档案馆建设思路与原则 区域性数字档案馆的建设采用集约化思想,分布存储式的资源开发、管理、应用系统平台,形成档案数字资源共建共享的机制。云计算环境下的区域性数字档案馆的建设,包括制度建设、制定统一的标准规范;优化和整合现有的档案数字资源;建立和培训各专业化队伍;建立科学的管理思想和高效的运行机制、具有多样化的服务体系。 基于云计算环境的区域性数字档案馆建设原则: 集约化建设,从基础设施到系统平台采用“统一规划、统一建设”,实行ICT资源的集中管理,确保区域性数字档案馆的用户共享所提供的各种ICT服务。 集成化管理,实现区域性数字档案馆的运行平台集成、信息系统集成、业务流程集成。将区域性数字档案馆的各级各类用户的各种档案资源进行集成管理和分布式存储,在云环境下利用信息技术对各种档案资源进行整合,使各种异构环境中档案资源整合成一个统一体。 分布式协同与共享,区域性数字档案馆通过云服务平台提供“一站式”服务,用户通过统一的界面,可以方便快捷检索到档案资源;通过平台的建设实现档案数字资源的优化整合,最终将实现资源的协同共享。 区域性数字档案馆的基础架构 区域性数字档案馆通过云平台实现各个用户的资源(包括计算资源、存储资源、数字资源等)合理有效整合,将档案数字资源构建于互联网、政务网以及局域网的基础之上,并为用户提供服务。 区域性数字档案云平台是利用云计算技术和理念构建起的区域性数字档案馆基础设施和服务平台,把分布的各个区域性数字档案馆用户整合到一个统一平台上,以档案数字资源的数字化存储和网络化传递为基础,重视档案数字资源的共享与面向用户的个性化服务,最终目标是建立起完全满足用户需求的区域性数字档案馆,真正实现数字档案馆的集约化,做到档案数字资源的共知、共建和共享。其核心理念,就是采用集群技术、虚拟化技术、分布式技术来进行数据和资源的调度与分配,对各个分散的区域性档案馆用户的档案数字资源进行收集与整理,同时把区域性数字档案馆用户的基础设施整合到统一的云服务平台上,以统一的操作界面,面向用户提供所需的数字档案馆应用服务。 区域性数字档案馆建设总体框架由四部分构成,底层为基础设施层,主要实现物理资源(包括计算资源、存储资源、数据资源等)的集成与整合,采用虚拟化技术“全方位’’搭建虚拟资源池,优化调整系统基础架构,为区域性数字档案馆提供包括档案存储、传输网络和使用所需的计算资源、存储资源、网络资源以及数据资源。 在区域性数字档案馆平台层,用户不需要管理或控制底层的云基础设施,包括网络、服务器、操作系统、存储等,但客户能控制部署的核心的应用程序,包括接收电子档案、虚拟库房管理、以及电子档案身份证的管理等;也包括控制运行应用程序的托管环境配置,包括OpenStack中间件的部署与配置、业务数据库的配置等。 在区域性数字档案馆应用层,主要提供综合业务服务,包括档案数字资源公共利用服务、档案政务服务、档案查询支持服务、电子档案身份证查询服务等,在整合区域档案云平台层所提供应用软件基础上,以服务的形式对外提供访问入口。 区域性数字档案馆平台层和区域档案云应用层都可以直接以服务的形式向平台用户提供服务。 在区域性数字档案馆终端用户层,用户可以采用各种终端界面访问应用层所提供的服务内容。 该平台框架的优势主要体现在以下几个方面: (1)降低资本支出:充分利用虚拟化技术将IT成本从资本支出转变为经营费用。 (2)消除过量配置:云平台按需提供扩展规模,从而消除了因为满足业务需求而产生的过量配置情形。 (3)实现区域内数字档案馆用户的融通:该总体框架的焦点在于把现有的多个分布、异构的区域性数字档案馆用户系统(平台)融于一个新的可互操作的“云”中,可以在多个平台之间迁移应用程序并实现互操作,支撑各级档案馆之间融通的有效实现。 区域性数字档案馆的运行场景 区域性数字档案馆构建起区域性数字档案云,各用户可以构建自己的数字档案私有云,然后加入到区域云平台中;也可以基于区域性数字档案云平台,通过共建、租借等方式加入到区域平台中,最终形成区域性数字档案云,在集中统一运行管理的基础上,实现区域内的档案数字资源的共享与集成访问。区域性数字档案云的运行场景如图2所示。
从使用云和构建云服务的角度分析,认为区域性数字档案云可以分为公共云、私有云和混合云三种,这三种云都可以通过云服务平台对外提供统一的接口,为云端使用者提供服务。 1.私有云模式 如果以区域性数字档案馆为单位,则私有云是指仅为区域性数字档案馆某一用户所使用的云,为用户内部人员和其下用户所提供的服务。私有云最大的特点就是部署在自身内部,因此其数据安全性、系统可用性和系统扩展性都可由自己控制,灵活性高,维护也方便;但其缺点也很明显,就是投资较大,尤其是一次性的建设投资较大,而且在建设之初需要有较强的技术实力做支撑。 2.公共云模式 是相对私有云模式而言的,它是指在私有云服务模式的基础上,向私有云之外的人员和其他单位提供的云计算,这也是区域性数字档案云的最终工作的理想模式。对于使用者而言,公共云服务模式的最大优点就是数字档案馆所应用的程序、服务及相关数据都存放在公共云的提供者处,自己无需做相应的投资和建设。但是目前最大的问题是,对于区域性数字档案馆用户而言,由于档案数据不存储在自己的数据中心,同时公共云的可用性不受使用者控制,存在一定的不确定性。 3.混合云模式 是私有云服务模式和公有云服务模式的一个延伸,是私有云只向外公开其一部分云服务或是对公有云进行再封装以及功能扩展而来。对于区域性数字档案云,混合云属于一种过渡模式,相比较而言,混合云的部署方式对提供者的要求更高。 目前,区域性数字档案云的建设存在一些有待研究的问题,比如机构分布广档案信息量大,为统一的信息化建设增加了难度等等。因此,当前基于云的区域性数字档案馆建设还需要通过规范标准、技术研发,系统建设以及实践积累等来逐步实现。 区域性数字档案馆的运行机制 区域性数字档案馆是个复杂的系统,其首要工作就是加强区域内档案数字资源的集约化共建与共享,在运行过程中建立相应的机制可以大大减少或避免不稳定因素,保障区域性数字档案馆的运行处于稳定状态。因此必须建立一套协调、适合、高效的运行机制。本文主要考虑档案数字资源的采集和组织管理机制。 1.档案数字资源采集机制 区域性数字档案云服务平台提供了一个档案数字资源的采集机制,通过统一检索界面让用户按需检索的方法对各个节点平台的信息资源进行采集,档案数字资源是分散在各个节点平台的,不需要进行集中管理。区域性数字档案云平台将用户在操作界面中的查询请求动态地分配到各个节点云平台中,然后对各节点平台上的档案数字资源进行分别采集和任务调度,根据用户需求去访问相关资源。 2.档案数字资源组织与管理机制 档案数字资源的组织与管理机制是区域性数字档案云服务平台运行的核心运行机制,是平台的关键部分。一般需要采用虚拟化技术将分布部署的物理资源按类型集中在一起,通过对节点平台的档案数字资源进行有效调度和管理,从而为用户提供个性化需求的服务。 在此运行机制基础上,对区域性数字档案馆的开发者和管理者来说,需要屏蔽网络的复杂性、整合计算资源以及存储资源;对区域性数字档案馆的各级用户来说,可以通过统一的访问入口获得与各种档案业务相关的服务。 本文认识到当前区域性数字档案馆的首要工作就是加强区域内档案数字资源的集约化建设与共享机制。区域性数字档案馆可以通过采用云计算技术架构搭建云虚拟资源池(包括云存储中心),采用虚拟化技术实现硬件资源的整合,从而对管理软件进行统一的实施和调配。但是,区域性数字档案馆是个复杂的系统,建立相适应的机制在运行过程中可以增强安全性、避免干扰因素,促使区域性数字档案馆的运行处于稳定状态。 基于云环境下的区域性数字档案馆要在运作理念上进行变革,突破原有的工作模式和状态,这些组织、运营和管理的演进势必推动的数字档案馆进一步的纵深发展。 |