用户名: 密码:
会员中心 在线投稿
| 网站首页 | 中国历史 | 世界历史 | 历史名人 | 教案试题 | 历史故事 | 考古发现 | 历史图片 | 文化 | 社会
相关文章    
您现在的位置: 历史千年 >> 文化 >> 文化研究 >> 正文
写入改革开放30年档案的…
看改革开放后消失的10大…
深入把握改革开放30年统…
文化研究的开放性与全球…
文化的开放意识与民族精…
文化经济的转向与文化开…
开放视野·实践品性·问…
把握改革开放历史的深层…
自强、开放的探寻与呼吁…
改革开放三十年的理论阐…
最新热门    
 
开放源代码的数字资源管理系统DSpace和Fedora的分析和比较

时间:2009-8-8 16:47:02  来源:不详
>    Java2 Standard Development Kit(J2SDK)1.4或者是更高版本;
    Apache Ant 1.5或者是更高版本,或者是其它类似的Java编译工具;
    PostgreSQL 7.3或者是更高版本,一个开放源代码的关系数据库系统;
    Jakarta Tomcat 4.x/5.x或者是类似的系统,如:Caucho Resin的等同版本。

      3 Fedora的分析

    Fedora(Flexible Extensible Digital Object and Repositoty Architecture)系统[2]是由Andrew W.Mellon基金会资助,由Virginia和Cornell大学联合开发的开放源代码系统,遵守Mozilla开放源代码协议。Fedora是一个通用的数字对象管理系统。可以用在很多地方,包括:数字图书馆、内容管理、数字资产管理、资源保存等。2001年发布Fedora 1.0版,目前最新版本2.0版。
    3.1 Fedora的数据模型
    (1)Fedora的数字对象框架
    数字对象框架(Digital Object Architecture,DOA)最早是William Y.Arms于1997年提出的,后来在Fedora系统中得到实现。Fedora中的数字对象的结构模型如图2所示。
    数字对象的结构模型[14]
    Persistent ID(PID),数字对象唯一标识符(Digital ObjectIdentifier),用来唯一地标识一个数字对象,以便于在命名空间内唯一地引用该数字对象。
    系统元数据(System Metadata),描述整个数字对象,用来管理该数字对象和建立数字对象的索引。
数据元素(Datastream),是数字对象所包含的数据,它可能是元数据,也可能是数据本身。如果是元数据,可能是各种格式的,比如Dublin Core,MARC。如果是数据本身,可能是文本、图像、音频、视频数据。一个数字对象包含一个或者多个数据元素。
    数据发布器(Disseminator),是数字对象内部的一种结构,对应着一种发布数字对象内容的方式。包括两部分:接口定义(Behavior Definition)和接口的实现(Behavior Mechanism),分别对应着对数据内容的操作接口和对数据内容操作的接口的实现[14]。
    (2)Fedora的仓储
    仓储(Repository)是存储管理数字对象的容器,是Fedora系统中非常重要的实体。仓储实现了数字对象的存储管理,并且通过一定的访问控制策略提供了数字对象内容发布的机制。数字对象存放在仓储里面,一个数字对象对外部可见的只是它的唯一标识符,与数字对象的交互只能通过仓储访问协议进行[14]。

   3.2 Fedora的体系结构
    Fedora是一个三层结构的系统,采用灵活可变的数字对象仓储体系结构。
    Fedora的体系结构图[15]
    最上层是管理和访问接口层,定义了系统的公共视图,构建于Web Services技术之上。仓储提供了两个相关的Web Services,管理Web Service和访问Web Service。Fedora管理接口定义了管理仓储的公开接口,包括创建、修改、删除数字对象或者数字对象的数据元素(包含数据和元数据)。Fedora访问接口定义了访问数字对象的公共接口。
    中间层是内部服务层,包含管理子系统,访问子系统,安全子系统。管理子系统和访问子系统分别实现了管理和访问接口。
    底层是存储于系统,负责读写数字对象和数字对象元素。数字对象的元素可以是分布的。存储子系统需要负责实时请求和缓存分布的数据。Fedora支持通过HT-TP协议和FTP协议访问分布式资源。
    3.3 Fedora的主要功能特点[16]
    (1)灵活的数字对象模型
    Fedora数字对象模型提供很大的灵活性,支持创建各种类型的对象,包括:文档、图像、电子书、多媒体学习对象、数据集、元数据等。Fedora中的元数据模型可以用数字对象中的一个或多个数据流描述和访问,可以是一个本地的元数据集合,一个标准的元数据集合,或者是DC元数据的扩展。
    (2)以Web Service方式发布管理和访问服务
    Fedora仓储系统提供的管理和访问服务作为Web Service进行发布,通过WSDL(Web Services Description Language)进行描述。同时访问服务接口还提供了基于Web页面的调用实现。外界对数字对象的访问通过调用数字对象提供的行为中的具体方法来进行。数字对象的行为作为分布式的Web Service进行实现,用WSDL进行表述,通过HTTP GET/POST或者SOAP(Simple Object Access Protocol)进行访问。
    (3)内容版本控制
    通过Fedora管理接口修改数据元素或者是数据发布器可以自动地生成新版本的相应内容。Fedora对象包含一个所有版本的记录,对以往版本内容的访问可以通过在Fedora访问服务(API-A和API-A-LITE)请求之上加入时间戳来实现。
    (4)XML格式的数据存储和导入导出
    缺省情况下,Fedora数字对象在Fedora系统中以FedoraObject XML(FOXML)格式编码的XML文件形式存储。数字对象中的内容数据保持本身的格式以数据元素(Data Stream)的形式存放在系统的序列化存储区。
    数字对象可以遵照Fedora Object XML(FOXML)Schema或者是Metadats Encoding and Transmission Standard(METS)[13]Schema格式编码过的XML文件的格式提交到Fedora存储系统和从系统中导出。在Fedora的未来版本中还将支持MPEG2/DIDL和METS 1.3规范。
    (5)对象之间的关联支持
    Fedora提供对象之间关联关系的声明。对象到对象的关联元数据用来表示对象之间的各种关系,包括:某个对象是一个数字馆藏的成员,是否另一个对象的一部分从另一个对象派生,或者是等价于另外一个对象等。这些关系定义在Fedora的关联本体集合中。
    (6)简单检索功能
    Fedora自动地为存储系统创建两种索引。缺省的检索索引是有关对象的属性和DC元数据元素。在Fedora 2.0中,有一个新的基于RDF的资源索引,包含对象之间的关联关系。这两种索引都可以通过基于表现性状态传输协议REST(Representational StateTransfer)[17]这种面向资源的Web服务接口来检索。
    (7)OAI元数据采集服务
    每个Fedora数字对象有一个原始的DC记录,符合OAI PMH 2.0协议[9]标准所定义的Schema规范,这种元数据可以使用OAI PMH 2.0标准访问。
    (8)管理工具
    Fedora2.0系统提供一个迁移工具可以实现批量的对象导入和导出。迁移工具在2个新增强的命令行工具:Fedoraingest和Fedora-export的基础上实现,可以在不同的仓储之间实现对象的移动和复制,包括从以前的版本升级。
    Fedora仓储系统中包含一个管理员客户端中的批处理工具,可以批量创建和修改数字对象。另外,还包括一个报告工具,提供对Fedora仓储中各种内容的不同管理视图的报告。
    3.4 Fedora的安装和运行环境
    本文以Fedora 1.2版本为基础扩展开发了一个通用的数字资源管理系统DRMS[18],所需的安装和运行环境如下:
    Unix类或者是Windows操作系统,包括Linux,Solaris等;
    Java2 Standard Development Kit(J2SDK)1.4或者是更高版本;
    MySQL 3.23.x版本,MySQL4.x版本,或者是Oracle 9i关系数据库系统;
    Apache Jakarta Tomcat 5.x或者是类似的系统。

  4 DSpace和Fedora的比较

    通过上述对两个系统的分析,可以总结出两个系统之间的一些共同点和区别如下。
    4.1 相同点
    (1)都基于开放和模块化的体系结构。DSpace基于一个三层结构而且数据模型基于OAIS参考模型;Fedora使用灵活可扩展的数字对象和仓储体系结构。
    (2)都支持长期保存的问题,可以给同一种内容提供多种数字格式,使用技术元数据并保证一个全球唯一的标识符来访问每个数字对象。
    (3)都支持数字对象,可以是原生的或者是数字化的,不受特定的文件格式或数字内容类型的限制。
    (4)都采用METS标准作为数据交换的格式。
    (5)都实现了OAI协议,提供元数据采集服务,方便系统之间的互操作。
    (6)系统都采用纯Java实现,具有良好的跨平台性。
    4.2 不同点
    (1)处理数据的方式不同。DSpace中的数据和元数据作为独立的两个实体,Fedora中的数据和元数据被封装在数字对象内部。
    (2)对内部数据的管理和访问方式不同。DSpace直接将数据和元数据暴露

上一页  [1] [2] [3] 下一页

 
  | 设为首页 | 加入收藏 | 联系我们 | 友情链接 | 版权申明 |  
Copyright 2006-2009 © www.lsqn.cn All rights reserved
历史千年 版权所有