范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

数字图书馆体系结构的发展的论文

  【内容提要】首先介绍了目前大多数数字图书馆所遵循的基本的数字图书馆体系结构,该结构在功能上可划分为四个逻辑组件:资源库、命名系统、索引/搜索系统、用户界面。然后介绍了NSDL、NCSTRL两个最大的数字图书馆项目在体系结构的关键问题方面的实践,最后,作者提出了数字图书馆体系结构发展的看法。
  【摘要题】专题探讨
  【【关键词】体系结构/互操作
  1 介绍
  世界上有许多国家进行数字图书馆的建设,但到目前为止,并不存在一个通用的数字图书馆体系结构,这是由于信息技术和相关标准不断发展的结果,怎样基于现有的技术并考虑到未来技术的发展,构筑一个灵活强大的数字图书馆体系结构,对于数字图书馆的建设是至关重要的,这需要我们了解相关技术和标准以及数字图书馆体系结构的发展变化。
  数字图书馆要为用户提供各种简单易用、功能强大的知识服务,通常从功能上可将数字图书馆划分为:用户界面、命名服务、搜索系统、资源库等部分。数字图书馆的建设涵括各种数字资源的创建、管理、查询、利用、存储的整个过程。自从williamY.Arms等于1997年提出了数字图书馆的信息体系结构以来,数字图书馆的体系结构在不断完善和发展,通过许多试验项目仍在不断改进。图1代表了数字图书馆的基本体系结构。
  附图
  图1 数字图书馆的基本体系结构
  资源库
  资源库的功能包括存储和管理各种数字对象,通常是由关系型数据库来管理。应用程序通过资源库提供的库访问协议(RAP)来访问资源库。可实现存储、访问、复制、移动和删除数字对象等操作。
  与web上的信息所不同,数字图书馆中数字资源是以数 字对象的形式进行封装的,一个数字对象包括:
  ①一个全球唯一的独立于地址的长期标识符;
  ②数字资料,存储数字图书馆的资料,也就是最终用户需要获取的信息内容,如经XML置标后的文本、一本电子图书等,
  ③元数据,关于数字资料的数据。一般情况下,元数据有三种:a.描述性元数据,用于发现和标识一个对象,如MARC和DublinCore。b.结构性元数据,为用户显示和导航一个对象(包括该对象的内部组织信息),如一本书由章节组成。c.管理性元数据,描述该对象的管理信息;创建日期、文件的格式、访问权限、知识产权问题等。
  命名系统
  命名系统是针对长期标识符的分配、管理及解析的一个综合系统,CNRI为数字图书馆提出了完整的命名系统"调度系统(HandleSystem)",它是一个独立的系统,其职能是负责数字资源的全球唯一的、长期的、独立于地址的命名的分配、管理和解析。在调度系统中,本地名称空间通过获取一个调度系统的命名授权,就可以纳入到全球调度名称空间,这样所有的本地名称在全球调度名称空间中将是唯一的。
  索引与搜索系统
  索引的创建可能是由机器的自动扫描、手工录入和干预,或者是这两者的结合。客户机把查询式提交给索引服务器,将返回相匹配的数字对象的URN(统一资源命名,如调度码)。索引服务还提供被索引信息的元数据和查询机制。
  用户界面
  用户界面是用户与数字图书馆的接口,数字图书馆向用户提供的最终服务都是通过用户界面来实现的。一般情况下,数字图书馆借助通用的Web浏览器作为其用户界面工具。此外,用户界面的内容编排和服务方式问题是很复杂的,不同的用户需求是不同的,用户对数字图书馆的简单灵活的需求首先就表现在用户界面上。
  2 NSDL项目的体系结构介绍
  NSDL(NationalSTEMDigitalLibrary,STEM—Science,Technology,EngineeringandMathematics)是NSF资助的、由多家单位来实施数字图书馆项目,它包括64个子项目,其目的是支持科学、技术、工程和数学教育,提供广泛接入和方便使用的分布式资源网络和学习机制,NSDL一期工程已于2002年底为公众提供服务,它是目前规模最大的数字图书馆项目。
  由于NSDL的内容和用户的多样性,为让各种用户共享不同的信息,最初的体系结构设计就是通过共享元数据,并利用元数据开发核心服务(如,搜索和发现)。其体系结构(见图2),包括以下几个基本概念:
  附图
  图2 NSDL体系结构
  ·采用公共的核心元数据实现异构系统间的资源发现。
  ·核心元数据与具体领域的扩展元数据相结合。
  ·以元数据为基础实现跨库搜索并创建更丰富的服务。
  ·采用自动索引和检索系统来减少编目工作。
  元数据库—NSDL体系结构的关键部分是元数据库。元数据库存储所有藏品集的元数据,并通过OAI协议把它们提供给服务商,服务商通过元数据可以开发出各种服务。在NDSL中,元数据库可能分布在多个服务器上,并有多个镜像。NSDL早期采用分布式元数据库,现在改成集中式。这是因为分布式元数据库在检索时会因为其中的一个元数据库的查询失败或响应较慢,而造成整个检索的失败或长时间的响应,而集中式元数据库可以避免这种现象。
  NSDL的互操作性问题
  NSDL的互操作性采用三种方式来实现:
  ·联合:这是一种传统的方法,其所有的成员组织都遵从某些标准规范,如通过Z39.50协议共享在线目录。
  ·OAI采集:以OAI元数据采集为基础。每个数字图书馆藏品的元数据都能提供到DublinCore的映射,并以简单的交换格式向外提供,这样,服务提供商就能采集这些元数据,把它建入到信息发现系统中,而且这些藏品能够实现良好的互操作性。
  ·搜集:即使各种不同的组织之间不存在任何形式的合作,通过网络爬虫收集开放访问的信息仍然可以实现一定程度上的互操作。各种网络搜索引擎就是这样。
  NSDL主要通过OAI元数据采集来实现互操作。2001年初,NSDL确定支持8种标准元数据格式,这8种元数据之间的"互换通过DublinCore元数据核心集作为过渡。
  (1)DublinCore
  (2)DublinCorewithDC—EdExtensions
  (3)LTSC(IMS)
  (4)ADL(SCORM)
  (5)MARC21
  (6)Content&nbsp
  ;StandardforDigitalGeospatialMetadata(FGDC)
  (7)GlobalInformationLocatorService(GILS)
  (8)EncodedArchivalDescription
  3 NCSTRL项目体系结构介绍
  NCSTRL (Networked Computer Science TechnicalReferenceLibrary)是另一个有代表性的数字图书馆项目,其规模仅次于NSDL,它是由DARPA资助的,来自北美、欧洲和亚洲的160多家学术研究机构参与了该项目。其体系结构以Dienst体系结构为基础,该体系结构的一个重要特征就是分布式搜索(见图3)。
  附图
  图3 NCSTRL的体系结构
  在NCSTRL的早期项目中,用户的查询式被直接提交给所有的索引服务器,但随着参与机构的增多,检索时同样会因为其中的一个元数据库的查询失败或响应较慢,而造成整个检索的失败或长时间的响应,为了解决这一问题,NCSTRL引入了查询路由器的概念。
  查询路由器QR(QueryRouters):根据一定的机制把查询式发送到分布式的索引服务器中,并负责合并来自不同的索引服务器的查询结果。另外,该体系结构还引入了藏品服务(CollectionService)的概念,它是查询路由的基础,提供把各种服务集成到数字图书馆中的各种机制。按照当前的藏品服务定义,它提供以下信息:
  ·参与该藏品服务各单位的目录
  ·每个单位的索引服务器的网络地址
  ·索引服务器的元信息(为查询路由提供依据)
  查询路由
  查询路由器定期地与藏品服务通信,藏品服务数据包括索引信息(每个机构的藏品)在索引服务器之间的分布情况,如斯坦福大学藏品的索引可能在I1和I2两个索引服务器上有备份,康奈尔大学藏品的索引可能在I2和I3两个索引服务器上有备份。通过这些信息,查询路由器将决定查询式被提交给哪些索引服务器来处理。
  附图
  图4 查询路由
  连通域
  由于全球范围内的Internet的连通性差别相差巨大,为了提高数字图书馆的分布式搜索的相应时间,NCSTRL引入了连通域的概念,连通域是指网络上具有高度连通性的一组节点。连通域的概念是藏品服务的一部分,藏品服务分布在一组区域元服务器RMS(RegionalMetaServers)中——每个连通域一个RMS。每个RMS从主元服务器MMS(MasterMetaServer)获取特定域的信息,见图5。
  附图
  图5 连通域
  连通域之外的索引信息在连通域内的索引服务器上有备份,这样用户的查询将在连通域内部完成,只有当其中的索引服务器查询失败时,查询式就被提交给主元服务器,主元服务器再把该查询式分配给到其它的连通域。
  索引服务器的动态调整
  由于考虑到单个搜索的失败,故NCSTRL元数据在多个索引服务器中存在备份。藏品服务中的数据列出了索引服务器接受查询式的优先顺序,有的索引服务器被设定为主索引服务器,有的被设定为次级服务器。主索引服务器首先接受查询式,如果在一定的时间内没有完成查询任务,查询式就会转交给次级索引服务器。
  需要说明的是,主索引服务器和次级索引服务器的顺序并不是固定不变的,而是动态调整的,其中的参数可由管理员来设定。这个动态调整的过程是通过一个简单算法来实现的。在索引服务器成功完成一次查询之前,查询路由器给每个索引服务器增加一个失败记数,如果查询成功,失败记数就减一。当查询路由器通过藏品服务提供的信息来选择索引服务器时,它进行一个稳定性测试:该索引服务器最近是否有N次连续响应失败(N是可以设定的)?如果一个索引服务器没有通过这种稳定性测试,它就会被降级,也就是说,如果是一个主索引服务器就降级为次级目录服务器,而另一个次级目录服务器就有可能升级为主目录服务器。
  4 对数字图书馆体系结构发展的看法
  由于用户对数字图书馆的功能需求不断发展,信息技术的迅速进步,数字图书馆的概念和功能都在不断发展。通过对上述两个项目的体系结构的分析,加上笔者的探索和实践,我们认为数字图书馆的体系结构的设计必须事先考虑到开放性、互操作性、扩展性以及伸缩性。
  4.1 开放性
  数字图书馆系统必须是一个开放的系统,开放的含义包括一下几个方面:
  (1)能够与第三方系统或功能模块实现良好的对接和集成;
  (2)能够方便地在本系统内部增加删除或修改某些功能模块;
  (3)尽可能广地支持各种资源格式和标准;
  因此在系统设计时需要遵循一下原则:
  (1)基本体系结构简单化,在设计基本体系结构时主要考虑信息的流通和管理机制,强调系统的通用性和稳固性;
  (2)功能模块化,数字图书馆的服务功能是不断发展的,因此数字图书馆的每一项服务应该是相对独立的,便于安装、撤销和维护;
  (3)选取成热的通用的标准和协议。如用户界面采用通行的Web浏览器,文档表现采用XML定义,元数据采用DublinCore、中文元数据标准等。
  4.2 互操作性
  通过信息资源本身实现互操作是最应该受到鼓励的方法,因为数字图书馆建设的基础是资源,用户最终利用的也是资源,而且与信息系统比较起来,资源从类型上(如图书、期刊、科学数据、地图、档案)要容易预见,发展变化也相对缓慢,从资源的格式上讲(如标准的文件格式.txt、.html、.mpeg等),大家对通用标准的认同更加一致。因此,通过一定的标准规范让不同的藏品遵循相应的元数据标准,并通过元数据的共享或互换,可以实现资源间的共享,就如上面所介绍的NCSTRL项目,也已采用OAI元数据采集协议来实现来自不同单位的藏品的互操作。可喜的是,现在许多数字图书馆项目一般都主动遵循一定的元数据标准去创建元数据。并出现了一些工具和方案能够实现不同元数据标准的元数据元素的映射。当然,信息系统之间的互操作随着中间件和代理技术的发展也取得了很大的进步,同时近年来,Web服务技术为网络软件的共享和互操作方面提供了新的机制,将来随着这些技术的进一步发展,实现信息系统间的互操作将越来越简单。
  4.3 扩展性
  NCSTRL为我们在扩展性方面提供了很好的经验。由于NCSTRL的成员单位比较分散,并且不断有新的成员单位及新的用户加入,最终选择了把数字图书馆划分成不同的区域,这
  样不但适应了数字图书馆不断延伸的特点,而且还能为本地用户提供及时的、具有本地特色的服务。在中国数字图书馆工程建设一期规划(2000—2005)就采用了区域服务的思想。
  4.4 伸缩性
  由于各数字图书馆建设单位在经济、技术、管藏资源、用户需求等方面都不平衡,因此不同数字图书馆的建设规模也将是不同的。一个好的体系结构设计必须能够适应不同规模的系统,使不同规模的系统都能够获取最佳的效率。
  【参考文献】
  WilliamY.Armsetc,AnArchitectureforInformationinDigitalLibraries,D—LibMagazine,February1997http://www.dlib.org/dlib/february97/cnri/02armsl,htm
  C.Lagoze(ed.),W.Arms,S.Gan,D.Hillmann,C.Ingram,D.Krafft,R.Marisa,J.Phipps,J.Saylor,andC.Terrizzi.CoreservicesinthearchitectureoftheNationalDigitalLibraryforscienceeducationNSDL). InProceedingsoftheSecondACM/IEEE—CSJointConferenceonDigitalLibraries,Portland,OR,2002.
  D.FulkerandG.Janee.ComponentsofanNSDLarchitecture:Technicalscopeandfunctionalmodel.InProceedingsofthe&nbs
  p;secondACM/IEEECSJointConferenceonDigitalLibraries.Portland.OR.submittedinJanuary2002.
  WilliamY.Arms,DianeHillmannetc.ASpectrumofInteroperabilityTheSiteforSciencePrototypefortheNSDL,D—LibMagazineJanuary2002http://www.dlib.org/dlib/january02/arms/01arms,html
  Dushay,N.,J.C.French,andC.Lagoze,"ACharacterizationStudyofNCSTRLDistributedSearching,"CornellUniversityComputerScience,TechnicalReportTR99—1725.January1999
  Ca
  rlLagoze,DavidFielding.SandraPayette,Makingglobaldigitallibrarieswork:collectionservices,connectivityregions,andcollectionviews,ProceedingsofthethirdACMconferenceonDigitallibraries,p.134—143,June23—26,1998,Pittsburgh,Pennsylvania,UnitedStates
  DienstArchitectureSummaryDescription.http://www.cs.cornell,edu/cdlrg/dienst/architecture/architecture,htm

水利工程施工中质量控制方法探析摘要水利工程是关系到我国民生的一项重点基础系统工程,水利工程是有效预防自然灾害保证粮食生产提高水资源质量,保证国民的生命财产安全的重要保证,随着我国水利事业的发展,加强水利施工中的水利工程建设防渗堵漏施工方法摘要当前,随着我国经济发展速度的不断加快,为增强我国基础设施建设,并为国民经济增长奠定下坚实的基础,促使我国水利行业的发展速度显著提升,且各类水利工程项目也呈现出逐年递增的趋势。然水利水电工程地质勘测方法探析摘要随着现阶段我国经济的迅速发展,使得对水利工程的需求量也在不断增加。工程地质测绘工作是水利水电工程项目的主要内容之一,其能够对水利水电建设项目的地质结构进行有效的分析,从而及时的德国可再生能源产业发展10年回顾与展望新能源专业论文(1)德国可再生能源产业发展初期十分弱小,但2000年4月1日生效的可再生能源法(LawforthePromotionofRenewableEnergies)改变了德国能源市场。此后,德发展新能源产业启示录之一新能源专业论文(1)在历史上,巴西是一个石油资源相对短缺的国家,能源严重依赖进口然而,到2006年,巴西却实现了能源独立。这一巨大的转变要归功于其大力发展以生物燃料为主的新能源产业的做法。如今,巴西在第一太阳能光伏产业的英特尔?新能源专业论文(1)在德国勃兰登堡州森林的深处,有一大块与周围满眼的绿色格格不入的土地。这块土地被荒废了很长时间,上面不生一毛,看上去倍加刺眼。如今,在这块土地之上却已铺满了光伏发电设备。这儿曾是前苏数控系统伺服电机控制浅探摘要伺服电机比步进电机性能更优越,随着现代电机控制理论的发展,伺服电机控制技术成为了机床数控系统的重要组成部分,并正朝着交流化数字化智能化方向发展。关键词数控系统伺服电机直接驱动近浅谈对中国特色社会主义理论体系的认识论文关键词中国特色社会主义理论体系论文摘要中国特色社会主义理论体系是对马列主义毛泽东思想的继承和发展,是党领导人民探索中国社会主义建设的经验总结和马克思主义中国化的最新理论成果,是关于社会主义初级阶段理论的立论基础论文关键词社会主义初级阶段立论基础理论基础历史依据现实依据论文摘要社会主义初级阶段理论,是邓小平理论的主要内容,是邓小平理论的立论理论基础,是党的路线方针政策提出的依据。社会主义初基于科学发展观的理论体系及其特征论文关键词科学社会主义科学发展观理论体系论文摘要科学发展观理论体系是在特定历史条件下形成的。继承和创新党的思想路线牢固树立人民群众是历史创造者的观点深入认识我国发展出现的阶段性特征浅谈先进复合材料成型工艺过程中的质量控制1前言作为一项具有较强特殊性的工作,先进复合材料成型工艺得到了长足的发展和进步。研究该项工作过程中的质量控制,能够更好地提升先进复合材料成型的最终效果。2概述当前复合材料整体成型技
论析信息素质定义的发展与评价标准论文关键词信息素质图书馆评价标准论文摘要论述了信息素质定义的发展,并且结合信息社会的特征和要求,给出了自己的定义同时论证了图书馆与信息素质的关系,强调在制定信息素质评价标准时,制定青春在音乐中飞扬从纽约开车一路往西北,走走停停七十五英里,到达宾州东斯特劳斯堡的那个早晨我真的有点困,所以并没有奢望遇到什么惊喜。当我走进东斯特劳斯堡大学一间并不起眼的教室,听到来自新成立的中华青这场音乐考试,他们高分通过这场音乐考试,他们高分通过7月21日晚,在马林阿尔索普(MarinAlsop)的指挥下,美国国家青少年交响乐团(NYOUSA)一个由卡内基音乐厅于2013年启动的音乐教育项目的产物中国青少年自新大陆的音乐收获中国青少年自新大陆的音乐收获2017年7月26日晚,由中国青少年组成的中华青少年交响乐团(NYOChina)继上周六在纽约卡内基音乐厅首演后,在北京音乐厅完成了国内首秀。他们在西雅为什么学习音乐?为期三个星期的排练和演出结束了,当我在上海告别老师和同学,登上汽车时,心里涌起一阵不舍。非常庆幸我参加了中华青少年交响乐团,在这三周里,我们共同生活,共同向世界级的大师们学习。这段浅析初中音乐创新教学策略1使学生对音乐文化的接触渠道得到延伸和扩展在进行初中音乐课堂教学的过程中,教师可以把那些影视中出现过的音乐创作型的美妙的优秀的应用到课堂教学中,同时在音乐课堂教学中深入解读音乐所表自媒体时代下民间音乐文化产业整合研究自媒体时代下民间音乐文化产业整合研究民间音乐是劳动人民在劳动和生活中自己创作自己演奏的音乐形式,它以口头创作口头流传的方式生存于民间,表现了劳动人民的生活,抒发了他们的感情,表达了音乐活动对学前儿童多元智能的开发应用音乐活动对学前儿童多元智能的开发应用以多元智能理论为基石,以音乐活动为切入点,通过深入分析该理论对儿童的音乐教育影响来获得启示,挖掘儿童优势智能。多元智能理论学前儿童智能音乐活动开农村幼儿园音乐教学现状分析与应对策略当前,国家实施了学前教育发展第一二期计划,使得农村幼儿园如雨后春笋般地发展起来,呈现在园幼儿数持续增长在园教师数迅速扩充等良好形势。但是,由于短时期内过快发展,许多的条件跟不上发展分析外宣翻译的特点及其翻译策略分析外宣翻译的特点及其翻译策略分析外宣翻译的特点及其翻译策略分析外宣翻译的特点及其翻译策略精品源自高考试题摘要外宣翻译是为了传递信息和促进交流,让外国人更好地了解中国的过去和现在以浅谈阿姐鼓与90年代文化内容提要本文以歌曲阿姐鼓为对象,剖析90年代中国文化的基本特征,探讨在深入全面的社会改革开放之后中国文化的可能和困惑。主题词阿姐鼓流行歌曲中国文化90年代由何训田作曲,朱哲琴主唱的