用户名: 密码:
会员中心 在线投稿
| 网站首页 | 中国历史 | 世界历史 | 历史名人 | 教案试题 | 历史故事 | 考古发现 | 历史图片 | 文化 | 社会
相关文章    
您现在的位置: 历史千年 >> 文化 >> 文化研究 >> 正文
使企业信息安全危机防患…
政府信息无真制约则无真…
八卦是一种信息解码
八字信息大观
租用八字测婚信息1
租用八字测婚信息2
人体疾病信息预测
疾病在四柱中有信息标志
人力资源管理和财务管理…
国土资源部深入学习实践…
最新热门    
 
资源信息微积分

时间:2009-8-8 16:47:03  来源:不详

      1 引子

    起初,神创造天地…神说:“要有光”,就有了光。神看光是好的,就把光暗分开了。神称光为昼,称暗为夜。有晚上,有早晨,这是第一日。 ——引自《圣经》创世纪
    有了光,世界显得五彩缤纷。同样,知识发现需要光的照明;需要有能发光又能感光的全息摄像设备以及资源信息的传播渠道。那么,什么是资源?国际普遍认为它是指anything(世界的万物)。诚然,信息本身也是一种资源,称为信息资源。信息资源用来描述资源信息,资源信息又充实了信息资源。信息资源和资源信息两者通过“廻环”的修辞,极准确地说明了信息和资源辩证结合、相依相成的关系。若用y表示资源信息,用x表示信息资源,则两者的关系可用准函数f表示。如同我们可用指数求幂也可用幂求指数(对数)一样,资源信息和信息资源的辩证关系也反应了它们之间的准函数(f)和准反函数关系。从本休论(ontology)看来,哲学的辩证、修辞的廻环和数学的函数求反具有本质的一致性。我们可以通过信息发现资源,也可以通过资源去描述信息。用本体论的话说,也就是可用x求y(f),可用y求x。f和是一个关系的两个指向。所谓信息准微积分就是应用数值微积分的原理对资源信息进行微观描述和宏观整合,使其产生光的效应。信息(Information)一詞的詞干“formation”含有“结构”之意。信息之所以为信息就是因为它能以某种数据(不同于数字)结构为载体进行传媒,离开数据结构信息也就不成其为信息了,而f正是这种数据结构的具体表达形式,它建立了数据的联系。
      2 正和反逻辑函数

    传统的书目已经开始不自觉应用了f和之间的知识发现互动原理。所谓的文献著录(标引),其实质就是用资源去描述信息,所谓检索就是利用数据的逆结构(反准函数)去寻求资源(索引),标引和反标引(索引)生动地反映了知识发现中潜在的f和互动事实,f在其中表示为某一字段元素,x和y都是资源,它们互为元数据,x、y方程组构成了一条款目的完整信息,而款目的集合就是数据库。无论是印刷型的还是电子型的,其本质是完全一致的。
以下是一个简单的书目款目A  文摘号   001
  ISBN号   7-5323-5116-5
  题名    化石漫谈
  作者    夏树芳
  出版发行  上海科技出版社
  载体形态  32开
  分类    Q911
  主题    化石
  摘要    ……
 
    A在其中表示为某一资源的m维向量,该向量由m个元素(element)或字段组成,这样一个动态数据库的款目就可记为,数据库就可记为。e变量名反映了数据(书)和元数据(夏树芳等)之间的准函数(逻辑)关系。标引或著录就是用元素名表示资源间的准函数关系,反标引(逆向著录)同样用元素名表示资源间的准反函数关系。既然资源代表anything,那么元数据也属于anything,同样可以对它标引建立一个款目B。具体说来数据库文件的正文就是用元数据标引资源,而数据库文件的索引就是用资源标引元数据。例如本例的作者反标引可记成
    款目B:  夏树芳(作者名)——元数据
  文摘号(元素名)  001(元素值)

    B款目的集合(数据库)则可记为其中元素(文摘号)的值就是元数据001,通过它指向资源(书),并可通过该书的标引了解它的全貌。如同我们可以用逻辑地址去映射物理地址,用逻辑主语去映射实际主语,我们同样可以用本体论研究知识发现的方法,把元素称为资源的逻辑函数。利用这样的逻辑函数关系我们就能知晓某书是誰写的,而某人又写了哪些书。这种函数的映射建立了资源之间的对应关系。元素成了资源间的“血缘”。有了它,A和B保持了父子关系,而D和I就有了源和目标的关系。这里我们把A定义为父款目,把B定义为子款目。把D定义为源数据库,把I定义为源数据库扩展(索引)。其关系如下图所示:
 
      3 资源信息微积分

    微积分的基本思想方法就是化整为零,聚零为整,通过对研究对象的无限细分来达到无限逼近的目标。资源信息微积分和数值微积分在方法论上如出一辙,大资源可以化为小资源更细致地描述。早期的分析著录和综合著录已经孕育了这一基本思想,而近年RDF(Resource Description Framework资源描述框架)的出现为资源描述提供了无限细分机制,从而为语义网的开发找到了有效的工具。任何资源信息从本体论看来,无非是由外延和内涵构成的反映事物存在状态的一种代码组合形式。这种现象在早期应用中屡见不鲜,只是并不自觉而已。在图书馆界大谈特谈的分类索引语言和主题索引语言,提升一步说,不就是概念的外延和内涵吗?分类表示事物的类别概念,难道不也是主题吗?其实分类是一种特殊的主题(即分类主题),而主题则是分类中的一个实例(Instance)。在资源描述的过程中,分类的职能是“分”,而主题的职能是“赋值”,有了分类大资源可化为小资源,有了主题就可对小资源进行内涵“计算”(描述)。经过这样的剖析透视,隐藏在知识发现背后大量微积分事实便可窥一斑而见全豹。因此,既然分类和主题关系的本质是外延和内涵的关系,分类和主题只是表达外延和内涵的一种语言,我们就可以利用外延和内涵的关系揭示资源信息描述的本质所在。如图所示:
 
   M表示内涵(Meaning);E表示外延(Extension);e表示由分类表达的小资源,而以元素名来表示它的具体类别;S表示小资源的主题(Subject),即元数据(Metadata),它是元素e的值;曲线C(e)表示外延和内涵的概念(Concept)关系,由于它表达的只是一种逻辑的外延和内涵,并非数值关系,这里不妨把它称之为“隐函数”以此说明隐在其中的是信息和概念而并不存在可以明显表示的数值:e和m作为变量代表具体的外延和内涵,作为函数代表主题之间的外延和内涵关系;R表示资源(Resource)信息,其“值”即为S的准积分或逻辑意义上的积分;显然S就是R的微分。这样,即可建立一个资源信息的逻辑微积分数学模型:这些本不相干的元数据也可在另一概念空间中统一为单变量(内涵)。资源信息变量的坐标变换和空间映射使复杂的信息关系简化为简单的信息关系而又不因此抛弃它的本质。通过E和M我们窥见到了信息所表达的“哭”、“笑”面部表情(物质的存在状态)。为了研究探索事物的本质,我们经常改变视角,有时把父对象分为子对象,如子款目、子字段等,有时又把子对象聚在一起研究。在这里我们再次应用了这一思想,把资源信息从微观空间(子信息空间)移到了宏观空间(父信息空间),成功地表述了资源信息的微积分原理,从而使我们有可能通过这一理论创新去克服知识发现的障碍。

 4 语义网解读

      4.1 有形和无形
    有形分割是一种资源的物理分割,无形分割是一种概念分割。有形分割在几何(物理)空间中进行;无形分割则在概念空间中进行。资源描述的微分始于几何空间。这种微分只是物理实体的结构分解,例如把文献逐层分解为书、刊、章、节、单册等,然而分别形成目录,题录,文摘等二次文献。分明分割的对象是资源的客观知识单元的物理实体。这种分割的优点是直观(有形),缺点是有限,难以在信息空间中扩展(微分)。然而,它必竟为以后的资源信息微分作了必要的前期准备。由于有形分割的空间束缚,人们梦寐以求跨越时空(泛空间)的信息传递目标即便在硬件(网络)支持下也难以实现,其瓶颈制约是因为缺少一座在思维空间和信息空间的“推理”桥梁。所幸,人们从以上资源信息的逻辑函数求反中再次得到了启迪,从而摆脱了信息资源开发利用的根本理论困境。知识发现本身就是知识描述的求反,如果说其初级形式是“检索”,那么它的高级形式无疑就是“思维”了。信息的传播需要有形和无形的互动,实中有虚,虚中有实,虚虚实实才行,要善于在有形中观察描述,在无形中思索,这就是有形和无形,描述和检索,观察和思考的求反过程。离开有形,信息便会魂不附体;离开无形,网络就成行尸走肉。语义网的有形单元是网页,而无形单元就是附于其中的语义和概念。语义网络需要一座链接概念和网页的桥梁。完成网页链接至概念链接质的飞跃。
      4.2 资源信息微观演变
    资源信息的描述坐标已经发生了很大变化。从具体坐标发展到抽象坐标。以下列出几个坐标体系的比较:       
       AACRII   MARC      RDF   ontology
描述对象   文献资源  文献资源     资源   语义
传输平台    纸质    电脑      网络   网络
语言      自然    数据库     XML    OWL等
元素     著录项    字段      标记   标记
 
    实际上,Ontology是RDF在语义领域的应用和发展。它把概念作为特殊的资源对象对待。如果说后者是基于资源的描述框架。那么前者就是基于概念的描述框架。描述的坐标已经发生了从资源到概念(内涵和外延)的转变,知识发现的对象已经发生了从宏观到微观,从具体到抽象,从有形到无形的变化。RDF提供了资源拆分的技术而Ontology侧重于语义的分析,两者的完美的结合为我们架起了一座从宏观资源实体通向微观知识描述的桥梁。Ontology的技术关键就是要刨根问底地弄清楚知识树“怎么种?根在哪?施什么肥?”。简言之,就是用什么去表达?怎样表达?表达什么的问题。
      4.3 语义“磁针”
    尽管从AACRII(Anglo-American Cataloguing Rules.2.ed英美编目条例)到Ontology,知识发现的对象发生了从宏观到微观的变化,但对象间的抽象关系即元素仍然不变,只是具体名称有所不同。在AACRII中元素用著录事项表示,它把书和其他资源联结起来;在Ontology中,随着资源对象的微观化,资源关系进一步抽象为概念(Concept),而资源被抽象为外延E和内涵M。由此看出元素是各种资源的粘合剂,和普通粘合剂的区别在于它犹如磁针带有极性和方向性,极性又可具体化为:外延和内涵。由此可见语义磁针是对元素功能的形象化描述。然而语义磁针不是天然物质,它需要人工导入,在导入过程中首先要对它的内涵外延进行定义使其具有明确的指向(磁极)。RDF Schema(RDF的数据结构模式)担负了这一使命,它的结构化核心词汇(Structured Core Vocabulary)分别用Classes和Properties来定义RDF数据文件所用元素的资源类型(外延)以及所具有的特性(内涵),确定了各元素的描述职能范围,从而为构建语义磁场打好了“地基”。以下是语义磁场各层面的简单示意:
    有了语义磁针(元素),信息的传播就有了“光”。其具体极性就可抽象为+和-,数字化为0和1二态。磁针通过彼此联结便形成“磁力线”,有了“磁力线

[1] [2] 下一页

 
  | 设为首页 | 加入收藏 | 联系我们 | 友情链接 | 版权申明 |  
Copyright 2006-2009 © www.lsqn.cn All rights reserved
历史千年 版权所有