用户名: 密码:
会员中心 在线投稿
| 网站首页 | 中国历史 | 世界历史 | 历史名人 | 教案试题 | 历史故事 | 考古发现 | 历史图片 | 文化 | 社会
相关文章    
您现在的位置: 历史千年 >> 文化 >> 文化研究 >> 正文
六爻测疾病新论及实践
爻的四个层次理论及实例…
民俗学教学改革理论及实…
论中国古代文体论研究范…
“吟咏情性”与“以意为…
浅论宋代话本体传奇的世…
老庄生态美学思想的三维…
王岳川著《艺术本体论》
论焦竑的文论及其学术基…
梁漱溟文化生命理论及其…
最新热门    
 
本体论及语义搜索引擎

时间:2009-8-8 16:47:03  来源:不详
and sufficient for a thing to be a member of the class.)。例如:“正方形是四个角都是直角的四边形”就是一个简单概念。而“正方形是四个角都是直角的四个边等长的四边形”就是一个详细概念,因为四个边等长是正方形的充分且必要条件。
    关系描述概念和概念属性的交互。
    实例是概念表示的具体的事物,如对于大学这个概念,山东大学就是一个实例。严格的说,一个本体不应该包括任何实例,因为它被假设为一个具体领域的概念化。一个本体与相关的实例的组合就是我们如今所称呼的知识库(knowledge base)。
    公理是用来限制类和实例的取值范围,公理中包括许多具体的规则和约束。
    ★ 六元组表示法
    这种方法的基本思想就是用一个六元组来表示一个本体。
    An Ontology={C,AC,R,AR,H,X}
    其中C表示概念的集合。AC表示多个属性集合组成的集合,其中每个属性集合对应于一个概念。R是一个关系集合。AR是由多个属性集合组成的集合,其中每个属性集合对应于R中的一个关系。H表示概念之间的层次结构关系,X表示公理集合。
    为了深入描述本体的表示方法,以下列出了一个家庭本体描述实例。
    Family_Ontology={Cfamily,ACfamily,R family,ARfamily,H family,X family}where
    Cfamily={father,mother,children}
    ACfamily={ACfamily(father),ACfamily(mother),ACfamily(children)}
    ACfamily(father)={name,age,job,salary,……}
    ACfamily(mother)={name,age,job,salary,……}
    ACfamily(children)={name,age,sex,……}
    R family={TakeCareOf(mother,mother,children),
    Educate(father,mother,children),
    Help(children,mother),……}
    ARfamily ={ARfamily(TakeCareOf),ARfamily(Educate),ARfamily(Help),……}
    ARfamily(TakeCareOf)={feed,clothing,seeDoctor,……}
    ARfamily(Educate)={teach,exercise,……}
    ……
    (3)本体的构造的生命周期
    了解了本体建设的准则和方法论之后,下一步就是要着手建立本体。而建立的过程可以用生命周期的概念来描述。Uschold & Gruninger提出了一个本体构造的方法学框架[4](图1),框架包括以下组成部分:
    首先要明确本体使用的目的和范围,然后依次构造本体。构造本体过程可以分为三个阶段:
    本体捕获就是确定关键的概念和关系,给出精确定义,并确定其它相关的术语;本体编码即选择合适的表示语言表达概念和术语;已有本体的集成是对已有本体的重用和修改。这个阶段也是一个循环往复的迭代过程。
    最后是评估阶段,要根据需求描述、能力问题(competency question)等对本体以及软件环境、相关文档进行评价。
      3.4 基于本体的语义搜索引擎模型简介(OntoSSE,ontology-based Semantic Search Engine)
    OntoSSE是基于本体的搜索引擎,它能够实现语义搜索、知识检索和一定的推理功能。本模型假设搜索引擎存在的环境是web网页,这些网页并未自动含有语义标记。
    此系统也应具备搜索引擎的各种基本的功能,比如网页的遍历和获取、索引的建立、页面查找算法等,都可以参考目前流行的搜索引擎的结构和实现过程。
    OntoSSE的重要之处是信息库和知识库的交流。知识库是实现智能搜索的核心,它如同人的大脑,其增长也需要一种自然的循环。知识库的丰富也决定着检索能力和Question-Answer能力的高低。信息库是知识库存在和发展的空间,知识库就是对信息库的判断、提取、分析和概括。智能搜索引擎就是通过知识库把用户的问题提高到知识层面,然后利用这个知识检索信息库。[5]二者的有机结合离不开语义分析和知识管理。因此,Ontology作为语义分析和知识共享和重用的重要基础,与知识库、信息库一起构成OntoSSE的三大支柱。
    展示了基于本体的语义搜索引擎OntoSSE的系统结构及其工作流程。OntoSSE模型的工作原理和检索步骤可以概括如下:
    (1)搜索引擎通过自动网页采集器(web spider)来抓取网页,参照特定词表将网页信息分类建立索引,加入索引库中。
   OntoSSE的体系结构及其工作流
    (2)由人工、自动或者半自动的方式,建立领域或者通用的本体。(3)参照本体,使用本体描述语言(DAML、RDF)对文档进行标注。(4)标注的文档(RDF Triple)相当于一个本体的实例,它被存放在知识库中。(5)用户以自然语言输入查询请求,这种请求可能是关键字,或者一个问题。(6)查询过滤器(分析器)对用户的查询请求进行语义分析,提取出相关属性的值。(7)检索代理结合RDF Triple中体现的类和关系信息以及由查询过滤器提交的属性值,进行逻辑推理,生成查询实例。(8)查询实例被传往信息数据库,在不同目录中查找,并将结果处理后返回给用户。例如,如果我们要检索“微软总裁是谁”,将这个问题输入模型以后,查询过滤器根据分词技术,进行语义理解,分析出该句子的语义实际表示了“有某个名为‘职务’的属性其值是‘微软总裁’”。而通过本体和知识库,系统通过推理,可以知道在名为“人”的类中有名为“职务”的属性,这样,在进行语义推理时,就生成一个人的类的实例,其中有属性“职务=微软总裁”,而通过知识库得知,这个实例的名字属性为“Bill Gate”。这时,我们就获得了“Bill Gate”的答案。最后,我们还可以从信息库和知识库中检索与比尔盖茨相关的各种潜在信息。
    可见OntoSSE模型可实现本体对搜索引擎三个方面的改进:提高结果相关度、语义推理功能和知识检索。

      4 结束语

    通过本体支持语义,支持人机之间的交流,从而实现机器智能,为web的发展带来了新的契机。而本体在搜索引擎中的应用,必将对搜索引擎的易用性和效率,产生极大的改进,从而使得web用户能够更好的在浩如烟海的信息海洋中遨游。

【参考文献】
    1 中国互联网络信息中心.第十四次中国互联网络发展状况统计报告[R].2004/7
    http:llwww.cnnic.net.cn/
    2 Ontologies-Description and Applications.http://wiki.w3china.org/wiki/index.php
    3 Gruber T.Towards principles for the design of ontologies used for knowledge sharing.International Journal of Human-Computer Studies 1995,43(5/6):907-928
    4 Uschold M.Building Ontologies:Towards UnifiedMethodology[J].Inexpert systems 96,1996 (3)
    5 吴丹.搜索引擎的智能化研究[J].情报理论与实践,2002(4)

上一页  [1] [2] 

 
  | 设为首页 | 加入收藏 | 联系我们 | 友情链接 | 版权申明 |  
Copyright 2006-2009 © www.lsqn.cn All rights reserved
历史千年 版权所有