• 语义标注杂记

    普通类
    • 支持
    • 批判
    • 提问
    • 解释
    • 补充
    • 删除
    • 什么叫语义标注

    1、标注通常是为某一资源 (如一段话或者一个词)赋予一个标识,如在书中将某个概念用红笔画出来;语义标注是基于某个本体对数据源进行标注,这种标注不是划线或者划个圈,而是给它一个标记,如<person>某某某</person>。

    2、《语义网原理与技术》第78页以及后面的部分内容:
    本体在一个具体的应用中需要与实例联系起来,而语义标注技术正能够丰富本体中实例里的技术。从语义网的角度来看,在传统web上添加语义信息,将web的状态从机器可读到机器可理解,这是整个语义网实现的基础。这种语义信息添加过程称为意义标注,语义标注是语义网实现的瓶颈问题。
    语义标注可以从标注的执行者和标注过程所采用的本体两个角度分析。。。
    79页
    针对本体进行语义标注,首先需要明确要标注的对象。从本体的角度来说,就是明确需要将本体中的哪些成份和现实世界建立联系。同时也是标注的粒度问题。本体标注的粒度由粗到细可以分为标注概念、标注概念的属性、标注关系和标注实例。

    3、就是用本体进行标注,指出资源在语义层面上的特征

    图书馆里给书分类可以视为语义标注,它使用本体(分类法)为资源(书)赋予语义特征(分类号)
    为博客文章添标签也可以视为语义标注,它使用本体(已有标签集合)为资源(文章)赋予语义特征(标签)
    语义标注的结果是语义元数据,如一本书的分类号是什么,一篇文章的标签是什么都是语义元数据,可以用于检索
    owl是本体表示语言

    4、OWL只是本体表示语言,而不是本体本身

    同样,RDF是记录元数据的一种方式,而不是元数据本身

    5、在本体的建模阶段,大部分的建模工作都集中在领域知识的抽象表示上,即发现领域内的概念、概念的继承层次、潜在的关系和公理等。对于领域中的实例,在建模时一般不需要考虑它们,除非建模时就能确定该本体所涉及的所有实例。实际上,通常的本体都具有一定的通用性,表示特定领域内的知识,但由于领域内可能的实例数目无穷无尽且动态变化,因此,只有本体和一个具体的应用结合时考虑实例才有意义。将现实应用中涉及的实例和抽象的本体概念相联系,这正是语义标注(Semantic Annotation)所要做的工作。和数据库类比,语义标注就如同为建立好的数据库表添加具体的纪录。

    从语义Web的角度来看,在传统Web上添加语义信息,将Web的状态从机器可读提高到机器可理解,这是整个语义Web实现的基础。通常,这种语义信息的添加是基于本体进行的,称之为语义标注。语义标注将推动语义Web走向实际应用,智能Agent能够根据Web上的语义信息实现智能推理任务,并能提高信息检索的精确性。
    如果将本体看作简化了的知识库,那么从本体的角度来看,添加实例,即进行语义标注,可视为丰富本体的过程。如果站在语义Web的角度来看,语义标注便是语义信息的发布过程:用户依据一定的本体,为页面添加语义信息。然而,语义Web中的标注问题由于受到多方面因素的影响,变得很复杂。一部分人希望语义Web上的语义信息能像页面本身的创建一样,由用户来完成,因为任何机构都不可能完成如此庞大的语义标注任务。这样一来,任何用户都能够选择或创建自己喜好的本体,并利用它们来标注页面。这些本体的规模通常是小型的。目前的很多研究者都支持这种观点,它们认为语义Web将建立在无数的小本体之上,正如Rousset在ISWC2004大会上的特邀演讲中所说的:“Small can be beautiful in the Semantic Web”[Rou04]。但这种观点的缺点也很明显:大量的小本体往往是异构的,这将造成在使用语义信息的过程中需要频繁执行处理本体异构的操作,给应用系统带来沉重的负担。为了克服第一种观点的缺陷,一部分人希望某些大型的机构能提供一些权威而通用的大本体,让用户在标注的过程中使用。但这样做也同样会导致很多问题:首先,本体的提供者如果被少数机构垄断,那将大大限制了用户表达自己思想的自由,Web从此失去了它与生俱来的自由本质;其次,目前的研究已经表明,创建涵盖人类多个方面知识的大规模本体极其困难,而又要让这样的本体得到Web用户的公认,这个目标更难以达到;最后,也是最重要的问题是:什么机构或组织能提供这样的本体呢?W3C还是ISO?Google还是Yahoo?美国国家标准局还是中国国家标准局?这种本体的标准之争必然会涉及到不同国度、历史背景和文化,很难有一个最终的结果。在我们看来,上述两种观点都过于极端,切实可行的标注方案应该是二者的折中,既要保证标注的本体具有一定的通用性,又要保证它能满足用户的要求。涉及专业领域的本体可由领域中的权威机构统一制定,如医学中的UMLS本体,而涉及文化冲突的本体制定时可以考虑多个版本。因此,对语义Web来说,语义标注不仅仅是一种技术,更是一种文化。
    语义标注技术也碰到了经典的“鸡与蛋”的问题:一方面通常的网页创建者很不愿意为创作的网页内容提供语义标注,除非他亲自感受到那样做所带来的巨大好处;另一方面只有大规模的语义标注数据存在,并在Web上实现优于现有技术或现有技术不能解决的应用,才可能有更多人或团体愿意提供语义标注。最后,在语义标注过程中通常既要保证个人的观点,又要比较权威的专家的意见,而且还需要大量本体来满足不同用户的需求;某些用户仅希望通过标注来更快地找到标注对象所对应的网站,而那些本身知道链接的高层用户还要求进一步获得关于标注对象的更精确的描述。
    作为语义Web的基础,很多研究机构都对其进行了深入的研究,但并没有取得根本性的进展。至今,语义标注仍然是语义Web实现的瓶颈问题。

    • 语义标注的意义

    提高检索的准确性和完整性

    为推理奠定基础(比如,有一条公理:如果A喜欢B,那么A也喜欢C。当对用户进行个性化推荐的时候不仅仅只是寻找相关、相似的学习元,还可加上经过推理得到的学习元)

    为用户的个性化推荐奠定基础

    同时是一个丰富本体库的过程

    • 标注(annotation)与语义标注(semantic annotation)

    1.annotation

    Annotation, or tagging, is about attaching names, attributes, comments, descriptions, etc. to a document or to a selected part in a text. It provides additional information (metadata) about an existing piece of data.

    2.semantic annotation is not tagging

    Compared to tagging, which speeds up searching and helps you find relevant and precise information, Semantic Annotation goes one level deeper:

    • It enriches the unstructured or semi-structured data with a context that is further linked to the structured knowledge of a domain.
    • It allows results that are not explicitly related to the original search.

    So, if tagging is about promptly finding the most relevant result, semantic annotation adds diversity and richness to the process.

    3.semantic annotation

    Semantic Annotation helps to bridge the ambiguity of the natural language when expressing notions and their computational representation in a formal language. By telling a computer how data items are related and how these relations can be evaluated automatically, it becomes possible to process complex filter and search operations.

    4.image

    Imagine your search engine understands that "Barcelona" is a city in "Europe", it can answer a search query on "IT Companies in Europe" with a link to a document about Yahoo Office in Barcelona, although the exact words "Barcelona" or "Yahoo" never occur in your search query.

    • 标签:
    • 用户
    • 杂记
    • 本体
    • 标注
    • 语义
    • 语义web
  • 加入的知识群:
    学习元评论 (0条)

    评论为空
    聪明如你,不妨在这 发表你的看法与心得 ~



    登录之后可以发表学习元评论
      
暂无内容~~
顶部