Thursday, January 20

What is Ontology



刚才花了半个钟头, 用一个书的例子写了"What is Ontology", 一发送,网络连接失败, 甚至没有存档!
keso建议我节哀顺便,我看还是重写一遍吧。



Ontology: 存在论,本体论。
这是一个2000年前希腊哲学家们提出的概念,最近由于W3C翻出这个词来,搞得脑袋乱乱。

搜索网络:
介绍Ontology,先得从Semantic Web(语义网)开始。

目前的万维网(WWW)是以读者为目标,用各种颜色、字体、多媒体技术表示琳琅满目的内容。但是如果要做软件来提取网页的意思,汇总网络的知识,有许多东西要改变。比如说:现在有一个书目网页上有这样一段:
书 名:What is Ontology
作 者:Ben
译 者:Tim Berners-Lee
你很容易知道这里要表示的内容,但是如果一个软件读到这个网页,它看到的是什么呢?
书 名:〈span style="font-weight: bold;">What is Ontology〈/span>
〈span style="color:red;">作 者:〈a href="http://fadshop.net/ben">Ben〈/a>〈/span>
译 者:Tim Berners-Lee
呜,乱糟糟。这个软件就需要从这里分析出书名、作者、译者等信息。更糟糕的是这个软件必须是对一个网页来定制;如果它来到另一个有相同内容的网页,所看到的原码又不一样,需要对这个做另一番的处理。即使同一个网站,老板随时可能修改版面风格,你的程序又跑不动了。

如果按照XML的方式来组织网站就好了:

〈book>
  〈title>What is Ontology〈/title>
  〈author>Ben〈/author>
  〈translator>Tim Berners-Lee〈/translator>
〈/book>
〈person>
  〈name> Ben 〈/name>
  〈website>http://fadshop.net/ben〈/website>
〈/person>

然后再写清楚author是person的一种就可以了。

用这种构架来表示互联网,就可以轻易编写程序,在各大出版社或书店的网站里跑来跑去,收集所有书的内容,从里面找到你所需要的资料。找到你心仪的书之后, 程序还会检查一下书店的地址,再在邻近街上找到一个好的咖啡馆,告诉你在买书的时候不妨进去坐坐。程序再来到市政网站,找到公交车路线和时间,帮你把一切 弄得妥妥当当,买书的过程就是一个享受。
是啊,只要书店、咖啡馆、市政府的网站都用共同的方式来标注它们的内容,网络就成为一个统一的知识库,可以用程序找到最适合你的东西。

上面所说的就是Semantic Web(语义网)。这里还有一个小障碍:如果有一个书店用〈writer>而不是〈author>来表示作者,怎么办?Ontology就是要定义一个专业领域内的词汇,并且描述这些词汇之间的关系。比如说:〈author>是一个person,不是用来吃的,没有奶油味道;〈book>一定要有书号ISBN,否则就是盗版书...

简单来说,Ontology就是一个专业词汇表。我说“专业”是因为目前人们只能从专业开始,慢慢覆盖人类的所有知识领域,不可能一下子把所有都包含进来。

现在再来看看关于Ontology的定义,是不是另有一番味道?

  • an explicit formal specification of how to represent the objects, concepts and other entities that are assumed to exist in some area of interest and the relationships that hold among them.
  • 共享概念模型的形式化规范说明



Labels: ,

2 Comments:

At January 20, 2005 11:11 AM, Blogger keso said...

节哀。。。

 
At October 05, 2005 8:53 PM, Blogger Unknown said...

看贴回帖。 :D

 

<< Home