1 / 115

本体的发现与应用

本体的发现与应用. 2014 年 《 本体工程 》 课程讲座 程龚 gcheng@nju.edu.cn. 如果由你来开发一个语义 Web 应用,首先你会去做什么?. 本体的应用. 下 半节课. 本体的重用. 上半节课. 提纲. 本体的发现 本体的搜索 本体的呈现 体验本体搜索引擎 本体的应用. 本体的搜索. 包含“ professor ”的本体. 包含“ student ”的本体. 如果由你来具体实现,你会怎么做?. professor. student. 倒排索引 (inverted index). 布尔检索模型. 开源软件.

selma
Download Presentation

本体的发现与应用

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 本体的发现与应用 2014年《本体工程》课程讲座 程龚 gcheng@nju.edu.cn

  2. 如果由你来开发一个语义Web应用,首先你会去做什么?如果由你来开发一个语义Web应用,首先你会去做什么?

  3. 本体的应用 下半节课 本体的重用 上半节课

  4. 提纲 • 本体的发现 • 本体的搜索 • 本体的呈现 • 体验本体搜索引擎 • 本体的应用

  5. 本体的搜索

  6. 包含“professor”的本体 包含“student”的本体 如果由你来具体实现,你会怎么做?

  7. professor student 倒排索引 (inverted index)

  8. 布尔检索模型

  9. 开源软件 • 布尔检索引擎 • Apache Lucene (http://lucene.apache.org/)

  10. 词形变换

  11. 同义词

  12. 你准备怎么解决这些问题?

  13. 索引扩展

  14. (student OR students OR learner OR learners) AND (learn OR learns OR learning OR learned OR learnt) student AND learn • student • students • learner • learners • learn • learns • learning • learned • learnt 查询扩展

  15. 索引扩展 vs. 查询扩展,它们各有什么优缺点?

  16. 开源软件 • 词干提取器 • Snowball (snowball.tartarus.org) • 同义词典 • WordNet (wordnet.princeton.edu)

  17. 包含查询词的结果还是有很多,怎么办?

  18. 排序方法1 • 与查询越相关,排序越靠前。

  19. 词频 (term frequency) TF(student)=3 TF(faculty)=1 …

  20. 词频 (term frequency) TF(student)=3 TF(faculty)=1 … TF(student)=2 TF(faculty)=1 …

  21. 反文档频率 (inverse document frequency) TF(student)=3 TF(faculty)=1 … TF(student)=1 TF(faculty)=3 … DF(student)=1000 DF(faculty)=200 …

  22. TF-IDF TF-IDF(student)=3log(10000/1000)=3 TF-IDF(faculty)=1log(10000/200)=1.7 … TF-IDF(student)=1log(10000/1000)=1 TF-IDF(faculty)=3log(10000/200)=5.1 … Φ=10000 DF(student)=1000 DF(faculty)=200 …

  23. 排序方法2 • 被引用越频繁,排序越靠前。

  24. 排序方法3 • 被使用越广泛,排序越靠前。

  25. 排序方法 • 与查询越相关,排序越靠前。 • 被引用越频繁,排序越靠前。 • 被使用越广泛,排序越靠前。

  26. 除了排序,你还有什么招数?

  27. 分类

  28. 本体的呈现

  29. 节点连接图 (node-link diagram)

  30. 缩进列表 (indented list)

  31. 嵌套矩形 (treemap)

More Related