210 likes | 367 Views
SEWM2007 中文 Web 检索评测. 李静静 , ljj@net.pku.edu.cn 北京大学网络实验室 2007-03. 提纲. 评测任务介绍 CWT200g 测试集构建 评测结果 总结. 评测任务之一:主题提取( Topic Distillation ). 对于一个特定主题发现一组关键资源 注重以站点作为资源的查询 要求是在前十个结果中寻找尽可能多的不同站点(用它们的网站的入口页面表示) 判断是否一个好的入口页面 , 应该考查结果是否符合下面三个条件 : 是否大部分切合主题; 提供主题的可靠的信息; 不是一个更大的切合主题站点的一部分.
E N D
SEWM2007中文Web检索评测 李静静, ljj@net.pku.edu.cn 北京大学网络实验室 2007-03
提纲 • 评测任务介绍 • CWT200g测试集构建 • 评测结果 • 总结
评测任务之一:主题提取(Topic Distillation) • 对于一个特定主题发现一组关键资源 • 注重以站点作为资源的查询 • 要求是在前十个结果中寻找尽可能多的不同站点(用它们的网站的入口页面表示) • 判断是否一个好的入口页面,应该考查结果是否符合下面三个条件: • 是否大部分切合主题; • 提供主题的可靠的信息; • 不是一个更大的切合主题站点的一部分
评测任务之二:导航搜索(Navigation search) • 主页查询(Home Page finding,HP) • 通常是一个网站的主页 • 指定页面查询(Named Page finding,NP) • 满足用户需求的特定页面 • 评测准则 • 第一个正确答案出现位置的倒数平均值(MRR)
CWT200g文档集 • CWT200g • 根据天网搜索引擎在2005年11月份数据中的627,036个站点为数据基础 • 容量:197GB • 覆盖29,100个网站,37,482,913个网页 • 网页本身是压缩保存, 以天网格式保存
Topic 示例:主题提取(TD) <top> <num>Number:TD217 <title>体育新闻</title> <desc>Description: 足球,篮球,奥运,亚运等等的新闻报道 </top>
Topic 示例:导航搜索(HP/NP) <top> <num>Number:NP890 <title>中国政法大学学工部</title> </top> <top> <num>Number:NP1145 <title>政府网站2005年十件大事</title> </top>
相关答案集的构建 • 采用pooling方法,pooling的深度比去年加大 • 每个主题1000个待判断的文档 • 相关判断结果 • 保留了56个主题,共1848个相关文档 • 各主题平均答案数 • SEWM2007:33个 vs. SEWM2006:33.5个
TD评测结果 根据保留的56个主题来评分的结果
总结 • 人工评测耗费的资源较大 • pooling深度对评测结果的影响不大,即答案集不全对评测的影响不大 • 不同的主题对pooling深度的要求不同,采用更好的pooling方法可提高构建答案集的效率