• 软件测试技术
  • 软件测试博客
  • 软件测试视频
  • 开源软件测试技术
  • 软件测试论坛
  • 软件测试沙龙
  • 软件测试资料下载
  • 软件测试杂志
  • 软件测试人才招聘
    暂时没有公告

字号: | 推荐给好友 上一篇 | 下一篇

SEWM-2004中文Web检索测试指南

发布: 2009-4-15 09:20 | 作者: 不详 | 来源: 测试时代采编 | 查看: 41次 | 进入软件测试论坛讨论

领测软件测试网

4 主页/指定页面查询
用户有时候会用名称来查询特定的网页。在这种情况下,一个有效的搜索
系统将在第一个或前几个返回结果中给出那个网页。
今年的任务包括两个任务的组合:主页查询和指定页面查询。这两种情况
下,查询结果只有一个并且用户的查询需求常常是页面的名称。不同的是主页
查询的目标是一个特定的主页,而指定页面查询所找到的可以不是一个主页,
而是满足用户需求的特定页面。例如,主页查询时,查询词“内蒙古民族大学
”对应的查询结果是“www.mzdx.com”;而指定页面查询时,查询词“2001
年中国十大并购人物”对应的查询结果是“www.mergerschina.
com/top10/index-7.asp”。
一些查询/排序策略对两种类型的查询都有效,而有的只对其中一种有效。
我们提供混和的查询集合。评判为:判断参与者返回文档的URL是否为
最初选定文档的URL。当然,如果页面有两个不同的URL,那么这两个都将
被认为是正确的答案。
通过第一个正确答案的位置对系统进行比较。以第一个正确答案出现位置
的倒数平均值(MRR)为评估准则。
在这项工作中,不允许人工的或者交互的修改查询。
5 索引限制
没有索引限制。你可以随意索引每篇文档的全部内容,或者部分内容。
6 提交和判断
1) 所有的结果在2004.11.1之前,提交给北大网络实验室(邮箱地址:
yhf@net.pku.edu.cn)。
2) 提交信息:
主题提取:提交5组运行结果。对于每个查询,列出结果不超过1000个。
主页/指定网页查询:提交5组运行结果。对于每个查询,列出结果不超过
50个。
结果的格式如下(一个结果一行):
topic-id rank sim url
topic-id :topic主题的编号
rank :在返回结果中文档的位次
sim :主题与文档的相似度计算值
url :结果的url。(为文档数据中的URL字段内容)
3) 我们针对每个任务,接受每个参赛队的5组正式提交结果,但是否能够全
部被评测依赖于提交数目、重叠度和可获得的判断资源。希望对于每个任务(主
题提取和两个主页/指定网页查询), 每个参赛队提交的运行结果中有2组被
评估。
4) 所有的评测工作将由我们的评估人员完成。
5) 评估的标准是二元的:是关键资源或者非关键资源,是主页/指定网页或者
非主页/指定网页。
6) 评估是基于文档内容完成的,此外,文档的URL也是评估的依据。特别的,
对于主题提取,文档中包含的链接(特别是在同一个网站上)所指向的文档也
是评估的依据。

延伸阅读

文章来源于领测软件测试网 https://www.ltesting.net/

22/2<12

关于领测软件测试网 | 领测软件测试网合作伙伴 | 广告服务 | 投稿指南 | 联系我们 | 网站地图 | 友情链接
版权所有(C) 2003-2010 TestAge(领测软件测试网)|领测国际科技(北京)有限公司|软件测试工程师培训网 All Rights Reserved
北京市海淀区中关村南大街9号北京理工科技大厦1402室 京ICP备2023014753号-2
技术支持和业务联系:info@testage.com.cn 电话:010-51297073

软件测试 | 领测国际ISTQBISTQB官网TMMiTMMi认证国际软件测试工程师认证领测软件测试网