IIs5.0建站点--〉第八章 索引服务(续)

发表于:2007-06-30来源:作者:点击数: 标签:
索引服务工作原理 索引服务将其所有的索引信息存储在编录中。编录中包含了索引信息和文件系统目录的存储属性。 Windows 2000安装索引服务后,将自动构造系统编录和Web编录,前者列出了所有永久连接磁盘驱动器的内容;后者则包含IIS相关的目录内容。 索引服务
索引服务工作原理
    索引服务将其所有的索引信息存储在编录中。编录中包含了索引信息和文件系统目录的存储属性。Windows 2000安装索引服务后,将自动构造系统编录和Web编录,前者列出了所有永久连接磁盘驱动器的内容;后者则包含IIS相关的目录内容。
    索引服务的实现包括索引过程和查询过程。
索引过程
    索引过程对待索引文件进行预处理,形成编录文件,使查询工作得以顺利进行。索引过程通常在索引服务初始化时进行。我们可以将这一过程比喻为图书馆的编目工作:在书库中成千上万本书中找到

读者想要的一两本书目并不是件容易的事情。为此,我们要先对所有的书籍进行编目,形成分类目录、书名目录和作者目录,依赖于这些目录的索引,读者才能快速准确的找到目标。
??相应的,索引服务也需要对目录文件进行预处理,也就是索引过程。查询功能其实是在索引过程形成的编录文件中进行查询工作。
??索引过程的工作原理如右上图所示。

当网站目录或虚拟目录中的内容添加到Web编录中。
??1.筛选器负责将各种不同文件格式的文件内容解读为文本形式的字符串。筛选器是格式相关的,一种类型的文件只有在相应类型筛选器的支持下才能被索引。
??2.不间断的文本字符串在单词截断器的作用下划分成相互独立的单词,单词截断器还要负责文本歧义判断的工作,以确保断句正确。
??3.从以上步骤中得到的单词对用户而言并不全部有用,有一些例外词或称干扰词显然不应包含在索引中,例如中文里的"的、地、了、什么、这个"和英文里的"I、you、and、of"等。
??4.经过规范化的文字成为最终索引的内容。
??5.上述步骤形成的索引以编录文件的形式储存在系统中,编录文件大约相当于编录所包含的全部目录大小的15%~30%。
查询过程
    查询过程是索引服务真正处理用户请求的工作阶段。查询存在于浏览器和Web服务器之间,最基本的查询表查询方式的工作过程如下。
如右图所示:
??1.在浏览器端,用户填写查询表单,其中包括查询关键词或关键词的逻辑组合。
??2.查询表单以Inte.net数据查询文件(IDQ文件)的形式发送到Web服务器。
??3.服务器在其编录文件中查询相应关键词,找到含有这些关键词的文档。
??4.服务器将查询结果形成HTML拓展文件(HTX文件),发送回

浏览器。
??5.浏览器端按照返回结果决定下一步任务。
??注意,服务器并没有将包含用户关键词的全部文档都返回浏览器,在HTX文件中返回的仅是这些文档的名称和链接。
查询编录实例
    索引服务提供了一个内置的查询界面,作为一个查询编录的例子,我们来看一下这个查询表格的使用方法:
??1.打开【计算机管理器】。
??2.展开左侧控制树中的【服务和应用程序】节点。
??3.展开【索引服务】节点。
??4.展开【Web】编录。
??5.单击【查询编录】,打开如右图所示的查询表格。
??6.在查询拦中以自由文本方式输入关键词,单击【查询】。
??7.右侧窗格的结果区显示索引服务找到的结果。单击结果链接可打开相应文档。

管理索引服务
    前面我们曾经提到过,索引服务是一种零维护的服务,其管理工作相应就小得多。经过以上两节对索引服务概念和工作原理的了解,现在我们可以开始索引服务的配置和管理工作了。
创建编录
    编录是Windows 2000进行索引管理的基本逻辑单位,每个编录包含一组文件目录,它们的索引信息由编录文件储存。编录之间是相互独立的,好比两套相互独立的图书目录系统,彼此不能交互索引信息。

  系统编录和Web编录是Windows 2000的内置编目,一般情况下使用Web编录作为IIS网站所以的主要编录。如果需要对网站索引信息进行详细划分,可以规划多个不同编目。创建编录的方法如下:
  1.打开计算机管理器。
  2.展开【服务和应用程序】节点。
  3.右击【索引服务】,指向【新建】,单击【编录】。
  4.如右上图所示,指定编录名称和位置,即编录文件的储存路径。单击【确定】。

添加目录
未添加目录的编录不能提供任何索引服务,所以应将需要索引是目录有组织的添加到相应的编录中。前文提到的内置Web编录缺省包括了IIS站点相关的目录,例如:
c:\inetpub\wwwroot\, d:\program files\common files\system\msadc??用户可以根据自己的实际情况适当增减被索引的目录范围,甚至可以另建新的编录进行索引。
在编录中添加目录的方法如下:
??1.打开计算机管理器。
??2.展开【服务和应用程序】、【索引服务】、【目录】节点。
??3.右击【目录】,指向【新建】,单击【目录】。
??4.如右图所示,指定目录的路径和别名。
??5.单击【确定】完成。

当目录添加到编目中之后,索引服务自动进行扫描和索引过程,无需用户参与。加入编录的目录并非全部有效,我们可以指定编目的已经添加的一些目录不参与编目索引。这样,临时暂停某些目录的索引时就不需将其从编录中删除;需要恢复索引时,仅需重新标记未有效即可。上述过程操作如下:
??1.在编录节点的目录列表中双击需要暂停索引的目录,打开如右图所示的【添加目录】对话框。
??2.在【包括在索引中吗?】问讯框中单击选择【否】。
??3.单击【确定】返回。
??4.这样,该目录就从编录中排除,不再对其进行索引。

导出列表
??为了将某个编目的全部目录设置内容保存为一个文件,可以导出目录列表,方法如下:
??1.在索引服务MMC窗口展开【编目】节点。
??2.右击【目录】节点,选择【导出列表】。
??3.如右图所示,在【另存为】对话框中指定列表文件类型和路径,缺省情况下将列表保存为纯文本文件。
??4.根据需要选择【只保存选定行】复选框。
??5.单击【保存】返回。

索引网站和目录
??前面提到,索引Web网站的方法之一就是将储存网站内容的文件夹加入编录中,在计算机管理器的索引服务节点进行此操作。然而,对于配置有多个虚拟目录的Web站点而言,这样的索引方式显然并不适用。
??在Internet信息服务器中索引Web站点、目录和虚拟目录的方法如下:
??1.单击【开始】、【程序】、【管理工具】、【Internet服务管理器】。
??2.展开左侧控制树中的计算机图标。
??3.右击需要索引的Web站点,选择【属性】。
??4.单击【主目录】选项卡。
??5.如右图所示,选择【索引此资源】复选框。
??6.单击【确定】。
    对于站点属性以下的目录、虚拟目录,均可采用此方法进行索引或解除索引。

对于NTFS分区上的目录,我们亦可指定对其的索引与否,步骤如下:
??1.在资源管理器中浏览并找到需要索引的文件夹,注意文件夹必须位于NTFS分区上。
??2.右击文件夹,选择【属性】。
??3.在目录属性对话框中单击【高级】,打开如右图所示的【高级属性】对话框。
??4.选择【允许索引服务编制该文件夹的索引】复选框。
??5.单击【确定】关闭对话框。
??6.单击【确定】完成。

手动扫描
    扫描是清点目录以便确定应该为哪些文档建立索引的过程。根据需要,索引服务会自动执行扫描。扫描分为完全扫描和增量扫描两种,完全扫描列出编录中全部目录所包含文档的清单,并将其添加到索引文档列表中。在下列情况中,索引服务对计算机上的磁盘驱动器进行完全扫描:
??● 索引服务在安装后第一次运行时
??● 将文件夹添加到编录中时
??● 发生严重错误时,作为故障恢复的一部分
??而当索引服务重新启动时,将通过增量扫描检测所有文档发生的变化,从而可以更新其索引。如果索引服务丢失相应数据,也会执行增量扫描。

??一般情况下,索引服务自动进行扫描工作,无需用户参与。但是,在某些情况下,有必要手动扫描。例如,添加新的筛选器之后,必须进行手动扫描才能使其生效。手动扫描的方法如下:
??1.在计算机管理器中展开索引服务节点。
??2.展开Web编录,单击【目录】。
??3.如右图所示,目录列表中右击需要重新扫描的目录,指向【所有任务】,选择【重新扫描】。
4.如右图所示,在确认对话框中单击【是】开始扫描。
??5.最后,注意重新扫描的方式也有完全和增量两种,对于添加筛选器之类的情况,应选择完全扫描,以便对所有文件进行重新过滤。
合并临时索引
    缺省情况下,编录中所包含的文件被统一扫描,生成唯一的编录文件。然而,随着向编录中添加目录、文件内容改变、尤其是进行增量索引之后,往往形成多个临时索引,这些独立的编录索引文件极大的影响了索引服务的运行,也增加了索引占用的空间。
??在适当的时候,需要合并编录的临时索引,方法如下:
??1.机管理器中展开索引服务。
??2.单击选择编录。
??3.单击【操作】菜单,指向【所有任务】,选择【合并】。
??4.在确认对话框中选择【是】开始合并。


索引性能调整与安全
    启动索引服务必然要消耗一定的系统资源,因此,仅索引必要的文档目录是十分必要的。此外,索引服务的安全性是个另人瞩目的问题,如果用户能够索引没有相应权限的文件,就会对系统安全性造成隐患。本节着重介绍索引服务的性能调整和安全性问题,以及索引服务故障排错。
索引性能调整
    用户对索引服务性能的需求取决于使用索引服务的频繁程度,如果一台服务器的主要角色定位于专用索引服务器,则其索引服务有必要对多数系统资源享有优先占有权。而对于偶尔从事索引服务的计算机,就不必考虑上述优先性。
??索引服务的性能调整在计算机管理器上进行,注意在调整服务器性能之前,要先停止索引服务。然后右击索引服务节点,指向【所有任务】,选择【性能调整】。打开如右图所示的索引服务用法对话框。

根据服务器当前承担的索引工作量和服务性质选择索引服务用法,可选的用法有:【专用服务器】、【经常使用】、【偶尔使用】、【从不使用】和【自定义】。它们所对应的规划索引工作量依次递减, 对于一般的包含索引功能的Web网站服务器,指定【偶尔使用】用法即可满足需求,如果该计算机还担当其他网络服务器的角色,最好选择【偶尔使用】用法以减少索引服务对内存等资源的占用率。
??如果选择自定义方式,就可以单击【自定义】按钮进行详细配置,如右图所示。
??在【所需性能】对话框中,可以自定义为索引和查询服务预留的资源。将【索引】滑块移到【迟缓】以延缓索引或移到【立即】以立即索引新文档和更改过的文档。迟缓索引使用较少的资源,立即索引将使用尽可能多的计算机资源。若想一次处理少量查询,可将【查询】滑块移到【低负载】;若需要同时处理大量的查询,可将滑块移到【高负载】。

??低负载使用较少资源,而高负载使用较多的资源。该对话框中的两个滑块为灵活配置索引服务器提供了有益的选择,应该据服务器的硬件水平和系统的实际需要配置这些选项。完成后单击【确定】返回。
Windows 2000内置的性能监视器可以监视索引服务的性能。于索引服务相关的性能计数器在下列表格中分别列出。
??系统监视器中的索引服务对象包含下表中列出的性能计数器,它们与索引、合并及查询相关:
?计数器名?说明
?索引大小 (MB)?所有已保存索引的总大小(以兆字节为单位)
?保存的索引?已保存索引的总数
?合并进度?完成合并的百分比
?词列表?词列表总数
?唯一关键字?索引中的唯一字的数量
?索引过的文档数?自从当前索引会话启动以来索引过的文档数。注意:这不包括在索引服务会话之前索引过的
?文档。
?待索引的文档数?已知需要索引的最小文档数
?延迟建立索引?需要编入索引但因为正在文档正在使用而暂时无法完成的文档数。
?文档总数?索引中已知的文档总数
?运行中的查询?正在处理的查询数
?查询总数?在该索引会话中处理的查询总数
系统监视器中的索引服务对象包含下表中列出的性能计数器。
?计数器名?说明
?绑定时间(毫秒)?绑定到筛选器文件的平均时间(毫秒)
?索引速度(MB/小时)?文档索引速度(MB/小时)。不包括生成的摘要。
?总索引速度?文档索引速度(MB/小时)。包括生成的摘要。

索引服务安全性
    索引过程本身就是系统安全性隐患之一,因为一旦索引结果的被提供给没有权限的用户,就可能招来黑客按图索骥的攻击。实际上,索引服务的安全性是由Windows 2000在系统后台自动执行的。索引服务在向浏览器端提供索引结果之前,先要滤掉用户端没有权限访问的资源,以确保提供给浏览器端的资源列表不包含权限问题。
    当然,为NTFS分区上的资源指定额外的安全性还是十分必要的,例如直接禁止资源加入索引列表,这样,该资源就不能以任何形式进行索引。禁止索引NTFS资源的方法如下:
??1.在资源管理器中,选择NTFS分区上的文件或文件夹。
??2.在【文件】菜单上,选择【属性】。
??3.单击【常规】选项卡,单击【高级】。
??4.清除【对于快速搜索,允许索引服务编制该文件夹的索引】复选框。
??5.单击【确定】返回。

原文转自:http://www.ltesting.net