用Lucene做一个简单的Java搜索工具(1)

发表于:2007-06-11来源:作者:点击数: 标签:
初学Lucene,刚接触搜索引擎。知道了一点点,想做个小工具,实现根据“单词”搜索某个 java 源文件。比如输入“String”去查询某些java源文件里用到了这个类。 这个想法的来源是,在以前刚学java时,有一本java基础教程的书的附带光盘里有作者写的一个程序,

初学Lucene,刚接触搜索引擎。知道了一点点,想做个小工具,实现根据“单词”搜索某个java源文件。比如输入“String”去查询某些java源文件里用到了这个类。

这个想法的来源是,在以前刚学java时,有一本java基础教程的书的附带光盘里有作者写的一个程序,可以方便初学者查找某些类在哪个实例里出现。当时没有太在意,觉得作者的代码很长。所以现在想自己也写一个这样的小程序。

开发工具与运行环境:使用Lucene2.0的包,jdk1.5,在WindowsXP下运行。

思路分析与设计

整个程序里,除了Lucene的必要操作外,就是IO的基本操作了。因为要对某目录下及其子目录下的所有Java源文件进行索引,就要用到递归,同时要过滤掉非Java源文件。根据这种情况,设计了以下5个类。

主类:索引类(IndexJavaFiles),搜索类(SearchJavaFiles)

异常类:索引异常类(IndexException),搜索异常类(SearchException)

还有一个文件过滤工厂类(FileFilterFactory)。

 

异常类不是必要的,特意设计来包装IO异常、文件异常和Lucene的异常。文件过滤工厂类的出现并不是故弄玄虚,只是不想太多代码集中一起,就把文件过虑器的设计放到一个类里。下面是程序的完整代码及注释。



IndexJavaFiles.java

/**

*indexthejavasourcefiles

*/

package powerwind;



import java.io.*;

import java.util.Date;



import org.apache.lucene.document.*;

import org.apache.lucene.index.IndexWriter;



/**

*@authorPowerwind

*@version1.0

*/

publiclearcase/" target="_blank" >cclass IndexJavaFiles { 

/**

*默认构造方法

*/

public IndexJavaFiles() {



/**

* 这个私有递归方法由index方法调用,保证index传入的file是目录不是

文件

*

*@paramwriter

*@paramfile

*@paramff

*@throwsIndexException

*/

privatevoid indexDirectory(IndexWriter writer, File file,

FileFilter filter)throws IndexException {

if (file.isDirectory()) {

// 有选择地(过滤)获取目录下的文件和目录

File[] files = file.listFiles(filter);

// 非空目录

if (files != null) {

for (int i = 0; i < files.length; i++) {

indexDirectory(writer, files[i], filter);

}

}

} else {

try {

// 这里的file经过先前的过滤

writer.addDocument(parseFile(file));

System.out.println("增加文件: " + file);

} catch (IOException ioe) {

thrownew IndexException(ioe.getMessage());

}

}

}



/**

*传参数是文件就直接索引,若是目录则交给indexDirectory递归

*

*@paramwriter

*@paramfile

*@paramff

*@throwsIndexException

*/

publicvoid index(IndexWriter writer, File file, FileFilter filter)

throws IndexException {

// 确定可读

if (file.exists() && file.canRead()) {

if (file.isDirectory()) {

indexDirectory(writer, file, filter);

} elseif (filter.accept(file)) {

try {

writer.addDocument(parseFile(file));

System.out.println("增加文件: " + file);

} catch (IOException ioe) {

thrownew IndexException(ioe.getMessage());

}

} else {

System.out.println("指定文件或目录错误,没有完成索引");

}

}

}



/**

*@paramfile

*

*把File变成Document

*/

private Document parseFile(File file) throws IndexException {

Document doc = new Document();

doc.add(new Field("path", file.getAbsolutePath(),

Field.Store.YES,

Field.Index.UN_TOKENIZED));

try {

doc.add(new Field("contents", new FileReader(file)));

} catch (FileNotFoundException fnfe) {

thrownew IndexException(fnfe.getMessage());

}

return doc;

}

}


共3页: 1 [2] [3] 下一页

原文转自:http://www.ltesting.net

评论列表(网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述)
...