Lucene - 短语查询
public class PhraseQuery extends Query
序号 | 构造函数和描述 |
1 | PhraseQuery() 构造一个空的短语查询。 |
序号 | 方法和描述 |
1 | void add(Term term) 在查询短语的末尾添加一个词条。 |
2 | void add(Term term, int position) 在查询短语的末尾添加一个词条。 |
3 | Weight createWeight(Searcher searcher) 专家:为该查询构造合适的Weight实现。 |
4 | boolean equals(Object o) 如果对象o等于此对象,则返回true。 |
5 | void extractTerms(Set<Term> queryTerms) 专家:将此查询中出现的所有词条添加到词条集中。 |
6 | int[] getPositions() 返回此短语中词条的相对位置。 |
7 | int getSlop() 返回松弛度。 |
8 | Term[] getTerms() 返回此短语中的词条集。 |
9 | int hashCode() 返回此对象的哈希码值。 |
10 | Query rewrite(IndexReader reader) 专家:调用将查询重写为原始查询。 |
11 | void setSlop(int s) 设置查询短语中词语之间允许的其他词语数量。 |
12 | String toString(String f) 打印此查询的用户可读版本。 |
- org.apache.lucene.search.Query
- java.lang.Object
private void searchUsingPhraseQuery(String[] phrases) throws IOException, ParseException { searcher = new Searcher(indexDir); long startTime = System.currentTimeMillis(); PhraseQuery query = new PhraseQuery(); query.setSlop(0); for(String word:phrases) { query.add(new Term(LuceneConstants.FILE_NAME,word)); } //do the search TopDocs hits = searcher.search(query); long endTime = System.currentTimeMillis(); System.out.println(hits.totalHits + " documents found. Time :" + (endTime - startTime) + "ms"); for(ScoreDoc scoreDoc : hits.scoreDocs) { Document doc = searcher.getDocument(scoreDoc); System.out.println("File: "+ doc.get(LuceneConstants.FILE_PATH)); } searcher.close(); }
步骤 | 描述 |
1 | 创建一个名为LuceneFirstApplication的项目,位于com.tutorialspoint.lucene包下,如Lucene - 第一个应用程序章节中所述。您也可以使用Lucene - 第一个应用程序章节中创建的项目,以便理解搜索过程。 |
2 | 创建LuceneConstants.java和Searcher.java,如Lucene - 第一个应用程序章节中所述。保持其余文件不变。 |
3 | 创建如下所示的LuceneTester.java。 |
4 | 清理并构建应用程序,以确保业务逻辑按要求工作。 |
package com.tutorialspoint.lucene; public class LuceneConstants { public static final String CONTENTS = "contents"; public static final String FILE_NAME = "filename"; public static final String FILE_PATH = "filepath"; public static final int MAX_SEARCH = 10; }
package com.tutorialspoint.lucene; import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; import org.apache.lucene.index.CorruptIndexException; import org.apache.lucene.queryParser.ParseException; import org.apache.lucene.queryParser.QueryParser; import org.apache.lucene.search.IndexSearcher; import org.apache.lucene.search.Query; import org.apache.lucene.search.ScoreDoc; import org.apache.lucene.search.TopDocs; import org.apache.lucene.store.Directory; import org.apache.lucene.store.FSDirectory; import org.apache.lucene.util.Version; public class Searcher { IndexSearcher indexSearcher; QueryParser queryParser; Query query; public Searcher(String indexDirectoryPath) throws IOException { Directory indexDirectory = FSDirectory.open(new File(indexDirectoryPath)); indexSearcher = new IndexSearcher(indexDirectory); queryParser = new QueryParser(Version.LUCENE_36, LuceneConstants.CONTENTS, new StandardAnalyzer(Version.LUCENE_36)); } public TopDocs search( String searchQuery) throws IOException, ParseException { query = queryParser.parse(searchQuery); return indexSearcher.search(query, LuceneConstants.MAX_SEARCH); } public TopDocs search(Query query) throws IOException, ParseException { return indexSearcher.search(query, LuceneConstants.MAX_SEARCH); } public Document getDocument(ScoreDoc scoreDoc) throws CorruptIndexException, IOException { return indexSearcher.doc(scoreDoc.doc); } public void close() throws IOException { indexSearcher.close(); } }
package com.tutorialspoint.lucene; import java.io.IOException; import org.apache.lucene.document.Document; import org.apache.lucene.index.Term; import org.apache.lucene.queryParser.ParseException; import org.apache.lucene.search.PhraseQuery; import org.apache.lucene.search.Query; import org.apache.lucene.search.ScoreDoc; import org.apache.lucene.search.TopDocs; public class LuceneTester { String indexDir = "E:\\Lucene\\Index"; String dataDir = "E:\\Lucene\\Data"; Searcher searcher; public static void main(String[] args) { LuceneTester tester; try { tester = new LuceneTester(); String[] phrases = new String[]{"record1.txt"}; tester.searchUsingPhraseQuery(phrases); } catch (IOException e) { e.printStackTrace(); } catch (ParseException e) { e.printStackTrace(); } } private void searchUsingPhraseQuery(String[] phrases) throws IOException, ParseException { searcher = new Searcher(indexDir); long startTime = System.currentTimeMillis(); PhraseQuery query = new PhraseQuery(); query.setSlop(0); for(String word:phrases) { query.add(new Term(LuceneConstants.FILE_NAME,word)); } //do the search TopDocs hits = searcher.search(query); long endTime = System.currentTimeMillis(); System.out.println(hits.totalHits + " documents found. Time :" + (endTime - startTime) + "ms"); for(ScoreDoc scoreDoc : hits.scoreDocs) { Document doc = searcher.getDocument(scoreDoc); System.out.println("File: "+ doc.get(LuceneConstants.FILE_PATH)); } searcher.close(); } }
我们使用了10个文本文件,从record1.txt到record10.txt,包含学生姓名和其他详细信息,并将它们放在E:\Lucene\Data目录中。测试数据。应创建索引目录路径为E:\Lucene\Index。在Lucene - 索引过程章节中运行索引程序后,您可以在该文件夹中看到创建的索引文件列表。
完成源代码、原始数据、数据目录、索引目录和索引的创建后,您可以继续编译和运行程序。为此,请保持LuceneTester.Java文件选项卡处于活动状态,并使用Eclipse IDE中提供的运行选项,或使用Ctrl + F11来编译和运行您的LuceneTester应用程序。如果您的应用程序成功运行,它将在Eclipse IDE的控制台中打印以下消息:
1 documents found. Time :14ms File: E:\Lucene\Data\record1.txt