分享web开发知识

注册/登录|最近发布|今日推荐

主页 IT知识网页技术软件开发前端开发代码编程运营维护技术分享教程案例
当前位置:首页 > 代码编程

Lucene搜索详解

发布时间:2023-09-06 01:54责任编辑:顾先生关键词:暂无标签

学习目标:

  • 掌握lucene搜索的编写步骤
  • 掌握lucene搜索核心API
  • 掌握lucene提供的基本查询
  • 掌握查询解析器的用法及语法

搜索流程详解

1、架构图

2、Lucene搜索API 图示

3、Lucene搜索代码示例

public class SearchBaseFlow { ???public static void main(String[] args) throws IOException, ParseException { ???????//使用的分词器 ???????Analyzer analyzer = new IKAnalyzer4Lucene7(true); ???????//索引存储目录 ???????Directory directory = FSDirectory.open(Paths.get("f:/test/indextest")); ???????//索引读取器 ???????IndexReader indexReader = DirectoryReader.open(directory); ???????//索引搜索器 ???????IndexSearcher indexSearcher = new IndexSearcher(indexReader); ???????//要搜索的字段 ???????String filedName = "name"; ???????//查询生成器(解析输入生成Query查询对象) ???????QueryParser parser = new QueryParser(filedName, analyzer); ???????//通过parse解析输入(分词),生成query对象 ???????Query query = parser.parse("Thinkpad"); ???????//搜索,得到TopN的结果(结果中有命中总数,topN的scoreDocs(评分文档(文档id,评分))) ???????TopDocs topDocs = indexSearcher.search(query, 10); ??//前10条 ???????//获得总命中数 ???????System.out.println(topDocs.totalHits); ???????//遍历topN结果的scoreDocs,取出文档id对应的文档信息 ???????for (ScoreDoc sdoc : topDocs.scoreDocs) { ???????????//根据文档id取存储的文档 ???????????Document hitDoc = indexSearcher.doc(sdoc.doc); ???????????//取文档的字段 ???????????System.out.println(hitDoc.get(filedName)); ???????} ???????//使用完毕,关闭、释放资源 ???????indexReader.close(); ???????directory.close(); ???}} 


搜索核心API详解

1、核心API图示:

2、IndexReader  索引读取器

Open一个读取器,读取的是该时刻点的索引视图。如果后续索引发生改变,需重新open一个读取器。获得索引读取器的方式:

  • DirectoryReader.open(IndexWriter indexWriter) 优先使用
  • DirectoryReader.open(Directory)
  • DirectoryReader.openIfChanged(DirectoryReader)共享当前reader资源重新打开一个(当索引变化时)

IndexReader分为两类:

  • 叶子读取器:支持获取stored fields, doc values, terms(词项), and postings (词项对应的文档)
  • 复合读取器:多个读取器的复合。只可直接用它获取stored fields 。在内部通过CompositeReader.getSequentialSubReaders 得到里面的叶子读取器来获取其他数据。
  • DirectoryReader 是 复合读取器

注意:IndexReader是线程安全的。

IndexReader 主要API:

LeafReader 主要API:

3、IndexSearcher 索引搜索器

  • 应用通过调用它的search(Query,int)重载方法在一个IndexReader上实现搜索。出于性能的考虑,请使用一个IndexSearcher实例,除非索引发生变化。如索引更新了则通过DirectoryReader.openIfChanged(DirectoryReader) 取得新的读取器,再创建新的搜索器。

注意:IndexSearcher是线程安全的。

4、IndexSearcher 索引搜索器API

搜索 API:

获取文档 API:

TopDocs ?搜索命中的结果集 ??(Top-N)

TopFieldDocs ?按字段排序的搜索命中结果集

ScoreDoc



Query查询详解



QueryParser详解

Lucene搜索详解

原文地址:https://www.cnblogs.com/morn21/p/9047118.html

知识推荐

我的编程学习网——分享web前端后端开发技术知识。 垃圾信息处理邮箱 tousu563@163.com 网站地图
icp备案号 闽ICP备2023006418号-8 不良信息举报平台 互联网安全管理备案 Copyright 2023 www.wodecom.cn All Rights Reserved