ElasticSearch+.net 大数据处理（一）

发布时间：2023-09-06 01:17责任编辑：蔡小小关键词：暂无标签

最近需要处理过亿的数据，笔者在朋友的推荐下学习了ElasticSearch，看了网上很多博客也遇到了很多问题，所以笔者记录一下学习和使用ElasticSearch的过程。

ElasticSearch的概念网上很多，笔者就不在此多啰嗦了，直接进入实战。

一、环境配置（仅window用户）

1. ElasticSearch是基于Lucene构建的一个分布式搜索引擎，运行需要java环境，所以要先配置java环境，安装JDK，这里笔者使用的版本是 jdk1.8.0_144

2.我是window用户，初学ElasticSearch，很多配置以及安装各种插件还需要手动编译jar,比较复杂容易出错，

所以就直接使用elasticsearch的rtf版本（https://github.com/medcl/elasticsearch-rtf）

笔者在github上下载的rtf版本的es版本为Elasticsearch 5.1.1（网上很多文章因为版本不一样，所以一些配置和命令可能有误，这种坑笔者已经遇到很多次了）

2.1 启动

这个是笔者下载的ElasticSearch目录结构，在控制台执行elasticsearch.bat（如下图）

这样就启动了Elasticsearch ，然后在浏览器中输入 http://localhost:9200/ 出现类似于下图的信息，ElasticSearch的环境配置就ok了。

2.2 安装ElasticSearch Head插件

安装方法一： https://github.com/mobz/elasticsearch-head 下载插件，看文档Running with built in server

安装方法二：直接在browser中搜索扩展程序 ElasticSearch Head 安装即可（chrome需要FQ）

笔者在这里直接使用第二种简单的方式，安装成功了浏览器上多来一个小图标

点击出现下图效果，ElasticSearch Head就能使用了

二、ElasticSearch CRUD

为了方便执行crud的操作，直接在浏览器上安装SENSE插件（如下图界面）

增加

PUT /db_dbname1/tablename1/1{ ?"title":"我是一个title", ?"author":"derrick", ?"content":"i am a content", ?"xx":"yyyyyyy"}PUT /db_dbname2/person/3{ ?"name":"derrick", ?"age":18}

修改（

修改就是将id置为和存在的记录一致）

、、

删除

查询

根据id查询单条记录

查询所有库，所有表的文档

在指定库指定表中查找某个字段等于某个值的文档

更多详细命令参考：https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html

三、中文分词

中文分词插件采用ik的，默认的是把每个汉字都拆成一个词，效果不好

代码如下：

默认标准分词

、

注：有些人的文章里直接是

GET /db_dbname1/_analyze?analyzer=standard

{

我们是神

}

在我用的这个版本里面，这样写是错误的

IK简单分词

另外还有一个

GET /db_dbname1/_analyze?analyzer=ik_max_word

{

"text":"车身电气系统"

}

显然默认标准分词不是我们想要的分词，所以这里可以设置全局分词

时间不早，今天先写到这

ElasticSearch+.net 大数据处理（一）

原文地址：http://www.cnblogs.com/dongqinglove/p/b3945de2e477a2fea52518abe9dc5a37.html

ElasticSearch+.net 大数据处理（一）

知识推荐