欢迎大家来到IT世界,在知识的湖畔探索吧!
作者:dabai567
链接:https://gobea.cn/blog/detail/g5pOjgra.html
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
~~~~
为了配合本文的讲解,我们先导入一批数据
curl -H 'Content-type: application/x-ndjson' -XPOST 'http://127.0.0.1:9200/my_store/_doc/_bulk' -d '{"index":{"_id":1}} {"price":10,"productID":"XHDK-A-1293-#fJ3"} {"index":{"_id":2}} {"price":20,"productID":"KDKE-B-9947-#kL5"} {"index":{"_id":3}} {"price":30,"productID":"JODL-X-1937-#pV7"} {"index":{"_id":4}} {"price":30,"productID":"PX-R-3956-#aD8"} '
欢迎大家来到IT世界,在知识的湖畔探索吧!
match和term有什么区别
使用match搜索文本时,es会先将文本进行分词,然后将分词后多个关键字再去搜索,而term则不会先去分词,直接将文本原封不动的去搜索,如下:
欢迎大家来到IT世界,在知识的湖畔探索吧!{ "query": { "match": { //1 "productID": "JODL-X-1937-#pV7" } } } { "query": { "term": { //2 "productID": "JODL-X-1937-#pV7" } } }
- //1 match查询会将JODL-X-1937-#pV7拆分成jodl,x,1937,#pv7多个关键词之后再去搜索
- //2 term查询会将JODL-X-1937-#pV7作为一个词直接去搜索
为什么用term得不到结果
term查询会精确搜索JODL-X-1937-#pV7,但是当我们执行查询语句时,并没有得到期望的结果(搜索不到结果),原因是我们在导入的数据时productID是先被分词之后再保存在es的,我们可以通过es提供的api接口_analyze来查看es实际存储productID的文本,执行如下命令:
curl -X GET "127.0.0.1:9200/my_store/_analyze?pretty" -H 'Content-Type: application/json' -d' { "field": "productID", "text": "XHDK-A-1293-#fJ3" } '
如图所示,XHDK-A-1293-#fJ3在导入数据的时候被拆分成了多个关键字,如果用XHDK-A-1293-#fJ3来进行匹配,肯定无法匹配到数据。那么我们要怎么才能在导入的时候不让文本分词,方案是我们可以将productID设置为keyword类型,现在我们需要重新创建映射mapping,步骤如下:
欢迎大家来到IT世界,在知识的湖畔探索吧!#删除索引,删除索引是必须的,因为我们不能更新已存在的映射 curl -H 'Content-type: application/json' -XDELETE 'http://127.0.0.1:9200/my_store' #重新创建mapping curl -H 'Content-type: application/json' -XPUT 'http://127.0.0.1:9200/my_store' -d '{ "mappings": { "_doc": { "properties": { "productID": { "type": "keyword", //设置`productID`为`keyword`类型 "ignore_above": 64 } } } } }' #再次重新导入数据 curl -H 'Content-type: application/x-ndjson' -XPOST 'http://127.0.0.1:9200/my_store/_doc/_bulk' -d '{"index":{"_id":1}} {"price":10,"productID":"XHDK-A-1293-#fJ3"} {"index":{"_id":2}} {"price":20,"productID":"KDKE-B-9947-#kL5"} {"index":{"_id":3}} {"price":30,"productID":"JODL-X-1937-#pV7"} {"index":{"_id":4}} {"price":30,"productID":"PX-R-3956-#aD8"} '
执行上面步骤之后,我们再通过API接口_analyze查看
现在productID已经不会被分词了,最后,我们再执行下term查询,已经可以找到数据了,如下图所示
总结
- term是精确搜索
- 在搜索文本情况下,term一般配合keyword类型进行搜索
参考
- https://www.elastic.co/guide/cn/elasticsearch/guide/current/_finding_exact_values.html
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://itzsg.com/69963.html