天天快看:[ES三周年]理解 ES 查询机制
(资料图)
为什么需要使用 ES 进行搜索
ES除了拥有索引上的优势,最重要的还是数据的结构,这都是ES为什么效率高,会使用它的原因。
1,结构化数据 VS 非结构化数据
结构化数据:也称作行数据,关系型数据库进行存储和管理,是由二维表结构来逻辑表达和实现(可以使用行、列来表现)的数据,严格地遵循数据格式与长度规范。非结构化数据:又可称为全文数据,不定长或无固定格式,不适于由数据库二维表来表现,包括所有格式的办公文档、XML、HTML、word文档,邮件,各类报表、图片和音频、视频信息等。其他的不同之处还有:结构化数据往往占用的空间较小,占企业数据的 20% 左右,容易管理。非结构化数据通常占用更多的存储空间,约占企业数据的 80% 左右,比较难以管理
2,结构化搜索 vs 全文搜索
结构化搜索:通常查询具有固有结构的数据,答案要么是肯定的,要么是否定的(即便是类似正则匹配这样的结构化搜索,正则表达式匹配数据也是确定的),数据要么属于查询结果集合,要么不属于。全文搜索:通常查询全文字段/文档的所有内容,答案返回的是一系列可能的数据,数据有一定概率属于结果集合。到这里,为什么需要使用 ES 进行搜索的答案就很明确了:对于非结构化文本(比如评论内容),传统的结构化搜索难以满足需求,于是就会使用 ES 进行全文搜索。当然 ES 不仅可以进行全文搜索,也可以进行一部分的结构化搜索,更加扩大了他的应用范围。对于数据量巨大的情景,有公司会使用 ES 代替传统的 MySQL 管理数据。
ES 基本概念介绍
本小结主要是介绍 ES 的一些基本概念,目的是方便之前没有了解过 ES 的同学可以理解这次分享所介绍的内容。
1,ES 存储模型
ES 在设计存储模型时,考虑了大家从关系型数据库转换肯能带来的困难,于是设计了 Index、Type、Document、Field 分别于对应传统关系型数据库(比如 MySQL) 的 Database、Table、Row、Column。注意: ES 存储时,并没有 Type 的概念,同一个Index 里的 Type 会拍平存储,只是方便理解才会对使用者提供这样一个抽象。由于Type 的存在会带来一些问题,在后续的版本里会逐步移除。
2,ES 与 Lucene
ES 底层基于 Lucene 开发,Lucene作为其核心来实现索引和搜索的功能。我们虽然讲的是 ES,但很大一部分内容是 Lucene 的实现。
关键词:
责任编辑:宋璟
-
天天快看:[ES三周年]理解 ES 查询机制
-
环球快资讯丨充电宝怎么充电才能延长电池寿命(充电宝怎么充电)
-
今日辟谣(2023年3月14日)
-
全球球精选!《黑暗荣耀》里的蛇是真蛇事件简单介绍
-
唐三彩主要在什么中使用_唐三彩的主要用途有-今日快看
-
证明书模板
-
03月14日09时浙江舟山疫情数据 阳了以后为什么会腰疼?应该怎么办?
-
关注:深圳队职业联赛经历:共夺得中超、甲B、中乙联赛冠军各一次
-
干冰
-
缤智这回彻底没辙!本田瞧了连连后退,仅6万起本田根本意想不到|热议
-
曲阜汽车站时刻表查询_曲阜东站高铁时刻表
-
快消息!盒乐不为
-
“互联网+”医疗服务能否纳入医保?国家医保局回应 天天微头条
-
《卧龙:苍天陨落》:因为“接化发”变得酣畅淋漓且爽快的战斗 世界快看
-
浙商证券:给予重庆百货买入评级
-
三只鸡月租1200元!美国现在流行“租母鸡” 订单已经接不过来… 当前快看
-
肩周炎的治疗土方法有哪些中药_肩周炎的治疗土方法有哪些_每日快报
-
重点聚焦!克服“好公司”崇拜力!平安基金张晓泉:该调仓时不能含糊
-
全球微动态丨3dmax镜子材质球_3Dmax镜子材质
-
信用卡能微信扫码支付吗_环球观点
-
oppo手机截屏的快捷键在哪(oppo手机截屏的快捷键是什么)
-
热钱是什么意思?_热钱是什么
-
初二物理密度计算题含答案和过程_初二物理密度计算题
-
straight是什么意思中文(straight是什么意思) 播报
-
今日观点!聚飞光电董秘回复:主要是随着业务的发展壮大,各子公司赢利水平提升,当期计提所得税费用增加所致
-
我的世界怎样让海龟蛋快速孵化_我的世界海龟蛋怎么快速孵化
-
努比亚Z50 Ultra外观做到了颜值第一
-
利拉德:多支球队战绩相近 理想情况下能排在第五
-
短发梨花烫内扣发型_短发梨花烫内扣 全球速递
-
今日杨洋被拍到_杨洋的不雅的照曝光是真的吗
-
世界微动态丨张晶霖:3.10伦敦金多头迎非农审判,黄金走势分析及操作建议!
-
河南省体育彩票网首页_河南省体育彩票网|当前观察
-
全球快看:申请助学金的理由简短_申请助学金范文
-
富瑞:下调京东目标价至358港元 评级买入-天天百事通
-
2023东湖花花游园会市集时间及地点 全球热消息