【云上未来】从Elasticsearch到ElasticStack的技术演进之路 |(附视频)

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 在2019云栖大会【Elasticsearch开发者生态专场】上,Elastic中国首席架构师朱杰(Jerry),为大家详细介绍了从“Elasticsearch”到“Elastic Stack”的产品和技术的演进趋势,并确立云上ES战略的意义。

本文字数:2566
阅读时间:预计5~8分钟

您将了解:
-从Elasticsearch到Elastic Stack所包含的战略意义
-云上ES的价值
-技术演进方向
-技术演进核心支撑点
-点击《Elastic Stack技术演进趋势》,查看完整分享视频

简介:

在2019云栖大会【Elasticsearch开发者生态专场】上,Elastic中国首席架构师朱杰(Jerry),为大家详细介绍了从“Elasticsearch”到“Elastic Stack”的产品和技术的演进趋势,并确立云上ES战略的意义。

{下文来自2019年云栖大会,Elasticsearch开发者生态专场,Elastic中国首席架构师朱杰带来的现场分享}


99490d7f0c4f480bbfc8cffa13e67ac6.png
(Elastic中国首席架构师朱杰(Jerry))

Elastic产品发展趋势

重新定义“ES”

在广大开发者的心中,ES代表了Elasticsearch。而如今,Elastic纳入了很多新的工具,因此在未来,ES应该代表Elastic Stack。之所以要重新定义ES,是为了为广大开发者和用户以及企业带来更加良好的使用体验。以前,我们将开源项目交给客户的时候往往是一组零件,客户拿到这组零件之后需要自己进行组装再构成应用。而如今,Elastic将这些能够放入Stack中的工具全部纳入进来,极大地改善了用户的体验,使得用户能够获得开箱即用的体验,而不需要从零开始搭建应用。

a1271a3aa9a144a788c16c1bd7aa07aa.png

云上驱动新未来

云计算是未来的必然趋势。正如PC和互联网的出现使得各个行业的生产率都得到了大幅度提升,云计算也必将成为帮助各个行业的生产率得以提升的基础设施,因此云已纳入到Elastic公司的发展战略之中,并与阿里巴巴建立战略合作关系。这里的云并不是简单地提供虚拟机让客户在云上部署,而是直接提供托管的数据服务。用户只需要通过API调用服务即可,从完全由客户自己运维变为使用托管的SaaS服务,将运维工作交给像阿里云这样更加专业的团队负责,这样才能使得未来的生产力得到巨大提升。未来,Elastic将与阿里云展开极其紧密的合作,在云上为客户提供Elastic Stack最佳的使用体验

58d6a389e2f749faa4714d15c007b369.png

解决方案导向

Elastic的另一个重要方向是以解决方案为导向。在上层体现在全文搜索向通用搜索进行转变,这依赖于Elasticsearch本身能力的提升,目前在很多具体的实践中也正在将Elasticsearch应用到更为广泛的通用搜索领域。在下层,无论是日志、指标、APM还是安全,它们的演进都是在大数据平台上构建的各种各样的解决方案,而这些解决方案都是用户驱动而产生的。Elastic将这些解决方案集成进入Elastic Stack,方便用户更好地使用。

19e5672038bf4aeca42584d543d6449a.png

重点解决方案-可观察性

接下来为大家介绍一些Elastic Stack的重点解决方案,其中最为重要的就是可观察性。可观察性解决方案其根本是将日志、指标以及APM三个方面整合到一个技术栈中,以此来为IT全面地解决问题,这是当前业界非常热门的一个趋势。Elastic Stack在实现这一能力方面拥有巨大的优势。这是因为想要实现三者融合,首先需要解决数据量问题,其次要解决实时搜索问题。而ES能够非常完善地解决上述问题,并且能够实现快速推进,帮助团队快速打通三者来分析企业业务。

6e806087693b4f0c87708b459677c71d.png

重点解决方案-安全

如今,企业各种安全方面的数据出现暴增态势。因此,Elastic Stack被很多企业用于安全数据的分析也是水到渠成的。目前,ES在安全能力方面已经迈出了自己的第一步,未来也会进一步完善安全数据分析功能,为用户提供开箱即用的安全数据分析解决方案。

185e122703cf40eaa8c543ecc36e2e40.png

新解决方案-企业搜索

Elastic目前也有一些正在孵化中的新解决方案,比如企业搜索方案,其提供了多种文档连接器,能够将数据加载进来进行全文搜索。

130487e6cda74142bd9cf7f31cfdd21c.png

新解决方案-Code搜索

另外一个比较新的解决方案是Code搜索,该方案提供了查询object和symbol定义和引用的能力,能够实现代码全文搜索。

924ae69bad3f48719fbc89fcdde6f6a8.png

Elastic技术发展趋势

Elasticsearch搜索引擎的演进

Elasticsearch从全文搜索引擎演进成为通用搜索引擎经历了8年多的时间,最早期的时候,Elasticsearch只是一个反向索引,无法实现指标分析等功能,在进行聚合时也会面临性能问题。在后来的演进中增加了列存储,这对于排序和聚合产生了巨大影响,不仅加快了执行速度,还降低了资源消耗。仅仅有这些还远远不够,在2014年的时候,Elasticsearch推出了聚合框架,此时它能够用于代替很多SQL分析场景。在2016年,Elasticsearch增加了BDK树并且做了稀疏数据的优化,为数字搜索优化了数据结构,加快了分析,并且降低了存储空间。在2018年的时候,Elasticsearch加入了数据上卷特性,将时序性数据聚合到大的时间框内,能够节省磁盘空间。经过这么多年的演进,Elasticsearch从全文搜索引擎变成了通用的搜索引擎。

d468ebf6472047c1a157af3fdf210468.png

业界领先的查询能力

Elasticsearch的查询能力目前在业界处于领先地位。用户可以将精确查询、全文查询以及地理位置的查询写到一条语句里面进行查询,之后还可以进一步进行聚合计算。

43c1a7913ba74df5924a6876236a07f5.png

应用场景空前繁荣

正是因为强大的查询能力,Elasticsearch的应用场景空前繁荣,能够看到最多的是代替了很多数据库查询的加速层,其次还用于用户画像、聚合报表、订单查询以及大数据风控等。

b4e92853d277427ca851e6d0026810cd.png

注入智能的灵魂

Elasticsearch还注入了智能的灵魂,主要包括异常检测领域的能力,主要提供的是无监督的机器学习算法。

d5ff267a442c4805b972c3d2d866efbb.png

机器学习赋能各种应用

Elastic的机器学习能力目前已经赋能到所提供的各种应用之中,比如APM、业务分析、日志、指标、安全等。

1e39338ccf7048d6a07377934cacc6d7.png

机器学习的下一站

无监督的好处在于不需要人工去标注数据,计算和判断的执行速度都会快很多。在Elasticsearch 7.2版本和7.3版本中,推出了Data Frame功能,能够将原始数据的索引经过转换聚合到另外一个更加适合分析的索引中,为后续的机器学习提供了更多的能力。未来,Elasticsearch也可能提供有监督的机器学习能力。

87581ed3220b4584a0ec6deb6632d27e.png

Beats生态蓬勃发展

无论是Elastic官方提供的Beats,还是开源社区中的Beats都基于的是统一的开发包。目前,Beats的生态非常活跃,广大开发者也可以将自己新的想法提交到Beats生态中,让更多的人来使用。

2da6076b9d424b24b7128955b99dfd88.png

Logstash生态蓬勃发展

作为老牌插件的Logstash仍然在持续发展当中,Logstash不仅积累了大量的插件,也在持续地改善自身的性能。未来,Logstash倾向于成为做数据转化和清洗的中间件。

8e68916b25d94f53bcff1510acf63d19.png

Logstash Beats集中管理势在必行

无论是对于Logstash还是Beats而言,都需要进行集中管理,后续版本中也会提供更多这一方面的能力。

9fbe60638a59494ea33521fe691f6a7f.png

Kibana快速迭代

Kibana的版本发布非常频繁,Kibana正在从最初级的仅仅负责ELK监控的平台逐步向APP平台转换,APP的能力越来越多,Kibana本身也正在向插件化平台转型。

68db4951a1544c2fa545533553d64aae.png

Kibana平台化战略

Kibana的平台化战略会是未来的发展方向,首先Kibana会变成一个可视化分析平台,这也是目前已经实现的功能。此外,Kibana还会演变成一个解决方案的平台,使得用户能够基于Kibana构建各种各样的行业解决方案。最后,Kibana还会成为运维平台,能够监控各种各样的业务指标。

13172fa5d202401f8b269fb7c84bd999.png

拥抱Kubernetes ECK

Kubernetes如今非常流行,因此拥抱Kubernetes是必然趋势。社区中也有大量的Elastic Stack运行在Kubernetes之上,因此作为Elastic公司而言,提供Kubernetes的能力是最为合适的。Elastic的ECK目前提供了管理和监控集群、方便升级新版本、弹性伸缩以及定时备份的能力,未来将会进一步拥抱Kubernetes生态,期待ECK的进一步发展。

7185fd9b12134355902d4d7f82677886.png

关于Elastic公司

Elastic是ELK 背后的公司,Elastic在全球社区拥有10多万参与者,真题产品下载次数达到了3.5亿,在全世界范文内拥有1600多名员工。目前,Elastic的付费订阅用户达到8800多家企业,FY20Q1收入为89.7M美元,YOY增长率达58%。Elastic的创始人兼容CEO Shay Banon在很多场合都想要传达的Elastic的产品哲学就是“Simple things should be
simple”,也就是让简单的事情变得简单。这一产品理念在Elasticsearch、Logstash、Kibana等各个产品中都得以体现。

6176071d637c48858d10bdb14ae37643.png

对于大家而言,可能最熟悉的就是Elastic的Elasticsearch产品,但其实Elastic还有很多产品和解决方案。如下图所示,底层是Elastic大数据平台,虚线框分隔了收费的商业版本产品和免费的开源版本产品。虚线框内是Elastic提供的开源产品,其中包含了强劲的存储索引计算分析引擎Elasticsearch,还有十分易用的数据摄取工具Logstash和Beats,以及用于前端数据展示的Kibana,这一整套的产品能够帮助大家解决很多实际的问题。虚线框之外则是Elastic提供的商业套件,其定位在于实现存入Elasticsearch的数据更加智能化的分析,提供了机器学习、数据关联分析、规则告警、多集群监控、报表以及高级安全等功能。在大数据平台之上,Elastic还提供了大数据解决方案,包括了搜索、日志、指标、安全、APM以及企业搜索等解决方案。

50a819e1905149448a7a2457563ded0b.png


加入我们

9.png

【云上ELK双11限时优惠】

  • 新购用户,预付首月 75折
  • 新购/续购/升级用户,预付6个月85折
  • 新购/续购/升级用户,预付12个月8折

2019年阿里云云栖大会上,Elasticsearch背后的商业公司Elastic与阿里云Elasticsearch确定战略合作升级,在100%兼容开源的基础上,完成了ELK的完整生态云上闭环,欢迎开通使用。
点击了解更多产品信息

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
3月前
|
安全 Linux 开发工具
Elasticsearch 搜索入门技术之一
Elasticsearch 搜索入门技术之一
227 1
|
28天前
|
canal 消息中间件 关系型数据库
【分布式技术专题】「分布式技术架构」MySQL数据同步到Elasticsearch之N种方案解析,实现高效数据同步
【分布式技术专题】「分布式技术架构」MySQL数据同步到Elasticsearch之N种方案解析,实现高效数据同步
78 0
|
3月前
|
存储 自然语言处理 Java
Elasticsearch全文搜索技术之二kibana的简介和使用
Elasticsearch全文搜索技术之二kibana的简介和使用
29 2
|
8月前
|
Java 索引
Elasticsearch之实战掌握误拼写时的fuzzy模糊搜索技术
Elasticsearch之实战掌握误拼写时的fuzzy模糊搜索技术
|
11月前
|
索引
白话Elasticsearch27-深度探秘搜索技术之误拼写时的fuzzy模糊搜索技术
白话Elasticsearch27-深度探秘搜索技术之误拼写时的fuzzy模糊搜索技术
38 0
|
11月前
|
算法
白话Elasticsearch26-深度探秘搜索技术之function_score自定义相关度分数算法
白话Elasticsearch26-深度探秘搜索技术之function_score自定义相关度分数算法
69 0
|
11月前
|
分布式计算 Java Spark
白话Elasticsearch25-深度探秘搜索技术之四种常见的相关度分数优化方法
白话Elasticsearch25-深度探秘搜索技术之四种常见的相关度分数优化方法
59 0
|
11月前
|
算法 Java
白话Elasticsearch24- 深度探秘搜索技术之TF&IDF算法/向量空间模型算法/lucene的相关度分数算法
白话Elasticsearch24- 深度探秘搜索技术之TF&IDF算法/向量空间模型算法/lucene的相关度分数算法
62 0
|
11月前
|
自然语言处理 搜索推荐 索引
白话Elasticsearch23-深度探秘搜索技术之通过ngram分词机制实现index-time搜索推荐
白话Elasticsearch23-深度探秘搜索技术之通过ngram分词机制实现index-time搜索推荐
68 0
|
11月前
|
搜索推荐 索引
白话Elasticsearch22- 深度探秘搜索技术之match_phrase_prefix实现search-time搜索推荐
白话Elasticsearch22- 深度探秘搜索技术之match_phrase_prefix实现search-time搜索推荐
61 0

相关产品

  • 检索分析服务 Elasticsearch版