日志分析的作用有哪些,日志分析案例分享

实时数据仓库分享
2024/8/16
SelectDB

由于日志记录了各种事件发生的主体、时间、位置、内容等关键信息,不仅是洞察系统内部状态的窗口,更是监控系统健康状况、安全状况、诊断问题和优化性能的关键工具。那么日志分析的具体作用有哪些:

  1. 故障诊断与排查

日志分析是系统故障诊断和排查的重要工具。当系统出现异常或故障时,通过分析相关日志文件,可以快速定位问题所在,减少故障排查时间,提高系统稳定性。例如,Web服务器日志可以记录用户的访问行为、请求处理情况等信息,一旦网站出现访问异常或错误,通过日志分析可以迅速定位到是服务器问题、网络问题还是代码问题。

  1. 性能优化与监控

日志分析可以帮助我们了解系统的运行状况,从而进行性能优化与监控。通过对系统日志进行分析,可以了解系统的负载情况、响应时间、吞吐量等关键指标,从而找到性能瓶颈并进行优化。同时,日志分析还可以实时监控系统的运行状态,一旦发现异常或潜在问题,及时采取相应措施,避免故障的发生。

  1. 安全审计与防范

日志分析在安全审计和防范方面也具有重要作用。通过分析系统日志,可以了解系统的安全状况,发现潜在的安全隐患,从而采取相应的安全措施。例如,通过分析Web服务器日志,可以发现是否存在恶意请求、非法登录等攻击行为,进而加强系统的安全防护。

  1. 用户行为分析

日志分析还可以用于用户行为分析。通过分析用户访问日志,可以了解用户的访问习惯、兴趣爱好等信息,为产品优化和精准营销提供有力支持。例如,电商网站可以通过分析用户访问日志,了解用户的购物偏好、浏览路径等信息,从而优化商品推荐和营销策略。

在云计算逐渐成熟的当下,越来越多的企业开始将业务迁移到云端,传统的监控和故障排查方法已经无法满足企业的需求,另外系统的老旧带来的成本上的负担也是不可忽视的。日志数据存储和分析架构的升级就显得格外重要,接下来我们就来看看观测云是如何解决这个难题的!

上海观测未来信息技术有限公司是一家国内领先的具备可观测性实时数据检测平台的公司,其自研产品「观测云」首批通过中国信通院颁发的「可观测性平台技术能力」先进级认证,可实现对云、云原生应用及业务系统的统一观测需求,为互联网、零售、金融等行业用户提供统一高效的数字化可观测服务。

观测云痛点需求:

在可观测理念逐渐深入人心的当下,人们越来越意识到通过多层次、多维度、多视角的数据去观测应用系统来提升故障的定位效率以及业务分析能力。而观测云本质上是一个全面性的、可观测性的解决方案,可提供整体数据的分析、洞察、可视化、自动化、监测告警、智能巡查、安全巡查等服务。

为更好提供上述服务,要求观测云具备对基础对象、网络性能、日志、应用性能、用户体验、可用性甚至CI进行观测的能力。这些能力要求观测云能够统一整合来自多个场景和多种结构的海量数据,并提供全面的日志检索分析能力,快速实现数据查询、筛筛选和分析。

为解决观测云在日志存储和分析场景所面临的挑战,飞轮科技与观测云进行了全面合作。通过SelectDB的倒排索引能力、Variant数据类型、冷热数据存储分层等特性,为观测云日志存储和分析场景服务注入强大的动力,实现存储成本降低70%的同时,查询性能提升2-4倍,最终实现整体性价比10倍提升!

基于SelectDB的存储架构升级:

引入 SelectDB 对 GuanceDB 内部架构进行升级,为了更好地介绍 SelectDB 如何在 GunaceDB 中作为存储引擎发挥作用,我们首先介绍一下 DQL 查询语言。在可观测性场景中,几乎所有的查询都涉及时间的筛选,同时大部分的聚合也需要按照时间窗口来进行,并且针对时间序列,还需要支持按单个序列在时间窗口前后进行 Rollup。在这些场景中,使用 SQL 来表达相同的语义就需要嵌套多层子查询,导致表达过程和编写都异常复杂。因此我们尝试简化语法元素,在此基础上设计出了新的查询语言 DQL,并且增强了在可观测场景下的常见计算函数,通过 DQL 即可查询指标、日志、链路追踪、对象等所有的可观测数据。

从 GuanceDB内部结构来看,本次升级使用 SelectDE3 替换了 Elasticsearch/OpenSearch,原有的查询架构保持不变。

5.PNG

55.PNG

当前的查询架构是综合 FE 和 BE 能力的混合计算架构,DCL 即可以利用 SelectDB 已经充分优化的查询能力,也可以让语法拓展不受 SelectDB 本身 SQL 能力的限制。

SelectDB的引入,实现了综合成本的大幅降低。之前在云上某可用区使用的是由20台16C 64G 云主机组成的Elasticsearch集群提供查询服务,同时采用了独立的索引写入服务(相当于使用20台云主机)。在替换成SelectDB之后,只需要13台同配置的云主机,总成本下降了67%。成本的大幅降低主要得益于两个因素:

1.SelectDB 写入性能高于 Elasticsearch:在应对 1GB/s的持续高吞吐写入时,SelectDB 所占用CPU保持在20%以下,折合约占2.6台云主机的成本,仅为 Elasticsearch 索引写入服务成本的13%。这一优势可以在降低写入成本的同时应对更大的突发流量,保障系统的稳定性。

555.png

2.SelectDB数据和索引压缩率高于 Elasticsearch:SSelectDB数据和索引采用列式存储和 ZSTD 压缩技术,使得线上集群整体压缩比可达1:8,而Elasticsearch 压缩比只有1:1.5,因此使用SelectDB时,所占用存储空间仅是Elasticsearch 的20%左右。

SelectDB的引入,实现了查询性能显著提升。在减少机器数量以后,我们对比了相同的查询在两个集群下的性能,实践表明 SelectDB 的点查和列表查询速度比 Elasticsearch 快近2倍,在聚合查询不进行采样的情况下,SelectDB相比 Elasticssearch 快将近4倍。

案例更多详情细节请访问:https://www.selectdb.com/blog/122

日志分析列式存储倒排索引