中华金融时刊坚持服务资本市场大局,以“公开、公平、公正”的原则为广大投资者持续奉献权威的财经证券新闻资讯!

当前位置:主页 > 国内资讯 > 阿里云账号实名注册,阿里云代理商

阿里云账号实名注册,阿里云代理商

2023-09-07 20:50:03 / 作者:冼承志/ 来源:中华金融时刊/ 浏览次数:

本篇文章3186字,读完约8分钟

阿里云国际站经销商,主营阿里云,腾讯云,华为云,亚马逊aws,谷歌云gcp,微软云az,免费开户,代充值优惠大,联系客服飞机@jkkddd


通过TraceExplorer实时分析链路数据

本文将介绍如何通过链路分析快速定位五种经典线上问题,更直观的了解链路分析的用法与价值。
背景信息
除了使用调用链排查单次请求的异常,或者使用预聚合的链路统计指标进行服务监控与告警之外,链路追踪还支持基于明细链路数据的后聚合分析,简称链路分析(Trace Explorer)。相比调用链,链路分析能够更快的定界问题;相比预聚合的监控图表,链路分析可以更灵活的实现自定义诊断。
链路分析是基于已存储的全量链路明细数据,自由组合筛选条件与聚合维度进行实时分析,可以满足不同场景的自定义诊断需求。例如,查看耗时大于3秒的慢调用时序分布,查看错误请求在不同机器上的分布,或者查看VIP客户的流量变化等。
问题一:流量不均
负载均衡配置错误,导致大量请求打到少量机器,造成“热点”影响服务可用性,怎么办?
流量不均导致的“热点击穿”问题,很容易造成服务不可用。在生产环境中出现过多起这样的案例,比如因负载均衡配置错误,注册中心异常导致重启节点的服务无法上线,DHT哈希因子异常等。
流量不均的最大风险在于能否及时发现“热点”现象。它的问题表象更多是服务响应变慢或报错,传统的监控无法直观的反映热点现象,所以大部分运维人员都不会第一时间考虑这个因素,从而浪费了宝贵的应急处理时间,造成故障影响面不断扩散。
通过链路分析按IP分组统计链路数据,可以直观地看到调用请求分布在哪些机器上,特别是问题发生前后的流量分布变化。如果大量请求突然集中在一台或少量机器,很可能是流量不均导致的热点问题,然后再结合问题发生点的变更事件,快速定位造成故障的错误变更,及时回滚。
在Trace Explorer页面设置按IP聚合,如下图所示,可以发现大部分流量集中在XX.XX.XX.108这台机器上。
问题二:单机故障
网卡损坏、CPU超卖、磁盘打满等单机故障,导致部分请求失败或超时,如何排查?
单机故障每时每刻都在频繁发生,特别是核心集群由于节点数量比较多,从统计概率来看几乎是一种“必然”事件。单机故障不会造成服务大面积不可用,但是会造成少量的用户请求失败或超时,持续影响用户体验和答疑成本,需要及时处理。
单机故障可以分为宿主机故障和容器故障两类(在Kubernetes环境可以分为Node和Pod)。例如CPU超卖、硬件故障等都是宿主机级别,会影响所有容器;而磁盘打满、内存溢出等故障仅影响单个容器。因此,在排查单机故障时,可以根据宿主机IP和容器IP两个维度分别进行分析。
面对这类问题,可以通过链路分析先筛选出异常或超时请求,然后再根据宿主机IP或容器IP进行聚合分析,可以快速判断是否存在单机故障。如果异常请求集中在单台机器,可以尝试替换机器进行快速恢复,或者排查该机器的各项系统参数:例如磁盘空间是否已满、CPU Steal Time是否过高等。如果异常请求分散在多台机器,那么大概率可以排除单机故障因素,可以重点分析下游依赖服务或程序逻辑是否异常。
在Trace Explorer页面筛选错误调用或慢调用,并设置按IP进行分组统计,如果异常调用集中出现在特定机器,则有较大概率是机器故障。
问题三:慢接口治理
新应用上线或大促前性能优化,如何快速梳理慢接口列表,解决性能瓶颈?
新应用上线或大促备战时通常需要做一次系统性的性能调优。第一步就是分析当前系统存在哪些性能瓶颈,梳理出慢接口的列表和出现频率。
此时,可以通过链路分析筛选出耗时大于一定阈值的调用,再根据接口名称进行分组统计,这样就可以快速定位慢接口的列表与规律,然后对出现频率最高的慢接口逐一进行治理。
找到慢接口后,可以结合相关的调用链、方法栈和线程池等数据定位慢调用根因。常见原因包括以下几类:
数据库或微服务连接池过小,大量请求处于获取连接状态。可以调大连接池最大线程数解决。
N+1问题。例如一次外部请求内部调用了上百次的数据库调用,可以将碎片化的请求进行合并,降低网络传输耗时。
单次请求数据过大,导致网络传输和反序列化时间过长,而且容易导致Full GC。可以将全量查询改为分页查询,避免一次请求过多数据。
日志框架“热锁”。可以将日志同步输出改为异步输出。
在Trace Explorer页面筛选大于5秒的慢调用,并设置按接口名进行分组统计,发现慢接口的规律。
问题四:业务流量统计
如何分析重保客户或渠道的流量变化和服务质量?
在实际生产环境中,服务通常是标准的,但业务却是分类分级的。同样的订单服务,我们需要按照类目、渠道、用户等维度进行分类统计,实现精细化运营。例如,对于线下零售渠道而言,每一笔订单、每一个POS机的稳定性都可能会触发舆情,线下渠道的SLA要求要远高于线上渠道。那么,应该如何在通用的电商服务体系中,精准的监控线下零售链路的流量状态和服务质量呢?
这里可以使用链路分析的自定义Attributes过滤和统计实现低成本的业务链路分析。例如,在入口服务针对线下订单打上 {"attributes.channel": "offline"}的标签,然后再针对不同门店、用户客群和商品类目分别打标。最后,通过对attributes.channel = offline进行过滤,再对不同的业务标签进行group by来分组统计调用次数、耗时或错误率等指标,就可以快速地分析出每一类业务场景的流量趋势与服务质量。
问题五:灰度发布监控
500台机器分10批发布,如何在第一批灰度发布后,就能快速判断是否有异常?
变更三板斧“可灰度、可监控、可回滚”是保障线上稳定性的重要准则。其中,分批次灰度变更是降低线上风险,控制爆炸半径的关键手段。一旦发现灰度批次的服务状态异常,应及时进行回滚,而不是继续发布。然而,生产环境很多故障的发生都是由于缺乏有效的灰度监控导致的。
例如,当微服务注册中心异常时,重启发布的机器无法进行服务注册上线。由于缺乏灰度监控,前几批重启机器虽然全部注册失败,导致所有流量都集中路由到最后一批机器,但是应用监控的总体流量和耗时没有显著变化,直至最后一批机器也重启注册失败后,整个应用进入完全不可用状态,最终导致了严重的线上故障。
在上述案例中,如果使用{"attributes.version": "v1.0.x"}对不同机器流量进行版本打标,通过链路分析对attributes.version进行分组统计,可以清晰的区分发布前后或不同版本的流量变化和服务质量,不会出现灰度批次异常被全局监控掩盖的情况。
链路分析的约束限制
链路分析虽然使用灵活,可以满足不同场景的自定义诊断需求,但是它也有几点使用约束限制:
基于链路明细数据进行分析的成本较高。
链路分析的前提是尽可能完整的上报并存储链路明细数据。如果采样率比较低导致明细数据不全,链路分析的效果就会大打折扣。为了降低全量存储成本,可以在用户集群内部署边缘数据节点,进行临时数据缓存与处理,降低跨网络上报开销。或者,在服务端进行冷热数据分离存储,热存储进行全量链路分析,冷存储进行错慢链路诊断。
后聚合分析的查询性能开销大,并发小,不适合用于告警。
链路分析是实时的进行全量数据扫描与统计,查询性能开销要远大于预聚合统计指标,所以不适合进行高并发的告警查询。需要结合自定义指标功能将后聚合分析语句下推至客户端进行自定义指标统计,以便支持告警与大盘定制。
结合自定义标签埋点,才能最大化释放链路分析价值。
链路分析不同于标准的应用监控预聚合指标,很多自定义场景的标签需要用户手动埋点打标,这样才能最有效的区分不同业务场景,实现精准分析。

标题:阿里云账号实名注册,阿里云代理商

地址:http://www.chinaktz.com.cn/zhgnzx/25642.html

上一篇:没有了

下一篇:没有了

免责声明:本篇的内容是在网上转载的,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,本人将予以删除。

看了又看的资讯

  • 深圳汽车抵押贷款平台-深圳汽车押证贷款

    深圳汽车抵押贷款 平台,深圳汽车押证贷款,根据深圳押车贷款、深圳抵押车贷款短期周转等需求,我们为您提供专业的深圳车辆抵押贷款解决方案,可以办理深圳押证不押车贷款、深

  • second发音规则_second 发音

    情降佛牌 为什么second的发音规则如此复杂? second是一个让很多学习英语的人感到困惑的词汇之一,因为它的发音规则相当复杂。为什么会出现这种情况呢? second的发音规则有哪些?

  • “担忧欧债危机全球股市下跌”

    经过记者郑步春 上周末,塞浦路斯试图对银行存款征收不重复的税收以弥补财政赤字空,因此引发了欧洲都柏林危机重燃的担忧,国际股市于本周一大幅下跌。 先下跌的是亚太股市,

  • 耐用防静电台面板怎么选?这些方面要注意!_佰斯特POUSTO

    提到 防静电台面 板,相信很多朋友们都不陌生,随着现在社会的不断发展,越来越多的企业都开始注重产品的质量问题。 为了能够进一步的确保产品的质量提升,一些电子行业都会使

  • 腾讯云国际账号注册,云数据库

    腾 讯 云 有着深厚的基础架构,并且有着多年对海量互联网服务的经验,不管是社交、游戏还是其他领域,都有多年的成熟产品来提供产品服务。腾讯在云端完成重要部署,为开发者及

  • 全面分析防静电仪器推车生产厂家的选择要点!_佰斯特POUSTO

    选择 防静电推车 时,需要综合考虑多个方面,以确保获得高质量、可靠且符合需求的产品,以下是选择防静电仪器推车生产厂家时需要注意的几个要点。 资格和认证 需要确认防静电推

  • RFID技术新动态:行业发展与市场应用前景广阔

    近年来,射频识别( RFID)技术以其独特的优势,在资产管理、库存管理、供应链优化等多个领域得到了广泛应用。随着技术的不断进步和市场需求的日益增长,RFID定制化标签成为了行

  • 二次结构泵新款推出-机械化施工更省力

    在建筑施工领域,二次结构泵作为一 款 现代化的施工设备,为工程进度和施工质量提供了有力保障。 二次结构泵 凭借其卓越的性能和 快捷可靠 的工作方式,成为现代建筑行业不可或

  • 艺术教育研修班

    2205不锈钢管 艺术教育研修班模式,指的是师生互动、对话、小组研讨、答疑,促进教师快速发展。 二、课程设计最具有代表性的主要特征:课程设计的特点是:为追求每个人的个性化发展提

  • “中美新双边投资保护协定谈判蒙阴影”

    经记者张国栋喻春从北京出发 “cfius让我们既失去了金钱,也失去了名誉。 这是我们无法接受的事情。 ’在昨天( 10月18日)三一集团美国风力发电项目诉讼案的新闻发布会上,三一集团

中华经济时刊网介绍

中华金融时刊关注上市公司及银行、券商、基金、保险、信托等各类金融机构,新闻资讯采集报道范围涵盖宏观政策、经济数据、资本市场运行、上市公司及各类金融机构动向。长期以来,中国证券报为广大投资者持续奉献权威、专业、客观的财经证券新闻资讯,在资本市场具有广泛的影响力、公信力,发挥着引领预期、一锤定音的作用。着力增加有效信息,注重市场报道实用性,方便受众把握宏观政策和市场走势,及时了解国民经济和证券市场各层面信息,为投资决策提供有效参考;致力于促进资本市场健康、高质量发展,积极发挥舆论监督功能,维护投资者权益。