应用高可用服务 AHAS

应用高可用服务AHAS是一款专注于提高应用高可用能力的SaaS产品,提供应用架构自动探测、故障注入式高可用能力演练、一键应用防护和增加功能开关等功能,可以快速低成本地提升应用可用性。

负载均衡

负载均衡SLB(Server Load Balancer)是一种对流量进行按需分发的服务,通过将流量分发到不同的后端服务来扩展应用系统的服务吞吐能力,并且可以消除系统中的单点故障,提升应用系统的可用性。

移动数据分析

移动数据分析(Mobile Analytics)是阿里云推出的一款移动App数据统计分析产品,提供通用的多维度用户行为分析,支持日志自主分析,助力移动开发者实现基于大数据技术的精细化运营、提升产品质量和体验、增强用户黏性。

云原生数据湖分析 DLA

云原生数据湖分析(Data Lake Analytics,简称DLA)是无服务器(Serverless)化的数据湖分析服务,支持按需与保留资源使用,打造最具性价比的数据湖分析平台;提供一站式的数据湖分析与计算服务,支持 ETL、机器学习、流、交互式分析,可以...

性能分析

性能分析服务为移动 App 提供实时线上性能数据的...性能分析服务支持 Android/iOS 应用类型,帮助客户建立 5 分钟线上故障感知能力,并与崩溃分析/远程日志服务配合使用,构建异常“感知-定位-恢复”的运维能力闭环,提升 App 使用体验。

智能对话分析

智能对话分析(Smart Conversation Analysis)依托于阿里云语音识别和自然语言分析技术,为企业用户提供智能的对话分析服务,支持语音和文本数据的接入。可用于电话/在线客服坐席服务质量检测、风险监控识别、服务策略优化等场景。

崩溃分析

崩溃分析服务为移动 App 提供实时线上稳定性相关...崩溃分析服务支持 Android/iOS/H5 应用类型,帮助客户建立 5 分钟线上故障感知能力,并与性能分析/远程日志服务配合使用,构建异常“感知-定位-恢复”的运维能力闭环,提升 App 使用体验。

物联网数据分析

物联网数据分析LA(Link Analytics)是阿里云为物联网开发者提供的数据智能分析产品,针对物联网数据特点,提供海量数据的存储备份、资产管理、报表分析和数据服务等能力,帮助企业用户更容易地挖掘物联网数据中的价值。

交互式分析Hologres

交互式分析Hologres是实时交互式分析产品,兼容PostgreSQL协议,与大数据生态无缝连接,支持高并发和低延时地查询分析万亿级数据,帮助您轻松的使用现有BI工具分析业务数据。

Quick Tracking

用户行为洞察分析平台(QuickTracking)是阿里云推出的企业级流量统计分析产品,支持多端(APP、小程序、WEB)数据采集,提供通用的多维度用户行为分析模型。借助Quick Tracking,技术、产品、运营等同学可以快速按需提取和分析流量数据,...

运维事件中心

运维事件中心是企业业务连续性的运营管理平台,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能,一站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应、更短的故障时长、更...

云数据库 OceanBase

OceanBase 是阿里巴巴和蚂蚁金服 100%自主研发的金融级分布式关系数据库,在普通硬件上实现金融级高可用,在金融行业首创“三地五中心”城市级故障自动无损容灾新标准,同时具备在线水平扩展能力,创造了 6100万次/秒处理峰值的业内纪录,...

容灾演练断网方式说明

使用场景 机房级业务整体不可用。机房级云服务不可用。机房级云基础设施不可用。使用限制 可用区断网基于VPC网络ACL的高级特性。若VPC不支持高级特性,则无法使用可用区断网方式。更多信息,请参见VPC高级功能。如果您可用区内的ECS实例...

什么是故障演练

适用场景 故障演练可适用于以下典型场景:衡量微服务的容错能力通过模拟调用延迟、服务不可用、机器资源满载等,查看发生故障的节点或实例是否被自动隔离、下线,流量调度是否正确,预案是否有效,同时观察系统整体的QPS或RT是否受影响。...

同城多活架构实践

演练预期:电商首页展示的查询链路对商品应用是强依赖,强依赖故障将导致业务不可用,且故障的爆炸半径应该控制在单元格内。创建故障演练。创建杭州单元格B下的商品应用故障演练(例如网络丢包)。具体操作,请参见创建演练。故障注入。在...

同城多活架构实践

演练预期:电商首页展示的查询链路对商品应用是强依赖,强依赖故障将导致业务不可用,且故障的爆炸半径应该控制在单元格内。创建故障演练。创建杭州单元格B下的商品应用故障演练(例如网络丢包)。具体操作,请参见创建演练。故障注入。在...

同城容灾演练产品概述

例如:企业正使用的云产品实例不可用。可用区的某产品的集群级别的性能衰减或不可用。基础设置故障导致的整个可用区故障。容灾演练示意图 同城容灾架构评估项 评估项 要求 SLB 多可用区SLB实例。应用层 ECS多可用区部署,相关应用多可用区...

产品版本说明

应用高可用能力测评(现已更名为“故障演练”):根据架构感知模块捕捉到的架构数据主动制造故障,检验应用系统及其各组件在故障下的可用性表现,从而验证应用系统的高可用能力,提前暴露故障隐患,帮助您针对性地应对风险。应用高可用防护...

什么是应用高可用服务AHAS

应用高可用服务(Application High Availability Service)是一款专注于提高应用高可用能力的SaaS产品,包含架构感知、流量防护、故障演练和功能开关四大独立的功能模块。架构感知:自动感知应用的拓扑结构。以可视化的方式直观呈现应用对...

诊断决策

您可以通过诊断决策,编排故障排查的过程。对于已知的明确故障,可以根据诊断现象,编排诊断决策,进而故障发生时执行,完成故障定位。对于未知的故障,您可以依据运维经验,编排出常见的排查路径,辅助快速故障定位。新建诊断决策从...

功能更新记录

本文介绍故障演练Chaos历次发布涉及的功能变更,帮助您了解故障演练的发布动态。2021年9月 功能名称 功能概述 支持资源包类型 支持地域 发布时间 可视化演练 可视化演练是基于架构视图来控制爆炸半径,并通过可视化的交付方式,直接面向...

产品架构

本文向您介绍故障演练的产品架构,以下简称故障演练为 AHAS Chaos。产品架构如下图所示:AHAS Agent AHAS Agent ...在服务不可用情况下,您可以通过手动执行命令来恢复演练。icmsDocProps={'productMethod':'created','language':'zh-CN',};

同城多活常见问题

基本概念 逻辑集群概念 可用区概念 同可用区多个逻辑集群优先 支持 支持 故障场景RPC切零 支持 支持 支持的服务 微服务 消息 分布式任务 微服务 消息是基于Shutdown机制实现多活么?不是。因为这样会涉及业务重启恢复,如果每次容灾...

应用场景

当主可用区出现机房故障不可用时,负载均衡仍然有能力在非常短的时间内(大约30s中断)切换到另外一个备可用区恢复服务能力;当主可用区恢复时,负载均衡同样会自动切换到主可用区提供服务。使用负载均衡时,您可以将负载均衡实例部署在...

支持的地域与可用

ALB支持的地域与可用区 地域 可用区 华东1(杭州)可用区H、可用区I、可用区G 华东2(上海)可用区E、可用区F、可用区G 华南1(深圳)可用区D、可用区E 西南1(成都)可用区A、可用区B 华北1(青岛)可用区B、可用区C 华北2(北京)可用区H...

什么是消息演练

各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必可少的一环,这些消息服务之前并没有实际在系统中经历过真实流量考验,很难发现一些其中隐患或缺陷,急需通过故障演练来评测高可用性。AHAS提供了强大且高灵活度的故障演练...

基本概念

本文介绍了应用高可用服务 AHAS 涉及的基本概念和四大子模块的基本概念,了解这些基本概念有助于您更好地使用本产品。通用概念:什么是应用高可用服务环境(AHAS 环境)?什么是探针?架构感知相关概念:什么是架构和架构组件?流量防护...

演练概述

基于阿里巴巴多年业务的真实线上故障库的积累,AHAS故障演练模块为您预定义了丰富的测试任务,检验应用的高可用能力。故障演练支持对部署在阿里云ECS实例、容器服务Kubernetes集群、K8s架构类应用、Java类应用进行故障演练。一次完整的故障...

管理探针

应用高可用服务AHAS会通过探针从您的系统中采集所需的信息。本文介绍了如何安装、升级、停止和卸载探针。什么是探针?应用高可用服务AHAS包括以下两种探针:应用高可用探针(即AHAS探针):这是安装在操作系统上的独立进程,用来采集架构...

安装探针概述

为您的主机等资源安装 应用高可用探针(即AHAS探针)后,即可使用AHAS架构感知和故障演练功能,能直观地看到应用对基础架构的依赖关系、组件间的依赖关系,以及对指定机器进行故障演练。接入 AHAS架构感知和故障演练可以接入云服务器ECS、...

产品高可用

当主可用区出现故障不可用时,负载均衡有能力在非常短的时间内(约30秒)切换到备可用区并恢复服务;当主可用区恢复时,负载均衡同样会自动切换到主可用区提供服务。说明 负载均衡的主备可用区是可用区级别的容灾。只有当主可用区整体不...

SLB高可用设计

当主可用区出现故障不可用时,负载均衡有能力在非常短的时间内(约30秒)切换到备可用区并恢复服务;当主可用区恢复时,负载均衡同样会自动切换到主可用区提供服务。说明 负载均衡的主备可用区是可用区级别的容灾。只有当主可用区整体不...

强弱依赖治理概述

异常发生时,影响核心业务流程,影响系统可用性的依赖称作弱依赖,反之为强依赖。以商品详情页为例。商品详情页后台系统架构如下。如果商品详情页对下游依赖是强依赖,例如当下游依赖库存、优惠、物流出现故障的时候,将导致业务流程...

什么是容器报警演练

容器演练是针对Kubernetes集群定制的故障演练,可以对Kubernetes集群中至关重要的高可用特性进行验证。目前AHAS仅支持容器演练中的报警演练。本文主要介绍容器演练中的报警演练功能。报警演练功能概述 Kubernetes集群的自动报警功能是保障...

同城容灾架构概述

前端部署DNS解析,如果某个可用区出现像IDC机房断电或者火灾等机房级故障时,可以通过前端切换DNS来及时恢复业务。非机房级故障(某个机房的单产品故障,如其中一个机房的ECS服务器损坏),可以通过对单产品的灾备设计来保障发生故障时系统...

故障演练常见问题

故障不生效的原因较多,可能是参数配置正确或无对应的请求命中,但故障规则已成功下发,故需要计费。刚刚购买的资源包为什么会被扣减次数?因为购买前已产生欠费,购买资源包后会先扣减所欠的次数。子账号的消费是否独立计费?不是,与主...

故障处理流程

故障处理流程图如下:SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,排查流程如下,详细步骤参见ping不通云服务(SAG-100WM):用户收到告警信息或者发现应用不可用。登录智能接入网关控制台,查看设备状态。访问其他公共...

应用场景

当出现这些故障时,如果用户业务部署在单个地区,那么就会因为地区故障导致服务不可用,且不可用时间完全依赖故障恢复时间。通过构建灾备库,使用数据同步服务实时增量同步主库数据以确保主库与灾备库数据的完全一致,当业务中心发生地区...

公共云同城容灾解决方案

云上同城灾备:应对公共云上某地域可用区故障场景,例如:企业正使用的云产品实例不可用。可用区的某产品的集群级别的性能衰减或不可用。基础设置故障导致的整个可用区故障。说明 同城容灾的基本概念及技术指标可参考 容灾备份基本概念 ...

报警演练

架构高可用,然后在左侧导航栏选择架构高可用>容器演练。在容器演练页面,单击报警演练。在报警演练页面,从集群名称下拉列表中选择演练的集群。在报警演练页面,选择待验证的报警事件(可多选),然后单击批量触发警报。报警演练开始后...
< 1 2 3 4 ... 200 >
跳转至: GO

新品推荐

你可能感兴趣

热门推荐

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折