全方位提升业务连续性能力,不同生命周期阶段使用不同策略保障业务系统高可用性:

规划:业务上线或变更之前,需要进行架构规划、容量评估甚至是异地多活部署。

线上管控:业务线上运行时,需要有防护工具对突发/异常流量进行防御并能快速切换预案,同时日常也需要定时进行风险巡检来低成本地保障系统高稳定性。

演练:通过故障的演习来验证系统的高可用性,预案的演练来进行恢复能力的验证,全面提升高可用性。

容灾:核心业务系统需要通过同城或异地容灾系统,来保障全局高可用性。

架构可视化,是指利用Advisor 的架构地图感知云上系统架构,以可视化的方式直观呈现云资源、容器和应用间分层依赖关系。架构自动识别:自动识别Redis,Mysql,ZooKeeper等常用的三方组件和ECS、RDS、Redis、CDN、DNS、MQ、SLB、EIP、NAT、DDOS、WAF等云资源,同时可识别容器服务、Kubernetes环境中的node、Pod、service、container等资源,将其拓扑关系进行可视化展示。风险可视化展示:根据通用风险规则,定期进行基于架构拓扑中节点的风险巡检,并将巡检结果可视化直观呈现。可根据风险描述及建议修复方案,进行配置、资源的调整。

外网仿真压测,通过PTS高效快速构建同模型和量级的业务流量,同时从公网的各地域运营商发起,真实模拟特定业务场景下的外网流量,从而全面验证和探测云上或云下整体架构的瓶颈和问题。全链路压测,通过PTS相关解决方案使生产环境具备压测流量识别和路由到指定影子存储区域的能力,结合相关影子存储区域的准备,具备生产环境同业务基础数据规模压测能力和精准衡量线上生产环境的能力,同时对于压测数据可以方便安全的清理。

对于运行态或已有应用可以通过AHAS 探针形态在不修改代码的情况下进行业务洪峰的流控、消息场景的削峰填谷。对于线上配置项和业务属性值通过AHAS 开关模块的轻量级方案进行安全和统一管控。流量防护:提供业务系统全方位可用性防护,从网关防护和应用防护两个层面、入口/应用/应用间/单机负载多维度,提升系统的高可用性。可零代码改动,一键快速启用。秒级防护能力和配置生效速度。功能开关:轻量级运行时动态配置修改功能,可用于集中管理应用的业务开关,并在运行时动态调配。

通过Advisor 智能顾问对云上主要云资源进行全面的巡检和风险识别,规则都来自于TAM面向客户的技术体系积累及阿里生态内SRE最佳实践的融合。基于Advisor的架构地图和用户的输入,进行更深层次的应用/业务架构层面的巡检和建议。

遵循混沌工程实验原理并融合了阿里巴巴内部实践,提供了丰富故障场景实现,帮助分布式系统提升容错性和可恢复性。丰富的演练库:不断积累的基于真实故障场景的演练库,提供客户端、网络、负载等多层面的演练经验库,可进行快速演练场景的创建及修改。支持小程序扩展定义:通过故障演练小程序,可以方便的添加各种准备、监控、检测等故障演练环节,从而实现更高阶、个性化的演练场景定义。

异地多活解决方案为阿里核心电商级沉淀多年的技术产品方案,为各种多元化业务提供适合业务自身特点的异地多活方案,为业务提供更佳的用户体验和容灾逃逸能力。

业务连续性核心能力
架构设计
架构可视化,是指利用Advisor 的架构地图感知云上系统架构,以可视化的方式直观呈现云资源、容器和应用间分层依赖关系。
架构自动识别:自动识别Redis,Mysql,ZooKeeper等常用的三方组件和ECS、RDS、Redis、CDN、DNS、MQ、SLB、EIP、NAT、DDOS、WAF等云资源,同时可识别容器服务、Kubernetes环境中的node、Pod、service、container等资源,将其拓扑关系进行可视化展示。
风险可视化展示:根据通用风险规则,定期进行基于架构拓扑中节点的风险巡检,并将巡检结果可视化直观呈现。可根据风险描述及建议修复方案,进行配置、资源的调整。
容量规划
外网仿真压测,通过PTS高效快速构建同模型和量级的业务流量,同时从公网的各地域运营商发起,真实模拟特定业务场景下的外网流量,从而全面验证和探测云上或云下整体架构的瓶颈和问题。
全链路压测,通过PTS相关解决方案使生产环境具备压测流量识别和路由到指定影子存储区域的能力,结合相关影子存储区域的准备,具备生产环境同业务基础数据规模压测能力和精准衡量线上生产环境的能力,同时对于压测数据可以方便安全的清理。
线上管控
对于运行态或已有应用可以通过AHAS 探针形态在不修改代码的情况下进行业务洪峰的流控、消息场景的削峰填谷。对于线上配置项和业务属性值通过AHAS 开关模块的轻量级方案进行安全和统一管控。
流量防护:提供业务系统全方位可用性防护,从网关防护和应用防护两个层面、入口/应用/应用间/单机负载多维度,提升系统的高可用性。可零代码改动,一键快速启用。秒级防护能力和配置生效速度。
功能开关:轻量级运行时动态配置修改功能,可用于集中管理应用的业务开关,并在运行时动态调配。
日常巡检
通过Advisor 智能顾问对云上主要云资源进行全面的巡检和风险识别,规则都来自于TAM面向客户的技术体系积累及阿里生态内SRE最佳实践的融合。
基于Advisor的架构地图和用户的输入,进行更深层次的应用/业务架构层面的巡检和建议。
常态化演练
遵循混沌工程实验原理并融合了阿里巴巴内部实践,提供了丰富故障场景实现,帮助分布式系统提升容错性和可恢复性。
丰富的演练库:不断积累的基于真实故障场景的演练库,提供客户端、网络、负载等多层面的演练经验库,可进行快速演练场景的创建及修改。
支持小程序扩展定义:通过故障演练小程序,可以方便的添加各种准备、监控、检测等故障演练环节,从而实现更高阶、个性化的演练场景定义。
容灾备份
异地多活解决方案为阿里核心电商级沉淀多年的技术产品方案,为各种多元化业务提供适合业务自身特点的异地多活方案,为业务提供更佳的用户体验和容灾逃逸能力。

关联云产品

PTS

强大的分布式压测能力的 SaaS 压测平台,可模拟海量用户的真实业务场景,全方位验证业务站点的性能、容量和稳定性。

即刻体验

AHAS

提供应用架构自动探测、故障注入式高可用能力演练和一键应用限流降级等功能,可以快速低成本地提升应用可用性。

提供免费版本

即刻体验

Advisor

为分布式应用的开发者提供了完整的调用链路还原、调用请求量统计、链路拓扑、应用依赖分析等工具。

免费使用

即刻体验

应用场景

应用即将上线,但对线上容量和应用性能瓶颈没有把握?

PTS x ARMS,打造经典压测监控方案,支持新版本性能基线测试、大促场景测试和线上容量规划等场景。

突发流量洪峰超出系统承载上限,无从应对?

PTS 与 AHAS 打造经典压测流控方案,提早发现性能短板的同时,并能进一步确保系统的稳定性。

线上架构混乱,想要调整优化却迟迟不敢动?

Advisor提供架构地图能力,可视化查看线上架构的同时从合理性和安全上巡检架构风险。