负载均衡

负载均衡SLB(Server Load Balancer)是一种对流量进行按需分发的服务,通过将流量分发到不同的后端服务来扩展应用系统的服务吞吐能力,并且可以消除系统中的单点故障,提升应用系统的可用性。

运维事件中心

运维事件中心是企业业务连续性的运营管理平台,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能,一站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应、更短的故障时长、更...

全局流量管理

全局流量管理通过DNS实现应用服务的就近访问接入、多地址负载均摊,同时根据健康检查进行DNS Failover,实现应用服务的同城多活故障隔离和异地容灾。

应用高可用服务 AHAS

应用高可用服务AHAS是一款专注于提高应用高可用能力的SaaS产品,提供应用架构自动探测、故障注入式高可用能力演练、一键应用防护和增加功能开关等功能,可以快速低成本地提升应用可用性。

数据库自治服务 DAS

数据库自治服务DAS(Database Autonomy Service)是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务,帮助您消除人工操作引发的服务故障,有效保障数据库服务的稳定、安全及高效。

Node.js 性能平台

Node.js 性能平台(Node.js Performance ...应用提供性能监控、安全提醒、故障排查、性能优化等服务的整体性解决方案。\nNode.js 性能平台凭借对 Node.js 内核深入的理解,提供完善的工具链和服务,协助客户主动、快速发现和定位线上问题。

性能测试 PTS

性能测试服务(Performance Testing Service,简称 PTS)是卓越的SaaS性能测试平台,具备强大的分布式压测能力,可模拟海量用户的真实业务场景。

云数据库 OceanBase

自主研发的金融级分布式关系数据库,在普通硬件上实现金融级高可用,在金融行业首创“三地五中心”城市级故障自动无损容灾新标准,同时具备在线水平扩展能力,创造了 6100万次/秒处理峰值的业内纪录,在功能、稳定性、可扩展性、性能方面都...

机器人流程自动化RPA

阿里云RPA产品是一款新型工作流程自动化办公机器人软件,通过模拟人工操作进行自动流程执行处理。它可以将办公人员从每日的重复工作中解放出来,提高生产效率

性能分析

性能分析服务为移动 App 提供实时线上性能数据的“采集-分析-监控-告警...Android/iOS 应用类型,帮助客户建立 5 分钟线上故障感知能力,并与崩溃分析/远程日志服务配合使用,构建异常“感知-定位-恢复”的运维能力闭环,提升 App 使用体验。

崩溃分析

崩溃分析服务为移动 App 提供实时线上稳定性相关数据的“采集-分析-监控-告警”能力...应用类型,帮助客户建立 5 分钟线上故障感知能力,并与性能分析/远程日志服务配合使用,构建异常“感知-定位-恢复”的运维能力闭环,提升 App 使用体验。

阿里云验证码

通过对用户的行为数据、设备特征与网络数据构建多维度数据分析,使用业界先进的风控引擎结合“规则+AI”模型,对风险设备使用、模拟行为、暴力重放等攻击进行综合实时风控判决,解决企业账号、活动、交易等关键业务环节存在的欺诈威胁,...

什么是故障演练

故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景,能够帮助分布式系统提升容错性和可恢复性。流程 故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。通过四阶段的...

监控服务概览

OSS监控服务为您提供系统基本运行状态、性能以及计量等方面的监控数据指标,并且提供自定义报警服务,帮助您跟踪请求、分析使用情况、统计业务趋势,及时发现以及诊断系统的相关问题。OSS监控指标主要分为基础服务指标、性能指标和计量指标...

IDC提供的主要业务有哪些?

IDC提供的主要业务如下:1、主机托管,如机位、机架、机房出租。2、资源出租,如虚拟主机业务、数据存储服务。3、系统维护,如系统配置、数据备份、故障排除服务。4、管理服务,如带宽管理、流量分析、负载均衡、入侵检测等。

容灾演练断网方式说明

如果ECS绑定了多块辅助网卡,每一块辅助网卡对应的安全组策略同样会进行故障注入,故障实验恢复时,系统会还原ECS绑定的原始安全组策略及辅助网卡对应的原始安全组。可用区断网在交换机级别进行模拟,而安全组断网在实例级别进行模拟。针对...

强弱依赖治理概述

系统改造验收:对于分布式系统,至少在运行态中,不会因为依赖的系统后台出现故障,引起当前应用出现系统级可用性的故障,例如进程挂掉、频繁FullGC、负载飙高等,何时何地都应具备快速止血的能力。限流降级参考:对于弱依赖,一般都要配置...

代码逻辑场景

本文列出了故障演练支持的代码逻辑场景。篡改Java方法返回值 修改Java指定方法的返回值,返回指定的值。参数名称 是否必选 默认值 参数说明 类名 是 无 完整的类名,包含包名。例如:com.alibaba.service.XxxService。如果模拟接口故障,需...

什么是容器报警演练

AHAS容器演练中的监控报警验证功能通过模拟事件触发,验证集群监控报警设置是否正常可用,并统计报警成功率、以及事件触发到监控报警的平均延迟,从而验证Kubernetes集群监控报警系统的有效性。报警演练功能特性 无损。不同于其他故障演练...

微服务应用问题定位及故障演练

方案通过AHAS故障注入模拟生产环境产生的故障,通过ARMS及时发现问题、定位问题,并结合ARMS的告警功能快速发现并解决问题。发现调用下游一个服务实例出现异常。发现业务Pod故障,验证业务的稳定性。发现调用数据库延迟故障,验证Pod的水平...

申请续用Windows Server 2003 镜像服务协议

实例中运行的应用程序如果发生故障,并且需要安装微软补丁或者需要微软方面提供操作系统级的故障排除支持方可解决的,阿里云仅能为您的故障排除提供协助,可能无法提供完全的问题解决方案。4.1.3& 受到硬件兼容性和驱动程序相关问题的限制...

故障注入

故障类型故障注入支持注入错误或者超时等事件,方便服务的异常测试,用于模拟服务异常的情况。取值如下:中断异常:注入运行时异常,中断请求并返回既定的错误状态码。超时异常:满足条件的请求,会增加响应时间,请求正常调用。超时时间...

PTS压测流程

演练阶段:在演练排查阶段,您需要对系统进行故障演练,进而发现并验证系统问题,锻炼系统及相关人员的应急能力,阿里云提供了故障演练平台帮助您演练预案。更多信息,请参见故障演练概述。容灾阶段:在容灾防护阶段,您需要构建系统的容灾...

故障注入

故障类型故障注入支持注入错误或者超时等事件,方便服务的异常测试,用于模拟服务异常的情况。取值如下:中断异常:注入运行时异常,中断请求并返回既定的错误状态码。超时异常:满足条件的请求,会增加响应时间,请求正常调用。异常比例...

边缘模拟器环境搭建

边缘模拟模拟了物业一体机的所有功能,厂商开发阶段可以使用边缘模拟器进行联调测试。本文主要介绍边缘模拟器的环境搭建。一、安装Docker环境1、Linux系统,以ubuntu为例,可以参考:https://docs.docker.com/engine/install/ubuntu/2、...

系统日志和屏幕截图

系统通过串口打印输出的日志会包含两种类型的信息,一类是系统启动开机时的日志内容,另一类是系统内核故障或异常时的日志内容。更多详情,请参见 《云栖社区》博客操作系统有异常?诊断日志来帮忙。您可以通过控制台实例详情页、控制台...

监控、诊断和故障排除

故障排除:提供常见的问题场景和故障排除方法。服务监控 监视总体运行状况 可用性和有效请求率 可用性和有效请求率是有关系统稳定性和用户是否正确使用系统的最重要指标,指标小于100%说明某些请求失败。可能因为一些系统优化因素出现暂时...

电源故障定位

您可以参考以下方法定位电源故障并进行处理流程。诊断流程 电源故障详细处理流程,如下图所示。处理步骤 测量输入电压。使用万用表测量输入电压,根据电源适配器的工作电压范围判断输入电压是否异常。插拔电源适配器。把电源适配器以及电源...

多应用服务场景如何实现批量切换流量

应用场景容灾演练时,模拟服务器故障,验证故障切换策略是否符合配置预期。创建多个应用服务同时切换流量的容灾预案,实现将多个应用服务的访问流量批量切换到其他地址池。创建运营商级别故障的容灾预案,故障发生时可一键执行预案,实现将...

诊断网页加载过慢的问题

针对这类问题,ARMS前端监控的慢会话追踪功能提供页面静态资源加载的性能瀑布图,可深入定位页面资源加载情况,全方位地诊断故障根源,从而快速排除故障。问题描述 网页加载较慢是经常出现且前端非常关注的问题之一。定位、排查解决这类...

多应用服务场景如何实现批量切换流量

容灾演练时,模拟服务器故障,验证故障切换策略是否符合配置预期。创建多个应用服务同时切换流量的容灾预案,实现将多个应用服务的访问流量批量切换到其他地址池。创建运营商级别故障的容灾预案,故障发生时可一键执行预案,实现将故障运营...

跨地域容灾

容灾系统部署在阿里云上两个地域中,当主系统发生故障时,业务系统切换到容灾系统。主系统和容灾系统部署在不同的地域,可靠性更高,有效避免了地域性灾害导致的系统故障。准备工作 在实现跨地域容灾之前,您需要选择一个不同于生产环境的...

应用场景

提供的精确到虚拟机级别的深度监控,能够如实的反应应用运行状态,通过配置报警规则,用户可以在发现系统出现故障(内存泄露或者 CPU 热点等)趋势时,通过诊断接口迅速定位故障点。Node.js 性能平台特别适合业务发展迅速、应用发布频繁、...

自动/手动主备切换

系统发生故障时,PolarDB集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现20~30秒左右的闪断,因此切换前请务必确保应用具备重连机制...

混沌工程缓存实战系列-Redis

Redis是一个开源高性能的Key-Value存储系统,虽然Redis本身具备了非常高的可用性,但是在实际应用中也会随着系统业务的复杂性以及不合理的使用,而导致很多的问题。本文将讲述如何通过混沌工程来暴露可能存在的使用风险,提升缓存问题的...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当主系统发生故障时,业务系统切换到容灾系统。主系统和容灾系统部署在不同的地域,提供容灾即服务,且RPO可以低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障...

混沌工程缓存实战系列-Redis

Redis是一个开源高性能的Key-Value存储系统,虽然Redis本身具备了非常高的可用性,但是在实际应用中也会随着系统业务的复杂性以及不合理的使用,而导致很多的问题。本文将讲述如何通过混沌工程来暴露可能存在的使用风险,提升缓存问题的...

支持计划

配置指导以及故障排除配置指导以及故障排除配置指导以及故障排除配置指导以及故障排除专属技术服务经理不支持不支持不支持 专属技术服务经理 健康检查可免费使用应用高可用服务(AHAS)应用架构核心巡检规则,使用受限节点架构可视化功能可...

实例的节点故障处理机制

本文档介绍云数据库MongoDB版实例的节点故障处理机制。单节点实例 由于单节点实例架构的特殊性,单节点实例仅拥有一个节点。当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于...

故障演练常见问题

故障不生效的原因较多,可能是参数配置不正确或无对应的请求命中,但故障规则已成功下发,需要计费。刚刚购买的资源包为什么会被扣减次数?因为购买前已产生欠费,购买资源包后会先扣减所欠的次数。子账号的消费是否独立计费?不是,与主...
< 1 2 3 4 ... 77 >
跳转至: GO

新品推荐

你可能感兴趣

热门推荐

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折