阿里云搜索结果产品模块_海外服务器

跨地域容灾

容灾系统部署在阿里云上两个地域中,当主系统发生故障时,业务系统切换到容灾系统。主系统和容灾系统部署在不同的地域,可靠性更高,有效避免了地域性灾害导致的系统故障。准备工作在实现跨地域容灾之前,您需要选择一个不同于生产环境的...

ack-node-repairer

当NodeProblemDetector(简称NPD)组件检测到节点上的故障并生成节点的事件(Event)或者Condition上报给集群时,ACK的自愈系统(ACKNodeRepairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。本文介绍如何...

跨可用区容灾

当生产站点因为不可抗力因素(比如火灾、地震)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,混合云容灾服务支持业务的跨可用区(AvailabilityZone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的RTO/...

阿里云试用中心,为您提供0门槛上云实践机会!

100+款试用云产品,最长免费试用12个月!拨打95187-1,咨询专业上云建议!
广告

跨地域容灾

容灾系统部署在阿里云的两个地域中,当主系统发生故障时,业务系统切换到容灾系统。主系统和容灾系统部署在不同的地域,提供容灾即服务,且RPO可以低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障...

使用云监控功能监控网站环境(部署于ECS实例)

设置进程监控对于常见的web应用,设置进程监控,不仅可以实时监控应用进程的运行情况,还有助于排查处理故障,下图是Java进程的相关监控示例。具体操作请参见添加进程监控。设置站点监控在云服务器外层的监控服务,站点监控主要用于模拟...

什么是消息演练

消息演练功能将这些常见的中间件进行了统一抽离,为消息服务安排分配了精选后的演练最佳实践,您不需要自己去研究分析每种消息服务需要什么演练场景,仅需选择演练方案即可,如下图所。消息演练功能会在您的授权下展出对应的消息服务整体...

FAQs

两者的对比如下表所:对比项网络层后端地址加权轮询跨Region难度故障隔离时间会话保持全局流量管理3层域名、IP支持简单分钟级不支持负载均衡SLB4层、7层IP支持困难秒级支持全局流量管理(GTM)、云解析DNS、全局负载均衡(GSLB)有什么...

什么是故障演练

故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景,能够帮助分布式系统提升容错性和可恢复性。流程故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。通过四阶段的流程...

云数据库Redis版是否支持主从节点的故障切换?

云数据库Redis版支持自动执行主从节点的故障切换。主从(Master-Replica)节点之间的同步和故障切换,由系统来自行管理,无需用户来维护。

微服务应用问题定位及故障演练

微服务应用通过阿里云业务实时监控ARMS监控发现节点及容器故障,在日常中可以通过AHAS演练及时发现问题及针对性防护。本文介绍微服务应用问题定位及故障演练的场景描述、解决的问题、部署架构图、选用的产品及参考链接等。直达最佳实践点击...
来自: 首页 >中间件

开源ChaosBlade与商业化AHAS CHAOS故障演练对比

平台侧核心能力项目AHASCHAOS故障演练ChaosBlade基础的故障注入、应用管理等功能支持支持高可用的演练服务保障支持不支持演练场景参数自动识别支持不支持演练流程编排(串行、并行)支持不支持演练流程安全防护支持不支持演练专家经验库...

故障类问题

本文介绍在使用DataV的过程中,可能出现的故障,及对应的解决方法。为什么打开界面看不到内容?可能是浏览器版本的问题,建议您使用Chrome50及以上版本。目前组件显示不正常,很多组件显示不全,如何解决?可能是登录状态丢失导致,请先...

代码逻辑场景

本文列出了故障演练支持的代码逻辑场景。篡改Java方法返回值修改Java指定方法的返回值,返回指定的值。参数名称是否必选默认值参数说明类名是无完整的类名,包含包名。例如:com.alibaba.service.XxxService。如果模拟接口故障,需填写接口...

微服务应用问题定位及故障演练

本文介绍微服务应用问题定位及故障演练的场景描述、解决问题、架构图及操作参考链接。场景描述您微服务架构应用基于阿里云容器服务Kubernetes(ACK)部署,通过阿里云业务实时监控ARMS发现微服务应用的容错能力是否健壮、容器编排配置是否...

为何Pod中仍存在已恢复故障的“僵尸进程”?

在K8s环境中,下发的故障已经被恢复了,但是Pod中仍存在该故障的“僵尸进程”。本文介绍该情况可能的原因以及解决方案。可能原因这是因为容器中存在PIDNamespace隔离。在容器中,故障演练进程的父进程是PID=1的进程,容器中的一号进程不...

管理SQL Server集群

默认展示专属集群ID、专有网络、主机数等信息,您可以在右侧单击,设置列表中展示的信息。您可以在右侧单击,下载专属集群信息到本地查看。在目标专属集群的操作列,单击详情。在专属集群的基本信息页,查看各项参数。参数说明如下:参数...

容器服务ACK集群故障排查

journalctl-ukubelet集群常见问题下表罗列了一部分ACK集群常见故障原因以及处理方法:故障场景处理方法APIServer组件停止或Master组件停止:不能创建(停止、更新)Pod、Service、Deployment等资源。已有的Pod和Service仍然能够正常工作...
来自: 首页

常见问题

本文介绍容器服务ACK的常见问题。您在使用容器服务ACK时如果收到容器服务ACK返回的错误信息,可查阅容器服务错误代码汇总匹配解决方案。如果您没有收到具体的错误信息,可根据以下问题分类匹配问题场景和解决方案。产品FAQ授权管理FAQ集群...

同城多活常见问题

本文介绍同城多活的常见问题以及解决方案。假设数据库主备,ECS双可用区部署,是否就是同城多活?和EDAS、MSE集群流量同可用区优先的差异和优势?消息是基于Shutdown机制实现多活么?数据库是两个机房各一个主备,还是主机房一主一备,备...

电源故障定位

诊断流程电源故障详细处理流程,如下图所。处理步骤测量输入电压。使用万用表测量输入电压,根据电源适配器的工作电压范围判断输入电压是否异常。插拔电源适配器。把电源适配器以及电源线重新进行插拔,排除接触不良的因素。交叉验证电源...

演练场景说明

故障演练场景是演练任务的核心。AHAS提供基础资源类场景和Kubernetes类场景,帮助分布式系统提升容错性和可恢复性。每一个执行阶段的演练场景都对应一个恢复阶段的演练任务。恢复阶段的演练任务目的是清除故障演练的影响,使应用或服务恢复...

流水单据型业务场景多活实践

说明基于MSHA流量监控或其他监控能力,确定业务稳态的监控指标,以便在故障发生时判断故障影响面以及在故障恢复后判断业务的实际恢复情况。演练预期如下:下单链路对订单应用是强依赖,强依赖故障会影响业务不可用。故障爆炸半径控制在单元...

流水单据型业务场景多活实践

说明基于MSHA流量监控或其他监控能力,确定业务稳态的监控指标,以便在故障发生时判断故障影响面以及在故障恢复后判断业务的实际恢复情况。演练预期如下:下单链路对订单应用是强依赖,强依赖故障会影响业务不可用。故障爆炸半径控制在单元...

诊断网页加载过慢的问题

针对这类问题,ARMS前端监控的慢会话追踪功能提供页面静态资源加载的性能瀑布图,可深入定位页面资源加载情况,全方位地诊断故障根源,从而快速排除故障。问题描述网页加载较慢是经常出现且前端非常关注的问题之一。定位、排查解决这类问题...

探针安装常见问题

常见问题本文介绍了以下常见问题:AHAS架构感知和故障演练探针limits配置ECS探针安装常见问题容器服务安装ack-ahas-pilot常见问题1容器服务安装ack-ahas-pilot常见问题2容器服务安装ack-ahas-pilot常见问题3容器服务安装ack-ahas-pilot常见...

常见问题-FAQ

两者的对比如下表所:对比项网络层后端地址加权轮询跨Region难度故障隔离时间会话保持全局流量管理3层域名、IP支持简单分钟级不支持负载均衡SLB4层、7层IP支持困难秒级支持全局流量管理(GTM)、云解析DNS、全局负载均衡(GSLB)有什么...

查看应用分组

您可以在应用分组中查看组内资源、监控视图、故障列表、报警历史、报警规则等监控数据,并执行相关操作。集中管理资源,便于您及时接收故障资源的报警通知,并及时处理故障。前提条件请确保您已创建应用分组,操作方法请参见创建应用分组。...

故障处理流程

当网关设备发生网络故障后,您可以先观察现象、收集信息,然后进行分析诊断,完成问题修复。故障处理流程图如下:SAG-100WM故障处理流程说明通过SAG-100WM访问阿里云,发现故障,排查流程如下,详细步骤参见ping不通云服务(SAG-100WM):...

阿里云售后服务说明

阿里云售后服务范围:关于阿里云服务与产品功能的咨询使用、配置阿里云产品的建议阿里云的产品相关的技术问题、故障诊断阿里云API和阿里云SDK问题的故障诊断与阿里云资源相关的操作或系统问题的故障诊断与阿里云的管理控制台或其他阿里云...

无法连接Windows实例

此处列举较为常见的问题原因,具体原因以现场排查结果为准。防火墙配置异常。远程访问端口的配置异常。CPU负载过高。安全组公网规则错误。修改管理终端密码后未重启ECS实例。数据盘挂载失败。客户端本地网络异常。运营商骨干网络异常。网卡...

设备无法上电

设备的外接电源有故障。设备的电源适配器有故障。解决方案确认设备电源开关是否打开。确认设备电源线缆是否插牢。确认外接电源是否有故障。更换其它可以正常供电的外接电源,如果设备可以正常上电,则可以确认是设备的外接电源有故障。确认...

安装探针概述

为您的主机等资源安装应用高可用探针(即AHAS探针)后,即可使用AHAS架构感知和故障演练功能,能直观地看到应用对基础架构的依赖关系、组件间的依赖关系,以及对指定机器进行故障演练。接入AHAS架构感知和故障演练可以接入云服务器ECS、自...

安装故障演练探针

对指定机器进行演练时,需要在机器上面安装故障演练探针,探针的作用是下发故障演练执行命令。背景信息一次完整的故障演练包括以下四个阶段:安装探针>创建演练>执行演练>停止演练操作步骤登录AHAS控制台。在左侧导航栏选择探针管理,在...

探针安装常见问题

常见问题本文介绍了以下常见问题:AHAS架构感知和故障演练探针limits配置ECS探针安装常见问题容器服务安装ack-ahas-pilot常见问题1容器服务安装ack-ahas-pilot常见问题2容器服务安装ack-ahas-pilot常见问题3容器服务安装ack-ahas-pilot常见...

容灾恢复

其中部分服务提供者可能由于网络、配置、长时间fullgc、线程池满、硬件故障等导致长连接还存活但是程序已经无法正常响应。单机故障剔除功能会将这部分异常的服务提供者进行降级,使得客户端的请求更多地指向健康节点。当异常节点的表现正常...

应用监控3D拓扑图

借助3D拓扑图,您可以快速定位诱发故障的服务、被故障影响的应用和关联的主机等,全方位地诊断故障根源,从而快速排除故障。快速入门请查看以下交互式文档,了解ARMS应用监控3D拓扑图的功能。为获得最佳体验,请在新窗口中打开查看。lt;p&...

服务管控和治理

服务路由通过设置路由规则对服务提供方和服务消费方进行流量分配调整,用于线下测试联调、灰度发布、蓝绿发布场景。更多信息请参见服务路由。服务鉴权通过设置黑名单规则、白名单规则的方式,对服务调用方进行鉴权控制。更多信息请参见...

什么是应用高可用服务AHAS

应用高可用服务(ApplicationHighAvailabilityService)是一款专注于提高应用高可用能力的SaaS产品,包含架构感知、流量防护、故障演练和功能开关四大独立的功能模块。架构感知:自动感知应用的拓扑结构。以可视化的方式直观呈现应用对基础...

强弱依赖治理概述

强弱依赖治理就是通过科学的手段持续稳定地得到应用间依赖关系、流量、强弱等数据,提前发现因为依赖问题可能导致的故障,避免依赖故障影响用户体验,积累数据持续推进系统稳定性提升。什么是强弱依赖?异常发生时,不影响核心业务流程,不...

独享代理常见问题

本文介绍使用独享代理的常见问题。5.7版本实例已经升级小版本了,为什么还是只有读写分离,没有独享代理功能?升级后您需要关闭原有的读写分离,才能看到独享代理的开启页面。想实现读写分离,是使用独享代理地址还是读写分离地址?独享...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO

新品推荐

你可能感兴趣

热门推荐

切换为移动版

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折
阿里云搜索结果产品模块_海外服务器