运维事件中心

运维事件中心是企业业务连续性的运营管理平台,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能,一站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应、更短的故障时长、更...

全局流量管理

全局流量管理通过DNS实现应用服务的就近访问接入、多地址负载均摊,同时根据健康检查进行DNS Failover,实现应用服务的同城多活故障隔离和异地容灾。

负载均衡

负载均衡SLB(Server Load Balancer)是一种对流量进行按需分发的服务,通过将流量分发到不同的后端服务来扩展应用系统的服务吞吐能力,并且可以消除系统中的单点故障,提升应用系统的可用性。

应用高可用服务 AHAS

应用高可用服务AHAS是一款专注于提高应用高可用能力的SaaS产品,提供应用架构自动探测、故障注入式高可用能力演练、一键应用防护和增加功能开关等功能,可以快速低成本地提升应用可用性。

数据库自治服务 DAS

数据库自治服务DAS(Database Autonomy Service)是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务,帮助您消除人工操作引发的服务故障,有效保障数据库服务的稳定、安全及高效。

Node.js 性能平台

Node.js 性能平台(Node.js Performance ...应用提供性能监控、安全提醒、故障排查、性能优化等服务的整体性解决方案。\nNode.js 性能平台凭借对 Node.js 内核深入的理解,提供完善的工具链和服务,协助客户主动、快速发现和定位线上问题。

云数据库 OceanBase

自主研发的金融级分布式关系数据库,在普通硬件上实现金融级高可用,在金融行业首创“三地五中心”城市级故障自动无损容灾新标准,同时具备在线水平扩展能力,创造了 6100万次/秒处理峰值的业内纪录,在功能、稳定性、可扩展性、性能方面都...

性能分析

性能分析服务为移动 App 提供实时线上性能数据的“采集-分析-监控-告警...Android/iOS 应用类型,帮助客户建立 5 分钟线上故障感知能力,并与崩溃分析/远程日志服务配合使用,构建异常“感知-定位-恢复”的运维能力闭环,提升 App 使用体验。

崩溃分析

崩溃分析服务为移动 App 提供实时线上稳定性相关数据的“采集-分析-监控-告警”能力...应用类型,帮助客户建立 5 分钟线上故障感知能力,并与性能分析/远程日志服务配合使用,构建异常“感知-定位-恢复”的运维能力闭环,提升 App 使用体验。

代码逻辑场景

限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障请求数的百分比,也可...

实例的节点故障处理机制

当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于测试、培训、非核心业务等场景,生产环境建议使用副本集实例或分片集群实例以保障服务的高可用性。副本集 图 1.副本集架构 ...

管理AP

操作步骤 登录终端访问控制系统控制台。在左侧导航栏单击网络>AP列表。在AP列表页面根据需要您可以进行以下操作。查看AP详细信息 单击需要查看的AP设备MAC地址名称,查看该AP的状态、启动时刻、IP地址等信息。参数说明详情请参考以下表格。...

日志管理

本文介绍如何在本地块网关控制台上传、下载日志。背景信息 本地网关控制台支持上传、下载日志。选择下载日志,可将日志信息打包生成gz格式并下载到本地主机。选择上传日志,可将日志上传至阿里云云存储网关服务器。如果发生故障,您可以...

日志管理

本文介绍如何在本地网关控制台上传、下载日志。背景信息 本地网关控制台支持上传、下载日志。选择下载日志,可将日志信息打包生成gz格式并下载到本地客户机。选择上传日志,可将日志上传至阿里云云存储网关服务器。如果发生故障,您可以...

DeviceLinkDown

DeviceLinkDown事件提示您线下机构侧动态路由邻居发生故障或者静态接入链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换...

基本概念

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

替换主机

当主机发生故障后,如果您创建专属集群MyBase时主机故障处理策略选择的是手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会通过...

如何配置AP信道

一般认为信噪比>30dB时,基本不会影响到当前信道工作。2.4G每间隔5个信道,可认为信号的隔离度能够达到30dB。2.4G推荐使用:1、6、11蜂窝部署。2.4G推荐使用HT20信道5G室内推荐:36、40、44、48、149、153、157、161、165信道。建议使用HT...

JVM注入动态脚本

受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障请求数的百分比,也可代表每次请求发生故障的概率。填写小于或等于0,则表示100% 发生故障。说明 仅填写百分比数字部分即可,即80%,填写80。请求过滤规则 否 无 通过...

5G用户突然批量掉线

根据无委会规定,中国是在2012年以后开放了36-64信道,但部分终端只支持149-165信道。因此AP切换到36-64信道时可能引起掉线。2、可能由于DFS造成。按照无委会相关法律规定,AP工作信道发信雷达信号时需要主动避让。基于我们目前AP的实现,...

替换主机

当主机发生故障后,如果您创建专属集群MyBase时主机故障处理策略选择的是手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会通过...

配置信道后AP配置未生效是什么原因

概述 本文描述关于信道配置的注意事项 详细信息 优先考虑信道配置不当:比如 选在了165+HT40信道。按照协议规定,5G高频中可进行捆绑的信道为149+153,157+161。165如果要做捆绑,需要配置为161+HT40。适用于 云AP

WIFI在2.4G频段介绍以及规划注意事项

概述 本文关于WIFI2.4G频段介绍以及注意事项。详细信息 WIFI在2.4G频段介绍 中国在2.4GHZ 使用频率范围2.4GHz~2.472...个非重叠信道可以使用,所以在进行无线网络部署时通常只采用3 个信道(一般使用信道1、6、11),并重复使用。适用于 云AP

链路状态

发生故障时,及时进行切换。操作步骤 登录智能接入网关控制台。在智能接入网关页面,单击目标实例ID。在智能接入网关实例详情页面,单击高可用配置,可查看链路状态。绿灯:表示链路正常。红灯:表示链路故障。icmsDocProps={'...

应急预案:专有云V3环境中AnalyticDB相关机器故障紧急...

1.概述 本文主要介绍在专有云V3环境中,AnalyticDB相关机器故障紧急维修...在专有云V3环境AnalyticDB相关机器发生故障,需要进行下线维修。3.解决方案 详情请参见以下KB文档。KB 123746 通用方案:专有云V3环境中AnalyticDB机器的RMA处理流程

同城多活架构实践

在杭州单元格B的商品应用发生故障的情况下,可使用MSHA切流功能将流量全部切换到另外的单元格,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换...

流水单据型业务场景多活实践

基于MSHA流量监控或其他监控能力,确定业务稳态的监控指标,以便在故障发生时判断故障影响面以及在故障恢复后判断业务的实际恢复情况。演练预期如下: 下单链路对订单应用是强依赖,强依赖故障会影响业务不可用。故障爆炸半径控制在单元内...

流水单据型业务场景多活实践

基于MSHA流量监控或其他监控能力,确定业务稳态的监控指标,以便在故障发生时判断故障影响面以及在故障恢复后判断业务的实际恢复情况。演练预期如下: 下单链路对订单应用是强依赖,强依赖故障会影响业务不可用。故障爆炸半径控制在单元内...

同城多活架构实践

在杭州单元格B的商品应用发生故障的情况下,可使用MSHA切流功能将流量全部切换到另外的单元格,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换...

修改DDH故障迁移配置

若您未开启DDH故障迁移服务,DDH发生故障停机后,您需要提交工单申请置换一台健康的DDH。注意 本地SSD型DDH(例如本地SSD型i2)不支持自行手动迁移和故障时自动迁移。如果本地SSD型DDH出现故障,您可以提交工单申请人工迁移,但迁移后本地...

读多写少型业务场景多活实践

在杭州单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换预期:将...

读多写少型业务场景多活实践

在杭州单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换预期:将...

DDH故障迁移

若您未开启DDH故障迁移服务,DDH发生故障停机后,您需要提交工单申请置换一台健康的DDH。注意 DDH因故障迁移完成后,DDH ID及ECS实例的元数据(例如实例ID、私有IP地址、公网IP地址)均保持不变,但是由于更换了物理服务器,DDH的机器码会...

故障处理流程

当网关设备发生网络故障后,您可以先观察现象、收集信息,然后进行分析诊断,完成问题修复。故障处理流程图如下:SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,排查流程如下,详细步骤参见ping不通云服务(SAG-100WM):...

设备级高可用

当主设备发生故障时,需在智能接入网关管理控制台切换备设备为主设备,用备设备替换主设备连接入网。双机热备:两台设备同时在线。自动检测,自动切换主备设备。SAG-100WM默认为双机冷备模式,您可以在智能接入网关管理控制台将其切换为双...

如何管理故障

故障发生条件当事件重要程度上升、整体影响面恶化、持续长时间未解决,综合评估已达到故障时(P1-P4),处理人可手动将事件升级为故障。故障过程故障过程用于记录管理故障处理的全过程。当故障处于 处理中/已恢复 状态时,故障详情默认进入...

应急预案:OSS物理机关机维修和系统重新克隆的方法

OSS物理机发生故障,每次只能下线一台,请合理安排窗口期。在机器下线过程中,需要对盘古ChunkServer上的数据做备份,请预留出足够的时间做变更。如果KV_Master不为3台或者5台,或者Checkready检查异常,需要联系阿里云技术支持获取帮助。...

备份和灾难恢复

故障切换回切:通过DNS将应用IP从原生产中心修改到灾备中心,实现故障切换和服务恢复机制主站发生故障时,由备站继续提供服务。3.两地三中心 业务部署模式:目前相同的业务应用可以分别部署在阿里云两个城市的三个数据中心中(杭州两个机房...

应急预案:专有云控制台服务异常的应急处理方法

1.概述 本文主要介绍专有云V3环境中,专有云控制台服务异常的应急处理方法。1.1.适用范围 专有云V2企业版,专有云控制台 专有云V3企业版,专有云控制台 1.2.用户告知 适用平台:x86、ARM 授权级别:L1(一线驻场工程师)临时或固化方案:...

如何判断信道质量好坏

信道利用率>75%时,即属于很差的信道质量,将严重影响AP性能。
< 1 2 3 4 ... 57 >
跳转至: GO

新品推荐

你可能感兴趣

热门推荐

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折