故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

云市场服务商合作协议

本协议是以下双方就服务商入驻云市场相关事宜所订立的有效合约,其中:一方是负责云市场的网络平台、技术支持与维护,以及日常运营管理、业务活动及其他相关支持的阿里云计算有限公司(“阿里云”)以及受阿里云委托负责云市场全部或部分...

基本概念

故障管理 网络故障的发现、分析、定位等维护管理,包括告警信息的收集入库、规则匹配、关联分析以及告警清除等一系列流式处理过程。Netconf netconf协议一般用于网络业务配置,使用结构化可描述语言实现快速的网络设备下发。gRPC 高性能、...

什么是云网管

观测平台(Observation Platform)基础设施运行状态维护和管理,包含性能数据和告警数据,实现对各类监控对象的异常数据判定,网络故障的发现、分析、定位等维护管理。高效采集,分钟级故障定位发现。自定义采集方式和分析过程,兼容所有...

ping不通云服务(SAG-100WM)

介绍SAG-100WM设备 ping 不通同云企业CEN(Cloud Enterprise Network)的云服务器ECS(Elastic Compute Service)或同云连接CCN(Cloud Connect Network)内的客户端的处理方法。问题现象 终端无法连接到阿里云。例如 ping 不通同CEN的...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

常见问题-FAQ

网故障恢复时间=故障发现时间+全网生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台、以及在不同的测试时间,全网生效测试结果会发生变化。重要 标准版最快可在4分钟左右准确发现故障并切换...

FAQs

网故障恢复时间=故障发现时间+全网生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台、以及在不同的测试时间,全网生效测试结果会发生变化。重要 故障发现时间:GTM可保障故障发现时间,目前...

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端 登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

物联网连接管理技术服务条款

阿里提供的物联网连接管理技术服务有赖于运营商的能力和资源,由于通信能力、系统、网络和资源的不确定性,阿里尽可能的维护能力的安全稳定,但对此不做任何保证。因法律法规、政策或运营商政策调整的原因导致阿里业务停止或受限,使本协议...

故障基础数据管理

故障订阅管理 故障通告订阅是用来维护故障通告接收对象,可根据不同的条件发送不同的渠道。故障订阅可以分为3种类型的对象:个人、干系人角色、钉钉群或其他通知渠道。通过合理的配置故障通告和订阅,能够确保相关干系人及时收到告警。

使用须知

服务可用性不包括以下原因导致的不可用时间:运营商核心异常、阿里云预先通知用户后进行的系统维护、任何阿里云以外的网络和设备异常、客户原因引起的异常等。边缘节点存在割接情况,一般割接频率不高于1次/月/节点,每次持续时间不多于6...

Ping健康检查

监控节点 指执行ping监控的节点所在的地理位置,系统默认提供的监控节点如下:重要 如果地址池的地址均为阿里云地址,且使用黑洞策略进行故障测试,监控节点请选择运营商节点。(原因:黑洞是在阿里云网络和运营商网络的互联网生效的ACL...

TCP健康检查

概述 TCP健康检查是GTM对目标地址进行健康检查使用的一种网络协议。主要是监控IP地址的网络可达性、端口可用...(原因:黑洞是在阿里云网络和运营商网络的互联网生效的ACL策略,但阿里云IP之间的流量基本上是在云网络内部流动,降低探测效果。

光伏发电异常检测提效

这些特性更加决定了对光伏后期运营维护的需要,不仅关系发电量,更是资产与人身安全的保障。而传统光伏运维基本上是通过人员巡检的方式发现问题,由此带来的不仅是人员成本的问题,还有故障不能及时被发现和解决隐患,进而导致电站长时间带...

专线连接类

排查物理专线故障原因,具体操作,请参见 故障排查。本地数据中心到阿里云的线路中断,如何解决?请在本地数据中心的网关设备上测试物理专线的客户端侧IP到阿里云侧IP是否可达,即此物理专线的直连IP是否可以ping通。如果不通,则需您向...

变更管理

运维事件中心是阿里云提供的云上变更管理服务,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能,一站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应、更短的故障时长、更...

客户案例

同时通过 OceanBase 云平台运维管控产品,日常运营维护 100%白屏化,大大的降低了维护运营成本。支付宝 公司介绍 支付宝是中国内地领先的第三方支付平台,致力于提供“简单、安全、快速”的支付解决方案。在 2017 年双十一购物节,支付峰值...

开启健康检查

开启健康检查是指对地址池中的地址配置健康检查策略,开启后可监测应用服务的可用性状态,并最终帮助企业实现自动故障隔离和自动故障切换的功效。健康检查的类型包括:Ping监控、TCP监控、HTTP(S)监控。前提条件 已完成 创建实例、创建...

新金融行业

终端配置要求本来不高,但安装多套终端管控软件会消耗大量额外的资源 人员流动性大且用户在多地分散,同时PC数量多、运行时间长和故障率高,导致维护困难和高折旧成本 传统PC功耗高、噪音大和占空间 无法实现安全的远程办公接 私域运营...

分支门店

总部对分支门店的响应协助相对偏弱,缺乏技术手段实现统一化的管理和服务机制 综合成本高 一次性购置PC电脑等设备的非经营性投入成本较大 过保后硬件维护费用高 运维管理复杂,需相对专业的IT人员投入,全国各片区收费标准参差不齐,整体较...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

归档存储服务等级协议

阿里云将对不可用时间进行赔偿,但不包括以下原因所导致的服务不可用时间:(1)阿里云预先通知用户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)...

事件管理

支持将影响恶化的事件一键升级为故障,实现事件全生命周期的在线化管理。集成告警数据:可集成多种告警源例如:ARMS、SLS、云监控、Prometheus、Dynatrace等数十种监控系统。同时支持自定义集成,可自动解析告警信息。事件分类与分派:首先...

客户案例

同时,阿里云的24小时运维服务保证了集群稳定,实现了零故障。互联网行业:宝宝树云上大数据仓库 客户架构如下。客户简介 宝宝树成立于2007年,是中国最大、最活跃的母婴类社区平台。作为最早做互联网2C的社区平台之一,宝宝树很早就建立了...

ping不通云服务ECS(SAG-1000)

本文介绍SAG-1000设备无法ping通ECS实例的原因和处理方法。问题现象 终端无法连接到阿里云,例如ping不通同CEN的ECS。可能原因 终端到设备的链路故障。设备到阿里云的VPN链路故障。目标ECS故障运营商网络故障。解决方案 登录 智能接入...

错误码

600013 运营维护升级,该功能不可用。建议切换到其他登录方式的操作尝试。600014 运营维护升级,该功能调用次数已达上限。建议切换到其他登录方式的操作尝试。600015 接口超时。建议您尝试纯数据登录测试或切换飞行模式(打开飞行模式...

错误码

600013 运营维护升级,该功能不可用。建议切换到其他登录方式的操作尝试。600014 运营维护升级,该功能调用次数已达上限。建议切换到其他登录方式的操作尝试。600015 接口超时。建议您尝试纯数据登录测试或切换飞行模式(打开飞行模式...

产品架构与功能特性

阿里云游戏平台利用阿里公共云能力优势,打造低延迟高画质的PaaS平台,通过运营中心、内容中心、管控中心支持泛游戏客户的业务拓展。云游戏平台架构 阿里云游戏架构图如下图所示。阿里云游戏平台主要功能模块包括:管控中心:定位于游戏...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

创建企业关系

当前支持企业之间建立运营管理关系、主体共享关系。具体关系类型和权益说明请见:关联类型说明。运营管理关系 运营管理关系建立流程:运营管理关系建立操作:一、建立关联邀请:登录企业账号中心,在关联企业页面,点击“创建管理关系”...

GTM实现跨访问加速与故障切换

概述 方案介绍 大部分企业的应用服务都会使用多个运营商的IP地址,因此可能会存在跨延迟、丢包、故障不可用等问题,而全局流量管理产品方案可以根据用户请求源地址的运营商,解析就近的应用服务器IP地址,实现就近接入、访问加速、故障...

诊断网页加载过慢的问题

慢加载详情 页面顶部的 页面信息 区域展示了本次访问的客户端IP地址、浏览器、操作系统等信息,帮助您确认故障原因。慢加载详情 页面的 页面资源加载瀑布图 区域展示了页面静态资源加载的瀑布图,帮助您快速定位资源加载的性能瓶颈。慢加载...

行业级平台

产业协同未来工厂云平台。阿里云工业互联网行业级平台...行业运营管理平台,是为运营商提供支撑服务,是帮助运营商更好的管理和发展自己的行业平台,主要包括行业门户的运营管理、行业平台管理、行业模板管理、统计分析和权限管理等功能模块。

设备显示离线

本文介绍智能接入网关设备显示离线的原因和处理方法。问题现象 登录 智能接入网关控制台,查看设备状态为 离线。可能原因 设备软件故障。设备到阿里云联网故障。解决方案 通过尝试在同一个运营商出口环境内 ping 其他知名网站,确认您的...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

演练场景说明

故障演练场景是演练任务的核心。AHAS提供基础资源类场景和Kubernetes类场景,帮助分布式系统提升容错性和可恢复性。每一个执行阶段的演练场景都对应一个恢复阶段的演练任务。恢复阶段的演练任务目的是清除故障演练的影响,使应用或服务恢复...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

账号

管理权限 在运营后台,单击左侧导航栏的 权限管理管理应用和服务访问权限。说明 开通账号鉴权后,选中 应用访问限制 或页面配置中 访问限制,可配置角色访问当前应用或页面。开启访问限制后,如果未设置指定角色访问应用和页面,仅管理员...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 商标服务 云安全中心 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用