运维事件中心

运维事件中心是企业业务连续性的运营管理平台,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能,一站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应、更短的故障时长、更...

性能分析

通过多维分析支持地域、机型、运营、版本等维度聚合分析,快速锁定问题范围。性能分析服务支持 Android/iOS 应用类型,帮助客户建立 5 分钟线上故障感知能力,并与崩溃分析/远程日志服务配合使用,构建异常“感知-定位-恢复”的运维能力...

Node.js 性能平台

Node.js 性能平台(Node.js Performance Platform)是面向中大型 Node.js 应用提供性能监控、安全提醒、故障排查、性能优化等服务的整体性解决方案。\nNode.js 性能平台凭借对 Node.js 内核深入的理解,提供完善的工具链和服务,协助客户主动、...

计算巢服务

计算巢是一个开放给企业应用服务、IT集成服务、交付服务、管理服务提供(以上都统称为服务)和最终用户的服务管理PaaS平台。服务能通过计算巢服务更好地在阿里云上部署服务、交付服务及管理服务。最终用户能通过计算巢管理在...

负载均衡

负载均衡SLB(Server Load Balancer)是一种对流量进行按需分发的服务,通过将流量分发到不同的后端服务来扩展应用系统的服务吞吐能力,并且可以消除系统中的单点故障,提升应用系统的可用性。

全局流量管理

全局流量管理通过DNS实现应用服务的就近访问接入、多地址负载均摊,同时根据健康检查进行DNS Failover,实现应用服务的同城多活故障隔离和异地容灾。

崩溃分析

崩溃分析服务为移动 App 提供实时线上稳定性相关...崩溃分析服务支持 Android/iOS/H5 应用类型,帮助客户建立 5 分钟线上故障感知能力,并与性能分析/远程日志服务配合使用,构建异常“感知-定位-恢复”的运维能力闭环,提升 App 使用体验。

云数据库 OceanBase

OceanBase 是阿里巴巴和蚂蚁金服 100%自主研发的金融级分布式关系数据库,在普通硬件上实现金融级高可用,在金融行业首创“三地五中心”城市级故障自动无损容灾新标准,同时具备在线水平扩展能力,创造了 6100万次/秒处理峰值的业内纪录,...

数据库自治服务 DAS

数据库自治服务DAS(Database Autonomy Service)是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务,帮助您消除人工操作引发的服务故障,有效保障数据库服务的稳定、安全及高效。

应用高可用服务 AHAS

应用高可用服务AHAS是一款专注于提高应用高可用能力的SaaS产品,提供应用架构自动探测、故障注入式高可用能力演练、一键应用防护和增加功能开关等功能,可以快速低成本地提升应用可用性。

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

如何管理故障

可对故障根因进行原因检查并结构化录入,检查点包括:故障原因、最近活动、注入方式、恢复方式等;关联故障期间的故障变更,新增故障改进措施等操作。故障状态处理中:处理中仍未恢复的故障;已恢复:故障对处理中的故障做恢复操作后是已...

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

诊断网页加载过慢的问题

由于页面的加载耗时受地域、网络情况、浏览器或者运营等因素影响,排查问题时无法复现A在访问页面时的具体情况。监控信息缺少,无法深入排查 大部分前端监控会通过PerformanceTiming对象来获取完整的页面加载耗时信息,这将缺失页面静态...

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

无法连接本地客户端

运营网络故障。解决方案 登录智能接入网关控制台。单击智能接入网关实例ID,查看当前设备状态是否为可用。如果离线,请参考设备显示离线处理。如果在线,请跳转至3。登录交换机控制台,查看设备和交换机的连通性。如果是静态路由接入,...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

ping不通云服务ECS(SAG-1000)

介绍SAG-1000设备无法ping通ECS实例的原因和处理方法。问题现象 终端无法连接到阿里云,例如ping不通同CEN的ECS。可能原因 终端到设备的链路故障。设备到阿里云的VPN链路故障。目标ECS故障。运营网络故障。解决方案 登录智能接入网关控制...

常见问题-FAQ

说明 受限于拨测平台探点发生变化和全国各地运营TTL缓存原因,如使用不同的拨测平台、以及在不同的测试时间,全网生效测试结果会发生变化。注意 标准版最快可在4分钟左右准确发现故障并切换故障发现时间:GTM可保障故障发现时间,目前...

FAQs

说明 受限于拨测平台探点发生变化和全国各地运营TTL缓存原因,如使用不同的拨测平台、以及在不同的测试时间,全网生效测试结果会发生变化。注意 故障发现时间:GTM可保障故障发现时间,目前默认的健康检查配置可以在故障的4分钟左右准确...

故障演练常见问题

欢迎您反馈在使用故障演练过程中遇到的问题,目前提供以下常见问题供您参考。单个演练活动成功状态怎么判断?因为一个活动可能会有很多目标机器,当所有机器执行完毕之后,如果有机器没有执行成功,那么这个演练活动就会被系统判断为失败。...

服务介绍

服务架构物联网无线连接服务智能卡物联网无线连接服务智能卡提供双网灾备版(移动+电信),一张单卡支持两大运营网络,您无需担心单一网络通道故障后无法提供服务,系统自动切换至备份网络通道,可有效提升设备的在线率和在线时长。...

设备显示离线

介绍智能接入网关设备显示离线的原因和处理方法。问题现象 登录智能接入网关控制台,查看设备状态为离线。可能原因 设备软件故障。设备到阿里云联网故障。解决方案 通过尝试在同一个运营出口环境内ping其他知名网站,确认您的运营网络...

故障处理流程

当网关设备发生网络故障后,您可以先观察现象、收集信息,然后进行分析诊断,完成问题修复。故障处理流程图如下:SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,排查流程如下,详细步骤参见ping不通云服务(SAG-100WM):...

如何管理事件

故障状态:处理中(升级时故障还在处理中),输入发现故障的时间、已恢复(升级时故障已恢复),输入故障生成的时间和故障恢复的时间;所属服务:升级故障所属的服务;影响服务:选择影响服务(可多选);进展摘要:处理人将事件升级为故障...

故障取消

cancelReason Long Body 否 取消原因 取消原因 problemNotifyType Long Body 否 PROBLEM_NOTIFY PROBLEM_NOTIFY 通告类型 PROBLEM_NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 ...

微服务应用问题定位及故障演练

本文介绍微服务应用问题定位及故障演练的场景描述、解决问题、架构图及操作参考链接。场景描述 您微服务架构应用基于阿里云容器服务Kubernetes(ACK)部署,通过阿里云业务实时监控ARMS发现微服务应用的容错能力是否健壮、容器编排配置是否...

ping不通云服务(SAG-100WM)

可能原因 终端到设备的链路故障。设备到阿里云的VPN链路故障。目标ECS故障。运营网络故障。解决方案 登录智能接入网关控制台。单击智能接入网关实例ID,查看设备状态是否为可用。如果离线,请参考设备显示离线处理。如果在线,请跳转至3...

如何排查Java场景下故障注入不生效的问题

为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,您需要先确认该演练的故障执行步骤是否已开启Debug模式。若...

什么是故障演练

定位与解决问题的应急能力通过故障突袭,随机对系统注入故障,考察相关人员对问题的应急能力,以及问题上报、处理流程是否合理,达到以战养战,锻炼人定位与解决问题的能力。故障演练与AHAS服务体系 故障演练作为AHAS的一部分,与AHAS其他...

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。功能简介故障注入流程如下所示:在微服务中,其实现方式为:管控台...

故障详情

故障详情 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 POST/problem/...

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。配置故障注入规则登录 SOFAStack 控制台。在左侧菜单栏选择 中间件...

常见问题

运维管理 容器应用服务常见问题经典应用服务常见问题 中间件 SOFABoot 常见问题微服务常见问题微服务故障排查之 DRM微服务故障排查之限流微服务故障排查之 RPC服务网格-故障排查消息队列常见问题任务调度常见问题分布式链路跟踪常见问题...

步骤五:分析数据

根据发现的问题,寻找问题原因,并解决问题。本文介绍模具设备OEE分析看板的示例数据,分析导致问题原因。前提条件 已完成OEE分析看板的搭建,具体操作,请参见步骤四:配置数据可视化。背景信息 本文以模具设备2021年2月25日和26日上报...

API概览

API 描述 CreateProblem 故障升级 GetProblemImprovement 故障复盘改进详情 GetProblemPreview 获取故障通知预览 UpdateProblemImprovement 更新故障复盘改进详情 CancelProblem 取消故障 CreateProblemSubtotal 故障新增备注小计 ...

代码逻辑场景

本文列出了故障演练支持的代码逻辑场景。篡改Java方法返回值 修改Java指定方法的返回值,返回指定的值。参数名称 是否必选 默认值 参数说明 类名 是 无 完整的类名,包含包名。例如:com.alibaba.service.XxxService。如果模拟接口故障,需...

运营多链路容灾备份

使用场景企业的线上应用服务,为了能向不同运营宽带用户提供良好的访问速度和质量,一般会使用多个运营的IP地址,并利用DNS做智能访问接入。即,相同的访问域名:联通用户通过域名,访问应用服务的联通IP地址:1.1.1.1。电信用户通过...

运营多链路容灾备份

使用场景企业的线上应用服务,为了能向不同运营宽带用户提供良好的访问速度和质量,一般会使用多个运营的IP地址,并利用DNS做智能访问接入。即,相同的访问域名:联通用户通过域名,访问应用服务的联通IP地址:1.1.1.1。电信用户通过...

产品优势

与传统依赖人力的应用交付和运维方式相比,计算巢提供了智能高效、安全可靠的服务交付和运维体验,有助于提升服务的服务能力,降低运营成本。智能高效 计算巢通过将应用发布为服务的方式,为服务提供了一个智能简捷的服务发布和管理...
< 1 2 3 4 ... 105 >
跳转至: GO

新品推荐

你可能感兴趣

热门推荐

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折