混沌工程缓存实战系列-Redis

Redis是一个开源高性能的Key-Value存储系统,虽然Redis本身具备了非常高的可用性,但是在实际应用中也会随着系统业务的复杂性以及不合理的使用,而导致很多的问题。本文将讲述如何通过混沌工程来暴露可能存在的使用风险,提升缓存问题的...

基本概念

资源管理 资源管理,实现系统资产和配置管理功能,提供各类资源及其相关属性的维护管理,范围不仅包括设备、服务器和IoT之类物理资源,也包括IP地址、业务链路等逻辑资源。设备 一般指IP网数通类网络通信设备,比如交换机、路由器、防火墙...

AIOps 解决方案专家服务内容说明

面对云上甚至多云的复杂业务系统,运维人员经常会遇到技术栈繁杂、配置告警耗时长、设置指标告警遗漏、告警风暴以及故障定位耗时等一系列运维问题,最终可能导致严重的资损。智能运维又称AIOps,即人工智能与运维相结合,可通过机器学习的...

设备网络状态

看门狗复位重启(WD_RST):0x01 设备存储异常重启(PANIC_ERR):0x02 设备重启(RE-POWER):0x03 设备运行异常重启(FATAL_ERR):0x04 0x40 设备内存动态监控。内存总量(type of total size):0x01 空闲内存总量(type of ...

诊断网页加载过慢的问题

根据 慢加载详情 页面的信息定位故障原因,进而排除故障。慢加载详情 页面顶部的 页面信息 区域展示了本次访问的客户端IP地址、浏览器、操作系统等信息,帮助您确认故障原因。慢加载详情 页面的 页面资源加载瀑布图 区域展示了页面静态资源...

蓝牙mesh智能家居产品规范

属性:包括设备具有的系统属性和物理属性,也包括设备具有的特殊功能,我们通过设置属性来改变设备的工作状态或让设备开启、关闭它的特殊功能。事件:设备在运行过程中出现了需要用户来手动干预的特殊情况,这时候上报给用户的通知;或者是...

温湿度计

火灾和烟雾探测器 手机/智能手机 工业HVAC/R 笔记本电脑/平板电脑 激光打印机 微环境/数据中心 PLC和IO模块 远程遥测装置 平板电脑 测试和测量 恒温/恒湿 通风和空调系统 气象站 风力发电逆变器 挡风玻璃和后视镜系统 无线基站 无线传感器...

全链路专家服务内容说明

客户应在阿里云承接服务后,提供场地、设备、必要的非生产环境及远程访问通道、权限、明确的业务目标(如生产系统异常描述、性能升级目标、数据同步需求等)等,协助阿里云开展服务。客户应审核阿里云制定的项目支持计划,以书面形式(包括...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位故障原因进行对应的快恢方式推荐。

使用SysOM定位容器内存问题

为解决因容器引擎层的不透明性而导致的故障排查困难问题,阿里云 容器服务 Kubernetes 版 ACK(Container Service for Kubernetes)团队推出操作系统内核层的容器监控可观测能力,为您提供更可靠、透明的容器引擎层,助力您更顺利地进行...

应用场景

物联网设备无时无刻不在产生海量的设备状态数据和业务消息数据,这些数据有助于进行设备监控、业务分析预测和故障诊断。背景信息 设备将原始数据通过 MQTT 协议发送到物联网平台,经由物联网平台将数据转发到消息服务系统,继而通过流计算...

如何抓取 HTTP 报文(Mac OS/Charles)

打开系统网络设置,查看本机 IP 地址:配置移动端 Proxy,以 iOS 设备为例,打开 设置>无线网络>对应 Wi-Fi 设置,添加 Proxy(Charles 机器)的 IP 地址和端口号。移动端配置成功后,移动端首次请求到达 Charles 时会有如下提示,单击 ...

强弱依赖治理概述

故障根源定位:后台系统故障,往往通过上一级的业务故障表现出来。故障处理讲究的是争分夺秒,良好的强弱依赖,对于系统自动化诊断有非常大的助力作用。依赖容量评估:正常调用链路下的系统容量需要评估。例如当某个弱依赖挂掉时,需要...

自助诊断GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题的故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点...

DeviceLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换机配置故障。用户侧交换机和设备的连线问题。处理方法 检查用户侧交换机。...

工作原理

日志被广泛地应用在系统监控和故障定位中,传统的日志分析手段以分析日志风险等级和匹配关键字为主,例如监控Error级别日志的内容和数量、监控含有Failed、Unsuccessfully等关键词的日志。但是在分布式环境和微服务架构下,以传统的人工...

为何云AP的功率并不大

另外,无线电管理局对WLAN设备的功率要求都有明确要求。在中国,室内AP的EIRP应当限制在20dBm以内。综上所述,纯粹的大功率的AP,不但可能在法规上违规,也并不能获得更好的覆盖范围和性能。正确的大范围覆盖的方法,是使用多AP,并合理...

电源故障定位

您可以参考以下方法定位电源故障并进行处理流程。诊断流程 电源故障详细处理流程,如下图所示。处理步骤 测量输入电压。使用万用表测量输入电压,根据电源适配器的工作电压范围判断输入电压是否异常。插拔电源适配器。把电源适配器以及电源...

以太网接口无法接通

接口、接口模块或者设备故障。解决方案 检查本端和对端设备是否接通电源,设备线缆和模块是否插好。检查设备两端链路、接口模块是否故障。如果设备之间使用双绞线连接,请排查以下检查项。检查项 检查标准 后续操作 用测试仪测试双绞线是否...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

DeviceSwitched

告警信息 事件名称 事件级别 状态码 状态描述 DeviceSwitched CRITICAL switched Device Role Changed 可能原因 智能接入网关主设备故障。智能接入网关主设备动态路由邻居故障。处理方法 无需处理。icmsDocProps={'productMethod':'created...

什么是设备诊断

设备诊断是阿里云物联网平台针对设备运行数据提供的一系列运维场景智能服务,帮助您分析判断设备故障、探测设备潜在风险并及时预知业务异常。服务架构 服务优势 丰富的数据诊断指标 提供网络连接成功率、设备离线原因、云对接次数等丰富的...

运营商回执错误码

其他未能定位故障 500 运营商错误 运营商侧未能定位故障 400 网元繁忙 网元是通信网中关键的设备,通信网是按照容量规划建设的,容量不够表明当前某个关键设备的已经满负载 482 被叫号码不可用 检查被叫号码状态后重试 476 号码强制...

用户自动识别概述

传统的识别窃或计量装置故障的方法包括定期巡检、定期校验电表、用户举报窃等,对人的依赖性较强,且查找窃漏电的目标不明确。目前,很多供电局的营销稽查、用电检查和计量工作人员,利用计量异常报警和能量数据查询功能来在线监控...

应用场景

场景一:面向大中型企业的多地容灾高可用网络架构 当本地数据中心的关键业务对可用性要求极高时,建议在多个接入点建立专线连接,该拓扑确保了因光纤切断、设备故障或接入点位置故障导致的连接故障的恢复能力。自主申请专线和共享合作伙伴...

设备显示离线

本文介绍智能接入网关设备显示离线的原因和处理方法。问题现象 登录 智能接入网关控制台,查看设备状态为 离线。可能原因 设备软件故障设备到阿里云联网故障。解决方案 通过尝试在同一个运营商出口环境内 ping 其他知名网站,确认您的...

用户窃识别

背景信息 传统防窃漏电主要通过定期巡检、定期校验电表及用户举报等方法发现窃或计量装置故障,该方法强依赖于人工手段,且抓窃查漏的目标不明确。通常供电局通过计量异常报警功能和电能量数据查询功能,人工在线监督用户用电情况。例如...

故障处理流程

本文为您介绍智能接入网关设备故障处理流程。SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,请参见以下流程排查故障:用户收到告警信息或者发现应用不可用。登录智能接入网关控制台,查看设备状态。访问其他公共网站,...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

播放异常自主排查

本文主要介绍当播放异常时自主排查异常根因的定位思路及排查步骤等。排查思路 说明 当出现播放异常时,建议优先使用播放链接检测工具进行自助检测。本工具可快速诊断常见播放异常问题,并根据具体异常提供解决建议。具体操作,请参见 视频...

播放异常自主排查

本文主要介绍当播放异常时自主排查异常根因的定位思路及排查步骤等。排查思路 说明 阿里云播放器SDK在持续不断的推出新功能并优化提升性能和稳定性,当您使用播放器SDK遇到问题时,建议您先使用最新版SDK进行验证,验证您的问题在最新版SDK...

播放异常自主排查

本文主要介绍当播放异常时自主排查异常根因的定位思路及排查步骤等。排查思路 说明 阿里云播放器SDK在持续不断的推出新功能并优化提升性能和稳定性,当您使用播放器SDK遇到问题时,建议您先使用最新版SDK进行验证,验证您的问题在最新版SDK...

多集群联邦发布容灾

背景信息 当站点因为不可抗力因素或者设备故障导致应用在短时间内无法恢复时,LHC 可提供多集群联邦发布容灾保护。当站点故障时,通过简单的配置,即可在容灾站点迅速恢复业务。容灾是一个范畴比较广泛的概念。广义上,容灾是一个系统工程...

前端监控场景

主要原因是对于前端监控的重视不足,认为服务端的监控可以部分替代前端监控,这种想法就导致系统在线上运行时,无法感知用户访问系统时的具体情况,因而定位线上用户偶现的前端问题变得非常困难。业务痛点 定位性能瓶颈困难 当用户反馈页面...

安全注意事项

安装注意事项 边缘一体机应在符合 安装环境要求 的环境下使用,否则可能造成设备故障,由此引发的设备功能异常或部件损坏、人身安全事故、财产损失等不在设备质量保证范围之内。边缘一体机,必须安装在室内环境,并确保室内环境:无漏水、...

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则无法解析域名。如果提示 PING${mse.nacos.host}(xxx.xx.xx.xx)56(84)...

产品服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)任何数据资源平台以外原因引起的,比如:由数据资源平台所依赖的上下游软件产品故障或配置调整引起的;数据同步模块中由于源端数据库或目的端数据库自身原因导致的;...

服务等级说明

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)客户的疏忽或由客户授权的操作所引起的...

服务协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)客户的疏忽或由客户授权的操作所引起的;(6)...

什么是消息演练

定位故障根源:经过消息演练之后,积累了消息系统的处理经验,对于未来的系统诊断定位有参考和提升作用。消息的演练场景 消息服务通常是由不同的模块组成。例如,RocketMQ分为生产者Producer、消费者Consumer、服务集群Broker和注册中心...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网无线连接服务 数知地球 AI Earth 数据库自治服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用