告警规则指标说明

JVM实例数 无 是 当前实时运行的Java虚拟机实例数量,常用于服务宕机告警配置。节点机发送的字节数 无 不是 节点机通过网络连接发送的数据量,其中包括应用程序发送的数据、系统消息和错误信息等。节点机发送的报文数 无 不是 节点机通过...

Windows系统实例的宕机问题排查

当Windows操作系统的ECS实例在运行过程中出现内核panic、内存溢出OOM(Out Of Memory)、蓝屏卡死等问题或收到系统事件通知实例出现操作系统崩溃时,说明该ECS实例发生宕机,您可以通过自助诊断工具或系统事件来定位原因并解决。定位宕机...

内核热补丁FAQ

Alibaba Cloud Linux 2系统的ECS实例中断处理释放内存页时由于访问空指针导致系统宕机 Alibaba Cloud Linux 2系统的ECS实例中使用已释放的文件系统inode出现系统宕机如何处理?Alibaba Cloud Linux 2系统的ECS实例OverlayFS的dentry泄露...

计算层高可用

日常查询分析任务在分布式的环境下,机器异常宕机在所难免。计算层高可用需要考虑如何避免因为机器宕机等异常情况导致的查询失败。Interactive模式 对于Interactive模式,MPP计算模型下全内存的Pipeline计算无中间结果保存。同时对于...

主备方案介绍

故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机吞吐对比图和单机宕机平均响应对比图。以下是集群宕机吞吐对比图和集群宕机平均响应对比图。主备容灾原理介绍 当云数据库HBase实例因不可预料的原因(例如设备故障、机房...

如何收集操作系统宕机后的内核转储信息?

ECS实例宕机后会生成一个转储信息文件,您可以将转储信息提交给阿里云,便于阿里云技术支持人员定位分析问题。本文为您介绍如何收集操作系统宕机后的内核转储信息。背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而...

主备双活

宕机测试 单机宕机吞吐对比 单机宕机平均响应对比 集群宕机吞吐对比 集群宕机平均响应对比 使用方法 准备 使用云HBase主备容灾方案参见 主备容灾。在高可用管理页面获取高可用链接地址和高可用实例ID。客户端依赖版本。hbase1.X版本使用...

使用限制

宕机迁移 当宕机的ECS实例数量大于云盒内对应实例规格可供创建的ECS实例数量时,不支持宕机迁移。弹性伸缩 仅支持在云盒内进行弹性伸缩。跨规格族变配 云盒内计算SKU包含的规格族是固定的,不支持将云盒内ECS实例的规格变更为除购买规格族...

概述

技术原理 PolarDB-X 采用数据多副本架构(比如三副本、五副本),为了保证副本间的强一致性(RPO=0),采用Paxos的多数派复制协议,每次写入都要获得超过半数节点的确认,即便其中1个节点宕机,集群也仍然能正常提供服务。Paxos算法能够...

使用限制

没有例外 自动宕机迁移 本地SSD型DDH不支持自动宕机迁移。没有例外 ECS实例使用的镜像限制 在中国内地以外的地域,ddh.c6s、ddh.g6s或ddh.r6s规格的DDH不支持使用Windows镜像创建ECS实例。没有例外 ECS实例数量限制 以下DDH规格单台DDH上最...

可用性与可靠性

异常时自动切换节点,宕机时自恢复来保证极致的可用性,还可以通过备份恢复来进行数据恢复。主备多副本与云盘三副本 AnalyticDB PostgreSQL版 是基于MPP架构的分布式数据库,对于所有的分布式系统来说,在通过分布式来增强性能的同时,也...

Linux系统实例的宕机问题排查

当Linux操作系统的ECS实例在运行过程中出现内核panic、内存溢出OOM(Out Of Memory)、蓝屏卡死等问题或收到系统事件通知实例出现操作系统崩溃时,说明该ECS实例发生宕机,您可以通过自助诊断工具或系统内核日志来定位问题并解决。定位宕机...

ECS实例宕机并产生“VFS:Unable to mount root fs on ...

如果您的ECS实例在启动过程中循环宕机,且产生了 VFS:Unable to mount root fs on unknown-block 日志信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在启动过程中出现循环宕机,无法正常进入系统,且产生类似于如下所示的调用...

ECS实例宕机并报错“Out of memory and no killable ...

如果您的ECS实例出现宕机,并且报错日志中存在 Out of memory and no killable processes 信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在运行过程中出现宕机,并且有类似于如下所示的调用栈:[28663.625353][pid]uid tgid ...

ECS实例宕机并产生“Objects remaining in kmalloc”...

如果您在ECS实例内使用memory cgroup kmem功能时内核存在 Objects remaining in kmalloc 告警日志,且实例出现宕机,则可以参考本文提供的方案解决问题。问题现象 当您在ECS实例内使用memory cgroup kmem功能时,内核有类似于如下所示的告...

SAP HANA Scale-Out 部署指南

SAP HANA Scale-Out 部署指南 概述 架构总览 资源规划 前期准备 阿里云账号 VPC ECS实例 ECS Metrics Collector的安装 文件存储NAS ECS宕机迁移 HANA安装 维护主机名 创建文件系统 准备OS以及安装包 安装SAP HANA 验证集群安装 版本管理 ...

产品优势

与共享宿主机(多租户环境)相比,DDH为您...高可用 DDH提供自动宕机迁移能力,在物理机故障时自动迁移,您无需准备备机,故障迁移自动完成。同时支持在不停机的情况下将ECS实例在不同宿主机间迁移,在需要时进行负载均衡,保障业务的高可用。

步骤三:部署CDR网关

在配置了高可用(HA)vSphere集群上,如果CDR网关所在的Esxi宕机,网关会在同集群其他Esxi服务器上运行起来,宕机时间取决于vSphere集群的HA配置。建议您提高网关虚机重启优先级,以尽量缩短虚机启动时间。对于vSphere 6.5以上版本,您可以...

CentOS7实例随机性宕机问题

问题描述 在使用Linux实例时,如果该实例满足以下三种情况,可能导致系统宕机。使用CentOS7.5或者7.6公共镜像或者自定义镜像创建实例。内核版本为3.10.0-862或3.10.0-957。频繁执行大文件或目录操作。问题原因 CentOS7.5和7.6内核加入支持...

服务介绍

升降级能力 边缘一体机处于繁忙状态时,可配置升降级策略来处理算法识别到的事件,降低边缘一体机在高压力情况下出现宕机的风险。任务感知 支持在边缘计算控制台,远程开启边缘一体机中的执行计划任务,开启执行计划任务后,可通过执行记录...

云上整机恢复VMware虚拟机

但如果VMware虚拟机的基础设施出现了问题,比如ESXi出现宕机,或者数据中心遭遇故障,您可以通过云备份管理控制台把已备份的VMware虚拟机整机恢复到阿里云ECS上,以保持业务的连续性及稳定性。操作步骤 按如下步骤把已备份的VMware虚拟机...

如何解决实例迁移后的宕机问题?

因Xen环境裁撤项目、ECS过保迁移、经典网络迁移到VPC等涉及虚拟化环境迁移需求,可能会导致一部分实例系统在迁移后出现kernel panic宕机、蓝屏、找不到引导设备(INACCESSIBLE_BOOT_DEVICE)等问题。本文主要为您介绍这些问题的解决方案。...

什么是边缘智能一体(执行计划版本)

升降级能力 支持一体机识别到现场AI事件超出硬件可处理的拼接时,一体机会根据用户配置的升降次策略进行处理,降低硬件在高压力情况下出现宕机的风险;任务感知 支持在云端对边缘一体机中的任务进行远程开关,同时可通过执行记录对边缘运行...

智能接入网关硬件版FAQ

为您的智能接入网关设备配置LAN口监听,用来监听主设备是否宕机。操作步骤如下:在智能接入网关Web界面,单击左侧导航栏 实验室。在 在实验室 页面,单击 高级配置 页签。在 高级配置 页签,单击 HA监听端口 下拉列表,选择LAN口监听,然后...

创建专有宿主机

您也可以在创建DDH后修改该配置,具体操作,请参见 设置宕机自动迁移。重要 本地SSD型DDH不支持宿主机故障时自动迁移服务。CPU超分比:仅超分型规格支持CPU超分比,CPU超分比影响DDH的可用vCPU数,一台DDH的可用vCPU数=物理CPU核数*2*CPU超...

功能概览

通过简单、安全及可靠的方式将虚拟机整机数据备份上云,确保客户本地机房出现故障、虚拟机宕机、生产系统数据发生误删、勒索病毒等事故时可以从云上的备份库将虚拟机整机恢复到本地VMware环境、阿里云VMware服务或阿里云ECS,实现业务系统...

设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能,宕机自动迁移开启后,当DDH因故障停机时,系统会自动迁移至健康的DDH。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。说明 创建专有宿主机DDH时,...

蠕虫病毒防御最佳实践

蠕虫的威胁 蠕虫主要导致以下几种危害:业务中断:蠕虫在感染主机后,可能会进行修改配置、停止服务等操作,导致主机宕机、业务中断等风险。信息窃取:信息窃取类蠕虫,会将服务器上的数据打包回传,可能造成严重的信息泄露、资源滥用。...

网站耗资源(客户程序故障)常见问题

由于我们是对主机服务器进行实时监控的,出现问题后必须马上采取措施,否则将会导致服务器宕机,所以发出此通知信的同时,已将您的网站暂停,希望您能理解,因此给您带来的不便向您表示深深的歉意,谢谢您的支持与理解。云虚拟主机会因为...

Persistent Buffer Pool

因此,在宕机和重启之后需要把Buffer Pool的所有页遍历一遍,剔除掉不能被复用的页。另外,Buffer Pool的回收依赖于K8s。使用该优化之后,可以使重启前后的性能更加平稳。重启前后性能对比如图所示:使用指南 打开如下参数即可使用。polar_...

Persistent Buffer Pool

因此,在宕机和重启之后需要把Buffer Pool的所有页遍历一遍,剔除掉不能被复用的页。另外,Buffer Pool的回收依赖于K8s。使用该优化之后,可以使重启前后的性能更加平稳。重启前后性能对比如图所示:使用指南 打开如下参数即可使用。polar_...

为什么选择安全沙箱?

当节点上某一应用异常和故障,如内存泄露、频繁CoreDump等等导致节点整体负载升高,单容器触发Host Kernel Bug导致系统宕机,单应用的故障延展到了整个节点,甚至进一步导致整个集群的不响应。安全沙箱(runV)容器通过独立的GuestOS ...

安全响应

系统安全类事件 勒索病毒 系统遭受勒索病毒攻击,核心数据被加密 高 系统事件往往会来自云安全中心,云安全中心同样会对入侵事件进行定级,建议参考云安全中心的定级说明 故障稳定性类事件 云稳定性事件 网络或应用宕机 高 稳定性事件通常...

如何使用Prometheus监控Cassandra

预置的Cassandra告警规则如下:指标分类 指标名称 指标含义 节点状态 集群中宕机的节点比例 若该指标大于10,表示集群中存在节点宕机。节点资源使用情况 节点的CPU使用率 若节点CPU使用率在过去5分钟内超过85%,表示CPU已达到瓶颈。节点的...

如何使用Prometheus监控Cassandra

预置的Cassandra告警规则如下:指标分类 指标名称 指标含义 节点状态 集群中宕机的节点比例 若该指标大于10,表示集群中存在节点宕机。节点资源使用情况 节点的CPU使用率 若节点CPU使用率在过去5分钟内超过85%,表示CPU已达到瓶颈。节点的...

事件中心事件汇总

增加jute.maxbuffer配置,防止宕机恢复失败。ZooKeeper:FullGc ZooKeeper集群发生(长时间/多次)FullGC 警告 ZooKeeper:CMSGc:Executing:ZooKeeper集群发生(长时间/多次)FullGC Full GC时间过长。可能导致处理延时增大,响应超时,导致...

配置操作审计事件告警

网站日志告警行动策略 严重度 告警规则的严重程度。高 说明 您可以为账号连续登录失败告警设置 最大失败登录次数,或者为未授权的API调用告警设置 未授权调用的最大次数。步骤七:配置自定义告警规则 以配置删除密钥时触发告警为例,设置每...

班次中的严重迟到和个性化中的严重迟到一样吗?

详细信息 在考勤打卡功能中,手机端和电脑端可以在【班次】设置严重迟到时间,同样【手机钉钉】-【个性化】中也可以设置严重迟到时间,但是若在班次和个性化中同时设置了【严重迟到】,则会优先以班次的严重迟到时间为准。适用于 专属钉钉

产品架构

随着虚拟化网络规模的扩大,这种方案中的ARP欺骗、广播风暴、主机扫描等问题会越来越严重。为了解决这些问题,出现了各种网络隔离技术,把物理网络和虚拟网络彻底隔开。其中一种技术是用户之间用VLAN进行隔离,但是VLAN的数量最大只能支持...

网络连通性诊断项说明

交换诊断 诊断项分类 诊断项 严重程度 说明 建议 网络ACL 网络ACL配置 关键 如果交换未绑定网络ACL,交换默认放行流量。如果源诊断对象和目的诊断对象位于同一个交换,不受网络ACL规则控制。如果源诊断对象和目的诊断对象位于不同...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
阿里邮箱 弹性公网IP 运维安全中心(堡垒机) 商标服务 数字证书管理服务(原SSL证书) 短信服务
新人特惠 爆款特惠 最新活动 免费试用