Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...

更新故障详情

P1 故障等级 relatedServiceId Long Body 否 123 关联服务 progressSummary String Body 否 进展摘要xxxx 进展摘要 preliminaryReason String Body 否 原因是服务宕机 初步原因 mainHandlerId Long Body 否 678 主要处理人 feedback String...

堡垒无法连接ECS排查步骤

问题描述 堡垒机调用ECS失败 可能原因【可能原因一】堡垒机到ECS服务器的网路端口通信失败【可能原因二】堡垒机的相关配置影响【可能原因三】ECS 系统自身的相关策略影响 解决方案【可能原因一】堡垒机到ECS服务器的网路端口通信失败【解决...

主备方案介绍

故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机吞吐对比图和单机宕机平均响应对比图。以下是集群宕机吞吐对比图和集群宕机平均响应对比图。主备容灾原理介绍 当云数据库HBase实例因不可预料的原因(例如设备故障、机房...

什么是AI通信加速库Deepnccl

scatter等算法,Hybrid+算法支持单机和多机的分层通信,充分利用单机内部高速带宽的同时降低了多机之间的通信量,通信算子编译优化方案相比NCCL原生在性能上提升了50%以上。通信多流优化:通常情况下,因网络带宽没有被充分利用,会导致...

什么是Deepytorch Training(训练加速)

scatter等算法,Hybrid+算法支持单机和多机的分层通信,充分利用单机内部高速带宽的同时降低了多机之间的通信量,通信算子编译优化方案相比NCCL原生在性能上提升了50%以上。通信多流优化:通常情况下,因网络带宽没有被充分利用,会导致...

经典网络和专有网络互通

确保和经典网络ECS实例通信的交换机的网段在10.111.0.0/16内。192.168.0.0/16 该VPC中不存在目标网段为10.0.0.0/8的自定义路由条目。需要在经典网络ECS实例中增加192.168.0.0/16指向私网网卡的路由。您可以使用提供的脚本添加路由,下载 ...

系统设置

网络设置 启用网络通信:设置指令系统与授权主机之间的通信状态,启用网络通信服务。授权地址:设置网络通信后端服务地址。服务主机:设置网络通信后端服务主机。服务路径:网络通信后端服务路径。消息设置 启用消息通信:启动网络消息通信...

云边通信组件Raven概述

为提升云边运维和监控能力,ACK Edge集群 引入了云边通信组件Raven。本文介绍Raven组件的基本概念、工作原理以及功能说明。云边协同架构的 跨地域网络通信 ACK Edge集群 采用中心云管理边缘IDC以及边缘设备的云边协同架构。分散在边缘侧的...

常见问题

否则说明事务云服务已宕机或者网络已中断。分布式事务 SDK 与事务云服务网络连接正常,但是通信失败,是什么原因?TCP 连接正常,说明事务云服务启动正常。分布式事务 SDK 与事务云服务通信返回失败消息,说明 SDK 发送给事务云服务的消息...

挖矿程序处理最佳实践

常见漏洞修复:关注安全漏洞情报,及时修复应用漏洞、应急漏洞和操作系统漏洞,部分原因是系统使用的应用程序软件版本较老,存在较多的漏洞没有修复,导致被入侵;业务安全加固:对业务代码上线前,进行代码安全测试或接入Web应用防火墙,...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

网络最大传输单元MTU

理论上MTU越大,可在单个数据包中传递的数据越多,网络通信越高效。本文介绍巨型帧相关功能以及如何修改ECS实例网卡的MTU。巨型帧(Jumbo frames)巨型帧是指有效负载超过IEEE 802.3标准所限制的1500字节的以太网帧,增大的有效载荷百分比...

故障应急协同

将故障相关成员直接拉进处理群,相关成员包括故障受影响业务应急接口人”、可疑原因业务应急接口人”,并且系统自动电话通知。进群后的成员,可直接在群内签到。每个故障建议设置单独的故障处理群,群内成员均为故障的相关人,为...

实例管理常见问题

更换要绑定的交换机,并确保交换机的可用IP数量大于等于1。500:Internal Failure 未开通云解析PrivateZone。一般情况下KMS会代您自动开通云解析PrivateZone,但如下场景下需要您自行开通。使用阿里云中国站账号购买非中国内地的KMS软件密钥...

数据类型

3.0 DingRtcUserOfflineReason 用户退出频道的原因。3.0 DingRtcVideoStreamType 相机流类型。3.0 DingRtcAudioTrack 音频流类型。3.0 DingRtcNetworkQuality 网络质量类型。3.0 DingRtcRenderMode 渲染模式。3.0 DingRtcRenderMirrorMode ...

阿里云云通信短信服务安全白皮书V1.0

【声明】本安全白皮书著作权归阿里巴巴云计算(北京)有限公司所有(以下简称阿里云云通信),未经阿里云云通信事先书面许可,任何主体不得以任何形式复制、修改、传播全部或部分内容。本白皮书仅供参考,对于本文档中的信息,阿里云云通信...

功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

交换机开通IPv6

如果交换机有和其他专有网络的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。交换机网段不能与所属VPC路由表中路由的目标网段范围相同或大于该范围。重要 交换机创建后,不能再修改网段。IPv6网段 交换机的IPv...

VPC开通IPv6

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。交换机网段不能与所属VPC路由表中路由的目标网段范围相同或大于该范围。重要 交换机创建后,不能再修改网段。IPv6网段 配置交换机的IPv6...

什么是AI分布式训练通信优化库AIACC-ACSpeed

优化方法 相比较传统的ring-allreduce算法,ACSpeed设计的hybrid-allreduce算法实现了单机和多机的分层训练,充分利用单机内部高速带宽同时降低多机之间低速网络的通信量,并且针对阿里云不同机型的网卡和GPU距离的拓扑特点,实现多种不同...

搭建IPv6专有网络

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 配置交换机的IPv6网段。交换机的IPv6网段的掩码默认为/64,您可以输入十进制数字0~255,...

搭建IPv6专有网络

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 配置交换机的IPv6网段。交换机的IPv6网段的掩码默认为/64,您可以输入十进制数字0~255,...

搭建IPv4专有网络

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 为交换机开启IPv6网段并配置交换机的IPv6网段。说明 如果您的VPC已分配IPv6网段,则需要...

M2M设备间通信

M2M(即Machine-to-Machine)是一种端对端通信技术。本章节以智能灯和手机App连接为例,分别使用规则引擎数据流转和Topic消息路由来实现M2M设备间通信,主要介绍如何基于物联网平台构建一个M2M设备间通信架构。智能灯与手机App的连接和通信...

支持IPv6专有网络下的资源访问IPv6互联网

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 配置交换机的IPv6网段。交换机的IPv6网段的掩码默认为/64,您可以输入十进制数字0~255,...

产品优势

需自行发现宕机并完成迁移,迁移时服务会中断。稳定性无法保障。简单易用 一站式网络管理、实时管理覆盖区、无缝连接阿里云产品与物联网平台,用户搭建灵活简便。需要购买服务器搭建负载均衡分布式架构,需要花费大量人力物力开发“接入+...

查询网络通信距离(NCD)

使用NCD的原因 存在的问题 在特定物理网络拓扑下,不同GPU节点之间的通信时延和可能产生的跨多跳交换转发引发的哈希不均,都可能导致不同GPU节点之间的通信性能存在较大差异,进而进一步影响模型训练的吞吐差异。解决方法 如上图所示,...

安全响应

系统安全类事件 勒索病毒 系统遭受勒索病毒攻击,核心数据被加密 高 系统事件往往会来自云安全中心,云安全中心同样会对入侵事件进行定级,建议参考云安全中心的定级说明 故障稳定性类事件 云稳定性事件 网络或应用宕机 高 稳定性事件通常...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,数据库、MQ等中间件异常事件),以及集成各业务自建的定位工具能力,并在故障及风险预警的应急过程中进行可疑原因定位,帮助促进故障及风险预警初因定位的时长缩短。...

路由表概述

一个交换机只能绑定一张路由表,交换机的路由策略由其关联的路由表管理。多个交换机可以绑定同一张路由表。交换机创建后,该交换机默认与系统路由表绑定。如果您需要将交换机绑定的自定义路由表更换成系统路由表,直接将自定义路由表与交换...

通信消息相关问题

本文介绍设备与物联网平台和物联网平台与服务器端的通信相关问题和解决方法。类目 问题 上下行消息 设备重复收到消息,如何去重?设备使用MQTT协议接入物联网平台后,接收不到通信数据,怎么办?物联网平台发送消息比较慢,存在超时情况,...

基于eRDMA增强型实例部署AI训练集群

在NCCL底层通信链接上,有多种不同的传输方式,例如单机内部多卡P2P通信以及多上的传统socket通信(如VPC网络)和高性能的InfiniBand(IB)通信,其中eRDMA是一种基于RDMA的传输方式,具有极低的延迟,并且在性能上接近RDMA网络的优势。...

界面提示“应急联系电话为必填项”时如何处理

如果您之前的备案信息没有填写应急联系电话,系统会出现上述弹窗提示,提示您的应急联系人信息不完善,需补充应急联系电话。排查处理 登录 阿里云ICP代备案管理系统,单击 主体详情,可以查看主体详细信息,鼠标放置到网站信息位置,网站...

网络规划

当您需要使用专有网络 VPC 和交换机来部署您的云上网络时,您可以结合具体的业务来规划 VPC、交换机的数量及IP地址的分配。同时还需要注意 VPC 与 VPC 或本地数据中心互通的要求。应该使用几个VPC?一个VPC 如果您没有多地域部署系统的要求...

API概览

通信监测 API 描述 DescribeCallList 分页查询时间范围内创建的通信信息。DescribeCall 获取单次通信详情。DescribeQoeMetricData 获取单次通信中用户的下行体验质量指标。DescribePubUserListBySubUser 根据订阅端获取通信中发布端用户...

ModifyInstance

Parameter.2.Code String 是 NetworkType 堡垒机的第2组属性的Code配置,设置为 NetworkType,表示设置堡垒机的网络。Parameter.2.Value String 是 vpc 堡垒机的第2组属性的Value配置,设置为 vpc,表示堡垒机实例采用VPC网络类型。...

修改主机的服务端口

目前堡垒对于服务器的RDP和SSH协议使用的是默认端口(RDP协议默认使用3389端口,SSH协议默认使用22端口),如果您在主机中自定义了端口,需要在服务端口中做相应修改。本文档介绍如何修改主机的服务端口。前提条件 在您修改服务端口前,...

清除主机指纹

当原主机指纹不适用时,比如经过系统重装操作导致主机指纹发生变化,您需要在堡垒中清除主机指纹,否则将无法通过堡垒进行正常运维。本文介绍清除主机指纹的具体操作。背景信息 堡垒通过主机指纹可以唯一识别一台Linux主机。清空主机...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 物联网无线连接服务 运维安全中心(堡垒机) 边缘网络加速 短信服务 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用