故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

电源故障定位

您可以参考以下方法定位电源故障并进行处理流程。诊断流程 电源故障详细处理流程,如下图所示。处理步骤 测量输入电压。使用万用表测量输入电压,根据电源适配器的工作电压范围判断输入电压是否异常。插拔电源适配器。把电源适配器以及电源...

网关一体机告警介绍

本文介绍网关一体机中磁盘故障电源故障等硬件告警,以及CPU使用率、内存使用率等软件告警信息。监控项 报警阈值 报警通道 恢复是否通知 疲劳度 是否实时 CPU使用率 一分钟内平均使用率超过95%客户邮箱 是 每日最多5封 是 内存使用率 一...

M2M设备间通信

M2M(即Machine-to-Machine)是一种端对端通信技术。本章节以智能灯和手机App连接为例,分别使用规则引擎数据流转和Topic消息路由来实现M2M设备间通信,主要介绍如何基于物联网平台构建一个M2M设备间通信架构。智能灯与手机App的连接和通信...

NAT网关故障排查指南

本文介绍NAT网关的常见故障及排查方案。流量不通类故障排查:ECS实例配置DNAT条目后无法被公网访问 VPC内新建交换机的ECS无法通过SNAT访问公网 VPC内存在多个NAT网关时,某交换机的ECS实例不能访问公网 访问流量异常类故障排查:客户端访问...

D2D通信技术

D2D通信技术,是阿里巴巴LinkWAN团队开发的新型LoRa通信技术,通过实现长前导码唤醒和本地数据控制功能,可很好满足功耗较低,响应时间较快和本地控制的场景需求。1、适用场景 D2D通信技术适用于智能家居,门锁,地锁等多种需要以下能力的...

设备无法上电

问题现象 设备的系统指示灯(SYS或RUN)和电源指示灯都不亮。可能原因 未打开设备电源开关。设备电源线缆没有插牢。设备的外接电源故障。设备的电源适配器有故障。解决方案 确认设备电源开关是否打开。确认设备电源线缆是否插牢。确认...

HaaS100实现LoRa点对点通信

更正文档 案例简介 本方案选取SX1268作为LoRa通信IC,HaaS100以外挂SX1268 SPI模组的方式,实现LoRa数据的收发。基础知识 LoRa是Semtech公司采用和推广的一种基于扩频技术的超远距离无线传输技术。相较于传统通信技术,LoRa具备低门槛、远...

产品架构

物联网平台支持与接入设备进行通信,可将设备通信数据流转到其他阿里云产品中进行存储和处理,是构建物联网应用的基础。本文介绍物联网平台的产品架构。设备 通过物联网平台集成开发的协议和SDK,实现设备上云管理。IP设备:指支持TCP/IP...

网络资源

网络资源是指用于节点之间通信和数据传输的硬件和软件资源,除了包括广域网、局域网、交换机、路由器,还包括常用到的专有网络、虚拟交换机、负载均衡、弹性公网、VPN、DNS、CDN等资源。在分布式系统中,网络资源的主要作用是支持节点之间...

应用场景

在智能交通领域通过使用物联网、云计算、传感器、大数据、无线通信技术对交通信息进行采集、存储、管理和分析,提供交通管理、指挥决策、交通信息服务等能力,能有效解决城市交通道路拥堵问题以及提高道路交通安全。车联网场景中涉及的...

应用场景

阿里云游戏平台面向游戏开发商、游戏运营商、通信运营商、视频网站等泛游戏客户提供不同客户场景的服务,助力客户能力升级。游戏开发商 背景 随着游戏内容和玩法丰富度的提高,游戏开发成本越来越高,尤其当游戏需要支持跨端运行时,开发...

PAI灵骏智算服务概述

基于数据中心超大规模RDMA“高速网”和通信流控技术,实现端到端微秒级通信时延,超大规模线性拓展可打造万卡级并行算力。融合生态,拓展创新边界。支持HPC和AI任务融合调度,为科研和AI提供统一协同的底座支撑,促进技术生态融合。云上...

数据转发到另一Topic

相关文档 配置解析脚本将Topic数据转发到其他Topic 基于消息转发的M2M设备间通信 基于Topic消息路由的M2M设备间通信 常见问题 两个设备之间能通信吗?设备可以订阅其他设备的通信Topic吗?硬件设备和MQTT客户端使用同一设备证书接入物联网...

常见问题FAQ

云投屏产品FAQ问题 M21播放盒子常见问题 Q:遥控器无法控制屏幕 A:请尝试将遥控器与屏幕重新配对。操作步骤如下:拔掉盒子的电源,然后重新插上,盒子开机。在盒子开机后10分钟内,同时按住遥控器的“OK键”(中间大圆圈按键)和“返回键...

共享内存通信(SMC)常见问题

如果您在Alibaba Cloud Linux 3系统中启用了共享内存通信SMC(Shared Memory Communication),且使用过程中遇到无法正常通信、部分端口不可用、对比TCP没有应用性能提升等问题,可以参考本文提供的方案进行排查并解决。启用SMC后应用性能...

数据转发到其他Topic

操作样例 基于消息转发的M2M设备间通信 相关文档 配置SQL表达式将Topic数据转发到另一Topic 基于Topic消息路由的M2M设备间通信 常见问题 两个设备之间能通信吗?设备可以订阅其他设备的通信Topic吗?硬件设备和MQTT客户端使用同一设备证书...

实例概述

物联网平台提供公共实例和企业版实例,基于实例管理设备接入、设备通信、设备运维及设备相关业务运行。本文介绍公共实例、企业版实例以及如何开通和使用实例实现物联网设备的管理和运维。说明 物联网平台连接设备的工作原理、功能特性和...

DDH常见问题

本文介绍DDH相关的常见问题及解决方案。DDH相关的常见问题及解决方案如下:什么是专有宿主机DDH?DDH有什么优势?在什么场景下需要购买DDH?DDH是裸机产品吗?DDH与弹性裸金属服务器有什么区别?怎么创建和释放DDH?怎么查看每台DDH上有...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

自助诊断GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题的故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点...

共享内存通信(SMC)使用说明

Alibaba Cloud Linux 3提供的共享内存通信SMC(Shared Memory Communication)是一种兼容socket层、使用共享内存技术实现的高性能内核网络协议栈。根据共享内存技术的不同,SMC又可以细分为基于Internal Shared Memory(ISM)技术的SMC ...

共享内存通信(SMC)使用说明

Alibaba Cloud Linux 3提供的共享内存通信SMC(Shared Memory Communication)是一种兼容socket层、使用共享内存技术实现的高性能内核网络协议栈。根据共享内存技术的不同,SMC又可以细分为基于Internal Shared Memory(ISM)技术的SMC ...

附录:SOFAStack 产品目录

SOFAStack 源于自蚂蚁内部沉淀十多年的金融级分布式中间件技术体系,吸收了支付宝自创立以来在关键金融交易系统锤炼出来的架构实践。SOFAStack 所有的产品技术均经过蚂蚁集团自身严苛的金融场景验证,为金融交易技术保证风险安全的同时,...

服务协议

本文为您介绍定向流量通信能力技术服务协议。通信能力技术服务协议,请参见 服务协议。

服务协议

本文为您介绍了短信服务通信能力技术服务协议。通信能力技术服务协议,请参见 服务协议。

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

服务条款

本文为您介绍 ChatApp 消息服务 通信能力技术服务协议和 相关服务条款。最新服务条款,请参见 ChatApp服务条款 和 Alibaba Cloud International Website Product Terms of Service。

功能特性

高可用管理平台 HAS 定位于 IT 技术风险防控。产品主要功能包括风险管理、日常巡检、故障诊断、应急预案、故障演练等。风险管理 风险管理 是高可用管理平台核心,是风险事件汇集、处置的中枢平台,具体如下。风险事件 风险事件汇集:负责将...

执行演练

在执行故障演练过程中,您可以实时查看演练进度、每个演练活动的运行状态及结果,同时也能够随时结束演练,进行恢复阶段的活动,清除故障演练影响。背景信息 一次完整的故障演练包括以下四个阶段:安装故障演练探针 创建演练 执行演练 停止...

应用故障自动诊断

常见故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系下游业务的负责人进行排查。应用变更导致的RT突增,您可以查看此次变更的具体变更进行排查。应用的某个服务导致RT突增,可以排查以下情况:服务是否在此时有发生...

分布式训练加速TorchAcc概述

通过半精度通信通信压缩、通信overlap等通信优化技术来提高通信效率。提供自动和半自动分布式策略,支持大模型高效训练。训练数据读取优化:Prefetcher:进行数据预取,让数据预处理和训练能够同时进行,从而减少数据处理的等待时间,...

虚拟机场景

本文列出了虚拟机常见故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...

VPC通信常见问题

本章节介绍并解答VPC通信常见问题。同一VPC内不同交换机可以通信么?不同VPC之间能否内网互通?VPC是否支持专线接入?VPC是否提供VPN功能?VPC可以访问公网服务么?公网可以访问VPC中的云服务么?VPC是否可以直接与经典网络通信?同一VPC...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

I-V曲线诊断

数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

GTM实现跨网访问加速与故障切换

概述 方案介绍 大部分企业的应用服务都会使用多个运营商的IP地址,因此可能会存在跨网延迟、丢包、故障不可用等问题,而全局流量管理产品方案可以根据用户请求源地址的运营商,解析就近的应用服务器IP地址,实现就近接入、访问加速、故障...

概述

PolarDB 的无感秒切技术故障探测、切换速度和切换体验三个方面对切换场景进行了优化,包括计划内的切换,如集群升降配和小版本升级,以及计划外的容灾切换。整合了多项技术,来解决用户的痛点问题:引入全新的高可用模块Voting Disk...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网无线连接服务 短信服务 边缘网络加速 负载均衡 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用