服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

使用OpenAPI诊断工具进行故障排查

阿里云OpenAPI平台提供使用诊断工具。本文介绍如何使用OpenAPI诊断工具进行故障排查。您可以登录 OpenAPI使用诊断,输入完整的RequestID或SDK报错信息,然后...如果诊断工具仍未能解决您的问题,您可以参考 故障排除、常见问题 获取解决方案。

可观测性的设计原则

通过在系统中实现分布式跟踪,可以快速定位问题并进行有效的故障排除。链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时,标识符将被添加到请求中,并在整个系统中传递。每个组件都可以将标识符添加到它们的日志中,以便在...

支持计划

配置指导以及故障排除 配置指导以及故障排除 配置指导以及故障排除 专属技术服务经理 不支持 不支持 专属技术服务经理(TAM)健康检查 可免费使用智能顾问Advisor 可免费使用智能顾问Advisor 可免费使用智能顾问Advisor。专属技术服务经理...

故障排除

CC API在调用时可能会遇到一些错误,遇到错误时以错误码为依据进行故障排除,本文为您介绍 常见错误码的解决方案。云产品运行时错误码 云产品API运行时返回的错误码。以下两个错误码为云产品运行时错误,如想获取云产品详细错误信息,需...

常见问题FAQ

4.HDMI无信号 故障示意图如下:故障排除方案如下:1.见下遥控器说明,按电源键,重启魔盒。2.重复插拔HDMI线 3.重启屏幕 屏幕操作指南由屏幕供应商给出。4.屏幕的信号源切换到HDMI输入。屏幕操作指南由屏幕供应商给出。如无法排除故障:...

ADP底座介绍

业务数据的存储备份及还原:提供自动化的数据备份方案及还原手段,保障在机器故障或变更失误场景下的业务恢复能力。功能架构 功能特性 功能模块 描述 日志服务 为集群提供日志管理能力。具体支持以下功能:自定义采集日志标准输出 自定义...

诊断网页加载过慢的问题

针对这类问题,ARMS前端监控的慢会话追踪功能提供页面静态资源加载的性能瀑布图,可深入定位页面资源加载情况,全方位地诊断故障根源,从而快速排除故障。问题描述 网页加载较慢是经常出现且前端非常关注的问题之一。定位、排查解决这类...

产品高可用

为了防止集群中某台机器故障导致的会话中断,您可以在业务逻辑中加入重试机制,降低对用户访问造成的影响。单CLB实例的高可用 为了向广大用户提供更稳定可靠的负载均衡服务,阿里云负载均衡已在大部分地域部署了多可用区以实现同地域下的跨...

实时分析链路数据

在 调用链分析 页面筛选错误调用或慢调用,并设置按IP进行分组统计,如果异常调用集中出现在特定机器,则有较大概率是机器故障。问题三:慢接口治理 新应用上线或大促前性能优化,如何快速梳理慢接口列表,解决性能瓶颈?新应用上线或大促...

安装探针概述

为您的主机等资源安装应用高可用探针后,即可使用AHAS架构感知和故障演练功能,能直观地看到应用对基础架构的依赖关系、组件间的依赖关系,以及对指定机器进行故障演练。接入 AHAS架构感知和故障演练可以接入云服务器ECS、自建Kubernetes、...

创建演练

指定IP选择:选中机器列表中的机器即可,精确指定机器执行故障注入。百分比选择:当演练对象为应用时,可使用 百分比选择 方式。滑动指针,设置1~100的百分比数值,每次执行演练时,系统会随机从所选应用分组下的存活机器中,按百分比选取...

设置开关推送

每批的机器数为总机器数/批次数。按机器顺序推送,同一批次内推送机器并行,多批次间按顺序推送。例如有10台机器,灰度批次 设为3,则先推送前3台机器,再推送3台机器,最后再推送4台机器。是否多次暂停:仅第一批暂停,表示推送完第一批...

监控服务概览

OpenAPI访问监控数据 OSS服务的相关监控指标数据可以通过云监控提供的OpenAPI访问,使用方法请参见:云监控SDK参考 访问监控数据 监控、诊断和故障排除 监控诊断和故障排除 通过详细介绍以下各个方面的内容帮助您更好地了解OSS服务的运行...

设备显示离线

如果是静态路由接入,尝试通过交换机,能否 ping 通设备的每个接口IP,如果其中有无法 ping 通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第二个和第三个灯是否为...

ping不通云服务ECS(SAG-1000)

如果是静态路由接入,尝试通过交换机,能否ping通设备的每个接口IP,如果其中有无法ping通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第2和第3个灯是否有红色的。...

评论管理

评论管理页面提供了用户评论相关统计数据,包括总评论机器过滤数和运营删除数,同时展示当前应用发布的所有内容的用户评论列表。支持用户评论查询、机器过滤、运营点赞以及运营删除/回收评论。总评论数:当前应用发布的所有内容所收到...

代码逻辑场景

受影响的请求 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求占所有应该发生故障...

查询运维报表数据

NotWorkShopNum Integer 37 未入网门店 UpholdShopNum Integer 238 维护中门店 NormalShopNum Integer 10020 正常门店 FaultShopNum Integer 320 故障门店 HighFreqFaultShopNum Integer 12 频繁故障门店 DeviceIndex Object ...

JVM注入动态脚本

受影响的请求 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求占所有应该发生故障...

EasyCkpt:AI大模型高性能状态保存恢复

通常,故障的根因是一到两台机器故障,这只会影响部分Worker。对于大规模分布式训练任务而言,不会所有的Worker都出现故障。特点2:机器故障是部分的。通过对众多故障失败案例的分析,对于训练集群而言:GPU易损坏,但机器的CPU和内存...

监控、诊断和故障排除

故障排除:提供常见的问题场景和故障排除方法。服务监控 监视总体运行状况 可用性和有效请求率 可用性和有效请求率是有关系统稳定性和用户是否正确使用系统的最重要指标,指标小于100%说明某些请求失败。可能因为一些系统优化因素出现暂时...

安装故障演练探针

对指定机器进行演练时,需要在机器上面安装故障演练探针,探针的作用是下发故障演练执行命令。背景信息 一次完整的故障演练包括以下四个阶段:安装探针>创建演练>执行演练>停止演练 操作步骤 登录 AHAS控制台。在左侧导航栏选择 探针管理,...

演练概述

完整的故障演练包括以下四个阶段:安装故障演练探针 对指定机器进行演练,需要在机器上面安装故障演练探针,探针的作用是下发故障演练执行命令。创建演练 配置演练基本信息、演练对象和演练全局参数。可同时选择多个故障类型。执行演练 将...

设备无法连接SSID

问题症状 无线终端连接SSID,显示未连接,无法关联SSID。解决方案 检查AP配置中的最大连接,最大可设置为128.2.DHCP不在AP上要检查一下地址池的使用情况,检查可用地址是否够用。3.更换新的AP,排除是否是AP故障。适用于 云AP

产品架构

因而负载均衡集群支持热升级,并且在机器故障和集群维护时最大程度对用户透明,不影响用户业务。说明 对于连接未建立(三次握手未完成),或者已建立连接但未触发会话同步机制,热升级不保证连接不中断,需要依靠客户端重新发起连接。入网...

为什么没有调用的指标统计?

问题现象 在扩容机器时,某台机器的请求、错误、异常均为0,但这台机器的JVM指标监控等数据又是正常的。解决方案 确认这台机器的JVM内存、CPU等资源占用是否比其他机器都要明显的低。如果这台机器的资源占用比其他机器明显的低,那么...

故障演练常见问题

例如:对 10 台 ECS 注入 CPU 满载和磁盘填充两种故障,则故障注入次数为 10(ECS)×2(故障场景)=20次,那么故障规则下发次数即为 20 次。挂载 JavaAgent 是否计费?仅针对故障规则下发次数进行计费,挂载 JavaAgent 为故障注入的...

接入演练应用

重要 在已部署故障演练探针的机器上,修改JVM启动参数并重启,应用会自动识别并生效,无需重新部署故障演练探针。启动应用。登录 AHAS控制台,在左侧导航栏选择 故障演练>概览。在左侧导航栏单击 探针管理,然后单击右上角的 接入探针。在 ...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

DDH常见问题

表格所需的DDH物理参数(比如CPU数量(Socket)、物理CPU核数、vCPU核数等)能在ECS管理控制台上查看。DDH有唯一标识码吗?有。每台DDH都有一个机器码(类似于物理服务器的资产ID,非宿主机ID),您可以使用该机器码标识DDH。将DDH分配到...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

管理MySQL集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

数据看板

机器人服务接待效果 解决接待量:排除转人工(如有)、无答案、推荐未点击、点踩(如有)的服务session量(接待人次)。该指标表明机器人服务能力的强弱,解决接待量越高则机器人服务能力越强。解决率:1-有转人工(如有)、无答案、最后一...

Logtail机器

机器组 日志服务通过一个Logtail采集配置来采集多台服务器上的日志,您可以将这些服务器加入到同一个机器组,并将Logtail采集配置应用到该机器组。您可以通过如下两种方法定义一个机器组。IP地址:在机器组中添加服务器的IP地址,通过IP...

数据看板

接待概况 用户可以查看所选机器人在某一时段的接待情况,除此之外还可以看到所选机器人截止到查看日期已经存在于智能对话机器人平台的时间。上图中的各项指标的解释如下:机器人:可进行机器人的选择,选择想要查看数据的机器人(下同)。...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

接入ARMS监控

故障演练时通过接入应用实时监控服务ARMS(Application Real-Time Monitoring Service)可以对演练过程的指标进行监控,包含JVM内存、JVM线程、JVMGC相关、网络出入口流量、磁盘、CPU等指标。本文介绍如何在故障演练中接入ARMS并监控演练...

RDS数据库有大量不明连接

3、如并非内部机器发起的请求,可以核实下该实例是否配置有DTS、DBS、dataworks等订阅和备份相关工具。4、排除如上3点,确认是外部不明连接后建议对白名单精细化,并修改账号密码,以防外部不明连接接入。适用范围 RDS For MySQL 相关文档...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
机器翻译 数据库自治服务 人工智能平台 PAI 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用