集群巡检项及预警风险 说明 关于如何使用集群巡检功能,请参见 使用集群诊断。根据集群配置,具体巡检项可能稍有不同。实际结果请以检查报告结果为准。检查类型 巡检项 预警风险 资源配额 ResourceQuotas SLB实例数配额检查 VPC内SLB配额...
方案总结 备份恢复方案实施成本较低,但RTO和RPO相对较长,且时间长短取决于数据量的大小和应用的复杂度。您可以借助ACK One备份中心支持的全量备份+增量备份能力,减少RTO和RPO时间。备份恢复作为容灾的兜底方案,重要性很高,在系统运维...
集群检查项 集群升级检查 由于Kubernetes自身的复杂性,以及升级Kubernetess版本时引入的运行时变更、API废弃、特性变更等操作,集群升级存在较高的操作风险。为保障集群平稳升级,ACK引入了集群升级前置检查。集群升级时会首先触发集群...
解决方案:集群API Server负载均衡实例6443端口监听配置异常,请调整负载均衡实例监听设置,恢复至集群创建时状态。API Server SLB实例 异常影响:检查集群API Server负载均衡实例是否存在。若集群API Server负载均衡实例不存在,会造成...
解决方案:集群API Server负载均衡实例6443端口监听配置异常,请调整负载均衡实例监听设置,恢复至集群创建时状态。API Server SLB实例 异常影响:检查集群API Server负载均衡实例是否存在。若集群API Server负载均衡实例不存在,会造成...
索引 集群检查项 集群升级检查 集群迁移检查 组件检查 异常检查项修复方案 废弃API说明 集群检查项 集群升级检查 Kubernetes自身的复杂性,以及升级K8s版本时引入的运行时变更、API废弃、特性变更等操作,导致集群升级存在较高操作风险。...
解决方案 在EDAS K8s集群中使用WAR包方式部署的客户,请通过Console/API方式重新部署应用即可。在EDAS K8s集群中使用镜像方式部署的客户,请使用注释掉Tomcat AJP Connector的Tomcat版本重新制作镜像并重新部署。验证方法 通过WebShell登录...
本文主要介绍如何使用迁移工具,将存量数据从阿里云Beta版Milvus集群或用户自建的Milvus集群,迁移到阿里云Milvus Zilliz内核版集群的方案。前提条件 已创建阿里云Beta版Milvus集群或自建的Milvus集群。已安装Docker,详情请参见 Docker...
本文介绍ES集群负载不均问题的分析方法及解决方案。问题现象 节点间磁盘使用率差距不大,监控中节点 CPU使用率或load_1m 呈现明显的负载不均衡现象。节点间磁盘使用率差距很大,监控中节点 CPU使用率或load_1m 呈现明显的负载不均衡现象。...
本文将介绍StarRocks迁移至EMR Serverless的整体解决方案及具体迁移步骤。该迁移方案仅供参考,您需要结合实际业务情况进行调整与优化,以更好地满足您的需求。迁移流程 整体迁移流程如下图所示,涵盖了作业改写、作业双跑、数据校验、业务...
多集群方案 在以下使用场景中,可以考虑采用单实例多集群方案。共享数据且支持不同敏感度的数据分析场景,如针对在离线分析进行时隔离。导入数据的工作负载与查询数据的工作负载需要进行隔离。对资源利用率不做特殊要求。Workload Group...
存储热备集群方案 当前 PolarDB MySQL版 支持如下几种存储热备集群方案。关闭存储热备集群 方案概述 仅在主可用区提供数据库服务,不提供存储热备集群能力,成本较低。在可用区整体故障场景时,故障恢复时间较长。若您对跨可用区高可用有...
本文介绍集群运行时,由于配置的集群存储根路径(对应Hadoop-Common服务中 fs.DefaultFS 配置项)缺乏访问权限,导致集群的部分服务启动失败的原因和解决方案。问题详情 在E-MapReduce控制台,集群的Hadoop-Common服务 状态 页面的 健康...
容器智能运维平台 提供集群巡检功能。您可以扫描集群运行状况,发现集群中存在的潜在风险,例如云资源配额余量、Kubernetes集群关键资源水位等,排查风险项并根据推荐的解决...相关文档 AIOps套件概述 集群巡检项及解决方案 集群检查 集群诊断
集群异常状态——不可用(unavailable)异常原因 解决方案 集群 API Server 的CLB实例被释放,可能包括以下情况:实例被手动释放 包年包月实例到期自动释放 阿里云账号欠费导致按量付费实例被释放 集群已无法恢复,请删除集群或重新创建...
ClusterComponent 检查项名称 检查项说明 修复方案 集群APIService可用状态 检查集群APIService是否可用。请尝试通过命令 kubectl get apiservice,检查集群中的APIService的可用状态,并通过 kubectl describe apiservice 命令,查看状态...
问题原因及解决方案 集群为1.20及以上版本 可能原因 可能由于备份服务组件migrate-controller版本过低。解决方案 请将备份服务组件migrate-controller升级至最新版本即可解决。具体操作,请参见 管理组件。集群为1.20以下版本 可能原因 ...
问题原因及解决方案 集群为1.20及以上版本 可能原因 可能由于备份服务组件migrate-controller版本过低。解决方案 请将备份服务组件migrate-controller升级至最新版本即可解决。具体操作,请参见 管理组件。集群为1.20以下版本 可能原因 ...
ClusterComponent 检查项名称 检查项说明 修复方案 集群免密插件版本检查 检查集群免密插件版本是否过低。集群免密插件版本检查过低,请尽快升级版本。具体操作,请参见 使用免密组件拉取容器镜像。集群APIService可用状态 检查集群API...
集群监控报警问题 如何配置X-Pack Watcher报警?出现GC内存无法分配的报警,如何处理?ES是否支持Grafana监控?集群状态指标数值分别表示什么意思?如何查看ES的磁盘使用情况?CMS GC时报错promotion failed,如何处理?访问集群问题 如何...
索引 注意事项 ACK Serverless集群中DNS域名解析原理 ACK Serverless集群支持的DNS服务发现方案 常见问题 相关文档 注意事项 如果在创建 ACK Serverless集群 时,未开启任意DNS服务发现组件,容器Pod将默认使用VPC提供的DNS服务器进行域名...
分类 相关文档 集群资源和集群组件异常问题排查 集群检查项及修复方案(包括升级集群、迁移集群、安装组件、升级组件过程中出现的异常以及解决方案)Pod异常问题排查 Pod诊断 Service异常问题排查 Service诊断 Ingress异常问题排查 Ingress...
您可以将开源RocketMQ集群迁移到 云消息队列 RocketMQ 版 上以获得更好的业务体验,本文为您介绍开源RocketMQ集群迁移上云的方案及原理。产品差异对比 和开源RocketMQ相比,阿里云 云消息队列 RocketMQ 版 在技术架构、弹性效率、运维复杂...
本文介绍混合云代理模式集群(SGE调度器)的部署方案。背景信息 在HPC生命科学领域,大部分企业均已经部署了线下的IDC数据中心,但可能会存在基础设施陈旧、算力不足的问题。随着业务的快速增长,企业希望在云上搭建新的算力集群,但同时...
本页面为您介绍切换集群部署方案的操作步骤,支持向上升级和向下降级两种切换方式。背景信息 集群实例的部署方案调整会导致全功能型副本数和可用区的调整。说明 部署方案切换过程可能会造成秒级业务闪断,建议避开流量高峰操作。部署方案...
方案优势 统一的集群管理:使用容器服务控制台统一管理集群和应用,避免在不同云平台之间切换控制台。一致的安全治理体系:基于阿里云主子账号体系对ACK集群、IDC自建集群或其他云厂商集群进行一致的RBAC授权管理。提供审计、安全巡检、...
方案优势 提供统一的控制台界面和API接口,支持对集群、计算、网络、存储、安全、监控、日志、作业、应用、流量等进行企业级的运维管控。面向云突发的业务波峰,业务自动或者定时触发弹性扩容和缩容云上资源,降低综合业务成本。开箱即用的...
方案二:借助工具迁移 使用迁移工具迁移自建Kafka集群至实例。为实例开启新的Group,准备消费实例的消息。为实例开启新的Producer,下线旧的Producer,并使旧的Group继续消费自建Kafka集群的消息。待自建Kafka集群的消息全部被旧的Group...
方案架构图如下所示:Serverless Spark将Spark、Serverless、云原生技术,深度整合到一起,相对于传统开源Spark集群版方案,具体以下优势:入门门槛低:Serverless Spark屏蔽掉了底层的基础组件,提供简单的API、脚本以及控制台使用方式。...
新集群元数据选型(DLF或自建RDS)新集群存储方案(OSS-HDFS或OSS)步骤一:构建新环境集群 创建新集群 创建新集群的详细步骤和参数说明,请参见 创建集群,可以根据在 查看集群实例配置信息 中梳理出的集群参数进行填写。以下配置参数需要...
集群巡检会按照触发风险的程度分为低危、中危和高危,并高亮显示。集群巡检详细内容包含风险级别、风险项名称、异常影响及解决方案。关于集群巡检的常见风险预警及修复方案的更多信息,请参见 集群巡检项及解决方案。相关操作 管理巡检规则...
容器智能运维平台 提供集群检查能力。您可以在集群升级、迁移等操作前执行集群检查,确认集群是否符合要求。本文介绍如何使用集群检查功能。前提条件 已成功创建Kubernetes集群。...相关文档 集群检查项及修复方案 使用集群诊断
准备集群资源 您可以根据防护场景,选择对应的集群部署方案,不同方案所需要的集群资源数量不同。防护场景 部署方案 所需资源 部署说明 安全性、高稳定性业务上线防护,追求业务和防护能力的高稳定性 防护能力和管控能力都容灾部署 1万QPS...
本文介绍在EDAS控制台导入Kubernetes集群时可能遇到的常见问题,并提供对应的解决方案。索引 预检项目失败一定会导入失败吗?预检项目结果为告警,需要关注吗?预检项目结果为检测中断,该怎么办?集群版本检查不通过,该怎么办?集群可用...
集群内备份和恢复应用 跨集群迁移应用 备份中心为集群内的有状态应用提供灾难备份和恢复能力,对于Kubernetes集群内的有状态应用的崩溃一致性,应用一致性,跨地域的灾难恢复提供了一站式的解决方案。同地域跨集群迁移应用 跨地域跨集群...
说明 对于采用双机房和多机房部署方案的集群,1 个集群实例最多支持创建 10 个只读副本。单击 确定 后,系统跳转到付费页面。根据实际需要设置 节点 和 只读副本存储大小,勾选 服务协议 并单击 立即购买。参数 参数说明 节点 包括节点规格...
以采用多可用区部署方案的集群实例为例,假设您创建的集群实例拥有三个可用区,每个可用区有一个节点(即 1-1-1 的节点分布架构),当您为该集群增删节点时,操作对应的资源变化说明如下:增加节点:OceanBase 数据库支持按倍数增加节点...
解决方案 在Elasticsearch控制台的集群配置页面,静态开启自动创建索引功能,您也可以通过命令方式开启,具体操作请参见 配置YML参数。主日志报错:all shards failed 报错说明 出现该报错后,集群会出现以下问题:读取请求无法从分片获得...
集群、容器的性能指标监控 解决方案 方案介绍 适用场景 参考文档 云监控容器服务ACK的监控方案 容器服务 Kubernetes 版 ACK(Container Service for Kubernetes)新建的集群默认安装与集成云监控(Cloud Monitor),提供集群、容器的部分...
本文介绍您在创建集群、使用集群、管理集群等过程中可能遇到的常见问题及对应解决方案。Alibaba Cloud Linux操作系统的集群兼容CentOS的容器镜像吗?创建集群选择了containerd容器运行时,是否可以改为Docker?容器运行时containerd、...