[帮助文档] 如何完成网络运维的集群IP变更_云原生应用交付平台(ADP)

使用方法在集群IP发生变更之前,也就是在家里发布软件版本时,需准备好etcd的快照,使用如下命令:mv /home/snapshot.db /home/snapshot.db-`date +%s` /usr/local/bin/etcdctl --endpoints=https://127.0.0....

存储的降本增效与运维

14 课时 |
14 人已学 |
免费

企业运维训练营之云上监控运维最佳实践课程

4 课时 |
1315 人已学 |
免费

企业运维训练营之大数据EMR原理与实践

8 课时 |
2696 人已学 |
免费
开发者课程背景图

[帮助文档] 使用ACS::CS::FCRunCommand通过函数计算服务在集群节点上执行命令_系统运维管理(OOS)

动作描述通过函数计算服务在集群节点上执行命令语法Action: ACS::CS::FCRunCommand Properties: clusterId: String commandContent: String OOSAssumeRole: String属性属性名称描述类型是否必填默认值约束...

[帮助文档] 如何在ACK Pro版集群中访问AI运维控制台

AI控制台包括运维控制台和开发控制台,均支持公网和私网两种访问方式,且访问方式的配置基本一致。本文以运维控制台为例说明如何配置访问方式。

SREWorks云原生数智运维工程实践-云原生运维实战篇-阿里超大规模Flink集群运维实践(上)

SREWorks云原生数智运维工程实践-云原生运维实战篇-阿里超大规模Flink集群运维实践(上)

 大数据运维在阿里云实时计算集群的落地实践:以数智为内核驱动的实时计算运维体系,解决稳定性、成本、效率三大运维领域需求。 摘要:本文整理自阿里云计算平台事业部实时计算高级运维专家王华(尚付)在FlinkForward Asia 2021生产实践专场的演讲。 一、&nbs...

SREWorks云原生数智运维工程实践-云原生运维实战篇-阿里超大规模Flink集群运维实践(中)

SREWorks云原生数智运维工程实践-云原生运维实战篇-阿里超大规模Flink集群运维实践(中)

二、 集群运维Flink Cluster • 一方面,Flink平台上运行着一个非常典型的业务,就是双11大促当天GMV媒体成交翻牌器,也就是家喻户晓的成交额大屏,这个业务对于稳定性要求非常高。除了GMV翻牌器,Flink还承载了阿里内部全部重要的实时计算业务,包括阿里...

SREWorks云原生数智运维工程实践-云原生运维实战篇-阿里超大规模Flink集群运维实践(下)

SREWorks云原生数智运维工程实践-云原生运维实战篇-阿里超大规模Flink集群运维实践(下)

三、 应用运维Flink Job   伴随着实时计算的大趋势,Flink的用户和作业数经历了飞速增长,现在平台上的作业数已经达到了几万个。但是众所周知Flink作业的运维是一个非常复杂的问题,列举一些日常用户最高频的咨询,比如为什么我的作业启动慢,为什么Failover...

[帮助文档] 如何通过智能运维诊断集群健康状况

开启智能运维服务后,系统会每天凌晨定时诊断集群,产生诊断报告。除了每天凌晨的定时诊断外,您还可以通过健康诊断进行自主诊断,默认每天限制诊断5次,每次诊断大约耗时3分钟。

阿里超大规模 Flink 集群运维体系介绍

阿里超大规模 Flink 集群运维体系介绍

摘要:本文整理自阿里云实时计算高级运维专家王华 (尚付) 在 Flink Forward Asia 2021 生产实践专场的演讲。主要内容包括:演进历史和运维挑战集群运维 Flink Cluster应用运维 Flink Job点击查看直播回放 & 演讲PDF一、演进历史和运维挑战阿里的实时计...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

相关电子书
更多
通过 ACK 智能化运维体系获得集群自动化诊断和自愈能力
腾讯云多Kubernetes集群高可用运维实践
腾讯云多Kubernetes集群高可用运维实践
立即下载 立即下载 立即下载