创建和管理托管节点池以及开启自动化运维能力
ACK提供了节点池功能对节点进行分组管理。节点池是具有相同属性(例如实例规格、操作系统、标签和污点等)的一组节点的逻辑集合。一个集群中可以创建多个不同配置和类型的节点池。您可以创建节点池,实现对节点进行统一的运维和管理。
在ACK集群中使用OOS加密参数
您可以在应用Pod中以文件系统或Secret挂载的形式,将存储在阿里云OOS加密参数中的密文引入到应用程序中使用,避免敏感数据在应用开发构建流程中传播和泄露。默认情况下,您直接从文件系统读取密钥和阿里云OOS加密参数之间的直接交互可能存在兼容性问题,您可以通过ack-secret-manager或csi-secrets-store-provider-alibabacloud组件解决此类问题。
使用集群的API Server审计功能实现集群安全运维
审计(Auditing)产生于API Server内部,用于记录对Kubernetes API的请求以及请求结果。ACK集群提供API Server的审计日志,帮助集群管理人员排查“什么人在什么时间对什么资源做了什么操作”,可用于追溯集群操作历史、排查集群故障等,降低集群安全运维压力。
基于自动化运维能力开启节点池节点故障自动恢复
托管节点池自动监控节点状态,确保节点正常运行。当节点发生异常时,ACK会自动执行恢复操作。将节点池设置为托管模式会为所有节点同时开启自动恢复功能,简化节点运维工作。本文介绍节点自动恢复的应用场景和处理流程。
关于ACK专有集群API Server的ClientCA证书更新运维公告
2024年07月15日00:00:00至2024年09月01日00:00:00期间,容器服务 Kubernetes 版将逐步更新ACK专有集群API Server使用的ClientCA证书,以延长ClientCA证书的过期时间,进一步保证集群安全。
SREWorks云原生数智运维工程实践-云原生运维实战篇-阿里超大规模Flink集群运维实践(上)
大数据运维在阿里云实时计算集群的落地实践:以数智为内核驱动的实时计算运维体系,解决稳定性、成本、效率三大运维领域需求。 摘要:本文整理自阿里云计算平台事业部实时计算高级运维专家王华(尚付)在FlinkForward Asia 2021生产实践专场的演讲。 一、 演进历史和运维挑战 阿里的实时计算经历了近10年的快速发展,总体来说可....

SREWorks云原生数智运维工程实践-云原生运维实战篇-阿里超大规模Flink集群运维实践(中)
二、 集群运维Flink Cluster • 一方面,Flink平台上运行着一个非常典型的业务,就是双11大促当天GMV媒体成交翻牌器,也就是家喻户晓的成交额大屏,这个业务对于稳定性要求非常高。除了GMV翻牌器,Flink还承载了阿里内部全部重要的实时计算业务,包括阿里妈妈、广告计量计费、搜索推荐、机器学习平台等核心电商业务的实时场景。这些实时场景既重要又实时敏感,稳定性是第一大挑战。....

SREWorks云原生数智运维工程实践-云原生运维实战篇-阿里超大规模Flink集群运维实践(下)
三、 应用运维Flink Job 伴随着实时计算的大趋势,Flink的用户和作业数经历了飞速增长,现在平台上的作业数已经达到了几万个。但是众所周知Flink作业的运维是一个非常复杂的问题,列举一些日常用户最高频的咨询,比如为什么我的作业启动慢,为什么Failover,为什么反压,为什么延时,如何调整资源配置来减少成本?这些看似简单的问题其实都非常复杂。 Flink....

阿里超大规模 Flink 集群运维体系介绍
摘要:本文整理自阿里云实时计算高级运维专家王华 (尚付) 在 Flink Forward Asia 2021 生产实践专场的演讲。主要内容包括:演进历史和运维挑战集群运维 Flink Cluster应用运维 Flink Job点击查看直播回放 & 演讲PDF一、演进历史和运维挑战阿里的实时计算经历了近 10 年的快速发展,总体来说可以分成三大时代:1.0 时代:2013 年到 2017 ....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。