故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

syslog日志查询

您可以通过输入设备名称、设备地址、关键字以及选择时间范围,检索和查询相关的设备日志,同时也可以配置解析规则触发事件告警,目前CMN内置了常见厂家的“端口Down”、“BGP邻居中断”、“ISIS协议变化”等常见故障的触发规则。...

混沌工程概述

常见故障场景 根据容器服务ACK集群的架构、组件特性,梳理常见的故障场景如下。场景 异常组件 异常场景 管控组件故障 kube-apiserver 组件容器部分副本不可用 组件容器全部副本不可用 组件容器CPU、内存、网络高负载 kube-controller-...

NAT网关故障排查指南

本文介绍NAT网关的常见故障及排查方案。流量不通类故障排查:ECS实例配置DNAT条目后无法被公网访问 VPC内新建交换机的ECS无法通过SNAT访问公网 VPC内存在多个NAT网关时,某交换机的ECS实例不能访问公网 访问流量异常类故障排查:客户端访问...

基础版实例

以下内容为AnalyticDB PostgreSQL版实例常见故障场景中基础版和高可用版的对比:恢复(Recovery)模式根据以往AnalyticDB PostgreSQL版运行情况,恢复模式为出现概率最大的故障场景,远大于另外两种场景,该场景下基础版恢复速度远高于高...

查询和分析时序数据

如果您要使用标准SQL语法或SQL+PromQL组合语法,请选择更多操作> 自定义分析,在Logstore查询和分析页面进行。登录日志服务控制台。在Project列表区域,单击目标Project。在时序存储> 时序库页签中,单击目标MetricStore。在页面右上角,...

ADP底座/本地运维控制台

针对常见故障场景,提供修复方案和处理建议。组件运维操作可视化:本地运维控制台新增以下几项白屏化运维操作prometheus、loki、local:新增水平扩容、垂直扩容、PVC存储扩缩容所有谐云中间件:新增水平扩容、垂直扩容、PVC存储扩缩容、主...

通过JDBC协议分析日志

日志服务支持您在数据库(例如MySQL)中使用JDBC协议连接日志服务,并通过标准的SQL92语法查询和分析日志。前提条件 已创建阿里云账号的AccessKey或RAM用户的AccessKey。具体操作,请参见访问密钥。如果使用RAM用户的AccessKey,则RAM用户...

创建预置标签

常见组合有:公司、部门、团队、项目等。Company Department Team Project 角色标签 一般用于描述资源管理者角色。常见组合有:网络管理员、应用管理员、系统管理员等。Role 成本标签 一般用于描述内部财务费用归属,主要用于内部结算或...

搜索语法说明

支持企业范围内跨仓库的代码搜索服务,除了通用目标词检索外,还支持通过关键词语法组合搜索条件进行精确搜索,本文介绍关键词语法的使用规则。关键词说明关键词说明样例repo指定搜索的代码仓库路径(path)或库名称(name)repo:myrepo,...

Markdown图表(下线)

本文介绍Markdown图表的常见语法及如何在日志服务的仪表盘中创建Markdown图表。前提条件 已采集日志数据。更多信息,请参见数据采集。已创建仪表盘。更多信息,请参见创建仪表盘。背景信息 注意 Markdown图表功能暂时无法使用。在查询分析...

索引选择

本章节主要为您介绍如何选择表格存储的查询方式以及索引常见组合方案。是否需要使用索引 以下情况您可以不使用索引进行查询: 如果基于主键和主键范围查询的功能已经可以满足业务需求,那么不需要建立索引。如果对某个范围内进行筛选,范围...

访问鉴权规则

最小常见组合权限使用RAM子账号登录访问开放搜索控制台,最小常见组合权限包括搜索一个应用的最小权限集合、应用列表权限、应用详情权限、监控与报警权限、RDS访问授权等,仅供参考。搜索一个应用的最小权限集合通过SDK对应用发起搜索请求...

访问鉴权规则

最小常见组合权限使用RAM子账号登录访问开放搜索控制台,最小常见组合权限包括搜索一个应用的最小权限集合、应用列表权限、应用详情权限、监控与报警权限、RDS访问授权等,仅供参考。搜索一个应用的最小权限集合通过SDK对应用发起搜索请求...

名词解释

本文介绍Lindorm搜索SQL语法常见术语。名词 对应Lindorm中的含义 描述 Table Table 表,构建表时需要定义表的Schema结构,包括表名、表的列名和列的类型。PRIMARY KEY PRIMARY KEY 主键,用于标识一行数据,可以唯一确定一行数据的分布...

名词解释

本文介绍Lindorm宽表SQL语法常见术语。名词 对应Lindorm中的含义 描述 Schema NameSpace Schema逻辑包含很多表,类似数据库的概念。Table Table 表,构建表时需要定义表的schema结构,包括表的列名和列类型。PRIMARY KEY PRIMARY KEY ...

功能特性

运维人员可以根据常见故障场景的处理过程,选择需要的原子能力进行编排组合,形成可执行的应急预案。当风险事件发生时,风险事件中心会推荐可执行的应急预案,供运维快速选择并自动化执行,从而通过标准化处理流程,实现故障快速恢复。故障...

脚本模式实践:高级SQL(Mybatis语法)示例

数据服务支持通过脚本模式来生成API,脚本模式下支持基础SQL和高级SQL,其中高级SQL涵盖了Mybatis语法常见标签类型:if、choose、when、otherwise、trim、foreach、where,您可以借助标签语法来灵活实现空值校验、多值遍历、动态查表、...

开启混沌工程

关于ACK常见故障的排除方法,请参见故障排除。相关文档 混沌工程概述 容器报警演练 Pod OOM故障演练 Service异常问题排查 Nginx Ingress异常问题排查 DNS解析异常问题排查 使用DNSTAP Analyser诊断异常 Pod异常问题排查 集群巡检与诊断

分区索引

HASH分区和时间范围分区组合语法示例如下: 创建组合索引,先按照时间范围进行分区,再按照HASH分区。CREATE SEARCH INDEX idx ON search_table(storeId, goodsId,goodsPrice,orderTime)partition by range time(orderTime)partition by ...

执行演练

在执行故障演练过程中,您可以实时查看演练进度、每个演练活动的运行状态及结果,同时也能够随时结束演练,进行恢复阶段的活动,清除故障演练影响。背景信息 一次完整的故障演练包括以下四个阶段:安装探针>创建演练>执行演练>停止演练 ...

应用故障自动诊断

常见故障自动诊断场景RT突增 下游业务导致的本应用的RT突增,您可以联系下游业务的负责人进行排查。应用变更导致的RT突增,您可以查看此次变更的具体变更进行排查。应用的某个服务导致RT突增,可以排查以下情况:服务是否在此时有发生...

虚拟机场景

本文列出了虚拟机常见故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...

GTM如何实现异地容灾

概述方案介绍异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

在DTS迁移或同步任务中配置ETL

说明 本产品参考了SLS的数据处理语法,关于SLS语法,请参见语法简介。典型场景示例 数据过滤: 按数值列条件过滤:如果id>10000,则丢弃这条记录,不同步到目标库:e_if(op_gt(`id`,10000),e_drop)。按字符串匹配条件过滤:如果name包含...

容器服务ACK集群故障排查

下表罗列了一部分ACK集群常见故障原因以及处理方法:故障场景 处理方法 API Server组件停止或Master组件停止: 不能创建(停止、更新)Pod、Service、Deployment等资源。已有的Pod和Service仍然能够正常工作,除非该Pod或Service需要调用...

GTM如何实现同城容灾

概述方案介绍同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

GTM实现跨网访问加速与故障切换

概述方案介绍大部分企业的应用服务都会使用多个运营商的IP地址,因此可能会存在跨网延迟、丢包、故障不可用等问题,而全局流量管理产品方案可以根据用户请求源地址的运营商,解析就近的应用服务器IP地址,实现就近接入、访问加速、故障切换...

运维事件中心

运维事件中心是企业业务连续性的运营管理平台,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能,一站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应、更短的故障时长、更...

新手指引

管理控制台常见问题 网站耗资源(客户程序故障常见问题 更多常见问题,请参见常见问题和故障排除汇总。反馈与建议 在使用阿里云云虚拟主机时,如果有任何疑问或建议,您可以通过以下渠道进行反馈: 如果您在文档使用中遇到以下问题,您...

云原生数据仓库AnalyticDB PostgreSQL版

兼容Greenplum开源数据仓库,MPP全并行架构,广泛兼容PostgreSQL/Oracle的语法生态,新一代向量引擎性能超越传统数据库引擎10倍以上,分布式SQL优化器实现复杂查询语句免调优。实现了对海量数据的即席查询分析、ETL 处理及可视化探索,是各...

HybridDB for MySQL(文档停止维护)

云数据库HybridDB for MySQL(原名PetaData)是同时支持海量数据在线事务(OLTP)和在线分析(OLAP)的HTAP(Hybrid ...最大程度的兼容MySQL的语法及函数,并且增加了对部分Oracle函数的支持,从而降低了用户的开发、迁移和维护成本。\n

全局流量管理

全局流量管理通过DNS实现应用服务的就近访问接入、多地址负载均摊,同时根据健康检查进行DNS Failover,实现应用服务的同城多活故障隔离和异地容灾。

负载均衡

负载均衡SLB(Server Load Balancer)是一种对流量进行按需分发的服务,通过将流量分发到不同的后端服务来扩展应用系统的服务吞吐能力,并且可以消除系统中的单点故障,提升应用系统的可用性。

应用高可用服务 AHAS

应用高可用服务AHAS是一款专注于提高应用高可用能力的SaaS产品,提供应用架构自动探测、故障注入式高可用能力演练、一键应用防护和增加功能开关等功能,可以快速低成本地提升应用可用性。

数据库自治服务 DAS

数据库自治服务DAS(Database Autonomy Service)是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务,帮助您消除人工操作引发的服务故障,有效保障数据库服务的稳定、安全及高效。

网络质量分析器

网络质量分析器(Internet Performace Analyzer)可以提供互联网全链路的网络质量分析能力。本服务提供的SDK集成到用户应用程序或者SDK中,配合云端配置的...可以结合业务场景进行网络故障的定界定位、网络质量的优化以及与其他云产品联动。

Node.js 性能平台

Node.js 性能平台(Node.js Performance ...应用提供性能监控、安全提醒、故障排查、性能优化等服务的整体性解决方案。\nNode.js 性能平台凭借对 Node.js 内核深入的理解,提供完善的工具链和服务,协助客户主动、快速发现和定位线上问题。

云数据库 OceanBase

自主研发的原生分布式关系数据库,在普通硬件上实现金融级高可用,在金融行业首创“三地五中心”城市级故障自动无损容灾新标准,同时具备在线水平扩展能力,创造了 6100万次/秒处理峰值的业内纪录,在功能、稳定性、可扩展性、性能方面都...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用