什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

基本概念

针对金融级场景下大规模分布系统的特点,提供了丰富的发布策略以满足不同的场景,帮助传统架构平滑过渡,适应金融技术风险保障需求,实现大规模金融级运维场景下的容器服务落地。ALB 负载均衡(Ant Financial Load Balancer,ALB)是将...

GxP欧盟附录11标准合规包

13.1 应报告和评估所有事件,而不仅仅是系统故障和数据错误。应确定重大事件的根本原因,并应成为纠正和预防行动的基础。使用云安全中心企业版 使用云安全中心企业版或者更高级别的版本,视为“合规”。1.1 风险管理应贯穿计算机化系统的...

围绕混沌工程的平台实践

原则3在生产环境中运行实验 混沌工程推荐故障演练是在生产环境中进行,主要的原因有以下两点:系统的行为会根据环境和流量模式的变化,例如系统依赖的组件在测试环境和生产环境会有比较大的差异。系统的监控和人员的应急响应在测试环境和...

主从实例读写分离部署(共享存储)

数据状态保存在盘古分布式存储系统中,无需从计算节点迁移,计算节点轻量无状态,系统可以快速从故障中恢复。该方案为当前每个实例内部默认启用,当系统发生故障时,无需手工运维介入,系统可以自动恢复。在恢复期间,如果查询算子需要访问...

监控、诊断和故障排除

对于有效请求率低于100%的情况,您需要根据自己的使用情况进行分析,可以通过请求分布统计或者请求状态详情确定错误请求的具体类型、原因,并排除故障。对于某些业务场景,出现有效请求率低于100%是符合预期的。例如,用户需要先检查访问的...

2022年

企业级分布式批处理方案 1.4.2,2022-03-07 变更类型 功能描述 相关文档 新增 分布式任务调度系统SchedulerX 2.0的日志服务,您不需要修改一行代码,只需要增加一个Log4j或Logback的配置,即可在控制台看到每次任务调度(包括分布式任务)...

Tair选型指南

选择容灾方案 图 3.Tair容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主从节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。...

计算组管理

参数说明 系统表 hologres.hg_warehouses 中包含的字段信息如下:字段 字段类型 说明 示例值 warehouse_id INTERGER 计算组ID,是计算组的唯一ID。1 warehouse_name TEXT 计算组名称。init_warehouse cpu INTERGER 计算组的CPU(单位Core)...

SAP HANA Scale-Out 部署指南

SAP HANA Scale-Out 部署指南 概述 架构总览 资源规划 前期准备 阿里云账号 VPC ECS实例 ECS Metrics Collector的安装 文件存储NAS ECS宕机迁移 HANA安装 维护主机名 创建文件系统 准备OS以及安装包 安装SAP HANA 验证集群安装 版本管理 ...

常见问题

监控、升级、系统参数 为什么监控中存在数据中断情况?20.8后的版本是否支持平滑升级,不需要迁移数据?常用系统表有哪些?如何修改系统级别的参数?是否要重启,有什么影响?如何修改用户级别的参数?如何修改Quota?云数据库ClickHouse和...

配置任务常见错误码及排查方法

原因:购买实例的源数据库参数 分布式数据库节点数量 与实际数量不符。解决方法:购买实例时选择与实际相符的 分布式数据库节点数量。DTS.Msg.LXQueryOrder.NotFoundNormalOrder 对实例进行升降配或者转换支付方式时。说明 目前实例降配...

实时分析链路数据

如果异常请求集中在单台机器,可以尝试替换机器进行快速恢复,或者排查该机器的各项系统参数:例如磁盘空间是否已满、CPU Steal Time是否过高等。如果异常请求分散在多台机器,那么大概率可以排除单机故障因素,可以重点分析下游依赖服务或...

混沌工程缓存实战系列-Redis

Redis是一个开源高性能的Key-Value存储系统,虽然Redis本身具备了非常高的可用性,但是在实际应用中也会随着系统业务的复杂性以及不合理的使用,而导致很多的问题。本文将讲述如何通过混沌工程来暴露可能存在的使用风险,提升缓存问题的...

采集客户端数据的高可用方案

通过该机制,存储系统确保3个数据副本分布在不同服务器的不同物理磁盘上,单个硬件设备的故障不会造成数据丢失,同时确保3个数据副本之间的数据强一致性。因此对于单硬件设备故障风险,日志服务天然具备了可用性特征。但是在一些相对极端的...

源为PolarDB-X的功能规范和约束说明

由于 PolarDB分布式版 自身不提供Binlog以及其他的一些限制,在业务设计、运维变更、数据质量以及业务开发时,会受到如下规范的约束,请您在实际使用中注意。概览 业务设计规范 数据库架构规范 运维变更规范 数据质量风险声明 业务开发的...

源为PolarDB-X的功能规范和约束说明

由于 PolarDB分布式版 自身不提供Binlog以及其他的一些限制,在业务设计、运维变更、数据质量以及业务开发时,会受到如下规范的约束,请您在实际使用中注意。概览 业务设计规范 数据库架构规范 运维变更规范 数据质量风险声明 业务开发的...

常见问题

本文介绍 PolarDB PostgreSQL版 的常见问题和解答。基本问题 Q:什么是 PolarDB?A:PolarDB 是一个关系型数据库...此时您可以通过修改 innodb_fast_startup 参数值为 ON 来加速重启,关于如何修改参数,请参见 设置集群参数和节点参数

使用访问日志

全球加速提供访问日志功能,可以记录所有访问终端节点的流量信息,帮助您检查访问控制规则、排查网络故障等。访问日志介绍 您可以选择为全球加速实例的一个或者多个终端节点组创建访问日志,采集到的访问日志将会投递到终端节点组所在地域...

数学统计函数

语法 inverse_beta_cdf(α,β,p)参数说明 参数 说明 α 贝塔分布参数,double类型,取值大于0。β 贝塔分布参数,double类型,取值且大于0。p 逆累积分布函数的输入参数,double类型,取值范围为[0,1]。返回值类型 double类型 示例 查询和...

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

故障演练

故障隶属于单机或是分布系统之一,分布故障包含单机故障。对于单机或同机型的故障,以系统为视角,故障可能是当前进程内的故障,比如:如FullGC,CPU飙高;进程外的故障,比如其他进程突然抢占了内存,导致当前系统异常等。对于大多数...

演练场景说明

AHAS提供基础资源类场景和Kubernetes类场景,帮助分布系统提升容错性和可恢复性。每一个执行阶段的演练场景都对应一个恢复阶段的演练任务。恢复阶段的演练任务目的是清除故障演练的影响,使应用或服务恢复正常,通常不需要配置参数。本文...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

应用场景

故障恢复 通过ASM,可以轻松实现开箱即用的故障恢复功能:分布系统存在高度复杂性,在基础设施、应用逻辑、运维流程等环节都可能存在稳定性风险导致业务系统的失效。提供了基于Istio的混沌工程能力,包括如何使用连接池配置和异常检测...

单实例快速恢复

为了能够快速恢复系统故障,Hologres提供了单实例快速恢复的机制。本文为您介绍单实例快速恢复的触发条件和行为。实例快速恢复逻辑说明 Hologres在 V2.0版本之前,Hologres计算节点均为容器调度(即下图中的Worker Node),资源管理器...

编辑自定义功能

例如:将已定义的属性 电压 作为出参,则设备上报该故障事件时,将携带当前设备的电压值,用于进一步判断故障原因。当接入网关协议为OPC UA时,需设置参数索引,用于标记参数的顺序。说明 不能用以下系统保留参数作为输出参数的标识符:set...

什么是故障演练

故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景,能够帮助分布系统提升容错性和可恢复性。流程 故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。通过四阶段的...

概述

再者云计算平台会提供冗余存储和备份能力,避免系统因为硬件故障或其他原因导致的停机或数据丢失。这种备份机制可以提高系统的可靠性。责任共担模型 阿里云平台提供高可用的基础设施,并提供应用稳定性相关工具体系。用户可以基于阿里云...

单个添加物模型

例如:将已定义的属性 电压 作为出参,则设备上报该故障事件时,将携带当前设备的电压值,用于进一步判断故障原因。当接入网关协议为OPC UA时,需设置参数索引,用于标记参数的顺序。说明 不能用以下系统保留参数作为输出参数的标识符:set...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

调整Linux实例中limits系统参数的方法

该配置文件中的 nofile 参数系统中所有用户打开文件数的最大值,/proc/sys/fs/nr_open 为系统中单进程可分配的最大文件数,若系统中 nofile 参数值超过了 nr_oepn 参数值,则可能导致实例无法被远程连接。本文主要介绍调整 limits.conf ...

使用参数模板

参数模板分为系统参数模板和自定义参数模板两类。前提条件 RDS PostgreSQL实例需满足以下要求:实例为云盘版实例。实例大版本为RDS PostgreSQL 10或以上版本。背景信息 RDS PostgreSQL实例提供两种参数模板,具体如下:系统参数模板:创建...

使用参数模板

系统模板介绍 说明 RDS MySQL当前仅高可用系列、集群系列 和基础系列提供系统模板,三节点企业系列可以 新建自定义参数模板。RDS MySQL高可用系列、集群系列 和基础系列提供以下系统参数模板:默认参数模板 数据安全性最高,但读写速度较慢...

系统设置

变量系统 参数 说明 新增变量 单击 新增,可以在变量系统中添加一个变量,您可以设置变量的参数名称、参数类型和参数值。说明 变量类型包括但不限于字符串、布尔值和数值。删除变量 单击任一变量右侧的 图标,删除当前变量。相机系统 参数 ...

设计方案

基于稳定性支柱设计原则,整体稳定性设计方案可参考如下:架构设计原则 软件系统从所有的功能都在一个应用程序内运行的单体应用架构,到不同的功能模块分别部署在不同的服务器上的传统分布式应用架构,再到服务细分通过轻量级的通信机制...

创建 API

包括后端服务地址、后端Path、后端超时时间、参数映射、常量参数系统参数。后端基础定义 参数 描述 后端服务类型 目前支持HTTP/HTTPS、函数计算、VPC、OSS、Mock五种类型。HTTP(s):默认类型,后端是HTTP或者HTTPS协议的服务接入,当网关...

DT-MPC v3.1

0 0~1 扰动特性参数 系统未知扰动特性参数 10 0.01~5000 权重动态调整最小系数 权重调整最小比例 0.1 0.02~1 CV最大变化速率 CV最大变化速率 1e8 1e-5~1e8 外部预测序列 CV预测序列 0-1e5~1e5 使用比例 使用比例 0 0~1 CV变量及参数-等级...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云安全中心 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构
新人特惠 爆款特惠 最新活动 免费试用