运维事件中心

运维事件中心是企业业务连续性的运营管理平台,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能,一站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应、更短的故障时长、更...

全局流量管理

全局流量管理通过DNS实现应用服务的就近访问接入、多地址负载均摊,同时根据健康检查进行DNS Failover,实现应用服务的同城多活故障隔离和异地容灾。

负载均衡

负载均衡SLB(Server Load Balancer)是一种对流量进行按需分发的服务,通过将流量分发到不同的后端服务来扩展应用系统的服务吞吐能力,并且可以消除系统中的单点故障,提升应用系统的可用性。

应用高可用服务 AHAS

应用高可用服务AHAS是一款专注于提高应用高可用能力的SaaS产品,提供应用架构自动探测、故障注入式高可用能力演练、一键应用防护和增加功能开关等功能,可以快速低成本地提升应用可用性。

数据库自治服务 DAS

数据库自治服务DAS(Database Autonomy Service)是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务,帮助您消除人工操作引发的服务故障,有效保障数据库服务的稳定、安全及高效。

Node.js 性能平台

Node.js 性能平台(Node.js Performance ...应用提供性能监控、安全提醒、故障排查、性能优化等服务的整体性解决方案。\nNode.js 性能平台凭借对 Node.js 内核深入的理解,提供完善的工具链和服务,协助客户主动、快速发现和定位线上问题。

云数据库 OceanBase

自主研发的金融级分布式关系数据库,在普通硬件上实现金融级高可用,在金融行业首创“三地五中心”城市级故障自动无损容灾新标准,同时具备在线水平扩展能力,创造了 6100万次/秒处理峰值的业内纪录,在功能、稳定性、可扩展性、性能方面都...

性能分析

性能分析服务为移动 App 提供实时线上性能数据的“采集-分析-监控-告警...Android/iOS 应用类型,帮助客户建立 5 分钟线上故障感知能力,并与崩溃分析/远程日志服务配合使用,构建异常“感知-定位-恢复”的运维能力闭环,提升 App 使用体验。

崩溃分析

崩溃分析服务为移动 App 提供实时线上稳定性相关数据的“采集-分析-监控-告警”能力...应用类型,帮助客户建立 5 分钟线上故障感知能力,并与性能分析/远程日志服务配合使用,构建异常“感知-定位-恢复”的运维能力闭环,提升 App 使用体验。

配置持久内存的使用方式

持久内存中数据的可靠性取决于物理服务器和持久内存设备的可靠性,因此存在单点故障风险。建议您在应用层做好数据冗余,将需要长期保存的业务数据存储到云盘上,以保证应用数据的可靠性。本文示例中使用的配置如下:实例规格:ecs.re6p.2...

如何管理故障

本文档主要介绍如何管理故障故障发生条件当事件重要程度上升、整体影响面恶化、持续长时间未解决,综合评估已达到故障时(P1-P4),处理人可手动将事件升级为故障故障过程故障过程用于记录管理故障处理的全过程。当故障处于 处理中/已...

功能特性

云数据库Redis版支持多种架构,数据可持久化存储,可用性高,且支持弹性扩展和智能运维。架构灵活 双机热备架构 系统工作时主节点(Master)和备节点(Replica)数据实时同步,主节点故障时系统自动进行秒级切换,备节点接管业务(期间会有...

持久内存型

除了降低成本之外,持久内存型还能带来应用架构的简化,可将目前流行的应用+缓存+持久存储的架构模型,演进为更加简洁的应用+具备持久能力的内存数据库的架构模型,下图所示。产品优势 持久内存型基于Intel傲腾™持久化内存硬件,提供大...

产品优势

数据持久化存储:内存+硬盘的存储方式,在提供高速数据读写能力的同时满足数据持久化需求。分钟级监控 提供基于引擎和资源的分钟级别历史监控。提供各数据结构和接口的监控信息,访问情况一目了然,便于用户对云数据库 Memcache 版的使用...

标准版-双副本

标准版-双副本采用主从架构,不仅能提供高性能的缓存服务,还支持数据高可靠。简介 标准版-双副本模式采用主从(master-replica)模式搭建。主节点提供日常服务访问,备节点提供HA高可用,当...排序、计算类较多的业务建议选用集群版配置。

API概览

故障新增备注小计 FinishProblem 故障完结 ListProblemSubtotals 故障小计列表 RecoverProblem 故障恢复 ReplayProblem 故障复盘 RevokeProblemRecovery 故障撤销恢复 UpdateProblemNotice 更新故障通告 CreateProblemMeasure 创建故障改进...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

持久化存储

本章将为您介绍如何使用平台能力在自研节点中进行持久化存储,由于健康检查及恢复机制的存在,自研节点需要通过本章介绍的功能才能实现数据本地存储后在节点重启等情况下数据不丢失。table th:first-of-type{ width:160px;} 参数名称 参数...

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。功能简介故障注入流程如下所示:在微服务中,其实现方式为:管控台...

Redis持久化策略

云数据库Redis版支持两种持久化策略:RDB持久化和AOF持久化。本文将为您介绍这两种策略的特性及相关的控制台操作,您可以灵活地调整Redis持久化设置,打造更符合业务需求的Redis服务。RDB持久化 RDB持久化是指Redis周期性地为引擎中保存的...

修改DDH故障迁移配置

本章节介绍在创建DDH后如何修改DDH故障迁移配置。背景信息 故障迁移服务开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启DDH故障迁移服务,DDH发生故障停机后,您需要提交工单申请置换一台健康的DDH。注意 本地SSD型DDH...

持久内存型

本文介绍云数据库Redis企业版持久内存型的规格(含标准架构和集群架构),包含内存容量、连接数、带宽等信息。购买方式 创建Redis企业版云盘实例 术语介绍 持久内存型 Redis企业版持久内存型(简称持久内存型)基于Intel 傲腾™持久内存,...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。配置故障注入规则登录 SOFAStack 控制台。在左侧菜单栏选择 中间件...

如何管理事件

本文档主要介绍如何管理事件。事件来源通过流转规则触发的系统事件;通过手动新增的人工事件。事件的状态已分配:事件已分配处理人,可点击“响应”按钮进行接手;已响应:事件已被处理人接手响应,在处理完事件后,可点击“完结”按钮进行...

DDH故障迁移

一台DDH基于一台指定的物理服务器,可能会因为故障而自动停机。为了降低物理故障对您业务的影响,阿里云为您提供DDH故障迁移服务。您可以在创建DDH时或创建DDH后配置DDH故障迁移。创建DDH时,在其他设置区域,选中宿主机故障时自动迁移。...

演练概述

基于阿里巴巴多年业务的真实线上故障库的积累,AHAS故障演练模块为您预定义了丰富的测试任务,检验应用的高可用能力。故障演练支持对部署在阿里云ECS实例、容器服务Kubernetes集群、K8s架构类应用、Java类应用进行故障演练。一次完整的故障...

故障隔离

某个服务故障或者异常时,如果该服务触发熔断会造成整个服务的不可用。而故障隔离能够定位到异常的服务实例,实现实例级别精细化的隔离和摘流,使故障影响的范围更小、更可控。配置故障隔离规则登录 SOFAStack 控制台。在左侧菜单栏选择 ...

云数据库Redis支持数据持久化吗?

本章节介绍云数据库Redis的数据持久化机制。云数据库Redis社区版采用内存加硬盘的方式存储数据,通过AOF和RDB文件将Redis实例中的数据持久化保存到硬盘中。您可以在Redis管理控制台进行备份与恢复。除此以外,云数据库Redis企业版从访问...

故障演练常见问题

故障不生效的原因较多,可能是参数配置不正确或无对应的请求命中,但故障规则已成功下发,需要计费。刚刚购买的资源包为什么会被扣减次数?因为购买前已产生欠费,购买资源包后会先扣减所欠的次数。子账号的消费是否独立计费?不是,与主...

测试环境

本文介绍Redis企业版(持久内存型)性能测试所使用的具体环境。产品概述 Redis企业版(持久内存型)基于Intel 傲腾™数据中心级持久内存,为您提供大容量、兼容Redis的内存数据库产品。单实例成本对比Redis社区版最高可降低30%,且数据持久...

什么是故障演练

故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景,能够帮助分布式系统提升容错性和可恢复性。流程 故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。通过四阶段的...

弹性Web托管服务等级指标

故障恢复能力阿里云为付费用户的云服务提供7×24小时的运行维护,并以在线工单和电话报等方式提供技术支持,具备完善的故障监控、自动告警、快速定位、快速恢复等一系列故障应急响应机制。1.10网络接入性能弹性Web托管针对应用负载情况,...

代码逻辑场景

本文列出了故障演练支持的代码逻辑场景。篡改Java方法返回值 修改Java指定方法的返回值,返回指定的值。参数名称 是否必选 默认值 参数说明 类名 是 无 完整的类名,包含包名。例如:com.alibaba.service.XxxService。如果模拟接口故障,需...

应用场景

故障跟踪:支持对故障进展、故障影响面、舆情反馈、Timeline进行在线化管理、协同,提升故障处理效率。故障复盘:基于最佳实践经验,沉淀了对故障进行深度复盘的结构化要求,形成了线上检查点,以产品的方式承载流程落地。故障改进:支持对...

开源ChaosBlade与商业化AHAS CHAOS故障演练对比

ChaosBlade是一款简单易用且功能强大的混沌实验实施工具,AHAS CHAOS故障演练是ChaosBlade的商业化产品。本文介绍AHAS CHAOS故障演练与开源ChaosBlade的能力对比。产品简介 开源ChaosBlade与商业化AHAS CHAOS故障演练的特点如下: 开源...

应用故障自动诊断

如果发现问题,则会在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地发现和解决问题。常见的故障自动诊断场景RT突增 下游业务导致的本应用的RT突增,您可以联系...

同城多活架构实践

本文介绍同城多活容灾架构的建设原则和难点,并通过一个电商业务案例,介绍如何基于MSHA来快速、无侵入的帮助业务实现同城多活容灾架构。同城多活架构介绍 同城多活(DB主备)的架构图如下:同城多活架构包含以下主要特征:应用可用区级多...

同城多活架构实践

本文介绍同城多活容灾架构的建设原则和难点,并通过一个电商业务案例,介绍如何基于MSHA来快速、无侵入的帮助业务实现同城多活容灾架构。同城多活架构介绍 同城多活(DB主备)的架构图如下:同城多活架构包含以下主要特征:应用可用区级多...

什么是云数据库Redis版

数据持久化不依赖传统磁盘,保证每个操作持久化的同时提供近乎Redis社区版的吞吐和延时,极大提升业务数据可靠性。容量存储型:基于云盘ESSD研发,兼容Redis核心数据结构与接口,可提供大容量、低成本、强持久化的数据库服务,适用于兼容...
< 1 2 3 4 ... 62 >
共有62页 跳转至: GO
产品推荐
负载均衡SLB 块存储 数据库自治服务 云服务器 商标 SSL证书 轻量应用服务器
这些文档可能帮助您
DAS专业版费用说明 开通AHAS 什么是应用高可用服务AHAS 什么是架构感知 基于域名或URL路径进行转发 什么是PolarDB

新品推荐

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折

你可能感兴趣

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化

热门推荐

切换为移动版

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折