业务多活容灾解决方案
多活容灾是在阿里巴巴电商业务环境演进出来的新一代容灾解决方案,其包含同城多活容灾场景和异地多活容灾场景。该方案可以将业务恢复和故障恢复解耦,有基于灵活的规则调度、跨域跨云管控、数据保护等能力,保障故障场景下的业务快速恢复,助力企业的容灾稳定性建设。
方案架构
异地多活业务架构
同城多活业务架构
数据库UNIT类型多活架构
数据库COPY类型多活架构
数据库TP业务多活架构
数据库AP业务多活架构
异地多活业务架构
同城多活业务架构
数据库UNIT类型多活架构
数据库COPY类型多活架构
数据库TP业务多活架构
数据库AP业务多活架构
异地多活业务架构
异地多活从业务视角来看是通过对业务做自顶向下的流量隔离来实现的,按照某一个分流维度对业务流量进行划分,并路由到不同的地域。每个单元内的业务架构分为接入层、服务层、数据层。
可以解决的问题
流量管理难度高
数据同步策略复杂
容灾切换数据质量保障难
多数据中心统一管控难度大
方案优势
业务即容灾:各个数据中心既是业务体系也是容灾系统
业务连续性保障:可实现分钟级的容灾切换
业务高速发展支撑:各个数据中心均可读写,具备水平扩展能力以及跨地域的快速扩建能力
流量有效隔离:各个数据中心承载的流量大小可灵活调配
成本有效控制:有效分摊各个数据中心成本
推荐产品
同城多活业务架构
同城多活基于阿里云现有成熟的云产品容灾能力,为中小企业构建全站跨可用区容灾能力,实现机房故障分钟级切换。主要覆盖包括流量路由,接入层,应用层,中间件,数据库,大数据等绝大部分技术场景。
可以解决的问题
单可用区部署,面对机房级故障只能消极被动等待
多可用区部署,微服务、MQ等流量无法从故障可用区逃逸
多可用区部署,微服务调用由于跨机房网络延迟造成性能问题
不支持灰度发布,业务创新不灵活
方案优势
建设难度低:低成本,易实施,周期短
多年积累:阿里巴巴多年容灾架构经验积累,方案成熟、稳定、可靠
业务级容灾:全站跨可用区容灾,故障场景业务分钟级恢复
流量封闭:微服务调用在机房内封闭,避免跨机房调用RT增大
业务高速发展支撑:多中心在线,可搭建灰度发布流程,使创新更灵活
数据库 UNIT 类型多活架构
每个单元部署独立的数据库系统,单元之间通过数据传输服务进行数据【双向】实时同步,保持每个单元都有全量数据,每个单元均可进行读写操作,读写流量会根据业务定制的分流策略进行单元写保护,这种同步策略用于支持服务层的单元化服务类型,是多活场景的核心同步策略。
架构特点
流量管理难度高各单元内部署独立 RDS、PolarDB-X 以支持您的在线业务系统。阿里云 RDS、PolarDB-X 实现了与多活管控系统的无缝对接,实现基于中心的一键建单元能力
各单元数据库为上层业务提供读写服务,每个单元保存全量业务数据,主要用于支撑单元化服务
通过数据传输服务的双向同步功能实现 RDS、PolarDB-X 的跨云同步。解决多活场景跨地域(数百公里~数千公里)数据同步的压缩、高效传输、数据防循环等技术难题
实时向上层多活管控系统上报数据同步状态,实施单元间流量切换时的数据保护策略
单元内通过数据传输服务实现 RDS、PolarDB-X 到 ADB 的数据同步,实现单元内 AP 业务、TP 业务均可多活
推荐产品
数据库 COPY 类型多活架构
每个单元部署独立的数据库系统,单元之间通过数据传输服务进行数据逻辑单向实时同步,保持每个单元都有全量数据,中心单元可进行读写,非中心单元只提供读服务。这种同步策略用于支持中心化服务和普通服务,中心化服务路由回中心执行,普通服务可在单元内进行读。
架构特点
各单元内同样部署独立 RDS、PolarDB-X 以支持在线业务系统
中心单元为上层业务提供读写服务,其他单元提供只读服务,每个单元保存全量业务数据,主要用于支撑中心化服务和普通服务
通过数据传输服务的单向同步功能实现 RDS、PolarDB-X 的跨云同步
实时向上层管控系统上报数据同步状态,实施单元间流量切换时的数据保护策略
单元内通过数据传输服务实现RDS、PolarDB-X到ADB的数据同步,实现单元内AP业务、TP业务均可多活(单元只读能力)
推荐产品
数据库 TP 业务多活架构
OLTP(On-Line Transaction Processing)业务通常流量较大,但查询逻辑简单,对访问延迟比较敏感,同时有事务要求。
可以解决的问题
多活流量控制
多活数据同步
多活配置
多活场景运维
多活容灾切换
方案优势
基于此方案可以轻松解决多活在基础设施方面的各类问题,从而让客户更加专注于设计业务的分流策略
推荐产品
数据库 AP 业务多活架构
OLAP(On-Line Analytical Processing)业务通常流量较小,数据时效性要求低,但查询逻辑复杂。针对 AP 业务的多活实现会复用 TP 业务多活中的数据同步能力,是 TP 业务多活能力的延伸。
可以解决的问题
多活流量控制
多活数据同步
多活配置
多活场景运维
多活容灾切换
方案特点
通常 AP 业务并不是独立存在的,会以 TP 业务的存储系统作为上游,将 TP 业务实时产生的增量数据批量或实时的同步到 AP 业务的存储系统 ADB 中,供 AP 业务进行复杂的查询
推荐产品