运维事件中心

运维事件中心是企业业务连续性的运营管理平台,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能,一站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应、更短的故障时长、更...

全局流量管理

全局流量管理通过DNS实现应用服务的就近访问接入、多地址负载均摊,同时根据健康检查进行DNS Failover,实现应用服务的同城多活故障隔离和异地容灾。

负载均衡

负载均衡SLB(Server Load Balancer)是一种对流量进行按需分发的服务,通过将流量分发到不同的后端服务来扩展应用系统的服务吞吐能力,并且可以消除系统中的单点故障,提升应用系统的可用性。

应用高可用服务 AHAS

应用高可用服务AHAS是一款专注于提高应用高可用能力的SaaS产品,提供应用架构自动探测、故障注入式高可用能力演练、一键应用防护和增加功能开关等功能,可以快速低成本地提升应用可用性。

数据库自治服务 DAS

数据库自治服务DAS(Database Autonomy Service)是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务,帮助您消除人工操作引发的服务故障,有效保障数据库服务的稳定、安全及高效。

Node.js 性能平台

Node.js 性能平台(Node.js Performance ...应用提供性能监控、安全提醒、故障排查、性能优化等服务的整体性解决方案。\nNode.js 性能平台凭借对 Node.js 内核深入的理解,提供完善的工具链和服务,协助客户主动、快速发现和定位线上问题。

云数据库 OceanBase

自主研发的金融级分布式关系数据库,在普通硬件上实现金融级高可用,在金融行业首创“三地五中心”城市级故障自动无损容灾新标准,同时具备在线水平扩展能力,创造了 6100万次/秒处理峰值的业内纪录,在功能、稳定性、可扩展性、性能方面都...

性能分析

性能分析服务为移动 App 提供实时线上性能数据的“采集-分析-监控-告警...Android/iOS 应用类型,帮助客户建立 5 分钟线上故障感知能力,并与崩溃分析/远程日志服务配合使用,构建异常“感知-定位-恢复”的运维能力闭环,提升 App 使用体验。

崩溃分析

崩溃分析服务为移动 App 提供实时线上稳定性相关数据的“采集-分析-监控-告警”能力...应用类型,帮助客户建立 5 分钟线上故障感知能力,并与性能分析/远程日志服务配合使用,构建异常“感知-定位-恢复”的运维能力闭环,提升 App 使用体验。

工商变更

工商变更包括工商登记项发生变化,例如公司名称、地址、经营范围,注册资本、法人/董监高、股权等。

代码逻辑场景

限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障请求数的百分比,也可...

分类管理ABAC

背景信息: 某些企业员工流动大,导致员工对应的权限也需要频繁变动,加上满足特定条件的员工分布在不同的组织架构中,没有任何规律,如果管理员手动找出这些员工并授权,需要增加管理人员不少工作量,严重降低工作效率。...

日志聚类

本文介绍日志聚类功能及其操作,包括开启日志聚类、查看聚类结果和原始日志、对比不同时间段的聚类日志数量等。背景信息 日志服务提供日志聚类功能,支持在采集日志时,将相似度高的日志聚合,提取共同的日志模式(Pattern),快速掌握日志...

JVM注入动态脚本

受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障请求数的百分比,也可代表每次请求发生故障的概率。填写小于或等于0,则表示100% 发生故障。说明 仅填写百分比数字部分即可,即80%,填写80。请求过滤规则 否 无 通过...

实例的节点故障处理机制

当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于测试、培训、非核心业务等场景,生产环境建议使用副本集实例或分片集群实例以保障服务的高可用性。副本集 图 1.副本集架构 ...

时序聚类函数

时序聚类函数针对输入的多条时序数据进行聚类,自动聚类出不同的曲线形态,进而快速找到相应的聚类中心和异于聚类中的其它形态曲线。关于函数的算法及实现原理请参见LOG机器学习介绍(02):时序聚类建模。函数列表 函数 说明 ts_density_...

DeviceLinkDown

DeviceLinkDown事件提示您线下机构侧动态路由邻居发生故障或者静态接入链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换...

基本概念

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

聚类模型评估

基于原始数据和聚类结果,评估聚类模型的优劣性,从而输出评估指标。背景信息 评估指标Calinski-Harabasz又称VRC(Variance Ratio Criterion),其计算公式如下。参数 描述 SSB 聚类之间的方差,定义如下。其中:k:聚类中心点的数量。mi:...

K均值聚类

本文为您介绍算法组件中的K均值聚类组件。功能说明K均值聚类是一种矢量量化方法,在数据挖掘的聚类分析中很流行,目的是将n观察划分为多个k簇,其中每个观察都属于具有最均值的簇,作为簇的原型。计算逻辑原理使用KMeans算法进行建模。使用...

如何降低索引流量费用?

开启日志聚类功能后,索引总流量增加10%,示例如下表所示:原始日志大小 索引比例 日志聚类功能产生的索引量 索引总流量 100 GB 20%(20 GB) 100 GB×10%30 GB 100 GB 40%(40 GB)100 GB×10%50 GB 100 GB 100%(100 GB)100 GB×10%110 ...

概述

针对时序数据分析场景,日志服务提供了丰富的时序分析算法,可以帮助您快速解决时序预测、时序异常检测、序列分解、多时序聚类等场景问题,兼容SQL标准接口,大大降低了您使用算法的门槛,提高分析问题和解决问题的效率。功能特点 支持单...

应急预案:专有云V3环境中AnalyticDB相关机器故障紧急...

1.概述 本文主要介绍在专有云V3环境中,AnalyticDB相关机器故障紧急维修...在专有云V3环境AnalyticDB相关机器发生故障,需要进行下线维修。3.解决方案 详情请参见以下KB文档。KB 123746 通用方案:专有云V3环境中AnalyticDB机器的RMA处理流程

替换主机

当主机发生故障后,如果您创建专属集群MyBase时主机故障处理策略选择的是手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会通过...

人脸聚类

使用人脸聚类功能,你可以将媒体集中存在相似人脸的多张图片进行分组,可用于网盘的人脸相册、家庭监控的陌生人检测、甚至新零售的顾客管理等场景。人脸聚类后,您可以根据人脸分组查询对应人员的所有图片信息。您可以通过不同语言的SDK...

替换主机

当主机发生故障后,如果您创建专属集群MyBase时主机故障处理策略选择的是手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会通过...

日志管理

如果发生故障,您可以下载日志或提供日志上传路径给阿里云工程师定位问题。下载日志 在浏览器中,输入https://<块网关IP地址>访问本地块网关控制台。输入用户名和密码,单击确认。单击关于,进入关于系统页面。找到日志信息区域,单击下载...

日志管理

如果发生故障,您可以下载日志或提供日志上传路径给阿里云工程师定位问题。操作步骤 在浏览器中,输入https://<文件网关IP地址>访问本地文件网关控制台。输入用户名和密码,单击确认。单击关于,进入关于系统页面。找到日志信息区域,单击...

DDH故障迁移

若您未开启DDH故障迁移服务,DDH发生故障停机后,您需要提交工单申请置换一台健康的DDH。注意 DDH因故障迁移完成后,DDH ID及ECS实例的元数据(例如实例ID、私有IP地址、公网IP地址)均保持不变,但是由于更换了物理服务器,DDH的机器码会...

K均值聚类

K均值聚类首先随机选择K个对象作为每个簇的初始聚类中心,然后计算剩余对象与各簇中心的距离,将其分配至距离最近的簇,再重新计算每个簇的聚类中心。该算法假设聚类对象为空间向量,且以各聚类内部的均方误差和最小为目标,不断地进行计算...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在故障详情页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障通告...

修改DDH故障迁移配置

若您未开启DDH故障迁移服务,DDH发生故障停机后,您需要提交工单申请置换一台健康的DDH。注意 本地SSD型DDH(例如本地SSD型i2)不支持自行手动迁移和故障时自动迁移。如果本地SSD型DDH出现故障,您可以提交工单申请人工迁移,但迁移后本地...

备份和灾难恢复

故障切换回切:通过DNS将应用IP从原生产中心修改到灾备中心,实现故障切换和服务恢复机制主站发生故障时,由备站继续提供服务。3.两地三中心 业务部署模式:目前相同的业务应用可以分别部署在阿里云两个城市的三个数据中心中(杭州两个机房...

应急预案:OSS物理机关机维修和系统重新克隆的方法

OSS物理机发生故障,每次只能下线一台,请合理安排窗口期。在机器下线过程中,需要对盘古ChunkServer上的数据做备份,请预留出足够的时间做变更。如果KV_Master不为3台或者5台,或者Checkready检查异常,需要联系阿里云技术支持获取帮助。...

应用场景

当其中一部分ECS实例发生故障后,负载均衡会自动屏蔽故障的ECS实例,将请求分发给正常运行的ECS实例,保证应用系统仍能正常工作。同城容灾(多可用区容灾) 为了提供更加稳定可靠的负载均衡服务,阿里云负载均衡已在各地域部署了多可用区以...

CreateGroupFacesJob

调用CreateGroupFacesJob接口对媒体集中的人脸进行聚类操作,即将同一人物的人脸分为一组并生成人脸分组的GroupId。背景信息 人脸聚类任务执行完成后,使用ListFaceGroups接口查看已有分组列表,并可以使用FindImages接口根据GroupId搜索该...

同城容灾 解决方案架构

当主用机房的数据库发生故障时,业务切换至备用机房的数据库。A-S模式:同城两机房中部署完全一致的系统,其中一个机房(Standby)的资源完全用于备份,不对外提供业务。当主用机房(Active)发生故障时,业务切换至备用机房。A-A模式:...

人脸聚类相关问题

本文介绍了在使用人脸聚类过程中可能遇到的问题。为什么无法生成人脸分组?为了确保人脸分组的准确性,生成分组需要满足如下条件: 使用IndexImage将图片添加到媒体集。同一个人物在媒体集中的图片必须大于或等于3张,并且至少有3张符合...

更新历史

人脸聚类效果优化。提供人脸聚类分组的合并功能。2019-03-11 功能更新 提供人脸聚类功能公测。易用性优化。2018-12-28 功能更新 新增媒体集(Set)概念。提供基于媒体集的接口。2018-12-05 迭代优化 增加人脸异步任务。修复大量数据下group...

演练场景说明

故障演练场景是演练任务的核心。AHAS提供基础资源场景和Kubernetes场景,帮助分布式系统提升容错性和可恢复性。每一个执行阶段的演练场景都对应一个恢复阶段的演练任务。恢复阶段的演练任务目的是清除故障演练的影响,使应用或服务恢复...
< 1 2 3 4 ... 134 >
跳转至: GO

新品推荐

你可能感兴趣

热门推荐

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折