一次Redis生产事故,公司损失百万

一、前因公司有个核心项目redis的客户端一直是使用的jedis,后面技术负责人要求把jedis客户端替换成效能更高的lettuce客户端,同时使用spring框架自带的RedisTemplate类来操作redis。然而世事难料,就是这么一个简单的需求却让老师傅翻了船。。。二、事故预演按照预设的结果...

老大让我复盘上次Redis缓存雪崩事故

老大让我复盘上次Redis缓存雪崩事故

事故背景公司最近安排了一波商品抢购活动,由于后台小哥操作失误最终导致活动效果差,被用户和代理商投诉了。老大让我带同事们一起复盘这次线上事故。什么原因造成的?抢购活动计划是零点准时开始,22:00 运营人员通过后台将商品上线23:00后台小哥已经将商品导入缓存中,提前预热抢购开始的瞬间流量非常大&am...

Redis入门及实战

6 课时 |
1896 人已学 |
免费

Redis入门到精通(进阶篇)

66 课时 |
1226 人已学 |
免费

Redis入门到精通(基础篇)

46 课时 |
1058 人已学 |
免费
开发者课程背景图
Redis Cluster 宕机引发的事故(下)

Redis Cluster 宕机引发的事故(下)

五、解决问题定位后首先去Github上的查看相关问题是否有人遇到,在查询后发现此问题有人在去年11月提了PR解决了此问题,链接如下:https://github.com/xetorthio/jedis/pull/1633官方目前释放出了2.10.0-m1和3.0.0-m1中解决了此问题,但是由于不是...

Redis Cluster 宕机引发的事故(上)

Redis Cluster 宕机引发的事故(上)

一、演练过程Redis 集群环境:1. 测试环境:Redis Cluster 配置 :Redis 3主 3从 一共6个节点。2. 预发环境:Redis Cluster 配置 :Redis 3主 3从 一共6个节点。 下面是我们操作的时间线: 第一天程序运行中关闭任意一台从节点,测...

如何访问 redis 中的海量数据?避免事故产生

目录 前言 事故产生 分析原因 解决方案 总结 前言 有时候我们需要知道线上的redis的使用情况,尤其需要知道一些前缀的key值,让我们怎么去查看呢?今天老顾分享一个小知识点 事故产生 因为我们的用户token缓存是采用了【user_token:userid】格式的key,保存用户的token的值...

记一次redis挂机导致的服务雪崩事故,哦不对,是故事~

事故时常有,最近特别多!但每次事故总会有人出来背锅!如果不是自己的锅,解决了对自己是一种成长。如果是自己的锅,恐怕锅大了,就得走人了,哈哈哈。。。   这不,最近又出了一个锅:从周五开始,每天到11点就不停的接到服务器报警,对于一般的报警,我们早已见怪不怪了,然后作了稍微排查(监控工具: CAT),...

容器混搭搞出线上 Redis 事故,这坑我先踩为敬

事情是这样的, 现在有一个 redis 3.0 集群节点都是裸 redis 或 host 网络模式部署的容器 redis (基本上跟裸 redis 差不多), 需要把它们替换成 macvlan 网络模式的 redis 容器, 以显得我们的 dockerized redis cluster 很上档次。...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

社区圈子

云原生多模数据库Lindorm
云原生多模数据库Lindorm
Lindorm是适用于任何规模、多种类型的云原生数据库服务,支持海量数据的低成本存储处理和弹性按需付费,兼容HBase、Solr、SQL、OpenTSDB等多种开源标准接口,是互联网、IoT、车联网、广告、社交、监控、游戏、风控等场景首选数据库,也是为阿里巴巴核心业务提供支撑的数据库之一。
1211+人已加入
加入
相关电子书
更多
2023云栖大会:阿里云Redis - 更稳更快更好用
阿里开发者手册-Redis专题
国内开发者与Redis开源社区的发展
立即下载 立即下载 立即下载