一次Redis生产事故,公司损失百万
一、前因公司有个核心项目redis的客户端一直是使用的jedis,后面技术负责人要求把jedis客户端替换成效能更高的lettuce客户端,同时使用spring框架自带的RedisTemplate类来操作redis。然而世事难料,就是这么一个简单的需求却让老师傅翻了船。。。二、事故预演按照预设的结果...

老大让我复盘上次Redis缓存雪崩事故
事故背景公司最近安排了一波商品抢购活动,由于后台小哥操作失误最终导致活动效果差,被用户和代理商投诉了。老大让我带同事们一起复盘这次线上事故。什么原因造成的?抢购活动计划是零点准时开始,22:00 运营人员通过后台将商品上线23:00后台小哥已经将商品导入缓存中,提前预热抢购开始的瞬间流量非常大&am...

Redis Cluster 宕机引发的事故(下)
五、解决问题定位后首先去Github上的查看相关问题是否有人遇到,在查询后发现此问题有人在去年11月提了PR解决了此问题,链接如下:https://github.com/xetorthio/jedis/pull/1633官方目前释放出了2.10.0-m1和3.0.0-m1中解决了此问题,但是由于不是...

Redis Cluster 宕机引发的事故(上)
一、演练过程Redis 集群环境:1. 测试环境:Redis Cluster 配置 :Redis 3主 3从 一共6个节点。2. 预发环境:Redis Cluster 配置 :Redis 3主 3从 一共6个节点。 下面是我们操作的时间线: 第一天程序运行中关闭任意一台从节点,测...
如何访问 redis 中的海量数据?避免事故产生
目录 前言 事故产生 分析原因 解决方案 总结 前言 有时候我们需要知道线上的redis的使用情况,尤其需要知道一些前缀的key值,让我们怎么去查看呢?今天老顾分享一个小知识点 事故产生 因为我们的用户token缓存是采用了【user_token:userid】格式的key,保存用户的token的值...
记一次redis挂机导致的服务雪崩事故,哦不对,是故事~
事故时常有,最近特别多!但每次事故总会有人出来背锅!如果不是自己的锅,解决了对自己是一种成长。如果是自己的锅,恐怕锅大了,就得走人了,哈哈哈。。。 这不,最近又出了一个锅:从周五开始,每天到11点就不停的接到服务器报警,对于一般的报警,我们早已见怪不怪了,然后作了稍微排查(监控工具: CAT),...
容器混搭搞出线上 Redis 事故,这坑我先踩为敬
事情是这样的, 现在有一个 redis 3.0 集群节点都是裸 redis 或 host 网络模式部署的容器 redis (基本上跟裸 redis 差不多), 需要把它们替换成 macvlan 网络模式的 redis 容器, 以显得我们的 dockerized redis cluster 很上档次。...
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面底部提交“技术工单”与我们联系。
产品推荐
热门帮助文档
社区圈子