默认

开启辅助访问

登录立即注册

即时通讯网资讯 [资讯] LeanCloud 6月30日即时通讯服务瘫痪43分钟！

即时通讯网 › 首页 ›资讯 › 查看内容

想开发IM：买成品怕坑？租第3方怕贵？找开源自已撸？尽量别走弯路了... 找站长给点建议

推荐即时通讯资料太杂？看技术专辑吧! / 需要帮助？去社区发贴吧! / 技术交流群：185926912

[资讯] LeanCloud 6月30日即时通讯服务瘫痪43分钟！

JackJiang · 8 年前 | 阅读（14675）· 评论（1）| 来源 LeanCloud 转发收藏0

摘要即时通讯云服务商LeanCloud 2016年6月30日因一组负责实时通信服务数据统计的缓存机器发生故障，而导致雪崩致使即时通讯服务瘫痪43分钟之久！

以下消息来自LeanCloud官方：

6 月 30 日晚上 8 点左右，我们的实时通信服务发生了故障，导致大量应用的终端用户无法登录和发送消息，时间持续约 40 分钟，详细情况汇总如下。

故障时间

2016-06-30日 19:58 － 20:41（共计 43 分钟）

影响范围

LeanCloud 国内节点的实时通信服务受到影响（无法登录和发送消息），其它服务正常；美国节点一切服务正常。

事故经过

19:58 一组负责实时通信服务数据统计的缓存机器发生故障，导致用户登录或发送消息出现阻塞，类似操作开始消耗内部线程池资源；
20:05 线程池资源耗尽，所有用户登录过程都会失败；
20:22 确定了故障原因，开始重启缓存服务程序，但是服务程序所在机器因为压力过大失去响应，转而重启物理机器；
20:33 缓存服务恢复正常，登录和发消息等请求开始恢复正常（为了加速我们新增了部分实时通信服务程序，以增加响应能力）；
20:41 实时通信服务恢复正常。
下图中的黄线是故障时段前后的登录请求数量变化趋势曲线，与上述故障时间线吻合：

后续改进措施

聊天服务监控程序改由 Marathon 来自动部署并执行。该监控程序因前期的一次操作而被暂停，结果未能捕捉到此次服务异常，所以我们加入程序化的手段来保证其始终运行。（已完成）
增加对统计数据缓存服务的监控。（已完成）
增加对于登录请求数异常变化的监控。（已完成）
进一步优化实时通信服务的架构，针对所有环节做好容错，防止类似的阻塞操作再次出现。（一周内解决）

即时通讯云 LeanCloud 官方网站：https://leancloud.cn/

来源：即时通讯网 - 即时通讯开发者社区！

0 推荐

旧一篇：
[动态] 融云SDK版本更新（ 2.6.4 Stable） 新一篇：
[动态] LeanCloud 2016年6月产品更新汇总

相关阅读

即时通讯云 LeanCloud 2月26日发生短暂服务故障

即时通讯云 LeanCloud 2月19日因技术故障致全部服务中断半小时

即时通讯云 LeanCloud 3月29日因高负载发生连锁服务故障

即时通讯云 LeanCloud 因DDoS攻击致即时通讯服务瘫痪

即时通讯云 LeanCloud 动态：服务稳定性提升及新的计费方式

[动态] 即时通讯云 LeanCloud：全新WEB端JS SDK3.0发布

[动态] 即时通讯云LeanCloud数据存储服务增加统计功能

[资讯] 即时通讯云环信摘取“2016中国最佳SaaS产品奖”

[资讯] 实时音视频工程WebRTC开源5周年！

[动态] 融云SDK版本更新（ 2.6.4 Stable）

[动态] LeanCloud 2016年6月产品更新汇总

[动态] 融云SDK版本更新（ 2.6.5 Stable）

[观点] 总结开源实时音视频技术WebRTC的优缺点

[动态] 即时通讯云网易云信版本更新（2.5.0版）

[资讯] 即时通讯云环信荣膺Gartner 2016 Cool Vendor

[活动] 容联云通讯C轮融资狂欢：认证送豪礼

[资讯] LeanCloud与腾讯合作推出移动开发云解决方案

[动态] 环信云客服v4.10更新：全新排队机制，十余项优化

[资讯] LeanCloud 7月13日即时通讯服务瘫痪48分钟！

[动态] 即时通讯云LeanCloud发布Swift版SDK

查看全部评论 (1) 发表评论

最新评论

JackJiang 8 年前: 现在的即时通讯云的技术和商业模式应该是有问题，否则照这样下去，云的规模越大，服务商的压力越大，为了实现弹性云，成本也就越来越大

微信扫一扫关注！

相关分类

程序员那点事

即时通讯方案hot[淘宝下单]

MobileIMSDK (v6.5精编版)

开源移动端即时通讯框架。

快速入门 / 性能 / 指南 / 提问
MobileIMSDK-Web (有偿开源)

轻量级Web端即时通讯框架。

详细介绍 / 精编源码 / 手册教程
RainbowAVnew (有偿开源)

移动端实时音视频框架。

详细介绍 / 性能测试 / 安装体验
RainbowChat (技术转让)

基于MobileIMSDK的IM系统。

详细介绍 / 产品截图 / 安装体验
RainbowChat-Web (技术转让)

一套产品级Web端IM系统。

详细介绍 / 产品截图 / 演示视频

本月热门资讯

技术好文分类[更多]

TCP/IP详解经典网络编程基础 NIO编程精选通信协议选型 IM架构篇 IM安全篇 IM群聊篇 IM热门讨论心跳保活篇 IM综合资料实时音视频开发 Web端实时通信推送技术好文 IM大厂技术分享社交产品总结精品资源下载通信技术高阶程序人生

最新社区主题[更多]

1拥抱国产化：转转APP的鸿蒙NEXT

2[已回复] MobileIMSDK中发现给刚

3[已回复] 什么时候搞一个C#的 mo

4一年撸完百万行代码，企业微信的

5[已回复] 求教MobileIMSDK微信小

6博客不可以上传头像，我edge不支

7[已回复] 我发现MobileIMSDK安卓

即时通讯网　

实时推送、IM等即时通讯相关技术的学习、交流与分享的平台。专业的资料、专业的人、专业的社区！让即时通讯技术能更好传播与分享。

平等开放分享传承

商务/合作：business@52im.net
投稿/报道：contact@52im.net

友情链接[友链交换]

关于

微信公众号new

即时通讯网微信公众号

—— 打开微信扫一扫，关注本站的公众号 ——

Copyright © 2014-2024 即时通讯网 - 即时通讯开发者社区 / 版本 V4.4

苏州网际时代信息科技有限公司 (苏ICP备16005070号-1）

返回顶部