尊敬的极光客户:

  • 2019 年 04 月 09 日 19:30 - 22:30、2019 年 04 月 10 日 08:10 - 10:00左右,极光开发者部分出现推送无法下发或超时的情况,具体情况如下:

影响时间:

  • 2019 年 04 月 09 日 19:30 - 22:30、2019 年 04 月 10 日 08:10 - 10:00

影响范围:

  • 部分客户的Tag方式推送功能及设置Tag/Alias功能异常,少部分客户的广播和Alias推送功能异常。

原因及进展:

  • 2019 年 04 月 09 日 19:30 我司监控到Tag/Alias服务模块告警,经研发紧急排查发现因部分用户在短时间内极大量设置Tag/Alias,使整体使用量超过预期的弹性峰值,从而导致Tag/Alias缓存服务出现大量异常,根据内部逻辑,此时需要从磁盘恢复数据,同时在线Tag/Alias查询也渗透到磁盘进行查询,导致磁盘压力过大,进而影响到和Tag/Alias相关的推送服务。我司工程师紧急对磁盘资源及缓存资源进行扩容,22:00服务开始逐渐恢复,22:30服务完全恢复。
  • 2019 年 04 月 10 日 08:10 左右硬件资源到位在准备正式扩容之际,消息量早高峰加之昨晚故障期部分用户的消息补发导致再一次的Tag/Alias模块告警,研发同事在保证其他模块稳定工作的基础上尽最大努力快速恢复服务,10:00服务开始恢复正常。

后续改进:

  • 优化Tag/Alias的设置机制。
  • 对Tag/Alias的存储资源进行扩容,提高弹性峰值,避免此类事件再次发生。

因此给您带来的不便我们深表歉意,再次感谢您的理解与支持!
顺颂商祺!