- 凌晨 2 点,你的手机突然震动。网站宕机了,Slack 上满是红色警报,用户已经开始在推特上抱怨。你半睡半醒地盯着屏幕,完全不知道该从哪里着手排查。这是站点可靠性工程师(SRE)们再熟悉不过的场景。这些工程师必须不惜一切代价保障在线服务持续运行,而当服务中断时,压力值会瞬间飙升。故障恢复是一场与时间的赛跑,但大多数团队在真正开始排查问题前,就要花费第一个小时收集线索。“最初五分钟是恐慌期,” 纽伯德(NeuBird)首席执行官兼联合创始人高瑟姆・拉奥表示,“接下来的 25 分钟是召集团队确认问题 —— 比
- 关键字:
人工智能
系统故障
Hawkeye
hawkeye介绍
您好,目前还没有人创建词条hawkeye!
欢迎您创建该词条,阐述对hawkeye的理解,并与今后在此搜索hawkeye的朋友们分享。
创建词条
关于我们 -
广告服务 -
企业会员服务 -
网站地图 -
联系我们 -
征稿 -
友情链接 -
手机EEPW
Copyright ©2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
《电子产品世界》杂志社 版权所有 北京东晓国际技术信息咨询有限公司

京ICP备12027778号-2 北京市公安局备案:1101082052 京公网安备11010802012473