"); //-->
本文分享自天翼云开发者社区《浅谈故障复盘》,作者:朱****静
一、完善项目排障机制,做好预防性措施
1、完善项目内评审机制,关键操作执行前反复验证,如:是否抛出异常、返回值是否正确、确认操作结果是否符合预期等;
2、制定排障预案,严格按照排障流程执行操作;
3、研发人员需要输出详细的操作手册,手册详细记录操作内容、操作步骤、测试信息、回退方案等,确保现场人员根据操作手册可无误准确的执行操作;
4、增加hdfs清理回收站过期数据保留时长,降低数据丢失风险。
二、完善现场操作流程,严守部门故障修复制度
1、在程序上线前完整全面地进行checklist,变更事时至少2名研发人员在场,操作与检查同步进行;
2、检查待部署机器上的程序和新程序是否互相影响,包括环境变量、资源、工具包或本地库;
3、正式上线后,在生产环境操作时,故障发生后,严格遵守部门故障报送流程执行操作;
4、正式上线后,在生产环境操作时,上线、问题故障修复,严格遵守部门SOP及CCB变更流程操作执行。
三、提升技术能力,增强风险意识
1、研发人员具备风险识别意识,能够快速形成应急预案;
2、提升研发人员的排障能力和组件运维能力;
3、现场加强现场巡检,增加巡检频次。
专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们
相关推荐
Chiptorials ——使用ATECC608 TrustFLEX实现基本非对称身份验证
根据亚马逊首席技术官沃纳·沃格尔斯博士的说法,2026年及以后5项技术预测
安全电子爆竹
安全可靠的密码锁电路(CD4017)
几种用电指示灯的制作
安全可靠多功能充电器电路
保护人身和设备安全的固体传感开关
日本推出可用手机确认家中安全情况的服务
TechInsights 拆解:华为 MDC Pro 610 ADAS 控制器
从大理州苍山户外大赛看北斗与天通技术护航并实现“安全+生态”双重保障
Chiptorials——如何使用ATECC608 TrustFLEX实现公钥轮换
飞思卡尔杯-第六届设计应用大奖赛 优秀奖获奖论文2
中国信息安全不能居于“第四类”
别这么做:忽略最坏情况下的执行时间
Chiptorials ——如何将CryptoAuthLib库用于Microchip安全身份验证IC
TSA警告旅客避免使用免费机场Wi-Fi
Linux似乎正站在悬崖的边上?
基于CEC1712实现的处理器SPI FLASH固件安全弹性方案培训教程
新研究探讨可穿戴鲨鱼驱避装置
集成电路安全与系统科学思想的思考(上)
安全,运营商级WLAN应用要慎重
利用ECC608 TrustMANAGER和Kudelski IoT的keySTREAM SaaS进行现场凭证配置
哈尔滨中唯信息安全技术有限公司
限制AI/ML工具以确保物理AI的安全和保障
Quectel Matter over Thread 模块,实现智能家居互作性
量子计算将如何挑战 IoT 安全
报告称“AI 黑客时代已到来”
安全&底盘系统
交直流两用暗室安全灯
无线收发组件在安全方面的应用