然后拧动了信号生器的一个旋钮。
机柜前面板的黄色“故障”灯亮了,七段数码管显示了一组数字:o-o-o。
第六号机柜,第三块板卡,第二槽位。
吴国华走到机柜前面,根据数码管的提示,找到了那块板卡,按下锁紧机构,抽出抽屉,换上备用板卡,推回去,锁紧。
整个过程不到两分钟。
系统没有重启,任务没有中断。
终端屏幕上的数值还在跳动,仿佛什么都没生过。
io板卡热更换,分o秒,达标。
接着是存储板e纠错上限。
郑长枫在数据总线上注入了连续的双比特错误,这是e能纠正的极限。
诊断系统报出了警告:unrrectableerrordetecteddatarestoredfro
backup
系统从备份副本中恢复了数据,任务继续运行。
没有死机,没有数据丢失。
接着又是单机柜故障,这是更严酷的考验。
郑长枫直接拉下了一台存储机柜的总电源。
“嘭”的一声,六台存储机柜中的一台彻底黑了。
机柜前面板的红色故障灯亮了,诊断面板显示“st-ooffle”。
这章没有结束,请点击下一页继续阅读!
主控核心在o秒内检测到了故障,将原本分配给这台机柜的存储请求,全部重新路由到了其他五台机柜。
终端屏幕上的任务输出没有中断,甚至没有任何延迟。
吴国华走到故障机柜前面,打开柜门,检查了一遍,确认没有硬件损坏,然后重新推上电源。
机柜启动,自检,重新上线。
诊断系统自动将这台机柜加入存储池,恢复数据同步。
整个过程不到五分钟。
单机柜断电,系统无感知恢复,分o秒。
……
全系统级灾难,这是技术故障演练的最后一个场景,也是最极端的一个。
模拟主控核心软件死锁。
郑长枫在终端上敲了一个命令,模拟主核心进入死循环。
辅核心在个心跳周期后检测到了异常,自动接管了控制权。
黄色的“接管”指示灯亮了,绿色的“运行”灯没有灭。
终端屏幕上的任务输出没有中断。
然后是模拟全厂断电。
郑长枫拉下了机房的的总配电开关。
所有的灯光、所有的指示灯、所有的风扇,在一瞬间全部熄灭了。
机房陷入了短暂的黑暗,只有应急灯昏黄的光。
然后,柴油电机组启动了。
轰鸣声从地下传来,像一头被惊醒的巨兽。
台机柜的绿色指示灯依次亮起来,像多米诺骨牌。
从一号机柜到三十五号机柜,从左边传到右边,用了不到o秒。
系统从最后一次检查点恢复了任务。
终端屏幕上的数值继续跳动,仿佛那场断电只是一次短暂的眨眼。
如此每日循环往复,持续做了七八十轮。
整个集成组o多名成员,加上昆仑机的机组人员,轮番上阵。
吕辰甚至把在红星轧钢厂防静电车间组装的测试机柜般了来,配置了一个最小系统,进行各种极端故障抢修模拟。
安全威胁类,是纯军事环节。
这是昆仑机验收前新增的硬性要求,国防科委明确指示,昆仑机是国防重点工程,必须具备应对各种安全威胁的能力。