一、 对比组(替换法)
在有些情况,无法确定问题,就需要做实验,通过每次修改不同变量,来确定问题。在进行对比实验时,每次只能有一个变量作为变化,避免一次修改多个变量导致对实验结果推断的错误。在进行实验时要详尽的记录实验环境和操作步骤,以便为以后现象复现提供依据。
在日常工作中常用的对照组有故障前和故障后,通过思考故障前后操作的内容,以推断是故障可能出现的原因。
时间服务器接收不到卫星信号?
***步先采用拆分法,定位问题。天线部分实际上可分为三部分,蘑菇头,线,设备。
测试设备ANT是否有5V,确定设备端是否正常;测试天线是否有阻值,以判断线是否完整。如果上述都正常就可以采用替换法,先移动蘑菇头放置的位置,将蘑菇头放置在室外空旷位置,测试5分钟是否接收到卫星信号。在排除天线和蘑菇头问题外,可以更好的确定设备确实是否是设备故障。
时间服务器授时不同步问题排查步骤图表
二、 终局思维
这件事本身是为了解决什么问题?回到事物需要解决的本源上去思考应该采取什么操作。终局思维要从客户的***开始想解决的需求上去思考,而不是将思维限定在客户开始设定的解决思路上。例如客户经常会对NTP监控提出各种解决办法,站在终局思维去思考,无非是证明NTP系统是否是正常的。
根据此出发监控指标就只有三个:设备两台之间偏差小于15毫秒,设备对外提供服务器正常,客户端同步服务器正常。这个三个指标有个简单的判断,直接在客户端执行ntpq–p,时间源前面为*和+的就是代表整个系统是正常的。遇到无法同步的解决思路,原因是万兆交换机和子钟波百兆特率不匹配,客户要的是时间显示正常,随便找个系统内设备作为二级就可以了。
三、搁置问题
搁置观察问题,不是说不解决;其基本思路是系统的复杂性导致我们不能直接给出解决办法,故障的情况如果是问题就一定还会复现,如果不在复现,那么本身可能是某种未知的偶然性问题,本身不解决问题也不大。在实际工作中,搁置的问题一定要跟客户约定再次沟通的时间,只有当观察一段时间问题未在出现,那么问题才可以真正将其列为不在次范畴的问题。
什么问题适合搁置?
不知道什么原因导致的问题,猜测一种测试思路,让客户先测试一下。
四、概率的大小
任何事物都有一定的正确分布概率,思考问题的思路一定优先从大概率事件思考,当大概率可能排除后,才可以思考这件事的概率情况。例如:客户反应新的HJ210设备其中一个网口不能使用的,ping不通网口,更换一台设备后,运行一个月设备又出现这样的现象。根据以往经验HJ210的工控机没出现过这样的现象,一般工控机的故障在运行四五年之后才会出现,判断可能是设备两个网口设置在通一个IP段内,导致只有一个口可通信。
总结:
NTP服务器所出现的各种问题都是可以按章排除的,有时需要客户耐心一点,配合技术工程师一步步的完成操作,完全可以解决授时过程中的一些困境。
扫一扫咨询微信客服