一小时原则
经验表明,缺乏经验的网管员,尤其是刚入行的,更容易误入歧途。在查找问题时视野狭窄或者错过了即时的观察就有可能误入歧途。狭窄的视野是一个陷阱,没有考虑到外部因素可能会产生问题。外部因素有时也会导致灾难。在我刚入行的时候,总是从主管的角度来观察网络环境,但实际上,总有一些在我控制之外的因素也会对我们产生影响。
在任何一种情况下,基本上应该将排除故障恢复状态寻求帮助的工作时间限制为一小时。我比较倾向的方法是只进行一个小时解决服务器等问题的工作,如果不能解决问题或者保证合理的结束,就给技术支持小组打电话或者与这个领域的同行进行探讨。一定要充分利用在这个领域中的同行专家资源。
在一些技术论坛,比如网管员世界论坛、51CTO论坛可以找到该领域的同行,也可加入他们的QQ群,提供和接受解决所遇到问题的建议。根据一小时原则,当你已经花费了一个小时试图解决问题时,立刻去QQ群或者论坛呼叫同行。
故障时间价值的计算
故障时间的价值,也是在故障检修时要考虑的一个因素。
但是根据我的实际经验,很多工作人员可能会以系统故障为借口停止工作并且可能回家,请问,在办公室中,你看到过员工利用计算机故障时间来回复耽误的电话吗?没有。很多员工可能只是说计算机系统崩溃了而无法工作。
v我觉得故障时间价值的计算,不是三言两语能够说明白的,总之,系统故障时间的代价决定了你解决问题的方法,系统故障时间是非常昂贵的,即时在一个很小的企业中,你也可以估算出系统故障时间的代价究竟值多少人民币。
故障检修图
我写书或者写技术文章,总是从一个提纲或者脑图开始。如果故障检修也像这样,那么会更好的进行,并且更加有效。我的经验是,在白板上创建故障检修路线图。每次当我遇到困难的时候,离开机房回到自己的办公室——这往往是解决问题的灵丹妙药——可以静下心来,用清晰的和平衡的头脑进行思考。
通过在白板上创建故障检修图,你可以在工作中包含很多业务管理者。很多业务管理者都熟悉在会议室中反映情况,那里是很舒适的地方。通过在问题的解决方案中包括业务上的管理者,我们不仅能够获得新鲜的血液和新鲜的见解,而且还能够在技术和业务团体之间树立正面的管理。通过这样的手段,可以向他们宣传解决方案,而且更重要的是,可以迫使他们接受我们的方案。无数的研究以及你自己的工作经验已经说明有领导们的支持时,成功的几率会更高。
学习曲线分析
实际上就是分析解决故障是否在自己的能力范围之内。这里提供一个表格:
|
问题的本质
|
技能
|
学习曲线
|
建议解决方案
|
|
简单
|
高
|
低级
|
自行解决
|
|
经常发生,不困难
|
中
|
中级
|
在经过一些学习和阴暗解答之后解决问题好处包括能够很好的利用学习时间。因为这种类型的问题频繁发生,一旦进行学习并找到了解决方案,那么下一次解决问题就很容易。
|
|
频繁发生,问题介于简单和困难之间
|
低到中
|
中级到高级
|
这时与技术顾问或专家组成团队就很有意义。可以让专家展示解决方案,以便在将来能够独立的解决问题。
|
|
在寿命期间只发生一次,非常困难
|
不存在
|
很高级
|
交给别人做。保留一个专家来解决问题,并努力进行解释。
|
问题的本质 技能 学习曲线 建议解决方案
简单 高 低级 自行解决
经常发生,不困难 中 中级 在经过一些学习和阴暗解答之后解决问题好处包括能够很好的利用学习时间。因为这种类型的问题频繁发生,一旦进行学习并找到了解决方案,那么下一次解决问题就很容易。
频繁发生,问题介于简单和困难之间 低到中 中级到高级 这时与技术顾问或专家组成团队就很有意义。可以让专家展示解决方案,以便在将来能够独立的解决问题。
在寿命期间只发生一次,非常困难 不存在 很高级 交给别人做。保留一个专家来解决问题,并努力进行解释。
这个表格展现了一个决策模式,可以用于解决问题和利用外部专家的技能时。
对于前两种情况,可能要很好的利用你的时间来解决问题。对于后两个情况而言,明显的需要帮助才能将系统故障时间和公司与相关问题的损失减少到最小的程度。
在早期排除故障的工作中,了解你要解决的问题的本质,并确定你是否能够独立解决问题,还是需要其他的帮助以加强工作。



评论加载中…
