欢迎来到阿四技术服务!
热线电话 400-999-1378

行业新闻

IT运维——快速了解企业网络故障处理

发布日期:2018/05/14 阅读数:0

  于一个非计算机行业的公司,不管公司规模的大小,IT工作人员有一项主要工作就是快速为员工解决各种网络与系统故障,而且越是刚刚进入职场的懵新,越是会被老员工指派去从事各种运维工作,而老员工本身,更多的是从事企业的信息化管理工作,规则制度的编写等。被别人呼来喝去的指派,像救火队一样的到处跑的日子确实不好过,尤其很多新人开始没有工作经验还处理不好很多事情,所以千万不要小看这一份工作,这是你职场工作经验与人脉累计的起点,帮别人处理系统网络故障,甚至你可以直接对话董事长。那么,我们到底怎么样做好这份工作呢,下面我们就从了解故障处理开始。

 

网络运维

u=46479901,1611772840&fm=173&app=25&f=JPEG.jpg

 

系统与网络运维活动中的重要任务。故障处理能力也是运维工程师的核心能力之一。

 

首先,第一个问题:什么是故障?

故障是指系统在工作过程中,由于某种原因丧失规定功能影响业务的现象;从用户角度出发,凡是影响业务的现象都可以定义为故障。

因此故障不一定就是设备故障;也可能是系统/兼容性等问题。

 

第二个问题:什么是故障处理?

故障处理是指在故障发生之后,采取措施,是系统与网络恢复正常。

1、 在故障处理中,使系统与网络恢复正常是首要任务;

2、找到故障原因,避免下一次故障是接下来的更为重要的任务。

 

第三个问题:故障处理对工程师的要求有哪些?

1、精通各种技术原理;

2、熟悉相关产品特性 ;

3、具备丰富的经验;

4、沉着冷静,处乱不惊。

 

第四个问题:什么是例行维护

与故障处理相对应的是例行维护,例行维护的目的是预防故障发生,故障处理是指在故障发生之后,采取措施,使系统尽快恢复正常。

 

理想VS现实

故障处理往往被认为是一件很复杂,很高达上的工作。

故障处理的确是一件高大上的工作——对于少数复杂故障而言(20%)

但绝大部分故障都是简单的故障(80%),只需要你拥有以下4点能力:

1、 一定的理论基础;

2、 正确的处理思路;

3、 必要的处理技巧;

4、 熟悉厂商支持体系。

80/20法则在工作中和生活中广泛使用。故障处理领域同样适用。

在实际的维护中,简单故障占据绝大多数,比如说内存条问题,软件系统问题等。

所以工程师具备基本的要求即可处理大部分故障。

 

运维人员在企业中的知识体系,成长方式

 

QQ截图20181214090717.jpg

知识体系

 

通过系统培养成为技术专家固然好,但是投入的时间和精力也是巨大的。

 

通过一个个短小精干的技术专题引导思考,开拓思路,日积月累,一方面能解决大量现实的问题,另一方面也为专家之路奠定坚实的基础。

 

IT运维人员要善于对平时自己处理的故障事件中总结归类,根据事件分类排名,列出靠前的事件分类,将其作为专题研究。确实是故障的,针对其开发故障处理专题;若是用户使用不规范,编写操作规范、操作手册等(如果已经有了操作手册还有很多此类问题,考虑是否因为操作手册内容晦涩难懂);若为应用系统设计问题导致的运维人员无法解决的问题,应上报给相关上级使之协调解决。

 

故障处理专题与操作规范可写入知识库,作为解决问题的参考。

 

故障处理的注意事项

1、 以业务为中心,以恢复业务为首要任务;

2、 针对紧急故障有应急预案;

3、 操作人员技术能力必须合格;

4、 严格遵守操作规程;

5、 所有操作、信息有据可查;

 

发生故障时请先评估是否为紧急故障,是紧急故障请使用预先制定的紧急故障处理方法尽快恢复故障模块,进而恢复业务。

 

严格遵守操作规范和行业安全规程,确保人身和设备安全。更换和维护设备部件过程中,要做好防静电措施,佩戴防静电腕带。

 

故障处理过程中遇到任何问题,应详细记录各种原始信息。

 

所有重大操作,如重启设备、擦除数据库等均应作记录,并在操作前咨询确认操作可行性,在做好相应的备份、应急和安全措施后,方可由有资格的操作人员执行。