网络逻辑类故障
逻辑故障中最常见的情况就是配置错误,因为网络设备的配置原因而导致的网络异常或故障。
(1)路由器逻辑故障
路由器逻辑故障通常包括路由器端口参数设定有误,路由器路由配置错误、路由器CPU利用率过高和路由器内存余量太小等。
路由器路由配置错误可能是路由器端口参数设定有误、路由循环、找不到远端地址或是路由掩码设置错误等。比如,同样是网络中的线路故障,该线路没有流量,但又可以ping通线路的两端端口,这时就很有可能是路由配置错误了。
排查方法:路由器端口参数设定有误,会导致找不到远端地址。遇到这种情况,我们通常用“路由跟踪程序”就是traceroute(路由跟踪程序:在UNX系统中,我们称之为Traceroute;MSWindows中为Tracert),它和ping类似,最大的区别在于traceroute是把端到端的线路按线路所经过的路由器分成多段,然后以每段返回响应与延迟。如果发现在traceroute的结果中某一段之后,两个IP地址循环出,该时一是端抑端口路由又指向了线路的近端导致IP包在该线路上来回反复传递。traceroute可以检测到哪个路由器之前都能正常响应,到哪个路由器就不能正常响应了。这时只需更改远端路由器端口配置,就能恢复线路正常了。
路由器CPU利用率过高和路由器内存余量太小,导致网络服务的质量变差。比如路由器内存余量越小丢包率就会越高等。检测这种故障计费数据、路由器CU的温度、负载以及路由器的内存余量等数据,利用MB变量浏览器较直观,它收集路由器的路由表、端口流量数据、通常情况下网络管理系统有专门的管理进程,不断地检测路由器的关键数据,并及时给出报警。解决这种故障,只有对路由器进行升级扩大内存等,或者重新规划网络拓扑结构。
(2)一些重要进程或端口关闭
一些有关网络连接数据参数的重要进程或端口受系统或病毒影响而导致意外关闭。比如,路由器的SNMP进程意外关闭,这时网络管理系统将不能从路由器中采集到任何数据,因此网络管理系统失去了对该路由器的控制,或者线路中断,没有流量。
排查方法:用Ping线路近端的端口看是否能Ping通,Ping不通时检査该端口是否处于down的状态,若是说明该端口已经给关闭了,因而导致故障。这时只需重新启动该端口,就可以恢复线路的连通。
(3)主机逻辑故障
主机逻辑故障所造成网络故障率是较高的,通常包括网卡的驱动程序安装不当、网卡设备有冲突、主机的网络地址参数设置不当、主机网络协议或服务安装不当和主机安全性故障等。
①网卡的驱动程序安装不当。网卡的驱动程序安装不当,包括网卡驱动未安装或安装了错误的驱动出现不兼容,都会导致网卡无法正常工作。
排查方法:在设备管理器窗口中,检査网卡选项,看是否驱动安装正常,若网卡型号前标示出现“!”或“X”,表明此时网卡无法正常工作。解决方法很简单,只要找到正确的驱动程序重新安装即可。
排查方法:磁盘大多附有测试和设置网卡参数的程序,分别查验网卡设置的接头类型、IRQ、I/0端口地址等参数。若有冲突,只要重新设置(有些必须调整跳线),或者更换网卡插槽,让主机认为是新设备重新分配系统资源参数,一般都能使网络恢复正常。主机的网络地址参数设置不当,主机的网络地址参数设置不当是常见的主机逻辑故障。比如,主机配置的IP地址与其他主机冲突,或1P地址根本就不在于网范围内,这将导致该主机不能连通。排查方法:查看网络邻居属性中的连接属性窗口,査看TCP/IP项参数是否符合要求,包括TP地址、子网掩码、网关和DNS参数,进行修复。
④主机网络协议或服务安装不当。主机网络协议或服务安装不当也会出现网络无法连通。主机安装的协议必须与网络上的其它主机相致,否则就会出现协议不匹配,无法正常通信,还有一些服务如“文件和打印机共享服务”,不安装会使自身无法共享资源给其他用户,“网络客户端服务”,不安装会使自身无法访问网络其他用户提供的共享资源。再比如E-mai1服务器设置不当导致不能收发E-mai1,或者域名服务器设置不当将导致不能解析域名等。
排査方法:在网上邻居属性(Windows98系统)或在本地连接属性窗口查看所安装的协议是否与其他主机是相一致的,如TCP/IP协议,NETBEUI协议和IPX/SPX兼容协议等。其次查看主机所提供的服务的相应服务程序是否已安装,如果未安装或未选中,请注意安装和选中之。注意有时需要重新启动电脑,服务方可正常工作。
⑤主机安全性故障。主机故障的另一种可能是主机安全故障。通常包括主机资源被盗、主机被黑客控制、主机系统不稳定等。
排查方法:主机资源被盗,主机没有控制其上的finger,RPC,rlogin等服务。攻击者可以通过这些进程的正常服务或漏洞攻击该主机,甚至得到管理员权限,进而对磁盘所有内容有任意复制和修改的权限。还需注意的是,不要轻易地共享本机硬盘,因为这将导致恶意攻击者非法利用该主机的资源。
主机被黑客控制,会导致主机不受操纵者控制。通常是由于主机被安置了后门程序所致。发现此类故障一般比较困难,一般可以通过监视主机的流量、扫描主机端口和服务、安装防火墙和加补系统补丁来防止可能的漏洞。
主机网站设计系统不稳定,往往也是由于黑客的恶意攻击,或者主机感染病毒造成。通过杀毒软件进行查杀病毒,排除病毒的可能。或重新安装操作系统,并安装最新的操作系统的补丁程序和防火墙、防黑客软件和服务来防止可能的漏洞的产生所造成的恶性攻击。
网络故障的产生原因
作为网络管理员,在实际维护网络的过程中,遇到网络故障几乎是一件不可避免的事情。从故障现象来看,有的网络故障解决办法是相通的,但从实际运行环境来看,解决相同现象的故障,方法可能迥然不同;产生网络故障的原因很多,可能是网卡,不停地发出坏包也可能是交换机,端口故障使错包增多;还可能是服务器,硬盘的故障使网络瘫痪:软设置的错误更会引发各种各样的问题;一条链路负载量大,可能形成整个网络的瓶颈。
从SI的七层模型剖析,网络故障通常有以下几种可能:
◆物理层问题:物理设备相互连接失败或者硬件及线路本身的问题;
◆数据链路层问题:网络设备的接口配置问题;
◆网络层问题:网络协议配置或操作错误;
◆传输层问题:设备性能、通信拥塞及差错问题;
◆高层问题:包括操作系统,应用接口、驱动程序及各种应用程序错误。
网络故障的诊断过程应该沿着OSI七层模型从物理层开始向上进行。首先检查物理层,然后检査数据链路层,以此类推,设法确定信失败的故障点,直到系统通信正常为止。
网络故障是在所难免的,重要的是应请网络维护人员应该配备相应的工具和具备相应的知识,以便及时、有效的找到和解决问题
提高故障诊断水平需要注意以下几方面的问题:
◆认真学习有关网络技术理论
◆熟悉网络的结构设计,包括网络拓扑、设备连接、系统参数设置及软件使用
◆了解网络正常运行状况、注意收集网络正常运行时的各种状态和报告输出参数
◆熟悉常用的网站建设诊断工具,准确的描述故障现象。
重新确认商业模式避免网站失败
前期调研结束后,一般情况下,会对客户的网站策刘有大致的思路。在思路中,可能会涉及产品的定位、目标客户的定位、核心卖点的挖掘等,也有可能会涉及客户网络营销商业模式的重新设计。
最终需要做的网站可能不是客户当初找你时想要的网站。这些变化需要重新跟客户商讨,并赢得客户的认可。等客户重新确认之后,才能继续下面的工作。
确认工作主要是为了跟客户的决策层达成一致,提出有效的方向性建议,而不是一味迎合客户的要求。这是一个专业性强、负责任的建站团队应该做的事情,毕竟有时候客户并不总是对的。
建站团队应该从网络营销全局出发,给客户更专业的建议,而不仅仅是完成建站任务,达成网络营销目标才是客户想要的。确认完成就可以开始第六步“网站策划头脑风暴会议”工作了。
群策群力快速达成一致网站策划头脑风暴会议是指组织企业相关项目主要负责人、产品研发、生产、销售、网络营销相关人员等参与,共同讨论完成包括但不限于以下工作。
1.目标客户定位、产品定位、网站目标及商业模式设计等。
2.卖点挖掘与塑造。
3.网站说服力要素设计。
5.建站素材准备清单。
这些工作当然也可以不通过头脑风暴会议,而是由专门的业务小组完成,但是实践证明,让客户与网站利益相关的人员都参与整个过程的讨论,有助于更快地达成一致,并形成最终结果。避免在确认过程中,甚至建站后期阶段产生来自客户不同部门的各种修改建议或新增内容要求。
签字确认循序渐进无论是原型图,还是网站效果图完成后,应该请客户签字确认或邮件确认,避免阶段性的成果被随意修改,造成不必要的时间成本增加和工期延长。实践证明,如果不能很好地事先约定确认的环节,往往会造成很多意想不到的麻烦。例如,客户反复提出新的要求;添加新页面;页面上新增内容等打乱工程计划,甚至前功尽弃。
确认的主要时间节点有:原型图确认;效果图确认;网站整体验收,并且事先约定签字后一般不再做大幅度修改,简单耗时不大的修改,双方友好协商解决。
最终交付时,根据双方约定的功能与之前签字确认过的效果图进行各项检査与验收。
好的工作流程网站设计不仅给客户专业的印象,也可以有效提高最里,升避不必要的冲突,提高合作效率和客户满意度。