文章
  • 文章
搜索
首页 >> 新闻动态 >>工作动态 >> 材环所停产三天 --服务器故障
详细内容

材环所停产三天 --服务器故障

1028日上午,中心材环所因服务器故障而停产。后勤保障部接到通知后,部门领导高度重视,第一时间安排我去中心机房查看原因。我立马来到中心机房查看,看到服务器亮着CPU风扇灯,这种故障一般有两方面原因:1、风扇问题,2、主板问题。由于IBM服务器非常特殊,中心机房没有同型号的配件去测试,我无法确诊原因,于是立即联系了九江IBM售后。售后人员查看故障后表示需要向北京总部调配件维修,但要等周一才能申请(周末总部休息),并且申请需要一星期左右。一周的维修时间太长,将会严重影响中心的生产和形象。于是,我又打电话询问了多家电脑公司咨询维修事宜。次日,九江电脑城一家维修公司表示可以维修,罗所长和我一起将服务器搬至电脑城维修。维修人员经过一天的检测,基本确诊是主板故障,并且告诉我们维修可能会影响硬盘数据!考虑到实验数据的重要性,罗所决定另想办法。29号晚上,我和武汉富斯特公司进行了沟通,武汉富斯特公司表示可以先把数据导出来,再部署到另外一台服务器中,并且可以确保周一正常生产。于是1030早上,罗所长和我就一起赶往武汉富斯特公司。一路上我们无暇欣赏路边的风景,一直和武汉、南昌IBM售后保持联系,看是否能找到最合适的维修方法。中午,我们抵达武汉富斯特公司。但是一直到下午五点,数据还是未导出。正当我们着急时南昌IBM售后打电话告知我们有一块同款主板可以更换。领导当机立断,决定去南昌维修服务器。晚上10点我们赶到了南昌,南昌IBM售后很快就更换了主板,服务器终于可以运行,故障也最终得到了解决!为了能尽早恢复生产,我们当晚就返回了九江并且把主机安装好。第二天一早实验室就恢复了正常工作,此时,我们忐忑的心总算可以放下来了。当我们看见机器的正常运转那一刻,我们倍感欣慰,即使一天内奔波上千公里也值得。三天的停产,对于材环所和服务大厅的工作有最直接的影响。材环所实验室无法上传实验数据,服务大厅无法录入客户送来的样品,整个前台及实验室处于瘫痪状态,导致报告不能按时出具。这给客户带来了极不好的影响,最终也影响了整个中心的形象。

面对这样的突发事件,中心的实验平台为何如此不堪一击,我们后勤保障部经过探讨总结,认为主要有以下两方面的原因:

首先,也是最重要的一点,中心只有一台服务器支撑着材环所一切实验活动,过于单一化,一旦服务器出现故障,无法及时备份转移数据。

其次,这台服务器使用时间较长,市场上难很找到相同的配件。

为了避免再次发生类似的事件,确保中心的实验平台安全有效的运行,总结这次经验教训后,我们认为可以采用如下方案:

   一、再购置一台服务器,和现在的服务器组成热备份,每时每刻都在自动备份数据。如果其中一台服务器有故障,另外一台服务器可以立即替代工作。

   二、启用云服务,考虑将实验平台及数据存储于云平台上。以确保数据的万无一失。

    此次事件圆满的解决,主要得益于领导的果断和决策。在以后的工作中,我也要多向领导学习处理遇到突发事件的方式和方法。随着市场经济的迅速发展,中心工作的信息化在升级的同时,后勤保障部也会紧跟时代步伐,不断学习,提高部门的专业能力,为中心的信息化发展保驾护航。

                                                      后勤保障部

                                                    2017年11月28日



电话直呼
在线留言
联系我们:
0792-8983337
暂无内容
还可输入字符250(限制字符250)
seo seo