大唐黄岛发电有限责任公司 266500
摘要:随着发电机组容量和规模的成倍增长,分散控制系统的可靠性水平,已经成为确保发电机组以及电网系统安全、稳定、高效运行和满足国家节能环保要求的关键。但分散控制系统品种繁多、技术涉及面广、元部件离散性大,运行过程中难以避免发生各种各样的故障,威胁发电机组安全稳定运行。因此,降低分散控制系统的故障率,在生产中起着至关重要的作用。
关键词:分散控制系统,故障率,应急处理,网络安全
随着社会经济和科技的发展,分散控制系统也日渐趋于成熟,其安全性、可靠性和经济性也在不断地提高。但是分散控制系统故障仍时有发生,其中以电源故障、控制器故障、通讯网络故障、操作员站或服务器故障为主,严重威胁机组安全稳定运行。通过对火电厂分散控制系统中常见的一些故障进行分析和总结,我提出了下列相关预防措施及应急处理办法。
建立完善的巡检制度
巡检的目的是掌握设备运行状况及周围环境的变化,发现设备缺陷和危及安全的隐患,及时采取有效措施,保证设备安全和系统稳定。为确保机组稳定运行,及时发现设备隐患和缺陷,热工应建立完善的DCS巡检制度,同时应加强DCS巡检力度,保证每天至少巡检一次,并建立DCS巡检记录本,以便详细了解设备运行状况,当故障发生时可及时采取有效应对措施。
某厂DCS卡件一年内共故障10次,其中8次为热控人员日常巡检过程中发现,通过及时采取复位、拔插、更换卡件等有效措施,迅速恢复卡件运行,将风险降到了最低。
强化备品备件的储备管理
合理地管理备品备件是指用极少的备品资金和合理的备件储备,保证设备维修需要,提高设备使用可靠性和经济性。备品备件管理的首要工作是控制备品数量,若备品数量过多,储存时间过长,将影响使用寿命,大大降低设备可靠性和企业经济效益;若备品数量过少,容易出现备品备件短缺现象,影响机组安全稳定运行。
某厂通过建立DCS备品备件出入库台账,台账中详细记录了备件名称和型号、生产日期、入库日期、出库日期和原因、备件数量等信息,以便详细了解备件储备情况;同时还建立了计算机监控系统硬件台账、软件台账、软件修改记录、硬件损坏和更换记录等技术资料和档案,档案中详细记录系统发生的所有问题和处理过程。通过统计的设备故障率及故障趋势,每年能准确计算出备品需求量,不仅保证备品充足可用,还为企业节约大量采购设备资金。
定期对软件与数据备份
系统和软件运行期间会发生数据传输、数据存储和数据交换,如果没有采取数据备份和数据恢复手段和措施,就会导致数据的丢失,造成无法弥补与估量的损失。
某厂2号机操作员站一服务器突然蓝屏,失去监控功能,热工人员检查发现硬盘故障,立即更换硬盘并重装系统,但因以前并没有对软件和数据进行备份,又因热工人员技术能力有限,不知道安装和配置软件,只能将此服务器返厂,需耗时5天,期间部分操作员站失去监控。此厂若有软件和数据备份,即可通过恢复备份的办法迅速恢复服务器功能,减少设备故障时间,降低安全生产风险。由此可见,备份是DCS管理的重要环节。
做好软硬件升级改造工作
近些年,电子产品更新换代非常迅速,许多电子产品逐渐停产,而使用中的产品随着年限增加,硬件逐渐老化,抗振动、抗电磁干扰能力下降,有的软硬件功能已经跟不上用户需求,若旧的软硬件仍可使用,则可通过合理运用技术来延长设备使用寿命,降低设备维护费用;若软硬件功能已无法满足需求,或逐渐停产,则可在获得技术支持的情况下对软硬件升级改造,逐步将新型产品用于现场,将已淘汰或停产的产品退出使用,降低设备故障率,提高系统稳定性,减少或杜绝因DCS系统故障引起的机组非停次数。
另外,因不同厂家DCS寿命差异很大,可绘制各类控制系统电源、卡件、工控机、交换机等设备故障走向图,注重波峰出现前的预维护,提前计划技改项目,避免DCS电源全部失电、主保护冗余控制器全部故障或DCS网络瘫痪等一级故障的发生。
5、重视DCS检修工作
检修工作是发电厂生产管理的重要组成部分,对发电厂的安全性、经济性有着重大影响。
DCS设备由于长年累月无间断运行,卡件和零部件容易积灰、变形,从而出现短路、过热、接线端子松动、卡件接触不良等现象,影响设备安全运行。因此,必须定期地、有计划地对DCS设备进行预防性的和恢复性的检修,以便及时地检查、发现和消除设备存在的缺陷,消灭潜在的事故因素,提高设备健康水平,延长设备使用寿命,确保机组运行的安全性与经济性。
6、加强DCS网络与信息安全工作
随着计算机的普及和信息技术的进步,特别是计算机网络的飞速发展,网络与信息安全的重要性日趋明显。为使DCS网络系统的硬件、软件及其系统中的数据受到保护,不受偶然或恶意的原因而遭到破坏、更改、泄漏,需做好如下几点:
1)身份鉴别:对登录操作系统和数据库系统设置用户名和密码,密码长度不得小于8位,且为字母、数字组合,并定期更换;
2)访问控制:通过在控制区和非控制区安装正向隔离网闸,确保DCS数据只能从控制区流向非控制区;根据用户的角色分配权限,如操作台运行人员仅有操作权限,而工程师站热控人员具有逻辑和画面组态权限,无操作权限;生产控制大区是否存在网络非法外联情况
3)入侵防范和恶意代码防范:安装入侵防御软件和防恶意代码软件;如2017年的勒索病毒,我厂热工人员了解到事件的危险性后立即经联系各DCS厂家,咨询防范和处理措施,并在厂家提供的技术支持下对操作系统安装补丁。
4)资源控制:对重要服务器参数(如CPU负荷率、网络负荷率、内存和外存余量)进行监视,并关闭或拆除主机空闲的软驱、光驱、USB接口、串口等,对需要进行保留的进行严格管理;
5)安全审计:对网路设备运行状况、网络流量、重要用户行为、系统异常和重要系统命令的使用等重要安全相关事件进行记录,并对记录进行保护;
建立分散控制系统典型故障应急处理预案
为贯彻“安全第一、预防为主、综合治理”的安全生产方针,确保控制系统突发性重大事故和紧急事件发生时,能迅速、准确、高效地组织故障处理,最大限度地降低故障造成的影响,应制定分散控制系统典型故障应急处理预案。并认真组织学习该预案,按照要求及时组织培训、演练,让在岗人员明确职责,熟练掌握应急处置过程中涉及到的相关流程、要点等内容,积极应对,防患于未然,进一步提高应急处置能力。
应急预案中应分别编写控制系统一级故障、二级故障和三级故障后具体处理流程及处置措施,如出现控制系统电源全部失去、操作员站全部失去监控且无后备监视手段、控制系统网络全部瘫痪且无后备监视手段、重要控制系统冗余控制器均故障,运行人员应立即打闸停机,并联系热控人员处理。为使故障发生时能得到迅速处理,可将应急处理方案内容编写到应急处置卡上,并将应急处置卡挂在现场,卡片内容清晰简要、一目了然,热工人员根据应急处置卡即可进行处理。
结束语
降低分散控制系统的故障率,应从多处着手,规章制度、技术资料要齐全,定期工作、检修作业要重视,备品备件、升级改造要斟酌,同时还应多培训、多学习、多交流,在学习和交流中积累经验,确保故障发生时沉着冷静、有条不紊、处理迅速。
参考文献
《DL 5000-2000 火力发电厂设计技术规程》
《DL/T 659-2016 火力发电厂分散控制系统验收测试规程》
《DL/T 261-2012 火力发电厂热工自动化系统可靠性评估技术导则》
《DL/T 1083-2008 火力发电厂分散控制系统技术条件》
黄知,卢裕义.火电厂DCS控制系统故障的应急处理和预防措施[J].山东工业技术,2018(2):124.