气象数据库系统入库故障分析处理

(整期优先)网络出版时间:2023-05-17
/ 2

气象数据库系统入库故障分析处理

王嘉琦

[1]中国民用航空华东地区空中交通管理局山东分局,山东省济南市,250107

摘要:气象数据库系统主要由通信分系统、数据库分系统、预报平台、服务平台四部分组成。通信部分主要负责各种气象资料的接收与发送;数据库部分主要负责对各类数据进行分解,处理、存储;预报人员可以通过预报平台查询和检索相关信息,分析和制作各种天气预报产品,分发给需要的用户;服务平台供各用户浏览、提取气象资料。本文通过整理有关技术资料,分析实际案例,使大家了解相关故障原理,积累更多排故经验。

关键词: 气象数据库系统   产品入库  报文入库  系统参数 

1引言

民航数据库系统是民航气象业务的核心信息系统,它采用一套分级的,包含发送、请求、响应、回复、转发等多种功能的,复杂的数据交换模式,实现了实时收集、处理、储存、交换民航国内、国际飞行所需的综合航空气象情报信息的功能,提供给用户气象资料自动分析和制作等功能,为航空气象用户提供航空气象产品。

2 气象数据库系统报文无法入库

某日17:30(北京时),统一平台提示231212时次FT报未入库告警,查看华东网、合肥置顶报文监控软件均正常。机务员检查统一平台监控终端,发现本地数据库红灯告警。机务员初步判断报文未入本地库,在数据库客户端上查询DB00和DB01库中231212时次的FT报文,发现DB00库中能查到,DB01库查询不到,通信客户端线路均正常,且自主开发的报文监控软件上报文加载不成功。重新使用数据库客户端登录DB01数据库,提示连接不成功,多次尝试后登陆成功,但是cac和awos进程掉线。重启所有进程后,尝试报文异地查询手动入库,未成功,检查发现cac和awos进程再次掉线,判断DB01数据库故障。

按照步骤重启服务器,重启完毕后,231100时次观测SA报成功入库。

次日凌晨00:10(北京时),DB01数据库再次出现cac和awos进程掉线的问题,重启进程后恢复正常。

使用xftp连接DB01数据库,找到/home/mhdbs/bin/log目录下的alarm.log告警日志文件,其中记录了数据库的告警信息

经检查,告警原因为数据库实际连接数达到上限,导致进程掉线,查询数据库实际连接数及当前上限,修改上限后重启数据库,数据库恢复正常运行。

1、查询数据库的实际连接数:

以oracle用户登录DB01,进入sqlplus,输入select count(*) from v$process;系统会显示数据库的当前的连接数

C:\Users\Administrator\Desktop\lianjieshu.bmp

            图一  查询数据库的实际连接数

2、查询数据库进程数的上限:

输入select value from v$parameter where name=’processes’;系统会显示数据库进程数的上限

3、将DB01数据库进程数的上限提高至500:

输入alter system set processes=500 scope=spfile;

4、重启数据库

5、再次使用命令查询数据库进程数的上限,已修改为500

3 气象数据库系统本地预报产品未入本地数据库

某日,巡视发现区域预警与机场警报综合处理软件时,发现该软件编发的机场警报(JJ)、终端区天气预警(ZD)、话音方式航空器空中报告(AR)以及MDRS重要天气概率预报(MR)在软件自带的本机数据库以及上海民航气象数据库可查询到相应产品,但在济南民航气象数据库查询不到。机场警报(JJ)、终端区天气预警(ZD)、话音方式航空器空中报告(AR)以及MDRS重要天气概率预报(MR)预报产品,经软件处理后自动发送到通信服务器receive/forecastchart目录下,由通信服务器根据BSB表完成上述产品通过数据库服务器prog进程入本地数据库IMAGE01_PROG数据表和转发上海处理,经查阅数据库prog进程日志,发现上述产品在本地入库时出现以下告警信息,导致未能入库,告警信息如下:

D:\Desktop\截图\jietu4.bmp

图二 告警信息一

D:\Desktop\截图\jietu3.bmp

图三 告警信息二

数据库服务器入库控制参数-常规天气图标准设置过大(100)导致上诉预报产品文件出现FILE SIZE ERROR告警未能入库,时间配置参数资料早到时间判定设置不合理(180)出现sendtime is too early告警导致产品文件未入库。

使用数据库管理客户端调整配置参数设置,在系统配置菜单中的业务处理配置中修改时间配置,更改资料早到时间判定参数为1440; 在系统配置菜单中业务处理配置修改入库控制,更改常规天气图标准参数为0,重启数据库,数据库恢复正常。

4 气象数据库系统/home磁盘利用率过高

某短时间,机务员巡视数据库服务器磁盘空间监控时发现/home使用率达到50%以上甚至接近60%。

由于归档文件存放在/home/mhdbs/data/backup文件夹下,系统每天执行的自动归档操作产生的归档文件将不断的占用/home文件夹的使用空间,使得/home的磁盘利用率不断增大,为了保证系统的稳健运行,在每周例行的周维护中,都会进行归档文件迁出操作,该功能可以将AIX服务器上存储的归档文件迁移到安装管理子系统客户端的PC机保存,并将已经迁移成功的归档文件从AIX服务器上删除,以释放/home的磁盘空间。在/home/mhdbs/data/backup文件夹下,还有部分归档文件已经迁移成功但未删除,这样就占用了部分磁盘空间。经过对DB00和DB01数据库迁出文档保存文件夹对比检查,未迁出的重新进行归档文件迁出操作,已经迁出的运行命令:rm –r 文件目录,进行归档文件删除,只保留backup下本月的归档文件,完成后/home的磁盘利用率降为35%,恢复正常。

5 结束语

保障整个气象数据库系统的正常运行在工作中具有至关重要的作用,排故及维护经验的不断累积,可以快速准确的处理故障,满足用户对于气象数据库系统的需求,最大限度保障日常运行安全。

参考文献:

 [1]郭玉东,尹青,董卫宇.Linux原理与结构[M].西安电子科技大学出版社,2012

[2]孟庆昌.Linux教程[M].电子工业出版社,2019

作者简介:王嘉琦(1996.1--),男,本科,汉族,山东菏泽人,助理工程师,主要从事设备维护方面工作。


[1] 王嘉琦,1996年1月,男,助理工程师,设备维护维修