發電廠#1機組POC站異常離線分析處理分享
發電廠#1機組POC站異常離線分析處理分享
一、故障現象
POC站頻繁異常離線時間線整理
故障現象:
1、DCS係統狀態頁麵POC站離線狀態報警(紅色報警離線,圖1為正常運行狀態,僅POC9離線作為維護站);
圖1 機組正常運行DCS係統狀態
2、係統信息彈框報離線狀態,操作係統數據刷新、顯示正常,正常電腦運行可監視操作;
3、POC8離線時,實時趨勢暫停刷新,顯示屏黑屏,其他POC站僅離線報警,無其他異常。
圖2 POC第1次離線報警記錄
二、檢查過程
1、檢查過程
檢查操作站數據收發正常,查看電腦光網、以太網網口連接正常,查看交換機、LANBOX指示燈狀態正常,無單網故障報警,主工程師站小黑框無光網異常報警,判斷光網正常。重點排查以太網。
圖3 交換機運行正常
檢查SAP主從分配:POC5為主係,POC1為SAP監控、HIST1為曆史數據處理和輸入處理。
檢查日立操作係統日誌報警。
檢查工程師站小黑框報警內容。
檢查係統信息彈框報警及信息一覽記錄,整理異常時間線。
檢查主係電腦POC5負荷率(40%)。
2、處理過程
逐一退出POC站日立CV8係統並重啟,將所有操作站完成程序重啟。
將主係POC5保持離線狀態,緩減以太網負荷。
3、收集錯誤信息移交日立廠家分析:所有POC站CV8係統備份日誌文件、OS係統錯誤信息記錄、計算機錯誤信息記錄。
三、日立分析回複
故障原因:目前本廠日立係統為CV8.10.03,POC8電腦長時間記錄實時趨勢顯示,引起計算機內存高,從而使計算機訪問網絡出現延時,誤報其他POC站離線信息。
解決方法:
1、臨時解決辦法:出現該情況,將離線電腦的實時趨勢關閉,退出並重啟日立CV8操作係統。
2、終極解決辦法:POC站升級,新版本已經解決實時趨勢引起的內存高問題。
四、後續措施
基於日立廠家恢複和我廠實際情況,采取以下預防措施:
1、運行減少小窗口的不必要使用,降低非必要的實時趨勢顯示。
2、#1機組操作係統已計劃本年度升級係統及硬件,維護在此期間加強操作站的日常巡檢和維護。
3、關注同類型(如四管泄露)記錄並讀取曆史數據的工控設備運行情況,提高巡檢頻次。
4、建議運行部定期更換除了大屏以外的其他電腦實時趨勢顯示,減少單台電腦長期高負荷運行產生內存升高。