久久久久人,丁香花综合网,一级无遮挡毛片,亚洲产国偷v产偷,亚洲成人精选,偷拍欧美亚洲,日韩有码片

信息系統(tǒng)自動化運維平臺的研究與應用

2018-03-20 16:05:17 自動化 運維體系 精益化管理 信息系統(tǒng)   點擊量: 評論 (0)
隨著新技術與新業(yè)務應用的不斷深化,傳統(tǒng)信息系統(tǒng)運維工作面臨系統(tǒng)結(jié)構(gòu)復雜、設備規(guī)模大、運維人員少、支撐工具多等問題。為提升運維服務質(zhì)量,降低維護成本,提前發(fā)現(xiàn)運行隱患,文章從數(shù)據(jù)收集、維護處置、輔助決策等方面提出了信息系統(tǒng)運維自動化的思路。首先從運維數(shù)據(jù)采集、匯

0 引言

隨著電力企業(yè)信息系統(tǒng)的不斷增加與完善,信息化工作重心由建設階段逐漸向運行維護階段過渡,信息系統(tǒng)運維與安全壓力日益顯現(xiàn)。但是,在傳統(tǒng)的運維方式下信息系統(tǒng)運維工作主要由人工完成,部分相關運維工具由于功能分散、實用性低等問題,很難實現(xiàn)運維自動化處理,對系統(tǒng)配置也不能達到及時、準確、閉環(huán)的管理要求。尤其是對于信息系統(tǒng)客戶密集型的呼叫行業(yè),信息系統(tǒng)運維工作面臨設備多、系統(tǒng)規(guī)模大、實時性要求高、主業(yè)運維人員和運維工具少等現(xiàn)實情況,需投入大量的人力進行重復、繁雜的運維工作。

針對以上問題,本文提出了從數(shù)據(jù)收集自動化、維護處置自動化、輔助決策自動化等方面開展自動化運維的工作思路,以提升運維工作的效率與服務質(zhì)量。

 1 數(shù)據(jù)收集自動化

對于信息系統(tǒng)運維而言,如何有效處理和運用運維數(shù)據(jù)已成為運維工作的重要內(nèi)容。早期信息運維綜合監(jiān)管系統(tǒng)(Information Management System, IMS)通過手工錄入的方式進行數(shù)據(jù)的電子化管理,但隨著運維工作的不斷發(fā)展,數(shù)據(jù)來源不斷增多,如手工填寫的紙質(zhì)數(shù)據(jù)、監(jiān)控系統(tǒng)自動采集的數(shù)據(jù)、分析統(tǒng)計數(shù)據(jù)等,使得要做好自動化運維工作就必須要先做好運維數(shù)據(jù)管理工作[1]。本文提出的數(shù)據(jù)收集自動化方案主要包括運維監(jiān)控自動化、巡檢自動化及維護事件處理自動化。

1.1 功能架構(gòu)

1)運維監(jiān)控自動化。充分利用已部署的動環(huán)監(jiān)控、BTIM、呼叫平臺預警監(jiān)控、運維審計等輔助支撐系統(tǒng),對包括機房基礎環(huán)境、網(wǎng)絡安全設備、數(shù)據(jù)庫中間件、主機服務器、應用服務等進行全面監(jiān)控,重點實現(xiàn)監(jiān)控數(shù)據(jù)存儲及預警機制集中存儲,利用安全接入平臺、隔離裝置實現(xiàn)不同網(wǎng)絡區(qū)域監(jiān)控數(shù)據(jù)的互聯(lián)互通[2]。為實現(xiàn)運維自動化,需對現(xiàn)有監(jiān)控系統(tǒng)的數(shù)據(jù)進行集中存儲,建立安全的網(wǎng)絡互聯(lián)環(huán)境和統(tǒng)一預警機制,并實現(xiàn)對監(jiān)控數(shù)據(jù)的二次利用和分析。

2)巡檢自動化?,F(xiàn)階段電力企業(yè)信息系統(tǒng)巡檢工作主要通過紙質(zhì)巡檢表單進行日常及深度巡檢,且巡檢數(shù)據(jù)沒有得到有效分析和利用。針對這種情況,應開展巡檢無紙化、移動化及數(shù)據(jù)電子化工作,通過移動終端實現(xiàn)巡檢,并對巡檢數(shù)據(jù)進行電子化存儲,提高巡檢質(zhì)量,降低資源消耗,充分利用巡檢數(shù)據(jù)進行分析,為故障預判做好數(shù)據(jù)積累。

3)維護事件提醒自動化。目前電力行業(yè)信息系統(tǒng)維護事件提醒主要利用各類監(jiān)控系統(tǒng)通過聲光報警的方式在各自系統(tǒng)頁面給出,值班人員確認后短信通知相關人員。為降低人工勞動強度,應建立統(tǒng)一管理平臺對維護事件進行統(tǒng)一提醒,并以郵件、短信、電話等方式自動發(fā)送通知,減少人為干預。

1.2 關鍵技術

運維數(shù)據(jù)處置包括數(shù)據(jù)采集、匯總、存儲等環(huán)節(jié),由于電力系統(tǒng)各單位運維工作信息化水平不一,數(shù)據(jù)來源不同,因此運維數(shù)據(jù)必須遵循多源獨立收集、格式統(tǒng)一整理、數(shù)據(jù)集中存儲的處置思路。數(shù)據(jù)處置結(jié)構(gòu)如圖1所示。

圖1 數(shù)據(jù)處置結(jié)構(gòu)Fig.1 Data disposal structure

數(shù)據(jù)采集的關注點是通過服務收集各類格式數(shù)據(jù),并進行電子化存儲,因此針對不同的數(shù)據(jù)存儲場景應采用可擴展的、標準的數(shù)據(jù)收集組件,通過數(shù)據(jù)收集組件將各個監(jiān)控系統(tǒng)不同類型數(shù)據(jù)進行統(tǒng)一匯總,采用以下思路進行數(shù)據(jù)收集自動化建設工作。

通過商業(yè)軟件和定制開發(fā)的方式對運維范圍內(nèi)信息系統(tǒng)進行監(jiān)控,各監(jiān)控系統(tǒng)均有一套數(shù)據(jù)存儲系統(tǒng)[3]。為實現(xiàn)數(shù)據(jù)的統(tǒng)一存儲和綜合利用,需具備一套數(shù)據(jù)收集組件進行存儲數(shù)據(jù)的格式轉(zhuǎn)換、抽取,同時該組件支持抽取規(guī)則定制,可對抽取數(shù)據(jù)的數(shù)據(jù)量、數(shù)據(jù)種類、轉(zhuǎn)換格式、源端、目標端進行復制。數(shù)據(jù)收集組件如圖2所示。

圖2 數(shù)據(jù)收集組件Fig.2 Data collection component

由于存在監(jiān)控系統(tǒng)未完全覆蓋所有應用、服務和設備的情況,應提供數(shù)據(jù)采集Agent對專用設備和服務進行監(jiān)控及數(shù)據(jù)采集,提供移動巡檢應用,實現(xiàn)巡檢工作的無紙化和移動化,利用現(xiàn)有安全接入平臺進行移動終端接入,確保應用安全可靠。

在運維數(shù)據(jù)全采集后,形成的數(shù)據(jù)將會是海量數(shù)據(jù),數(shù)據(jù)庫必須具備高可擴展性、高并發(fā)性、高可用性等特點,傳統(tǒng)數(shù)據(jù)庫存在性能瓶頸,不能有效支撐對運維數(shù)據(jù)的集中分析和運算,因此需采用分布式數(shù)據(jù)庫[4]。分布式模式如圖3所示。

圖3 分布式模式Fig.3 Distributed mode

運維事件提醒主要是告警提醒,以聲光、郵件、短信、電話等方式自動發(fā)送,減少人為干預。部分系統(tǒng)自帶通知功能,但存在誤報情況,且發(fā)送內(nèi)容不能集中管理,需通過人工編制發(fā)送短信。因此,本文通過開發(fā)運維事件處理集中提醒處置功能,可對告警事件進行集中管理,創(chuàng)建標準事件庫,實現(xiàn)通知內(nèi)容的自動生成功能[5]。集中處置流程如圖4所示。

圖4 集中處置流程Fig.4 Centralized disposal process

 2 維護處置自動化

維護處置自動化主要包括現(xiàn)場事件處置自動化、配置變更自動化監(jiān)測和故障診斷自動化,可以節(jié)省大量人力成本。

2.1 現(xiàn)場事件處置自動化

現(xiàn)有系統(tǒng)多采用B/S結(jié)構(gòu),缺少靈活、強大的自動信息采集策略,不能適應新技術發(fā)展的需求,且與大部分應用系統(tǒng)存在沖突,運行維護容易導致服務中斷,影響服務的持續(xù)開展;缺少可視化運維支撐手段,不利于服務受理人員第一時間分析處理問題;通過電話溝通事件情況,導致溝通成本高,不能滿足對實時性的要求。目前,通過桌面異常上報工具進行問題的收集及處理,可有效推動桌面異常處置的效率和水平,但存在對桌面工程師個人能力水平依賴性較高的問題。針對以上情況,建立現(xiàn)場異常處置知識庫并與現(xiàn)有工具及應用進行有效結(jié)合,通過知識庫自動關聯(lián)給出問題的解決方案,可減少對人員素質(zhì)的過度依賴,解決系統(tǒng)處置標準不一致的問題[6]?,F(xiàn)場事件自動化處置過程如圖5所示。

圖5 現(xiàn)場事件自動化處置過程Fig.5 The automatic process of on-site event

現(xiàn)場事件處置自動化充分體現(xiàn)了現(xiàn)場運維工作的建設思路,主要涉及座席端、運維端及數(shù)據(jù)服務3個部分。現(xiàn)場處置模塊劃分如圖6所示。

圖6 現(xiàn)場處置模塊劃分Fig.6 On-site disposal module division

現(xiàn)場處置模塊涉及的主要功能如下。

1)座席端的設計充分考慮了異常事件特點,可自動完成軟電話日志、系統(tǒng)日志、網(wǎng)絡配置等基礎環(huán)境信息收集,并進行自適應截屏,將座席人員人工工作量減少到最小。

2)在上傳異常事件后,可在數(shù)據(jù)服務端自動關聯(lián)展示座席人員組織、空間、業(yè)務關系等信息,自動分析歷史事件,提高了運維人員信息收集的效率。

3)運維人員通過運維端可多維度查詢異常事件,快速瀏覽截圖、日志等信息,為準確定位問題、快速恢復服務提供有力支撐。

2.2 配置變更自動化監(jiān)測

目前電網(wǎng)企業(yè)信息系統(tǒng)運維配置管理工作主要通過文檔進行臺賬及配置信息管理,配置管理需要過多的人工干預,無法達到及時、準確及閉環(huán)的管理要求[7]。針對這種情況,可建立配置庫管理應用,與涉及變更的檢修、上下線等運維流程進行關聯(lián),同時通過代理應用實現(xiàn)對各類配置對象的實時監(jiān)測機制,自動對配置庫的變化進行監(jiān)控、記錄與管理。

要實現(xiàn)配置管理自動化,必須建立配置管理數(shù)據(jù)庫(Configuration Management Database,CMDB),配置管理的粒度越細,管理難度越大[8]。要達到配置管理自動化的目標,就需建立配置管理模型,即配置管理包括哪些配置項及配置項之間的關系。配置項應包括:聯(lián)系人、機房、機柜、電源、存儲、主機、操作系統(tǒng)、授權、個人電腦、打印機、網(wǎng)絡接口、網(wǎng)絡設備、安全設備等。要做到配置管理自動化,首先要自動偵測IP地址范圍內(nèi)哪些IP需要激活,定義設備類型及依賴關系和影響范圍;配置連接權限、連接協(xié)議和關鍵配置信息,實現(xiàn)關鍵配置(如文件、參數(shù)、程序版本)[9]定義掃描規(guī)則,定期掃描配置信息,對變更配置自動生成待處理任務,并進行確認處理;同時應支持圖形可視化影響范圍和依賴關系展示,通過查詢歷史版本,實現(xiàn)差異對比分析。

2.3 故障診斷自動化

目前大部分企業(yè)在故障診斷自動化方面無應用系統(tǒng)支撐,為實現(xiàn)故障診斷自動、及時、準確的目標,通過建立一套診斷處置策略,診斷代理自動分布式地收集日志信息,利用診斷策略對收集的信息進行集中分析,自動給出故障診斷情況及處置方式[9]。

故障診斷一般依賴于日志信息,一般通過日志可直觀判斷異常發(fā)生的原因。因此要實現(xiàn)故障診斷,首先要實現(xiàn)設備關鍵日志的收集、分析和存儲,并通過異常代碼自動關聯(lián)處置方案,利用Agent執(zhí)行處置腳本,實現(xiàn)異常的自動處置和診斷[10]

 3 輔助決策自動化

通過人工效能分析、運行健康分析、運行方式分析等方式進行輔助決策支撐,可改善目前需投入大量人力進行運行日報、周報、月報及異常分析報告等運維分析工作的現(xiàn)狀。通過建立一套報告定制系統(tǒng),可定制規(guī)則,與各監(jiān)控系統(tǒng)進行整合,自動關聯(lián)運維數(shù)據(jù),自動生成相關運行報告,最終實現(xiàn)提高報告質(zhì)量的目標[11-12]。

輔助決策自動化功能在運維數(shù)據(jù)集中管理和配置數(shù)據(jù)正確、完

大云網(wǎng)官方微信售電那點事兒

責任編輯:售電衡衡

免責聲明:本文僅代表作者個人觀點,與本站無關。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內(nèi)容。
我要收藏
個贊
?