時間:2023-03-08 15:35:31
序論:在您撰寫運維管理時,參考他人的優秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發您的創作熱情,引導您走向新的創作高度。
關鍵詞:運維管理;ERP;安全策略;SLM;客戶主數據
中圖分類號:TP311文獻標識碼:A文章編號:1009-3044(2011)18-4281-02
Introduction of Operation and Maintenance Management
LI Yong-gang, JIN Wen-ting
(Petrochemical Company of Petro China Automation Institute, Lanzhou 730060, China)
Abstract: The article introduces the operation and maintenance work purpose, through the analysis of the system architecture, from safety strategy on the application of guaranteeing the smooth operation and maintenance work。It puts forward the problem of operation and maintenance work and gives reasonable solution and optimization opinion. The implementation of effective operation and maintenance management in the operation of the system, which can solve all kinds of problems, make operation and maintenance work more effective.
Key words: operation and maintenance management; ERP; security strategy; SLM; customer master data
中國石油銷售公司ERP系統已經全部上線使用,ERP的工作重心轉為運維,如何做好運維管理工作,如何減少運維的負擔,是我們需要深化考慮的問題。我們首先要了解運維的目的,進而認識到SAP在銷售公司實施的基本架構、系統安全及優化,最后運維的實現方法。
1 運維目標
對于SAP應用系統維護的目標,我們給出了基本的定義:
第一,系統要滿足用戶合理的需求,什么是合理的需求?用戶的需求,要看合理性,不合理的需求,我們提供建議,變成合理的需求,以系統實現,合理的需求,即使系統不能直接實現,我們就是開發報表程序也要盡量滿足用戶需求。目前系統基本滿足通用的業務流程需要,合理的個性化需求只要不違背板塊的總體要求,不影響到別的銷售公司的正常業務,作為運維人員就要盡量滿足用戶。
第二,改善成易學易用的系統。SAP的系統界面在銷售公司的實施已經經過了一次客戶化設計,本身比較簡化,一些不需要的操作都不作顯示。但是銷售公司人員廣泛,各階層掌握的層次不一致,針對銷售公司崗位化操作的特點,每個崗位相關操作的事物代碼不是很多,把常用的事物代碼添加到收藏夾的方法就很實用,簡單的操作用戶就可以更加方便的對系統操作。
第三,穩定性。保證用戶正常操作和使用,尤其是月末月初,月結的時候對系統地操作人員增多,但據數量也大量增長,對系統地要求就更高,如果系統不穩定,影響到日常操作或者月末結賬,就成運維事故了。
第四,提升系統的性能。銷售ERP因為和多個系統進行接口,為了滿足不同銷售公司的個性化需求開發了很多ABAP和BW報表,這些開發雖然滿足了各個公司的要求,但是不可避免的降低了整個系統的性能,我們不斷提升硬件的系統性能和進行開發程序系統、接口程序的優化,來保證系統能夠滿足用戶不斷變化的正常的使用。
2 SAP系統架構及安全策略
下面我介紹一下銷售公司SAP系統的架構,按照SAP的標準,首先是有開發系統、測試環境然后正式環境這三套系統。整個的系統基礎平臺都已是Netweaver平臺,ERP系統我們現在是7100.4.14.3136版本,全部系統的數據庫都是在適合大型企業的ORACLE下建立起來的。
下面我簡單介紹一下我們使用的SAP系統安全策略,首先就是操作系統的安全,它包括了防病毒系統、操作系統的監控和我們的監控人員的日常作業。它保證了我們的各系統的正常運作,特別介紹一下SAP應用系統的策略,例如∶用戶口令、用戶帳號的安全策略,用戶口令安全我們制定了一系列的安全策略,有口令長度的控制、例外控制、使用時間控制等,對于用戶帳號的問題,我們設置連續輸入三次錯誤密碼自動鎖定帳戶的機制,防止他人猜測密碼進入操作;還設置密碼三個月自動重置,加強了安全性。
然后數據的備份策略,為了在系統出現故障時能及時恢復系統,我們從正式系統拷貝出一份,定時備份,以防系統出現意外情況,及時恢復。
系統的安全問題處理,實際上我們主要是從四個方面,一是網絡安全、系統安全、數據安全、機房的安全,這四個方面都有專門人員作日常值班。每天值班人員監控系統,對于系統發生異常狀況時,都能及時的發現、及早處理,并且對各種異常我們都制定了一系列的處理的流程,比如SLM系統提報機制,根據問題級別,分類處理。然后對于用戶的問題處理,用戶是能使用系統還是不能完全使用,可以根據不同情況處理作不同的處理。最后還要總結這些問題,制定策略一方面是以后如何避免該問題的發生,一方面是制定以后再出現類似的問題如何處理的流程,以便及時處理好這些問題,提高用用戶的滿意度。
3 運維的問題以及解決方案
目前主要存在的運維問題有以下幾點:
第一、新客戶主數據申請時間較長,新開發客戶銷售業務無法及時開展。
目前,新開發的客戶申請流程如下:申請FMIS7.0編碼MDM平臺申請ERP編碼ERP編碼擴展財務對照表維護財務對照表審核財務責任中心對應。由于FMIS7.0編碼和ERP編碼申請均需要經過股份和項目組相關人員審批,流程較長,后續流程屬于我公司可控范圍。目前完成客戶申請提報到財務責任中心對應至少需要2個工作日的時間,在此階段該客戶發生的業務無法按照正常業務流程在線運行,導致新增客戶困難,影響市場開發。
盡量優化申請流程,尤其是要保證ERP系統內這部分可控范圍內的效率,這至關重要,其他系統的操作我們可以電話聯系相關人員進行溝通解決。
第二、由于系統流程設計原因,發生的非正常數據,系統考核未剔除。
銷售公司對于ERP系統的使用進行考核,一些停用的加油站在系統內并未刪除,基數過大導致考核成績差。
系統內停用的站點都是以凍結客戶的形式暫時不允許使用,并不是真正刪除,所以導致考核時統計并未刨除這部分加油站。這一點的改進需要調整考核的策略,按照客戶數量進行統計在用的加油站客戶。
第三、結賬時系統速度太慢。
月末結帳時,用戶登錄系統數量增大,導致系統數據交互頻繁,速度減慢。
增大服務器內存,優化程序,提高服務器響應速度。
第四、應用問題。
由于銷售公司實行崗位輪換,人員變動頻繁,第一批參加ERP系統上線的關鍵用戶大多都不在原崗位上,接手人員由于工作交接、缺乏業務知識等原因,操作不熟練,造成一定的錯誤。
由于每個銷售公司都有專門的運維負責人,各個運維負責人可以根據該公司情況制定出專門的培訓手冊下發,大家通過看材料自學,在線提問解答的方式盡快完成知識轉移。
4 運維流程的優化
目前的運維流程為,分公司用戶提出問題給他們的關鍵用戶關鍵用戶提報SLM至運維中心并發傳真運維中心收到傳真轉問題給運維負責人運維負責人轉問題給相應負責人在測試系統處理完畢運維負責人測試運維負責人發起傳輸到正式系統的申請運維負責人在傳輸完畢后轉移問題給提報人提報人關閉該問題。
優化流程需要從各個環節做起,首先要求提報人把問題寫清楚、要求提明確,減少運維中心和運維負責人進行問題分類和分析的時間;完善測試系統,使測試過程簡化;提報人經常提完問題就不再關注,這一點需要糾正,時刻關注郵件提醒,問題轉移回來及時通知各分公司用戶。
5 結論
運維管理是提高ERP系統順暢運行的必備保障,已經成為中石油信息化建設的重要組成部分。運維管理可以有效解決實際系統運行中的各類問題。運維工作是一項長期、重復性較多的工作。運維人員要做好預防性的工作,做到防微杜漸;盡量減少人為因素對運維流程造成的不及時性,使運維工作更加有效率。
參考文獻:
關鍵字:集中帳號管理、集中認證、集中授權、安全審計
中圖分類號: G250.74 文獻標識碼:A
隨著信息化技術的日新月異,信息化建設也取得了飛速發展,系統核心業務大多應用采用集中化的數據處理中心運行模式,設立相對集中的數據處理中心,伴隨信息化的不斷推進,業務應用、辦公系統不斷被推出和投入運行,大量的服務器主機來運行關鍵業務,提供業務應用、數據庫應用、運維管理等服務。
由于運行著大量的網絡設備、主機系統、數據庫系統和WEB中間件,它們分別屬于不同的部門和不同的業務系統。目前各IT系統都有一套獨立的認證、授權和審計體系,并且由相應的系統管理員負責維護和管理。當維護人員同時對多個系統進行維護時,工作復雜度成倍增加。另外管理員給用戶分配權限,缺乏集中統一的資源授權平臺,無法嚴格按照最小權限原則分配權限。隨著用戶數量的增加,權限管理任務越來越重,系統的安全性無法得到充分保證,給業務系統帶來重大的安全隱患,甚至影響業務系統運行效能。具體體現在如下幾個方面:
1、賬號共用問題
網絡中網絡設備、主機系統和數據庫系統眾多,有些帳號多人共用,不僅在發生安全事故時,難于確定帳號的實際使用者,而且難于對帳號的擴散范圍進行控制,存在安全隱患。
2、資源使用問題
系統的增多,使運維人員經常需要在各個系統之間切換,每次從一個系統切換到另一系統時,都需要輸入用戶名和口令進行登錄,給運維人員的工作帶來不便,影響了工作效率。運維人員為便于記憶,會采用較簡單的口令或將在多個系統間使用相同的口令,弱口令和相同口令危害到系統的安全性。
3、授權力度問題
在這種復雜異構的支撐體系中,IT運維最佳實踐是用戶最小權限分配原則,由于各系統單獨授權,無法嚴格執行,同時,隨著業務系統的增加,用戶的增加,用戶授權管理工作也變得相當復雜,系統安全性受到威脅。
4、資源審計問題
由于各IT系統獨立運行、維護和管理,所以各系統的審計也是相互獨立的,不但各個系統單獨審計,即使同一系統中的每個網絡設備,每個主機系統都要分別進行審計,缺乏集中統一的訪問審計平臺。無法對IT系統進行綜合分析,不能及時發現內部破壞和外部入侵行為。
如何提高系統運維管理水平,滿足相關標準要求,防止黑客的入侵和惡意訪問,跟蹤服務器上運維人員的操作行為,降低運維成本,提供控制和審計依據,成為一個單位或公司越來越關心的問題。
可信運維管理技術作為目前內網安全最前沿、最核心和最全面的技術趨勢,可以針對核心服務器、數據庫等資源的運維,提供了最核心的監控和保護,通過部署該技術進行運維管理,實現了運維人員集中的賬號管理,提高了管理的有效性;實現了集中認證與訪問控制,提高運維安全性;實現了集中授權、安全審計,規范運維過程。
1、集中帳號管理,提高管理有效性
通過可信運維管理會建立一套新的用戶體系,完全替代原有各系統獨立管理的用戶體系,前端用戶直接對應到維護人員,后端用戶直接對應到原各個系統用戶,提供集中可實名的用戶管理機制。通過統一用戶信息維護入口,保證各系統的用戶帳號信息的唯一性和同步更新;
2、集中認證與訪問控制,提高運維安全
集中認證實現用戶訪問信息系統的認證入口集中化和統一化,并采用高強度的認證方式,使整個信息系統的登錄和認證行為可控制及可管理,從而提升業務連續性和系統安全性。
集中訪問控制為維護人員提供統一的系統和設備入口,提供訪問控制功能,有效的解決運維人員的操作問題,降低相關信息系統的安全風險。
3、集中授權、安全審計,規范運維過程
對企業管理層而言,如果每年的IT運維管理成本預算不斷增加,又不能清楚看到這些成本投入到哪里,會帶來怎樣的價值,加之時不時出現的IT故障和業務部門的投訴等。這些問題積攢在一起, IT部門不僅會讓人覺得“虛”,更可能留下“花錢惹麻煩”的印象。表面上被認可,但實際價值卻難以落“實”的企業IT運維管理已成普遍現象。近期剛剛收獲“2012年IT運維管理最具價值品牌”榮譽的銳捷網絡,正在改變這一局面。
“看、說、做” 的新角度
銳捷網絡IT運維管理業務部總經理馮晉陽認為:“IT運維工作無法拋棄為業務部門服務的本質,如果缺乏展示手段,IT在企業中的價值就有可能被沖淡。IT運維部門想要得到認可,必須把工作價值體現出來,并讓別人發現?!眰鹘y的IT運維管理產品經過多年發展,雖然已經有了相當規模的應用基礎,但在體現IT系統價值方面還存在缺陷。這些缺陷首先體現在給企業管理層提供決策的“看、說、做”上。
首先是“看”:保證企業的IT系統能夠保持一個高效穩定的運行狀態,提升企業應對市場的能力,這是IT運維管理的重要價值。但是,傳統的IT運維系統卻很難直觀地讓管理者看到這種狀態。其次是“說”:當年終領導詢問下一年的經費預算時,IT運維主管領導往往左顧右盼,只能說“大概”怎樣。在需要IT運維部門“說實在話”的時候,由于沒有科學的證據,IT部門的主管往往難以獲得公信力或者說服力,這也是傳統IT運維管理工具的缺陷。最后是“做”:IT運維部門如何去描述自己的工作價值?雖然現代企業的發展離不開IT技術的有力支撐,但IT投入的最終目的依舊是為了使業務系統發揮功效,實現利潤與收益。在這條價值鏈上,IT運維管理在做什么呢?如果我們還停留在設備、網絡、服務器的底層監控階段,運維管理是無法與業務有機融合的。在企業的價值鏈中,IT運維的價值也會在無形中被抹殺。
“站在業務的角度去做運維,站在科學的角度上去說運維,站在企業價值的角度去呈現運維,這三點就是銳捷RIIL能夠幫助運維部門把價值落實的關鍵?!瘪T晉陽談到。用RIIL激活IT價值
對于IT運維管理部門來說,采用銳捷網絡的RIIL激活IT價值,要做到有章可循,可以分為三個具體的階段性操作來實現。
第一階段:用RIIL搭建基礎架構管理中心,通過多種協議方式完成所有設備的采集,形成物理和邏輯拓撲圖。幫助IT運維部門實現IT基礎設施管理的可視化和自動化,降低管理復雜度,從而提高對IT基礎架構的主動監管能力。
關鍵詞:IT運維管理;穩定運行;維護工作;設計與實現
中圖分類號:TP311.52
20世紀90年代以來,隨著英國政府電信管理中心及其下屬的中央計算機研發中心對IT服務管理實踐指南,即ITI信息技術基礎設施庫的正式,IT服務的質量由此開始有了一個質的飛躍。自此,作為IT管理模型的杰出代表,ITIL技術被廣泛采用,在很大程度上發揮了現代信息化資源的優勢。隨著近些年IT業的不斷地快速發展和市場應用信息化處理技術的發展日趨成熟,IT管理系統在整個部門工作中的地位顯得越來越突出。當前形勢下我國國內的IT運行管理體系仍舊以分散管理為主流系統,隨著我國經濟的不斷壯大與發展,傳統的IT運維管理已經不能滿足這種高工作量的工作,各單位內部事物的工作效率成為了高層管理著很傷腦筋的難題;由于現在國內對于IT運維管理要求的不斷提高,使得上述問題日益突出,對于運行維護部門而言要求資源進行支持的加強化已成為必然;因此,為了保證當今形勢下我國網絡的穩定性和安全性,對于整個IT行業的運維管理就必須改變以往的分散式管理運維制度,進行強化集中管理,加強以ITIL為主導的新一代運維系統的建設工作。以前,信息部門在處理相關故障方面并沒有一個統一規范的處理標準和處理步驟,同時也缺少對出現的相關的問題的記錄工作。自從基于ITIL為理論基礎的新型IT服務管理平臺投入運行之后,通過對整個發生的事件管理和配置管理兩個主要流程的記錄與處理,實現了整個IT運維管理的流程化和標準化的處理過程后,企業員工可以很方便的通過多種途徑對IT中出現的各種故障報告或者提出與之對應的服務請求。
1 ITIL簡介
作為IT服務管理的核心框架,ITIL是一套能夠協同整個運維流程通過服務級別協議(sLA)來提高IT服務質量的一種新型理論。它融合了系統管理、網絡監測以及系統開發管理等現代管理活動,以及對信息變更處理、資產管理和問題管理等許多流程理論與實踐的IT服務管理理論;整個IT管理主要分為兩大部分,即服務支持和服務提供;ITIL把整個IT管理活動歸納為一項管理功能和十個核心流程的處理工作;IT服務支持和服務提供又各包含五個流程,主要有事件管理和問題管理等環節;通過介紹我們不難發現,ITIL是通過對整個IT運維服務中的服務支持來進行事件管理的,事件管理對整個IT服務中遇到的故障能夠做出應急處理,通過對管理方法的變更、和配置管理來保障整個IT處理過程的記錄和管理工作的順利進行,從而達到對整個服務系統影最小化的目的。ITIL的根本目的就是為改善一系列IT服務質量不佳的狀況而不懈的努力。在整個IT處理的業務流程的改進過程中,ITIL能夠支持包括對現代企業組織機構不同形式和不同構成要素工作的全面支持與處理工作。并且可以做到根據機構、部門、工作組、所處崗位對不同人員進行靈活的模式分工。
2 IT運維管理系統的設計與實現
2.1 IT運維管理系統流程與運維管理
為了適應不同運維環境的需求,IT運維管理系統就應該對事件故障的發生以及相應流程標準處理機制全面考慮。使系統能夠根據使用者的需求功能(問題管理、事件管理以及管理等)進行高效的管理與預處理工作。所謂問題管理簡而言之就是當整個設計運維管理系統自動發現機制中,一旦出現故障信息,能夠迅速的以IT系統維護的關系作為依據對整個IT信息進行自動篩選并且發送給相關的運維管理人員,系統將收集到的信息進一步向系統工作臺進行轉發,以提醒相關人員對故障進行進一步的處理工作。事件管理,顧名思義,就是對已經產生的事件進行篩選,然后判斷是有相應的錯誤存在;一般而言,在具體條件下系統對做出處理反饋或者交由相關工作人員進行處理的事件有一定的記憶能力,這對于系統能夠最在有效的條件下解決故障事件的能力有了更好地保障。當前,隨著網絡協議發展的日趨成熟,整個計算機服務管理系統的資源模塊的不斷升級,以TELNET、SSH、SNMP等多個協議為代表的新型資源管理模塊能夠完成對信息的自動提取、發現設備故障和對設備故障進行監控等任務;一旦設備出現故障,運維管理人員處就能夠對故障進行及時有效的處理,在運維管理模塊給出故障分析的具置并就故障進行處理的過程。另外,為確保整個系統的的正常運行,運維管理模塊在對相關事件日常管理的基礎上還增加了專門針對于日常運維管理機制的設計工作,在各個配置模塊上添加了日常任務管理的功能,保證了每天系統對全套設備進行安全檢查的質量與效率。
2.2 資源管理
作為整個IT運維管理系統的基礎,資源管理系統能夠實現對全套系統的所有資源進行清楚的記錄并且有效地對管理效率有所提升,當前資源管理手段還是主要建立在對相應資源的電子或者紙質文檔的管理上,但是這種傳統的資源管理模式一旦出現資源的種類以及數量稍有增減的現象,便會使整個資源管理的工作變得十分繁復。因此在整套運維管理系統平臺中,運維管理人員須首先對各種資源進行分類,然后按照固定的格式和要求完成對各類資源相關信息的錄人工作,最后還要對整個管理流程配置自動監管設備,以保障在故障產生時系統能自動進行提醒。
2.3 服務臺與服務臺各功能的實現
服務臺是客戶向系統提交相關操作請求的一個窗口,而作為客戶提供的服務請求,說白了其實就是業務部門與整個信息中心之間進行信息交流的一個接口,但這個接口特殊是因為它具有唯一性。因為整個來自服務臺業務的客戶投訴和服務臺系統的監控系統發出的告警信息都是通過這個借口來傳遞的。服務臺業務流程是:根據客戶投訴或者監控系統發出的告警填寫服務請求工單,服務臺值班人員根據請求的嚴重程度判斷是否需要馬上處理或者現場處理,如果需要直接進入事件管理流程的入口(升級為事件);如不需要就分配給相關人員立即處理,處理完畢后填寫請求處理工單,該服務請求流程結束。
3 小結
提高整個IT運維管理部門工作效率的最為行之有效的方式就是從整個IT系統的擴展性能、實用性能和集成性能方面出發以全局的眼光來提高整套IT設備的管理從而完成以ITIL理論為基礎的全套運維管理系統的設計工作,成為當下相關信息中心研發部門進行研究和改進的重點。
參考文獻:
[1]張瑞冉.IT服務管理在運維管理中的研究與應用[D].首都經濟貿易大學2012
[2]楊小曄.IT運維管理平臺的設計與實現[D].北京郵電大學2011
[3]林碧芬.基于信息類型的信息網站設計模式研究[J].福建電腦.2009(11)
設計基于IT運維的設備管理平臺時,可以在遵循上述需求分析的情況下,進行數據庫、中間代碼以及前端等的設計,設計后同時進行數據庫、中間件及客戶端的部署??紤]到以后的管理及維護成本,可以采用B/S架構;數據庫選擇Mysql,其高性能及高并發性會給設備管理平臺提供高效的數據引擎支持;為提供報表管理功能,設備管理平臺也會提供數據導入導出工具。基于IT運維的設備管理平臺能夠對設備管理的全過程進行動態管理,不論是進行設備的采購、維修還是報廢等工作,都需要根據設備管理的操作流程進行,而且設備管理流程的每個步驟都要能夠根據操作人員的角色進行業務處理,從而快速、高效的管理設備。作為平臺的核心功能模塊,設備故障處理要經過故障申報、故障處理以及處理結果等步驟,每一步驟完成后會顯示步驟的操作人員和處理時間。
2IT運維管理平臺的功能模塊
缺陷管理模塊中可以創建關聯的變更單,此時有缺陷的被管理設備的狀態被標記為“擱置”,缺陷問題被創建后,一旦缺陷問題被成功關閉,則可以根據缺陷的解決狀態進行設備的狀態變更,解決的缺陷其狀態被變更為“已解決”。缺陷的記錄一般由發現缺陷的人員進行,缺陷驗收合格后,設備管理平臺的運維人員需要注明缺陷處理的相關信息,并注銷缺陷。IT設備經常會遇到變更關聯設備的情況,如果某設備有關聯的設備存在,那么此設備的關聯關系在被關閉前,此設備不能被移除。其中,用戶接入指的是用戶提交設備變更單,對于處理完成的變更單,如果其達到預期目標,那么此變更單相關的設備變更流程即可關閉,否則此變更處理流程需要被返回。檢修人員作出的檢修申請形成變更申請單,如果此變更申請單涉及到的是通信的檢修或停退,需要判斷此檢修過程是否存在檢修計劃,目的是讓用戶明確的知曉,從而指導設備管理。安裝人員提交安裝調試的變更申請,只有當所有變更資料都提交完后,才去驗收安裝調試過程是否合格;如果安裝調試過程達到預期目標,則可以關閉此變更申請單。配置管理變更申請一般是由用戶提出,配置管理人員會判斷是否需要備份處理。日常巡檢管理模塊根據巡檢的設備來執行不同的標準,巡檢記錄可以根據不同的預定義規則生成。設備管理平臺的運維人員根據巡檢標準、巡檢周期等進行設備的定期巡檢,并記錄相關的巡檢日志。相關設備的維護人員對此巡檢日志進行分析,并給出是否正常、是否有缺陷等結論,如果發現設備的缺陷,則依據前文介紹的缺陷管理模塊進行處理。
3基于IT運維的設備管理平臺
【關鍵詞】企業;SAP系統;運維管理
很多企業已經實施或正在實施SAP系統,多數企業SAP系統實施過程中關注的重點是如何滿足業務和管理的需求,目標是通過SAP提升企業管理水平,因此在這方面投入了更多多的時間和精力。SAP上線后企業關注的是系統的性能和不允許間斷作業。于是SAP系統的日常管理及安全也提出了大量的挑戰。而企業的SAP多數是兼職人員來管理,能力有限,企業更多的時間是為了滿足和保證系統的高可用性。因此,他們的主要工作是為了滿足不斷增多的用戶,不斷增漲的業務需求。安全性成了重中之重,企業也往往只關注SAP系統的性能和不間斷來滿足業務需要。安全方面任何行為或操作都不允許影響業務。
SAP系統,它在企業中的位置絕對是最重要的和最關鍵的,任何閃失都不允許出現的。企業花費大量的人力和物力來打造SAP系統,看重就是業務功能的實現。功能在業務部門眼中絕對排第一位,任何可能影響SAP系統正常運行的行為都會被扣上一頂影響生產,影響業務的帽子。造成了SAP后臺管理人員害怕、也不敢提出對SAP系統的任何變更和調整。因為誰也禁不起這頂大帽子。這就造成了后臺管理人員工作明顯傾向于穩定、性能??墒?,穩定和性能是非常耗時耗力,在努力解決SAP系統穩定和性能的同時,安全往往被忽視。
企業只重業務,輕視安全的事例比比皆是,這是多數企業的通病。出了安全問題才會亡羊補牢的事件也時有發生。SAP系統能夠影響業務,影響生產,如此重要,企業更應該重視其,安全不要被遺忘,不要被忽視。
本文重點討論SAP系統安全容易被忽視的方面,任何方面對安全而言都是重點。
其一,權限。SAP實施之初就會規劃和設計用戶權限,SAP系統本身的權限設計也非常到位,非常精細,可以看出SAP公司重視安全管理。多數企業初期把權限管理的都比較好,但隨著企業的運行,業務人員感覺對權限的需求永遠滿足不了其實際業務的需求,于是業務人員的權限會申請更大的權限。造成的結果就是權限形同虛設,到處都是權限過大的用戶,一旦發生泄密事件,系統管理人員無法排查。因此,建議企業不要因為業務需要而放任權限的審核。即使很麻煩,即使效率低,也要進行嚴格的管理,使之防患于未然。
其二,操作系統。是最容易被企業忽視的SAP系統安全的一部分。SAP系統所有數據在數據庫里,數據庫在操作系統下,因此取得操作系統權限就相當于獲得了整個數據庫,進而取得了整個SAP。因此操作系統安全不容忽視。
其三,備份。SAP系統備份是必須的,雖然它可能永遠也用不上。備份是運維管理人員的定心丸,也是SAP系統管理工作最重要的組成部分。但企業往往只重視備份,而忽略恢復。備份不是主要的,定期的恢復測試才是備份的意義所在。
其四,接口。企業中同SAP系統集成的系統越來越多。這方面的安全容易被忽視,SAP系統集成需要有一定權限的用戶,用戶創建后,授權限,接口開始使用,需要慎重管理這些用戶和密碼,這是一個非常危險的入口。因此,建議管理這些用戶,或實施接口盡量減少這些用戶的權限。
其五,數據庫。也是最容易被企業忽視的SAP系統安全的組成部分。SAP系統安裝過程中要求配置了多個數據庫的用戶和密碼。上線后,這些用戶將被徹底遺忘。SAP早期版本system的密碼是Oracle數據庫的默認密碼,后期幾乎不會被用到,當然也無人管理。多個用戶設置成同一個密碼,而且很可能非常簡單,能否記住創建的哪些用戶,實施顧問可能也無法說清楚。關注這些被大家遺忘的用戶能夠降低系統的風險。
經研究,在整個IT產品的生命周期中,采購和建設階段只占全部時間和成本的20%~30%,而運營階段則占了整個時間和成本的70%~80%,由此可見IT系統運營管理的重要性。然而,在過去相當長的一段時間內,醫院的IT信息部門更關注信息系統的建設和應用,而對該系統的運維管理則缺乏相應的重視和研究。大多數醫院雖然設立了信息中心或計算機中心來負責系統維護,但維護手段仍停留在較為初級的被動受理和解決故障階段,缺乏完善的維護管理流程,沒有設立明確的運營維護工作的考核指標。部分醫院甚至僅委派一名或兩名技術工程師負責全部IT系統的維護工作,管理者很難真正了解其IT維護管理水平的高低,進一步改進的方案也就無從談起。這種停留在初級階段的系統維護方法,顯然無法適應醫療IT應用系統日新月異的建設水平。
IT服務管理領域的標準ITIL
談到IT運維管理,我們先來了解一下有關ITIL的基本知識。在上世紀80年代末,英國政府商務辦公室OGC(Office of Government Commerce)開發出了ITIL(Information Technology Infrastructure Library)的最初版本,ITIL在面世之后,迅速從英國擴展到了全球許多國家。目前,ITIL已經取得了全球IT服務管理領域的廣泛認同和支持,成為了IT服務管理領域事實上的標準,目前全球有數萬家企業在應用ITIL。
從實踐中總結而來,是ITIL最大的特點,最初的ITIL版本就是一系列IT最佳實踐的總結。因此,ITIL不是采用先設計整體框架再細化各部分這種“自上而下”的方式開發出來的,與其他的標準有很大的區別。ITIL的最初版本中包含了十個以上的流程組,而后,OGC通過對最初版本的整合,消除了重復和不一致的地方,了ITIL v2版本,共包含7個體系:服務支持、服務提供、實施服務管理規劃、應用管理、安全管理、基礎架構管理及ITIL的業務前景,這就是被廣泛引用的ITIL框架(見下圖)。
由于本文討論的是醫院的IT運維管理,不可避免地借鑒了ITIL體系中的許多概念。但需要說明的是,ITIL僅僅是為IT服務管理提供了一個框架和準則,而其本身并非產品,應用ITIL也無需系統支持。參考和借鑒ITIL體系,建立和健全適合醫院自身實際的IT運維管理體系,才是我們的目的。本文的重點在于討論對醫院IT運維管理體系的建立,對ITIL本身就不再多介紹了。
當前醫院IT運維工作存在的問題
當前,醫院的IT系統運維工作通常由信息科或計算機中心等部門來負責。在部分信息化建設步伐較快的醫院,已經有專職的技術人員來負責IT系統的運營與維護,部分大醫院維護人員人數已經不少,但以下問題仍在醫院的IT運維工作中普遍存在:
1. 維護工作以“被動式服務”為主
主要體現在對IT系統的維護往往是在問題發生后,IT維護人員類似“救火隊員”一樣趕去搶修故障,缺乏主動性的預防式服務,這種維護模式下IT維護部門往往依賴一些技術水平高的“救火英雄”,而忽視了如何從管理的角度去預防問題的發生,結果就是一些本來可以避免的故障反復發生,給醫院的業務帶來阻礙。
經研究數據表明,IT系統發生的故障,只有20%是因為軟件、硬件或環境(網絡、電力等)因素造成,而有40%的原因是缺乏管理流程造成的。例如未經測試的變更,或是系統高負荷運轉等原因造成,另外40%的原因是由于人員操作失誤、備份或安全方面的疏忽所導致。也就是說在IT系統發生的問題中,大多數的問題是可以通過管理來避免的。
2. IT部門與業務部門的溝通不暢
對于使用IT系統的業務部門來說,關心的是業務不中斷,IT系統能夠安全穩定的運行,而IT管理部門往往是以技術為中心,這樣如果在業務部門產生對IT系統的使用需求或者是發生故障時,IT部門往往會將注意力放在技術環節上,而忽略了對方的業務目標。一個簡單的例子是,當業務部門由于設備故障(例如臺式機)而影響業務時,IT運維部門首先要做的不是解決故障,而是需要清楚恢復業務的時限,如果是恢復時限要求很高的問題,那么IT維護部門可能首先要做的可能不是去解決故障,而是更換一臺備用電腦來保障業務在最短時間內恢復。做到這一點就要求IT部門與業務部門有一套共同的溝通語言,這一點在后面講到服務級別管理時再詳細討論。
3. 不能量化評估IT部門工作的績效
IT運維部門的績效往往難以考核,產生的原因是由于未能制定有關IT運維工作的考核指標,日常的IT運維工作通常都由繁瑣細微的事情組成,如果沒有對關鍵事件進行記錄,沒有對各項工作的目標進行事先約定,那么對IT運維工作的評價只能夠憑感覺,沒有業務部門與IT部門都認可的標準,既談不到準確評估,更談不到改進與提高。
建立IT運維管理體系
以上提到的一些問題,在許多醫院中都普遍存在。想要解決這些問題,提高醫院的IT運維管理水平,需要做的工作很多,需要醫院IT部門有計劃、分階段地進行,逐步建立適合醫院自身IT水平的運維管理體系。
建立醫院IT運維管理體系,至少應該包括四項基本內容:IT運維考核指標(KPI,Key Performance Index);服務臺;服務級別協議(SLA,Service Level Agreements);IT基本服務流程。
1. IT運維考核指標
IT運維考核指標是醫院IT運維管理體系的核心,只有建立了科學的考核體系,才能對IT運維工作的結果進行量化評估與考核,發現不足,進行改進。IT運維考核指標是針對整個IT運維部門而制定,考核的是IT運維部門的整體績效,指標的設定應該包含對IT運維工作結果、部門及人員發展、財務等幾個方面的考核,我們在這里重點討論一下應該如何設定IT運維工作結果的考核指標。
IT運維部門的主要職責一方面要對IT設備及系統進行維護管理,保障其良好運行,另一方面要響應業務部門的需求,解決業務部門提出的問題。因此對IT運維工作的KPI設定主要分為IT系統運行水平和IT技術支持水平兩大類。在這里對這兩大類的常見考核指標做一些介紹,供醫院IT部門參考。
(1)IT系統運行水平KPI
通過對IT系統運行水平KPI的考核,可以考察IT運維部門的維護水平,這類指標常見的有:
系統中斷時間,指由于軟硬件或外界環境原因引起的關鍵應用系統的業務中斷時間,考核周期通常以月或年為單位,而具體目標的設定可根據各自醫院應用系統的數量、運行水平來制訂,例如:系統中斷時間
故障發生次數,指IT系統的故障發生次數,考核周期通常以周或月為單位。例如:故障發生次數
網絡安全性,保障網絡信息安全是運維工作的重要目標,對網絡安全性的簡單考核可以用考核周期內網絡信息安全問題的發生次數來進行,如果要做更科學的考察,可以根據不同等級的安全問題設立網絡安全性指數。
故障業務影響率,這一指標是考察發生的所有故障中,影響業務的故障所占比例,計算公式為影響業務的故障總數/故障總數。
(2)IT技術支持水平KPI
與第一類指標不同,技術支持水平KPI主要考察的是IT運維部門的技術支持和服務水平,重點考察IT部門是否能夠及時響應業務部門的申告與要求,服務水平是否達到了業務部門的期望。
故障解決達標率是指在目標時間內解決的故障數/全部故障數。對于不同級別的故障,事先都設定好了目標解決時間,這一指標考核的是在預計時間內解決故障的比例,這比簡單考核故障解決率更能反映IT運維部門對業務部門的支持情況。
平均故障解決時間是指所有故障的解決時間之和/所有故障次數。這一指標反映的是IT運維部門解決故障的能力,與第一個指標組合使用,可以更全面地反映IT運維部門的技術服務能力。
客戶滿意度是指IT運維部門的客戶是業務部門,對醫院來說就是使用信息系統的各個科室,服務水平的高低最終要反映到用戶的主觀感知上,因此設立一個主觀感知指標是非常必要的。這一指標可以通過對業務部門的滿意度調查問卷來實現。
以上3個指標是對IT運維支持水平最常見的考核指標,這類指標還有很多,例如故障響應及時率、故障解決超期時間、重復故障發生率等等。如何設定考核指標,關鍵是要符合醫院的IT管理戰略目標和IT管理重點,合理設定不同指標以及所占權重,使得KPI考核能夠達到促進IT運維管理的目的。
2. 服務臺的職能
對建立IT運維管理體系來說,服務臺在其中扮演了非常重要的角色,是建立IT運維服務體系必不可少的一環。我們這里說的服務臺并非是一個簡單的設立了熱線電話的值班員,它有幾項最基本的職能:
服務臺為用戶提供了IT部門的單一聯系點,確保用戶通過服務臺可以找到支持人員,也就是說確保了服務的可達性。
服務臺對所有用戶請求進行記錄,并監控后續處理過程,直到問題解決。這就保證了前面提到的IT運維指標體系中,所需要的數據都有權威依據,如系統中斷時間、故障解決達標率等。
服務臺作為IT部門的首次聯系點,可以過濾掉不相干的問題,并處理掉常見問題和簡單問題,而將處理不了的復雜問題再轉給IT后臺部門,這樣就保證了IT的技術支持部門不會被簡單的問題所打擾,可以集中精力處理專業性的問題。
建立服務臺遇到的常見問題是業務部門在遇到故障時,都習慣于直接找自己熟悉的IT工程師解決,而不愿意找服務臺幫助,解決此問題要求IT部門向業務部門大力宣傳服務臺的好處,同時也要大力改進服務臺的服務能力,比如服務臺直接服務的水平,響應的時間等。
3. 服務級別協議
服務級別協議(SLA,Service Level Agreement)的含義是IT部門對業務部門的服務承諾,定義了各種服務類型所要求滿足的服務質量。SLA的特點是用業務語言描述,而不是用技術語言進行描述。例如,對于故障處理,在SLA里可以將故障分為三類:影響業務的緊急故障、對業務使用存在隱患的嚴重故障及普通故障。然后分別對這三類故障定義響應時間和解決時間,例如緊急故障要求10分鐘響應,1小時解決,而普通故障則要求30分鐘響應,3個工作日解決。
只有在有效的服務級別管理被建立的條件下,IT部門才能更加清楚他們被期望提供什么和可以提供什么,因此才能夠更好地計劃和管理所提供的服務。
4. 建立基本運維管理制度流程
IT運維部門應該建立一系列基本運維管理制度和流程,以確保IT運維部門的基本任務得以實現。IT基本運維制度流程主要包括故障支持流程、IT變更流程、IT日常維護管理制度、重大事件應急管理流程以及IT安全管理制度等。這些基本運維管理流程的建立,是確保SLA能夠實現的制度保證,可以使IT部門在向業務部門提供服務時,能夠按照標準流程進行,從而保證服務的確定性,并能夠比較容易地發現服務中存在的問題,進行改進和提高。
IT運維管理外包的基本情況
以上簡要介紹了建立IT運維管理體系的基本概念及方法,最后再介紹一下關于IT運維管理外包的基本情況。
IT運維管理外包是近年來的新生事物,在歐美許多國家,將IT系統的運維工作外包給專業的公司已經比較常見,在國內,部分行業也已經開始進行這方面的嘗試。實際上IT運維管理外包這種模式非常適合于醫療行業,主要原因在于:
1. IT運維管理是一項非常復雜和專業的工作。對于醫院來說,IT管理并非其所擅長的領域,即使投入很多精力,也很難在短時間內見到成效。而專業的IT外包公司則具有豐富的經驗,可以在短時間內幫助醫院把IT系統的維護管理工作提升到較高的水平。