it運維管理論文
it運維管理論文
IT運維管理作為企業(yè)信息化管理的重要組成部分,有效保障了企業(yè)業(yè)務(wù)的正常運行。這是學(xué)習(xí)啦小編為大家整理的it運維管理論文,僅供參考!
it運維管理論文篇一
IT的運維管理與實現(xiàn)
摘 要:在科技不斷發(fā)展和信息技術(shù)日新月異的當今社會,人們的日常工作對信息系統(tǒng)的以來越來越大,因此,整個信息設(shè)備的穩(wěn)定運行以及日常的維護工作就顯得尤為重要。本文以ITIL理論為基礎(chǔ)對當今社會的IT的運維管理與實現(xiàn)做了深入的探討。文章開頭簡單介紹了IT在國際以及我國的發(fā)展歷程,并就ITIL作了詳細的概述;其次,通過對IT運維管理系統(tǒng)流程與運維管理以及資源管理和服務(wù)臺與服務(wù)臺各功能的實現(xiàn)來論述了整個IT運維管理系統(tǒng)的設(shè)計與實現(xiàn)過程。文章最后對本文進行了細致的總結(jié),并就未來IT的運維管理的發(fā)展做了展望。
關(guān)鍵詞:IT運維管理;穩(wěn)定運行;維護工作;設(shè)計與實現(xiàn)
中圖分類號:TP311.52
20世紀90年代以來,隨著英國政府電信管理中心及其下屬的中央計算機研發(fā)中心對IT服務(wù)管理實踐指南,即ITI信息技術(shù)基礎(chǔ)設(shè)施庫的正式發(fā)布,IT服務(wù)的質(zhì)量由此開始有了一個質(zhì)的飛躍。自此,作為IT管理模型的杰出代表,ITIL技術(shù)被廣泛采用,在很大程度上發(fā)揮了現(xiàn)代信息化資源的優(yōu)勢。隨著近些年IT業(yè)的不斷地快速發(fā)展和市場應(yīng)用信息化處理技術(shù)的發(fā)展日趨成熟,IT管理系統(tǒng)在整個部門工作中的地位顯得越來越突出。當前形勢下我國國內(nèi)的IT運行管理體系仍舊以分散管理為主流系統(tǒng),隨著我國經(jīng)濟的不斷壯大與發(fā)展,傳統(tǒng)的IT運維管理已經(jīng)不能滿足這種高工作量的工作,各單位內(nèi)部事物的工作效率成為了高層管理著很傷腦筋的難題;由于現(xiàn)在國內(nèi)對于IT運維管理要求的不斷提高,使得上述問題日益突出,對于運行維護部門而言要求資源進行支持的加強化已成為必然;因此,為了保證當今形勢下我國網(wǎng)絡(luò)的穩(wěn)定性和安全性,對于整個IT行業(yè)的運維管理就必須改變以往的分散式管理運維制度,進行強化集中管理,加強以ITIL為主導(dǎo)的新一代運維系統(tǒng)的建設(shè)工作。以前,信息部門在處理相關(guān)故障方面并沒有一個統(tǒng)一規(guī)范的處理標準和處理步驟,同時也缺少對出現(xiàn)的相關(guān)的問題的記錄工作。自從基于ITIL為理論基礎(chǔ)的新型IT服務(wù)管理平臺投入運行之后,通過對整個發(fā)生的事件管理和配置管理兩個主要流程的記錄與處理,實現(xiàn)了整個IT運維管理的流程化和標準化的處理過程后,企業(yè)員工可以很方便的通過多種途徑對IT中出現(xiàn)的各種故障報告或者提出與之對應(yīng)的服務(wù)請求。
1 ITIL簡介
作為IT服務(wù)管理的核心框架,ITIL是一套能夠協(xié)同整個運維流程通過服務(wù)級別協(xié)議(sLA)來提高IT服務(wù)質(zhì)量的一種新型理論。它融合了系統(tǒng)管理、網(wǎng)絡(luò)監(jiān)測以及系統(tǒng)開發(fā)管理等現(xiàn)代管理活動,以及對信息變更處理、資產(chǎn)管理和問題管理等許多流程理論與實踐的IT服務(wù)管理理論;整個IT管理主要分為兩大部分,即服務(wù)支持和服務(wù)提供;ITIL把整個IT管理活動歸納為一項管理功能和十個核心流程的處理工作;IT服務(wù)支持和服務(wù)提供又各包含五個流程,主要有事件管理和問題管理等環(huán)節(jié);通過介紹我們不難發(fā)現(xiàn),ITIL是通過對整個IT運維服務(wù)中的服務(wù)支持來進行事件管理的,事件管理對整個IT服務(wù)中遇到的故障能夠做出應(yīng)急處理,通過對管理方法的變更、發(fā)布和配置管理來保障整個IT處理過程的記錄和管理工作的順利進行,從而達到對整個服務(wù)系統(tǒng)影最小化的目的。ITIL的根本目的就是為改善一系列IT服務(wù)質(zhì)量不佳的狀況而不懈的努力。在整個IT處理的業(yè)務(wù)流程的改進過程中,ITIL能夠支持包括對現(xiàn)代企業(yè)組織機構(gòu)不同形式和不同構(gòu)成要素工作的全面支持與處理工作。并且可以做到根據(jù)機構(gòu)、部門、工作組、所處崗位對不同人員進行靈活的模式分工。
2 IT運維管理系統(tǒng)的設(shè)計與實現(xiàn)
2.1 IT運維管理系統(tǒng)流程與運維管理
為了適應(yīng)不同運維環(huán)境的需求,IT運維管理系統(tǒng)就應(yīng)該對事件故障的發(fā)生以及相應(yīng)流程標準處理機制全面考慮。使系統(tǒng)能夠根據(jù)使用者的需求功能(問題管理、事件管理以及發(fā)布管理等)進行高效的管理與預(yù)處理工作。所謂問題管理簡而言之就是當整個設(shè)計運維管理系統(tǒng)自動發(fā)現(xiàn)機制中,一旦出現(xiàn)故障信息,能夠迅速的以IT系統(tǒng)維護的關(guān)系作為依據(jù)對整個IT信息進行自動篩選并且發(fā)送給相關(guān)的運維管理人員,系統(tǒng)將收集到的信息進一步向系統(tǒng)工作臺進行轉(zhuǎn)發(fā),以提醒相關(guān)人員對故障進行進一步的處理工作。事件管理,顧名思義,就是對已經(jīng)產(chǎn)生的事件進行篩選,然后判斷是有相應(yīng)的錯誤存在;一般而言,在具體條件下系統(tǒng)對做出處理反饋或者交由相關(guān)工作人員進行處理的事件有一定的記憶能力,這對于系統(tǒng)能夠最在有效的條件下解決故障事件的能力有了更好地保障。當前,隨著網(wǎng)絡(luò)協(xié)議發(fā)展的日趨成熟,整個計算機服務(wù)管理系統(tǒng)的資源模塊的不斷升級,以TELNET、SSH、SNMP等多個協(xié)議為代表的新型資源管理模塊能夠完成對信息的自動提取、發(fā)現(xiàn)設(shè)備故障和對設(shè)備故障進行監(jiān)控等任務(wù);一旦設(shè)備出現(xiàn)故障,運維管理人員處就能夠?qū)收线M行及時有效的處理,在運維管理模塊給出故障分析的具體位置并就故障進行處理的過程。另外,為確保整個系統(tǒng)的的正常運行,運維管理模塊在對相關(guān)事件日常管理的基礎(chǔ)上還增加了專門針對于日常運維管理機制的設(shè)計工作,在各個配置模塊上添加了日常任務(wù)管理的功能,保證了每天系統(tǒng)對全套設(shè)備進行安全檢查的質(zhì)量與效率。
2.2 資源管理
作為整個IT運維管理系統(tǒng)的基礎(chǔ),資源管理系統(tǒng)能夠?qū)崿F(xiàn)對全套系統(tǒng)的所有資源進行清楚的記錄并且有效地對管理效率有所提升,當前資源管理手段還是主要建立在對相應(yīng)資源的電子或者紙質(zhì)文檔的管理上,但是這種傳統(tǒng)的資源管理模式一旦出現(xiàn)資源的種類以及數(shù)量稍有增減的現(xiàn)象,便會使整個資源管理的工作變得十分繁復(fù)。因此在整套運維管理系統(tǒng)平臺中,運維管理人員須首先對各種資源進行分類,然后按照固定的格式和要求完成對各類資源相關(guān)信息的錄人工作,最后還要對整個管理流程配置自動監(jiān)管設(shè)備,以保障在故障產(chǎn)生時系統(tǒng)能自動進行提醒。
2.3 服務(wù)臺與服務(wù)臺各功能的實現(xiàn)
服務(wù)臺是客戶向系統(tǒng)提交相關(guān)操作請求的一個窗口,而作為客戶提供的服務(wù)請求,說白了其實就是業(yè)務(wù)部門與整個信息中心之間進行信息交流的一個接口,但這個接口特殊是因為它具有唯一性。因為整個來自服務(wù)臺業(yè)務(wù)的客戶投訴和服務(wù)臺系統(tǒng)的監(jiān)控系統(tǒng)發(fā)出的告警信息都是通過這個借口來傳遞的。服務(wù)臺業(yè)務(wù)流程是:根據(jù)客戶投訴或者監(jiān)控系統(tǒng)發(fā)出的告警填寫服務(wù)請求工單,服務(wù)臺值班人員根據(jù)請求的嚴重程度判斷是否需要馬上處理或者現(xiàn)場處理,如果需要直接進入事件管理流程的入口(升級為事件);如不需要就分配給相關(guān)人員立即處理,處理完畢后填寫請求處理工單,該服務(wù)請求流程結(jié)束。
3 小結(jié)
提高整個IT運維管理部門工作效率的最為行之有效的方式就是從整個IT系統(tǒng)的擴展性能、實用性能和集成性能方面出發(fā)以全局的眼光來提高整套IT設(shè)備的管理從而完成以ITIL理論為基礎(chǔ)的全套運維管理系統(tǒng)的設(shè)計工作,成為當下相關(guān)信息中心研發(fā)部門進行研究和改進的重點。
參考文獻:
[1]張瑞冉.IT服務(wù)管理在運維管理中的研究與應(yīng)用[D].首都經(jīng)濟貿(mào)易大學(xué)2012
[2]楊小曄.IT運維管理平臺的設(shè)計與實現(xiàn)[D].北京郵電大學(xué)2011
[3]林碧芬.基于信息類型的信息網(wǎng)站設(shè)計模式研究[J].福建電腦.2009(11)
[4]李長征.國家部委IT運維管理體系案例[J].電子政務(wù).2008(12)
作者單位:華為技術(shù)有限公司,廣東深圳 518129
it運維管理論文篇二
IT運維管理的自動化的研究
摘要:隨著信息時代的持續(xù)發(fā)展,IT運維已經(jīng)成為IT服務(wù)內(nèi)涵中重要的組成部分。IT運維從誕生發(fā)展至今,自動化作為其重要屬性之一已經(jīng)不僅僅只是代替人工操作,更重要的是深層探知和全局分析,關(guān)注的是在當前條件下如
何實現(xiàn)性能與服務(wù)最優(yōu)化,同時保障投資收益最大化。
關(guān)鍵詞:IT運維管理 自動化 路徑
IT運維管理自動化是指通過將IT運維日常的、大量的重復(fù)性工作自動化,把過去的手工執(zhí)行轉(zhuǎn)為自動化操作,使IT運維工作得到升華。IT運維自動化不單純只是一個維護過程,同時更是一個管理的過程,一個能夠主動診斷和維修終端系統(tǒng)并能快速簡便更新補丁程序的自動化運維平臺顯然是IT工作雇員的愿望。因此,實現(xiàn)IT運維管理自動化是從傳統(tǒng)被動式服務(wù)轉(zhuǎn)變?yōu)橹鲃宇A(yù)防式服務(wù),以完善的流程程序貫穿整個運維管理的過程,實現(xiàn)運維管理的標準化、規(guī)范化、流程化和自動化是目前企業(yè)信息化建設(shè)急需解決的問題。
根據(jù)調(diào)查顯示,當IT專業(yè)人員被問及他們在系統(tǒng)管理面臨的最大的挑戰(zhàn)時 ,近一半的受訪者(46%)選擇了“提供對終端用戶滿意的服務(wù)水平”。這個看似最為基本的要求反而成為IT專業(yè)人員最大的難題。顯然,保持應(yīng)用程序和系統(tǒng)啟動并運行并不像聽起來那般容易,這就更有理由讓公司考慮自動化作為一個有效的解決方案來設(shè)置和維護最高級服務(wù)水平。
具體來說,一個企業(yè)往往擁有許多IT資源來維持其系統(tǒng)充分運轉(zhuǎn),通常有很多機位在管理,甚至處于不同的地理位置,且IT工作人員由于平時工作繁忙,每天都在重復(fù)著做著同一件事以至于讓IT運維管理工作陷入被動化“救火式”狀態(tài),從而造成IT運維管理人員往往要等到事情發(fā)生才會想起來去解救,沒有流程設(shè)置,周而復(fù)始就形成了連鎖的惡性循環(huán)反應(yīng)。如果能通過有限的IT人員和預(yù)算保持這一切安全運行且效率最好,這便是自動化的效果。
一、 緒論
1、 IT運維管理自動化研究的背景
新世紀的到來,也給各個行業(yè)帶來了新的挑戰(zhàn)和機遇。伴隨著信息化的不斷深入,企業(yè)數(shù)據(jù)量呈指數(shù)倍上升趨勢。IT運維管理也逐漸出現(xiàn)了一些瓶頸。一方面數(shù)據(jù)中心集中了幾乎所有的應(yīng)用和系統(tǒng),技術(shù)復(fù)雜度和關(guān)聯(lián)度已經(jīng)不能和以前相比;另一方面運維人員的高度集中和專業(yè)化也帶來了IT運維管理的高度復(fù)雜性。
雖然這些年在安全設(shè)備的應(yīng)用上越來越多,安全手段的采用也越來越多,但安全狀況卻不見好轉(zhuǎn)。一些IT管理人員經(jīng)常納悶:我們已經(jīng)在安全方面投入了相當多的努力,但為什么還會不時的出現(xiàn)安全問題?面對眾多的設(shè)備與手段,IT運維人員有時候感到無所適從,其根源又是什么呢?IT運維自動化的下一步該怎么走?接下來,我們將在本文中詳細介紹解決這些問題的辦法。
2、我國當前IT運維管理自動化的發(fā)展現(xiàn)狀
我國企業(yè)的IT運維管理大部分停留在IT運維管理軟件的應(yīng)用深化,管理流程的制定、梳理和優(yōu)化,管理制度的完善階段。但企業(yè)在實施信息化決策時,忽視了對內(nèi)部業(yè)務(wù)流程和信息技術(shù)的管理變革。
運維管理部門平常的工作就像是“救火隊”。IT人員總是隨時緊張的待命,以便應(yīng)付計算機系統(tǒng)各種各樣的需求,即使這樣,運維部門的服務(wù)質(zhì)量和維護成本還是存在很多問題。我們需要將這些被動的管理轉(zhuǎn)化為監(jiān)控管理的主動改造。
目前很多企業(yè)已經(jīng)接受了它的核心戰(zhàn)略必須支持企業(yè)。IT部門在現(xiàn)在的在企業(yè)中發(fā)揮著越來越重要的作用,企業(yè)的高管也慢慢的發(fā)現(xiàn),IT不再是我們所謂的“支持者”而是一個“驅(qū)動程序”。與國外尤其是歐洲的發(fā)展比較,我國的IT服務(wù)管理還處于早期的發(fā)展階段。
歐洲眾多成功企業(yè)大量的實踐證明,企業(yè)在實施IT運維管理的自動化后,減少了重復(fù)和多余的工作,有效的利用了人文資源;增強了IT人員的素質(zhì),提高員工的服務(wù)能力和工作效率;使得IT部門的服務(wù)水平規(guī)范,使工作流程規(guī)范,使得通過人事變動的風(fēng)險變低;提高IT服務(wù)的可用性、可靠性和安全性,為企業(yè)用戶提供高質(zhì)量的服務(wù);IT部門的開支的有效控制,降低運營成本,降低經(jīng)營風(fēng)險;使得在公司的投資回報率能總體增長,給企業(yè)帶來巨大的經(jīng)濟利益,使得企業(yè)的綜合競爭力提高。美國寶潔公司從1997年開始使用IT運維管理的自動化的IT服務(wù)管理體系,在接下來的四年里節(jié)省了超過約5億美元的預(yù)算,其運行費用下降了6%-8%,同時減少技術(shù)人員的數(shù)量大約在15%-20%。大量的實施服務(wù)管理的成功實踐案例,可以提高企業(yè)的運作效率的25.3%。
3、IT運維管理自動化的研究意義
企業(yè)需要建立完善而成熟的IT運維管理自動化體制,通過流程管理,不斷提高IT運維質(zhì)量,實現(xiàn)高效運維,提升組織內(nèi)IT服務(wù)滿意度。IT運維自動化是基于流程化的框架,將事件與IT流程相關(guān)聯(lián),—旦被監(jiān)控系統(tǒng)發(fā)現(xiàn)性能超標,會觸發(fā)相關(guān)事件以及事先定義好的流程,可自動啟動故障響應(yīng)和恢復(fù)機制。自動化工作平臺還可幫助IT運維人員完成日常的重復(fù)性工作(如備份、殺毒等),提高IT運維效率。同時,IT運維的自動化還要求能夠預(yù)測故障、在故障發(fā)生前能夠報警,讓IT運維人員把故障消除在發(fā)生前,將所產(chǎn)生損失減到最低。
4、IT運維管理自動化現(xiàn)狀存在的問題
目前許多企業(yè)的IT運維已經(jīng)實現(xiàn)從人工運維到計算機管理,但在交流中發(fā)現(xiàn)其中很多企業(yè)的IT運維管理還只是處在“半自動化”的狀態(tài)。因為這種IT運維仍然是等到IT故障出現(xiàn)后再由運維人員采取相應(yīng)的補救措施。這些傳統(tǒng)的被動、孤立、半自動式的IT運維管理模式經(jīng)常讓IT部門疲憊不堪,主要表現(xiàn)在以下三個方面:
(1)運維人員被動、效率低
在IT運維過程中,只有當事件已經(jīng)發(fā)生并已造成業(yè)務(wù)影響時才能發(fā)現(xiàn)并著手處理,這種被動“救火”不但使IT運維人員終日忙碌,也使IT運維本身質(zhì)量很難提高,導(dǎo)致IT部門和業(yè)務(wù)部門對IT運維的服務(wù)滿意度都不高。目前大多數(shù)企業(yè)的IT運維人員日常大部分時間和精力是處理一些簡單重復(fù)的問題,而且由于故障預(yù)警機制不完善,往往是故障發(fā)生后或報警后才會進行處理,使到IT運維人員的工作經(jīng)常是處于被動“救火”的狀態(tài),不但事倍功半而且常常會出現(xiàn)惡性連鎖反應(yīng)。 (2)缺乏一套高效的IT運維機制
目前許多企業(yè)在IT運維管理過程中自動化的運維管理模式不足,也沒有明確的角色定義和責(zé)任劃分,使到問題出現(xiàn)后很難快速、準確地找到根本原因,無法及時地找到相應(yīng)的人員進行處理和修復(fù),或者是在處理過程中存在問題,缺乏發(fā)現(xiàn)故障的流程化,而在解決問題時不但缺乏標準化的解決方案,也缺乏一個完整的跟蹤記錄。
(3)缺乏高效的IT運維技術(shù)工具
隨著信息化的深入,企業(yè)IT系統(tǒng)日趨復(fù)雜,林林總總的網(wǎng)絡(luò)設(shè)備、服務(wù)器、中間件、業(yè)務(wù)系統(tǒng)等讓IT運維人員難以從容應(yīng)對,即使加班加點地維護、部署、管理也經(jīng)常會因設(shè)備出現(xiàn)故障而導(dǎo)致業(yè)務(wù)的中斷,嚴重影響企業(yè)的正常運轉(zhuǎn)。出現(xiàn)這些問題部分原因是企業(yè)缺乏事件的監(jiān)控和診斷工具等IT運維技術(shù)工具,因為在沒有高效的技術(shù)工具的支持下故障事件很難得到主動、快速的處理。
二、IT運維管理自動化的系統(tǒng)總體設(shè)計
IT運維管理自動化系統(tǒng)的主要功能包括數(shù)據(jù)的采集、數(shù)據(jù)展示和運維告警。本節(jié)我們將從這三個方向出發(fā),來介紹這三種技術(shù)。
1. 需求分析
軟件需求分析在整個軟件開發(fā)與維護過程中越來越重要,直接關(guān)系到軟件的成功與否。其主要目的是:在綜合分析用戶對系統(tǒng)提出的一組需求(功能、性能、數(shù)據(jù)等方面)的基礎(chǔ)上,構(gòu)造一個從抽象到具體的邏輯模型表達軟件將要實現(xiàn)的需求,為下一階段的軟件設(shè)計提供設(shè)計基礎(chǔ)。
2. 系統(tǒng)功能需求
在這里我們分別介紹三種技術(shù),而三種技術(shù)的運用是互不可分的。
3. 數(shù)據(jù)采集
數(shù)據(jù)的采集是IT運維工作的主要根本,只有完成了數(shù)據(jù)的采集,才可以通過數(shù)據(jù)來了解企業(yè)IT系統(tǒng)運行的狀況,才能夠進行分析、預(yù)防故障的發(fā)生、處理故障、以及進行系統(tǒng)的升級、優(yōu)化工作。
4、數(shù)據(jù)展示
數(shù)據(jù)采集有很多種,這里我們介紹的是RRDTOOL。RRDTOOL是指Round Robin Database工具(環(huán)狀數(shù)據(jù)庫)。Round robin是一種處理定量數(shù)據(jù)、以及當前元素指針的技術(shù)。RRD的一個目的是在一個環(huán)型數(shù)據(jù)歸檔中存儲數(shù)據(jù)。
為了大家能更直觀、更方便的理解環(huán)形數(shù)據(jù)歸檔技術(shù),我們給出RRDTOOL簡單的數(shù)據(jù)流程圖,如圖2:
5、運維告警
隨著IT運維管理自動化的不斷深入和完善,在企業(yè)中,運維告警處于非常重要的地位。在重要信息運行的過程中,能快速、及時、準確的反映問題信息,使我們能在最短的時間內(nèi)處理、解決問題,從而避免巨大的損失,把損失降到最小。通過運維告警管理能降低IT管理人員的管理被動性,將管理人員從企業(yè)內(nèi)部的計算機面前解放出來,真正實現(xiàn)無人值守的運維管理,從而節(jié)省很多開支。
在接下里來的文章里我們將介紹NAGIOS的運維告警服務(wù)。為了更直觀的了解IT運維告警的運行,我們給出其流程圖。
運維告警流程圖如圖3:
三、工作展望
隨著社會的進步與發(fā)展,有越來越多的中小企業(yè)逐漸壯大,也有越來越多的中小企業(yè)發(fā)展起來,而IT運維管理的自動化還需要進一步的發(fā)展,緊隨企業(yè)的需求,隨著信息量的加大,對IT運維管理的自動化的要求也越來越高。希望在以后的,能有一款更好的軟件,包含各種功能,能處理更多的數(shù)據(jù),為中小企業(yè)提供便利。為提高IT運維處理問題的效率和服務(wù)質(zhì)量,建設(shè)IT運維呼叫中心也是很有必要的,實現(xiàn)語音呼叫和業(yè)務(wù)數(shù)據(jù)的對接,配合IT運維管理系統(tǒng)使用。使IT運維管理的自動化發(fā)展的更完善!
參考文獻:
[1]Jan van Bon,章斌譯.基于工TIL的全球最佳實踐.IT服務(wù)管理,清華大學(xué)出版社,2006.1.
[2]左天祖.中國IT服務(wù)市場現(xiàn)狀與發(fā)展趨勢. 2010.1.
[3]概念、理解與實施.IT服務(wù)管理, 2008:9~10.
[4]ITIL Glossary of Terms and Definitions,2007.5.
[5]陳宏峰,劉顧. ITIL Version3理論與應(yīng)用白皮書,2010.7:8~14.
作者簡介:
郭明巖,男,1985年8月,湖北工業(yè)大學(xué)計算機學(xué)院在職研究生,研究方向:計算機網(wǎng)絡(luò)。