2010年8月12日 星期四

中國航信重視IT運維監控體系建設 IT運維監控的新挑戰


作為一個以展現業務健康狀況為中心,面向業務的、分層次的監控管理體系,中國航信ITOMS系統經歷了一個循序漸進、不斷發展的過程。
  與時俱進

  民航業的快速發展一方面便利了人們的出行,另方面也對整體經濟市場起到了巨大的促進作用。相關資料顯示:2009年,國內乘坐民航出行的人次已突破兩億大關,而且,這一資料今年仍在保持穩定增長態勢。

  作為一家面向航空公司、機場、機票銷售代理、旅遊企業及民航相關機構和國際組提供專業服務的資訊技術及商務提供商,中國民航資訊集團公司(中國航信)的主營業務包括航空客運業務處理、航空旅遊電子分銷、機場旅客處理、航空貨運資料處理、互聯網旅遊平台、國際國內客貨運收入管理系統應用和代理結算清算等。伴隨整個行業的快速成長及公司自身業務的不斷發展,對公司的IT運維工作也提出了巨大挑戰,構建一個強健的IT運維監控管理體系對中國航信公司資訊化的發展至關重要。

  由於關聯業務龐大,下轄機構眾多,中國航信一直非常注重打造完整的、豐富的、功能強大的資訊服務產品線和面向不同物件的多級系統服務產品體系,極大地提高了行業參與者的生產效率。目前為止,其下屬共包括12家分公司、18家附屬公司、8家聯營公司,服務的客戶包括近30家國內航空公司以及近200家地區及海外航空公司,國內147家機場以及近7000家機票代理人,服務範圍覆蓋到300個國內城市、80個國際城市,並通過互聯網進入社會公眾服務領域,資產總額達到73億元人民幣。

  所有這些龐大的業務系統都由中國航信運行中心負責運維。這些設備及IT部件分置於兩個高等級資料中心,總面積超過6000平方米。包括:2000多台硬體設備、17000多個埠的光纖和客戶網路、1000多套系統中心平台、80套左右的資料庫平台以及50餘套中介軟體環境等。

  長期以來,中國航信對於IT運維監控體系建設就非常重視。早在1999年,公司就開始啟動開放系統的構建和監控體系,2003年引入集中監控機制。從2004年起,公司開始系統地實施基於ITIL(IT Infrastructure Library,即資訊技術基礎架構庫)最佳實踐的ITSM (IT服務管理)體系,並引入存取控制管理等管理理念。自2004年持續演進至今,已經部署了事件管理、問題管理、變更管理、配置管理、容量管理、業務連續性管理、服務級別管理、成本管理、供應商管理等9個管理模組和流程。

  2008年,中國航信作為北京奧運會保障的重點單位之一,圓滿完成了奧運航空運輸資訊服務保障。這其中,中國航信運行中心保障了航空旅遊業最核心的資訊系統,實現了奧運保障期間零停機的目標,在奧運保障專案中發揮了重要作用。項目的艱巨性和複雜性讓中國航信意識到服務管理資源整合的迫切性和重要性。

  對此,中國航信相關負責人指出,隨著自身業務的發展和IT基礎設施的不斷擴張,IT管理正在從側重資源管理向側重於業務和服務水準的IT服務管理演進;相應的,IT監控也從資源監控向業務監控轉變,構建一個強健的IT運維監控管理體系,將對其公司整體資訊化建設起到至關重要的影響和推動。

  面向業務

  為了更好地滿足當前及未來業務發展需求,創建更加完善的IT運維監控管理體系,經過長達6個月的技術論證和測試,中國航信最終決定選擇IBM Tivoli Netcool lT服務管理解決方案來構建新一代的ITOMS系統(即IT運維監控管理體系,IT Operations Monitoring & Management System,簡稱ITOMS)。

  作為一個以展現業務健康狀況為中心,面向業務的、分層次的監控管理體系,中國航信ITOMS系統經歷了一個循序漸進、不斷發展的過程。200910月,中國航信開放系統集中監控功能完善專案的完成,標誌著中國航信ITOMS在歷經三代發展後,成為一個真正“面向業務”的監控體系。

  該ITOMS專案於200810月開始正式啟動,分兩個階段實施。新系統中增加了知識庫管理系統、統一的事件中心、報表與分析中心、業務影響視圖等新功能,在不改變原有基礎監控平台功能的前提下,實現了系統與配置管理、事故管理等管理元件更有效的結合。

  “中國航信開放系統集中監控功能完善專案的完成,標誌著中國航信ITOMS在歷經三代發展後,成為一個真正‘面向業務’的監控體系。事件管理、配置管理和運維知識庫的整合是中國航信ITOMS漸進式發展進程中的關鍵一步。它讓中國航信的IT運維監控管理體系實現了‘以業務為中心’的轉型。” 中國航信副總裁兼運行中心總經理榮剛指出,中國航信一直將IT運維的安全性和可靠性作為IT服務水準持續改進的關鍵目標。中國航信擁有30年的IT運維管理經驗,目前已經形成了具有自身特色的IT服務管理模式。

  他表示,基於新的ITOMS系統,中國航信解決了原各種軟體產品資訊格式展現方式不統一、報警資訊與業務資訊脫節等問題,建立了以開放平台運維知識庫系統為核心的IT運維監控管理體系:在一個平台上,把監控、安全、存儲、備份等10多種運維管理軟體所產生的報警資訊進行統一處理、統一規則、綜合呈現,極大地提高了事件管理的水準,為IT服務管理的進一步升級轉變建立起IT管理支撐。

  統一展現

  在中國航信運行中心運行部經理沈強看來,就複雜、超大規模IT系統的運維而言,統一的事件資訊展現平台是十分必要的。該平台以一致的方式來展示源自各種IT運維管理系統的事件資訊,它還必須能夠與配置管理平台和知識庫平台緊密融合,以幫助值班人員快速定位和解決問題。而圍繞企業的關鍵業務,該平台需要借助動態的業務影響視圖來即時展現整個業務的服務水準。

  目前,利用基於IBM Tivoli NetcoolITOMS,中國航信在整個IT服務週期中充分實現了視覺化、可控化和自動化管理。

  視覺化方面,所有業務視圖從實施前的手工繪製實現了即時動態更新,同時創建了可反映業業務整體健康狀況的業務影響視圖,可全面展現包括事件資訊以及與之相關的配置、業務、知識等資訊;

  可控化方面,在ITOMS系統中,監控螢幕數由實施前的至少16個統一為1個;平均事件相應時間由實施前的300秒縮短至實施後的30秒;平均事件處理時間縮短2分鐘;實施後事件資訊擁有統一的規範格式,改變了16種軟體各自為政的狀態;實施後監控平台和SDservice desk ,服務台)記錄的事件平台狀態自動保持同步,無需值班人員手工處理。

  自動化方面,經過規則過濾、壓縮後,關注事件量由實施前的每天幾萬件減少為幾十件;事故管理能力得到提升:實施前手工創建事故單,內容不容易規範,準確性無法得到保證;實施後,經過值班人員審核後自動創建事故單,保證格式統一,確保資訊內容準確可靠。

  在總結中國航信IT 監控管理專案實施成功經經驗時,沈強表示:“首先,ITOMS系統的實施涉及到企業變革,得到了上層領導對專案高度重視;第二,所選的產品要好。我們選擇Tivoli Netcool這個產品,主要是因為其具有先進的IT服務管理理念,其技術上的維護量也比較小,並且能夠幫助我們整合這十多種資源;第三,IBMIT行業所積累的經驗對專案的順利實施有非常大的幫助。”

  IT 監控管理項目實施成功要素:

  @此類專案涉及到企業整體系統,必須得到企業高層的一致重視;

  @選對產品。產品應該具有先進的IT服務管理念以及較低的後期維護成本;

  @選對合作夥伴。選擇在該領域具有豐富實施經驗的方案商。