“兩招”化解IT運維日志管理難題

内蒙古快3历史开奖号码 www.scvddt.com.cn 日期:2017-06-28 10:14

隨著IT運維服務的發展,日志管理成為了IT運維工程師不可回避的工作,它不但可以跟蹤IT基礎設施活動,更是檢測故障是否發生、如何發生、何時發生、在何處發生的最佳答案。但不斷增加的設備與網絡行為產生了令人難以控制的海量日志,告警信息更是成百上千,而僅憑人工進行管理,幾乎成了一件不可能完成的任務。


  

IT運維日志監控也有“狼來了”


  

考慮到IT運維日志管理本身所具有的功效,收集日志數據及進行分析,通常被認為是IT運維最具常態的工作之一,更是防禍于未然的有效手段。但這種常態任務一旦超出工作負荷,不但在“量”上面無法完成,還很有可能在“質”上影響IT運維管理的有效性。


  

例如,趙蒙,某市信息網絡中心的IT運維工程師,雖說頭頂著IT光環,但他卻備受日志監控的煎熬,過著“苦行僧”一般的生活。網絡中心不但要負責電子政務數十個業務系統的運維保障,還兼管其他委辦局業務系統監控的工作,不論白班或是夜班值守的同事,所有人都有一項工作必不可少,這就是“檢查日志、評估和處理告警事件”。為了提高工作效率,在大家群策群力之下,許多針對操作系統或者是數據庫日志系統的自動處理腳本被一一開發出來。但這并沒有讓運維監控壓力得到緩解,網絡設備、服務器、網絡流量,甚至數據庫的警告信息,成千條日志信息堆積在一起更本沒法判斷問題的根源在哪里?在這種情形下,趙蒙漸漸疲態化,放棄了努力,每次在巡檢表格上胡亂填上幾筆,草草了事。


  

針對IT運維管理人員這種常態化的工作方式,E客認為:“管理人員如果每天只能按部就班的面對每一臺服務器、網絡設備,逐個去檢查它們的狀況,或者從幾千條日志中找到有價值的內容,確實需要耐心、細心和責任心。但由于工作量巨大,很多時候人們開始習慣“狼來了”的心態。此時,如果沒有對某條告警日志背后的隱患徹底查驗,看似正常的業務系統則可能由此轟然倒塌。但是,借助北塔軟件智能化的運維平臺,則可以實現自動處理海量日志、主動挖掘故障線索,不喊“狼來了”,即使“狼”真的來了也不懼怕?!?/p>
  

“兩招”化解IT運維日志管理難題


  

IT運維日志用來記錄用戶操作、系統運行狀態,是一個IT運維系統中重要的核心部分,它直接關系到系統出現問題時定位的速度。對日志的觀察和分析,能提前發現系統可能的風險,避免線上事故的發生。為了幫助趙蒙早日摘掉“日志控”的帽子,E客告訴你“兩招”最實用的方法,這就是日志管理中的“廣度、深度”。


  

第一招:用“廣度”拒絕漏網之魚


  

IT運維日志范圍夠不夠廣,是拒絕漏網之魚,走出成功的第一步。為此,趙蒙可以通過軟件將網絡、安全、機房、桌面、服務器、數據庫、中間件、應用、業務等各個方面監控起來,對所有設備的性能、各類數據流進行自動采集。隨后,他可以使用批量告警設置功能,進而屏蔽差異項,在縮短告警規則設置時間的同時,從上百條告警規則中解脫出來,只維護十分之一的告警規則,大幅降低了告警規則維護的復雜度。   

第二招:用“深度”追擊故障根源


IT運維日志管理不能是孤立的,否則它在主動運維方式中就沒有任何意義。


  

事件監控、日志分析,這些IT運維管理中的“自動化”,談起來容易,真正實現卻并不簡單。實際上,整個IT基礎架構,有很多不同的組成部分構成,有很多不同的信息,而自動化也是IT運維管理逐步發展演進的過程。