performance counter 和logman 都是Microsoft 上收集系統效能計數器的方式, 只是logman 是命令行,performance counter 是UI, 2個的效用相同, 用performance counter 也可以收集, 需要逐一的點選。
統一收集iT 系統的運行日誌、通過大數據分析、交叉比對,預先告訴現場工作人員,哪些系統可能快要故障,可早一步進行檢修。
即使系統真的發生故障,工程師也不用花費大把時間去撈數據,而可以把心力放在分析數據、判斷問題、尋求解方。
全世界server 平均200多天,才發現有人到此一遊。不知道被入侵, 不知道retry 多久了。
報錯和緩慢, 是用戶最經常抱怨的問題。
利用大數據分析,提升維運服務品質
用戶響應速度緩慢, 是常見效能問題的症狀。
效能問題, 不是一個單純一個工具就可以解決的問題!更不要期待找一個武林高手來解決一切, 從此江湖就此平靜了,沒有風波了。
由於IT系統環境日益複雜、通常只有在核心系統發生服務中斷後,并造成影響時,IT部門才會開始被動分析異常問題。由於需要通過不同的技術和多種監控工具,對龐大的複雜資料做繁複的診斷,造成處理問題的周期過長。
Disk 磁碟空間突然下降的厲害, 到底被誰吃掉了,還好提早發現了,不然就慘了。