哪個(gè)運(yùn)維監(jiān)控管理案例好用

來(lái)源: 發(fā)布時(shí)間:2023-02-05

2020年12月13日,據(jù)海外媒體報(bào)道,一個(gè)名為APT的網(wǎng)絡(luò)入侵組織把世界出名網(wǎng)管軟件廠(chǎng)商SolarWinds作為入侵目標(biāo)。這次APT攻擊首先是對(duì)SolarWinds旗下的Orion網(wǎng)絡(luò)監(jiān)控軟件更新服務(wù)器進(jìn)行入侵,并在軟件更新(Orion)中植入了惡意代碼。透露大約有1.8萬(wàn)客戶(hù)在其系統(tǒng)上部署了該更新,且對(duì)美國(guó)財(cái)政部高層領(lǐng)導(dǎo)使用的電子郵件系統(tǒng)也造成了影響。

SolarWinds的系統(tǒng)被攻擊之后,已導(dǎo)致全球許多組織的網(wǎng)絡(luò)遭到破壞,涉及的供應(yīng)鏈范圍極為廣大,被稱(chēng)為2020年美國(guó)極大網(wǎng)絡(luò)安全事件。

“太陽(yáng)風(fēng)”(SolarWinds) 是一家專(zhuān)職提供IT監(jiān)控和運(yùn)維解決方案的商業(yè)公司。其產(chǎn)品SolarWinds Orion Network Performance Monitor(NPM)是集網(wǎng)絡(luò)監(jiān)測(cè)、設(shè)備性能維護(hù)管理、故障監(jiān)控、網(wǎng)絡(luò)實(shí)時(shí)流量監(jiān)控和歷史數(shù)據(jù)統(tǒng)計(jì)、匯總和歷史數(shù)據(jù)分析、虛擬數(shù)據(jù)中心監(jiān)控、網(wǎng)絡(luò)拓?fù)浔O(jiān)控等功能于一體的網(wǎng)絡(luò)管理系統(tǒng)。該軟件主要是用于企業(yè)內(nèi)部網(wǎng)絡(luò)管理,目前全球客戶(hù)超過(guò)32萬(wàn)家。SolarWinds作為一個(gè)齊全的IT管理系統(tǒng)還有一些功能的欠缺,而且中文支持也是一個(gè)國(guó)內(nèi)推廣的難題。像同一類(lèi)型的軟件Hostmonitor、CA Unicenter也是存在同樣的問(wèn)題。 Argus是觀縱科技自主研發(fā)的it運(yùn)維監(jiān)控系統(tǒng),旨在對(duì)信息中心軟硬件實(shí)施全天候無(wú)死角監(jiān)控。哪個(gè)運(yùn)維監(jiān)控管理案例好用

觀縱在協(xié)調(diào)交付與研發(fā)做信創(chuàng)產(chǎn)品適配,幫助客戶(hù)在內(nèi)部搭建信創(chuàng)環(huán)境的時(shí)候發(fā)現(xiàn),如果想讓運(yùn)維行業(yè)的信創(chuàng)產(chǎn)業(yè)高質(zhì)量發(fā)展,是依靠自主創(chuàng)新研發(fā)產(chǎn)品是不夠的,還需要有領(lǐng)航者來(lái)為運(yùn)維行業(yè)發(fā)展做“規(guī)劃”,給予客戶(hù)足夠的安全感和信任感。

如今,觀縱的Argus運(yùn)維監(jiān)控系統(tǒng)目前已獲得部分信創(chuàng)適配證書(shū)。未來(lái)觀縱將繼續(xù)投入人力與物力,對(duì)產(chǎn)品進(jìn)行創(chuàng)新實(shí)踐,加快其在信創(chuàng)領(lǐng)域的運(yùn)維場(chǎng)景落地應(yīng)用,攜手上下游合作伙伴共建生態(tài),領(lǐng)導(dǎo)智能運(yùn)維行業(yè)向高質(zhì)量發(fā)展。 信創(chuàng)智能運(yùn)維監(jiān)控管理平臺(tái)Argus運(yùn)維監(jiān)控全自動(dòng)拓?fù)渖桑瑴?zhǔn)確率高達(dá)90%以上。

在信息系統(tǒng)的生命周期中,一般系統(tǒng)建設(shè)的時(shí)間大約為一年,而系統(tǒng)使用運(yùn)維的時(shí)間大約四到七年或更長(zhǎng),因此,業(yè)界提出了“三分建設(shè),七分管理”的運(yùn)維監(jiān)控管理。經(jīng)過(guò)大致兩輪的信息化建設(shè),企業(yè)信息化將逐步趨于成熟,后續(xù)信息化工作的重點(diǎn)之一便是做好系統(tǒng)的運(yùn)維工作,保障系系統(tǒng)平穩(wěn)運(yùn)行,支撐業(yè)務(wù)發(fā)展。

信息保障部門(mén)日常運(yùn)行管理?xiàng)l塊分割,網(wǎng)絡(luò)、應(yīng)用、IT基礎(chǔ)環(huán)境等資源需要不同技能分工人員,在不同時(shí)段值守,當(dāng)網(wǎng)絡(luò)設(shè)備發(fā)生變化時(shí),無(wú)法迅速的適應(yīng)。各類(lèi)業(yè)務(wù)應(yīng)用系統(tǒng)缺乏針對(duì)性的管理平臺(tái),單從網(wǎng)元和資源個(gè)體進(jìn)行管理的角度無(wú)法解決業(yè)務(wù)系統(tǒng)的監(jiān)控要求,因?yàn)闃I(yè)務(wù)系統(tǒng)是由多個(gè)關(guān)聯(lián)資源及其關(guān)聯(lián)關(guān)系組成,一旦業(yè)務(wù)系統(tǒng)出現(xiàn)運(yùn)行過(guò)慢、無(wú)法登錄、應(yīng)用報(bào)錯(cuò)等問(wèn)題時(shí),難以排查具體的故障點(diǎn),從而影響業(yè)務(wù)系統(tǒng)故障恢復(fù),也不利于業(yè)務(wù)系統(tǒng)的性能調(diào)優(yōu),造成單位IT資源與IT管理人員的“雙高”負(fù)荷運(yùn)轉(zhuǎn)。沒(méi)有統(tǒng)一的實(shí)時(shí)監(jiān)控IT運(yùn)維是依托經(jīng)驗(yàn)式、補(bǔ)救式的事后運(yùn)維。同樣的IT故障引發(fā)大范圍報(bào)障,需要通過(guò)監(jiān)控鎖定故障源合并事件;同樣的IT故障在缺乏監(jiān)控?cái)?shù)據(jù)描述和處置經(jīng)驗(yàn)的支撐時(shí),擅長(zhǎng)不同技能的運(yùn)維工程師處理效率有天壤之別;同樣的IT故障高頻復(fù)發(fā),需要監(jiān)控的分析優(yōu)化資源配置。

中間件和數(shù)據(jù)庫(kù)組件監(jiān)控:中間件和數(shù)據(jù)庫(kù)組件都統(tǒng)一提供sidecar模式部署的exporter進(jìn)行指標(biāo)采集,并配置監(jiān)控告警。如果不是集群納管的數(shù)據(jù)庫(kù),也可以開(kāi)發(fā)自定義exporter(kingbase、greatdb等國(guó)產(chǎn)數(shù)據(jù)庫(kù)都走這個(gè)方式),也可以開(kāi)發(fā)指標(biāo)推到Prometheus的pushgateway(polardb國(guó)產(chǎn)數(shù)據(jù)庫(kù)走這個(gè)方式),還可以配置Prometheus去拉取各組件的metrics(etcd等中間件有提供標(biāo)準(zhǔn)的metrics)。

各業(yè)務(wù)集群怎么部署監(jiān)控組件各業(yè)務(wù)集群都單獨(dú)部署Prometheus和grafana;在集群各節(jié)點(diǎn)部署有kubelet客戶(hù)端和demonset模式的node-exporter;在集群管理節(jié)點(diǎn)部署Deloyment模式的kube-state-metrics;而k8s的管理組件kube-scheduler、control-manager、etcd自帶metrics,不需要部署任何采集工具,而是在Prometheus的配置文件中配置各組件的metrics地址獲取指標(biāo)數(shù)據(jù);中間件和數(shù)據(jù)庫(kù)組件內(nèi)帶有Sidecar模式的xxx-exporter(比如mysql-exporter),部署中間件和數(shù)據(jù)庫(kù)時(shí)就開(kāi)始收集監(jiān)控?cái)?shù)據(jù)。 以 zabbix 為采集中心配合自研的 ArgusNMS 增強(qiáng)模塊為一組采集單元, ArgusEdge 的統(tǒng)一調(diào)度實(shí)現(xiàn)監(jiān)管控的需求。

數(shù)據(jù)準(zhǔn)入:所有數(shù)據(jù)對(duì)象化,定義固定字段、對(duì)象描述字段、對(duì)象具體數(shù)值三類(lèi),便于后續(xù)管理。數(shù)據(jù)血緣:數(shù)據(jù)采集階段記錄數(shù)據(jù)依賴(lài)關(guān)系,明確展示數(shù)據(jù)血緣,避免數(shù)據(jù)關(guān)聯(lián)錯(cuò)誤同時(shí)可比較大化減少數(shù)據(jù)冗余。數(shù)據(jù)生命周期:嚴(yán)格控制數(shù)據(jù)存儲(chǔ)生命周期,定時(shí)對(duì)冗余數(shù)據(jù)進(jìn)行清洗校驗(yàn),確保整體性能。數(shù)據(jù)完整性:基于數(shù)據(jù)血緣,對(duì)所有數(shù)據(jù)的完整性進(jìn)行校驗(yàn),不僅對(duì)單條數(shù)據(jù)本身同時(shí)需要對(duì)上下關(guān)聯(lián)數(shù)據(jù)進(jìn)行校驗(yàn)。數(shù)據(jù)責(zé)任制:將各類(lèi)數(shù)據(jù)的正確性和關(guān)聯(lián)性責(zé)任到各個(gè)專(zhuān)業(yè)團(tuán)隊(duì),從源頭控制數(shù)據(jù)質(zhì)量。我們要運(yùn)維監(jiān)控的對(duì)象你是否了解呢?比如CPU到底是如何工作的?信創(chuàng)智能運(yùn)維監(jiān)控管理平臺(tái)

想吃透運(yùn)維監(jiān)控系統(tǒng),就這一篇足夠了!哪個(gè)運(yùn)維監(jiān)控管理案例好用

Argus搭建可觀測(cè)性監(jiān)控的原則客觀性、系統(tǒng)性、關(guān)聯(lián)性、預(yù)見(jiàn)性。低嵌入、無(wú)干擾的第三方視角觀測(cè)采集數(shù)據(jù);不單一的只看某個(gè)指標(biāo),注重各觀測(cè)角度之間的整體性關(guān)系,系統(tǒng)的涵蓋所需觀察的每個(gè)方面,體現(xiàn)出被觀測(cè)對(duì)象較為完整的觀測(cè)結(jié)果;每個(gè)監(jiān)控項(xiàng)或應(yīng)用既具單獨(dú)性,又具相關(guān)性,而各要素和體關(guān)聯(lián)性系之間同樣存在這種“相互關(guān)聯(lián)或相互作用”的關(guān)系;任何事物的觀察都是基于時(shí)間的動(dòng)態(tài)行為,監(jiān)控的目的是要提早發(fā)現(xiàn)風(fēng)險(xiǎn),避免發(fā)生故障,所以我們所有的監(jiān)控行為都要對(duì)將來(lái)可能發(fā)生事件實(shí)現(xiàn)預(yù)判。 哪個(gè)運(yùn)維監(jiān)控管理案例好用

上海觀縱科技有限公司是一家集研發(fā)、生產(chǎn)、咨詢(xún)、規(guī)劃、銷(xiāo)售、服務(wù)于一體的服務(wù)型企業(yè)。公司成立于2022-11-14,多年來(lái)在webfunny前端監(jiān)控,webfunny前端埋點(diǎn),全鏈路應(yīng)用性能監(jiān)控,Argus-IT運(yùn)維監(jiān)控行業(yè)形成了成熟、可靠的研發(fā)、生產(chǎn)體系。公司主要經(jīng)營(yíng)webfunny前端監(jiān)控,webfunny前端埋點(diǎn),全鏈路應(yīng)用性能監(jiān)控,Argus-IT運(yùn)維監(jiān)控等產(chǎn)品,產(chǎn)品質(zhì)量可靠,均通過(guò)傳媒、廣電行業(yè)檢測(cè),嚴(yán)格按照行業(yè)標(biāo)準(zhǔn)執(zhí)行。目前產(chǎn)品已經(jīng)應(yīng)用與全國(guó)30多個(gè)省、市、自治區(qū)。webfunny,walkingfunny,argus為用戶(hù)提供真誠(chéng)、貼心的售前、售后服務(wù),產(chǎn)品價(jià)格實(shí)惠。公司秉承為社會(huì)做貢獻(xiàn)、為用戶(hù)做服務(wù)的經(jīng)營(yíng)理念,致力向社會(huì)和用戶(hù)提供滿(mǎn)意的產(chǎn)品和服務(wù)。上海觀縱科技有限公司注重以人為本、團(tuán)隊(duì)合作的企業(yè)文化,通過(guò)保證webfunny前端監(jiān)控,webfunny前端埋點(diǎn),全鏈路應(yīng)用性能監(jiān)控,Argus-IT運(yùn)維監(jiān)控產(chǎn)品質(zhì)量合格,以誠(chéng)信經(jīng)營(yíng)、用戶(hù)至上、價(jià)格合理來(lái)服務(wù)客戶(hù)。建立一切以客戶(hù)需求為前提的工作目標(biāo),真誠(chéng)歡迎新老客戶(hù)前來(lái)洽談業(yè)務(wù)。