青海運(yùn)維監(jiān)控技術(shù)指導(dǎo)

來源: 發(fā)布時(shí)間:2023-01-31

在云原生時(shí)代,基礎(chǔ)設(shè)施與應(yīng)用的部署構(gòu)建都發(fā)生了極大變化,傳統(tǒng)的監(jiān)控方式已經(jīng)無法適應(yīng)云原生的場(chǎng)景。Prometheus支持對(duì)kubernetes和容器的監(jiān)控,基本上是完美選擇,那么通過Prometheus監(jiān)控體系如何搭建PAAS監(jiān)控體系?監(jiān)控哪些對(duì)象?

k8s管理組件、節(jié)點(diǎn)、pod容器、各種中間件數(shù)據(jù)庫組件指標(biāo):mysql、redis、kafka、rocketmq、activemq、zookeeper、elasticsearch、mongodb、nginx、clickhouse。同時(shí),還提供了kingbase、polardb、GreatDB等國(guó)產(chǎn)數(shù)據(jù)庫的監(jiān)控。

怎么監(jiān)控?

k8s組件監(jiān)控:Prometheus直接拉取各組件的metrics接口數(shù)據(jù);

節(jié)點(diǎn)監(jiān)控:在各節(jié)點(diǎn)部署node_exporter,Prometheus自動(dòng)發(fā)現(xiàn)所有節(jié)點(diǎn)對(duì)象拉取exporter提供的數(shù)據(jù);

pod容器監(jiān)控:用各節(jié)點(diǎn)部署的kubelet的cadivisor功能,使Prometheus自動(dòng)發(fā)現(xiàn)并拉取cadivisor提供的容器運(yùn)行時(shí)指標(biāo),并部署kube-state-metrics拉取pod容器元數(shù)據(jù)。 Argus基于Zabbix的IT運(yùn)維監(jiān)控平臺(tái)。青海運(yùn)維監(jiān)控技術(shù)指導(dǎo)

信創(chuàng)終端運(yùn)維服務(wù)、數(shù)據(jù)中心運(yùn)維服務(wù)、業(yè)務(wù)系統(tǒng)運(yùn)維服務(wù)、適配遷移服務(wù)、安全運(yùn)維服務(wù)等信創(chuàng)運(yùn)維服務(wù)。通過信創(chuàng)運(yùn)維服務(wù)體系、信創(chuàng)安全管理體系、信創(chuàng)一體化服務(wù)保障平臺(tái)、信創(chuàng)現(xiàn)場(chǎng)和遠(yuǎn)程運(yùn)維服務(wù)管理平臺(tái),規(guī)范信創(chuàng)運(yùn)維服務(wù)過程,提升信創(chuàng)運(yùn)維服務(wù)保障能力,為客戶創(chuàng)建可視可控的運(yùn)維環(huán)境,保障信創(chuàng)終端、數(shù)據(jù)中心和業(yè)務(wù)應(yīng)用系統(tǒng)的可靠、高效、持續(xù)、安全運(yùn)行。

多種信創(chuàng)技術(shù)路線并存:信創(chuàng)運(yùn)維技術(shù)難度高,缺乏成熟運(yùn)維技術(shù)和經(jīng)驗(yàn)參考,信創(chuàng)運(yùn)維技術(shù)培訓(xùn)不健全。信創(chuàng)適配遷移困難:缺乏應(yīng)用系統(tǒng)適配改造經(jīng)驗(yàn),應(yīng)用遷移涉及重構(gòu)與重編譯,工作量大,遷移工具不成熟。信創(chuàng)生態(tài)環(huán)境不成熟:信創(chuàng)產(chǎn)品性能、可靠性、品質(zhì)、成熟度參差不齊,生態(tài)環(huán)境不成熟,產(chǎn)業(yè)鏈生態(tài)整合能力弱。信創(chuàng)運(yùn)維管理復(fù)雜:信創(chuàng)環(huán)境和非信創(chuàng)環(huán)境并存,運(yùn)維管理復(fù)雜。與國(guó)外成熟產(chǎn)品差距大,運(yùn)維難度高,要求較高的運(yùn)維技術(shù)能力。 中國(guó)香港運(yùn)維監(jiān)控答疑解惑Argus運(yùn)維監(jiān)控體系全梳理!

2020年12月13日,據(jù)海外媒體報(bào)道,一個(gè)名為APT的網(wǎng)絡(luò)入侵組織把世界出名網(wǎng)管軟件廠商SolarWinds作為入侵目標(biāo)。這次APT攻擊首先是對(duì)SolarWinds旗下的Orion網(wǎng)絡(luò)監(jiān)控軟件更新服務(wù)器進(jìn)行入侵,并在軟件更新(Orion)中植入了惡意代碼。透露大約有1.8萬客戶在其系統(tǒng)上部署了該更新,且對(duì)美國(guó)財(cái)政部高層領(lǐng)導(dǎo)使用的電子郵件系統(tǒng)也造成了影響。

SolarWinds的系統(tǒng)被攻擊之后,已導(dǎo)致全球許多組織的網(wǎng)絡(luò)遭到破壞,涉及的供應(yīng)鏈范圍極為廣大,被稱為2020年美國(guó)極大網(wǎng)絡(luò)安全事件。

“太陽風(fēng)”(SolarWinds) 是一家專職提供IT監(jiān)控和運(yùn)維解決方案的商業(yè)公司。其產(chǎn)品SolarWinds Orion Network Performance Monitor(NPM)是集網(wǎng)絡(luò)監(jiān)測(cè)、設(shè)備性能維護(hù)管理、故障監(jiān)控、網(wǎng)絡(luò)實(shí)時(shí)流量監(jiān)控和歷史數(shù)據(jù)統(tǒng)計(jì)、匯總和歷史數(shù)據(jù)分析、虛擬數(shù)據(jù)中心監(jiān)控、網(wǎng)絡(luò)拓?fù)浔O(jiān)控等功能于一體的網(wǎng)絡(luò)管理系統(tǒng)。該軟件主要是用于企業(yè)內(nèi)部網(wǎng)絡(luò)管理,目前全球客戶超過32萬家。SolarWinds作為一個(gè)齊全的IT管理系統(tǒng)還有一些功能的欠缺,而且中文支持也是一個(gè)國(guó)內(nèi)推廣的難題。像同一類型的軟件Hostmonitor、CA Unicenter也是存在同樣的問題。

Argus搭建可觀測(cè)性監(jiān)控的原則客觀性、系統(tǒng)性、關(guān)聯(lián)性、預(yù)見性。低嵌入、無干擾的第三方視角觀測(cè)采集數(shù)據(jù);不單一的只看某個(gè)指標(biāo),注重各觀測(cè)角度之間的整體性關(guān)系,系統(tǒng)的涵蓋所需觀察的每個(gè)方面,體現(xiàn)出被觀測(cè)對(duì)象較為完整的觀測(cè)結(jié)果;每個(gè)監(jiān)控項(xiàng)或應(yīng)用既具單獨(dú)性,又具相關(guān)性,而各要素和體關(guān)聯(lián)性系之間同樣存在這種“相互關(guān)聯(lián)或相互作用”的關(guān)系;任何事物的觀察都是基于時(shí)間的動(dòng)態(tài)行為,監(jiān)控的目的是要提早發(fā)現(xiàn)風(fēng)險(xiǎn),避免發(fā)生故障,所以我們所有的監(jiān)控行為都要對(duì)將來可能發(fā)生事件實(shí)現(xiàn)預(yù)判。 5個(gè)運(yùn)維必須知道的運(yùn)維監(jiān)控系統(tǒng),功能真心強(qiáng)大!

對(duì)于網(wǎng)絡(luò)出口與網(wǎng)絡(luò)專線的有效監(jiān)控與分析,既能協(xié)助業(yè)務(wù)運(yùn)維同學(xué)有效地定位業(yè)務(wù)異常、評(píng)估業(yè)務(wù)服務(wù)質(zhì)量等,也能有效地度量業(yè)務(wù)整體運(yùn)營(yíng)成本,畢竟現(xiàn)在帶寬的使用成本在整體運(yùn)營(yíng)成本中也是占比越來越大。相信運(yùn)維同學(xué)多少都會(huì)遇到下面等較高頻的使用場(chǎng)景:

這條專線當(dāng)前利用率多少?

在已經(jīng)使用的流量中,某個(gè)IP使用了多少流量?這些所產(chǎn)生的流量是基于什么協(xié)議與方向?

專線與網(wǎng)絡(luò)出口的丟包率與時(shí)延是怎么樣的?

每條專線中主要是哪些務(wù)在用?哪個(gè)是“地主客戶”?對(duì)

于網(wǎng)絡(luò)流量的監(jiān)控來說,其實(shí)中心是一個(gè)分析平臺(tái),通過把采集到的各種流量包抓取過來,然后再把相應(yīng)的流量送入分析集群。 觀縱將強(qiáng)大的Argus IT運(yùn)維監(jiān)控做到數(shù)據(jù)化、工具化、可視化。哪些運(yùn)維監(jiān)控哪里有賣的

IT運(yùn)維監(jiān)控所包含的產(chǎn)品功能強(qiáng)大、易于使用、解決方案齊全,可一站式滿足用戶的各種IT管理需求。青海運(yùn)維監(jiān)控技術(shù)指導(dǎo)

整個(gè)餓了么監(jiān)控系統(tǒng)在演進(jìn)過程中主要分為如下3個(gè)階段:

第一階段:主要由Statsd/Graphite/Grafana負(fù)責(zé)業(yè)務(wù)層的監(jiān)控,ETrace負(fù)責(zé)全鏈路監(jiān)控,Zabbix負(fù)責(zé)服務(wù)器層面的監(jiān)控,ELog負(fù)責(zé)分布式日志搜索;

第二階段:整個(gè)餓了么也從單IDC演進(jìn)成異地多活架構(gòu),所以對(duì)監(jiān)控也提出了更高的要求,基于這個(gè)我們也自研LinDB,以支持多活架構(gòu)下的監(jiān)控,Zabbix慢慢被ESM/InfluxDB/Grafana所替換,使用ELK替換原來的日志方案;

第三階段:主要做一個(gè)減法,即把原來StatsD/Graphite/ETrace/ESM/InfluxDB統(tǒng)一到了EMonitor+LinDB這樣的平臺(tái),以提供給用戶一套統(tǒng)一的監(jiān)控平臺(tái),日志開始使用阿里云的SLS。 青海運(yùn)維監(jiān)控技術(shù)指導(dǎo)

上海觀縱科技有限公司致力于傳媒、廣電,以科技創(chuàng)新實(shí)現(xiàn)高質(zhì)量管理的追求。觀縱科技擁有一支經(jīng)驗(yàn)豐富、技術(shù)創(chuàng)新的專業(yè)研發(fā)團(tuán)隊(duì),以高度的專注和執(zhí)著為客戶提供webfunny前端監(jiān)控,webfunny前端埋點(diǎn),全鏈路應(yīng)用性能監(jiān)控,Argus-IT運(yùn)維監(jiān)控。觀縱科技繼續(xù)堅(jiān)定不移地走高質(zhì)量發(fā)展道路,既要實(shí)現(xiàn)基本面穩(wěn)定增長(zhǎng),又要聚焦關(guān)鍵領(lǐng)域,實(shí)現(xiàn)轉(zhuǎn)型再突破。觀縱科技創(chuàng)始人姜應(yīng)偉,始終關(guān)注客戶,創(chuàng)新科技,竭誠(chéng)為客戶提供良好的服務(wù)。