在江蘇常州,一家長(zhǎng)期專注于 Zabbix 產(chǎn)品化二次開(kāi)發(fā)的研發(fā)機(jī)構(gòu)-縱目信息(ZMOPS),正在為這一愿景付諸實(shí)踐。以數(shù)據(jù)采集→處理→分析→觀測(cè)為產(chǎn)品主干,以 Zabbix 為底層**打造的統(tǒng)一監(jiān)控產(chǎn)品應(yīng)用于數(shù)十個(gè)行業(yè),同時(shí)不斷推進(jìn)基于 Zabbix 的物聯(lián)網(wǎng)數(shù)據(jù)平臺(tái)的開(kāi)源。Argus 是一個(gè)面向私有化及混合云數(shù)據(jù)中心提供***多層次的統(tǒng)一監(jiān)控和運(yùn)維管理平臺(tái),幫助用戶實(shí)時(shí)對(duì)各類IT資源(網(wǎng)絡(luò)設(shè)備、服務(wù)器、存儲(chǔ)、數(shù)據(jù)庫(kù)、中間件等)執(zhí)行性能指標(biāo)監(jiān)控,實(shí)現(xiàn)事前運(yùn)維。zabbix大流量數(shù)據(jù)的存儲(chǔ)。企業(yè)級(jí)zabbix項(xiàng)目
開(kāi)放性:源代碼全公開(kāi),任何用戶都可以編譯和發(fā)布自己的版本。同時(shí),社區(qū)和互聯(lián)網(wǎng)可以找到大量的模版??蓴U(kuò)展性:支持用戶自定義監(jiān)控項(xiàng),只要能想得到的KPI,基本都能監(jiān)控的到。數(shù)據(jù)采集:可用性和性能檢測(cè),自動(dòng)發(fā)現(xiàn),支持agent、SNMP、JMX、telnet等多種采集方式,支持主動(dòng)和被動(dòng)模式數(shù)據(jù)傳輸高可用:server對(duì)設(shè)備性能要求低,支持proxy分布式監(jiān)控,分布式集中管理,開(kāi)放式接口,擴(kuò)展性強(qiáng)告警管理:支持多條件告警,支持多種告警方式,模板能力:支持多組模板,模板繼承。告警設(shè)置:告警周期,告警級(jí)別,告警恢復(fù)通知、告警暫停,時(shí)段閾值、支持維護(hù)周期、支持單機(jī)停用歷史數(shù)據(jù):歷史數(shù)據(jù)查詢可配置,內(nèi)置housekeeping數(shù)據(jù)清理機(jī)制安全審計(jì):具備安全的用戶審計(jì)日志,權(quán)限認(rèn)證,用戶可以限制允許維護(hù)的列表。無(wú)商業(yè)版本:平臺(tái)本身沒(méi)有商業(yè)版和社區(qū)版本的區(qū)分,ZABBIX只對(duì)商業(yè)服務(wù)收費(fèi)(如培訓(xùn)、定制開(kāi)發(fā)、部署服務(wù)等)。zabbix 6.2支持場(chǎng)景基于TimeScaleDB(PG時(shí)序數(shù)據(jù)庫(kù))離線部署Zabbix5.4。
在實(shí)際的工作環(huán)境中,根據(jù)網(wǎng)絡(luò)環(huán)境和監(jiān)控的規(guī)模不同,zabbix一共有三種框架,分別是server_client架構(gòu)、master_node_client架構(gòu)和server_proxy_client架構(gòu)。1、server_client架構(gòu)zabbix**簡(jiǎn)單的架構(gòu),監(jiān)控設(shè)備和被監(jiān)控設(shè)備之間直接相連,zabbix_server和zabbix_client之間直接進(jìn)行數(shù)據(jù)交互。2、zabbix_proxy_client架構(gòu)proxy是連接server和client之間的橋梁,其本身不存放數(shù)據(jù),只是將zabbix_agent端發(fā)來(lái)的數(shù)據(jù)暫存,然后再提交給server。這種架構(gòu)一般用于跨機(jī)房、跨網(wǎng)絡(luò)的中型網(wǎng)絡(luò)架構(gòu)。在server_proxy_client架構(gòu)中,server設(shè)備的宕機(jī)會(huì)導(dǎo)致整個(gè)系統(tǒng)癱瘓而無(wú)法正常工作。3、master_node_client架構(gòu)master_node_client架構(gòu)是zabbix**復(fù)雜的架構(gòu)。一般用于跨機(jī)房、跨網(wǎng)絡(luò)、監(jiān)控設(shè)備較多的大型網(wǎng)絡(luò)架構(gòu)。與server_proxy_client架構(gòu)相比,master_node_client架構(gòu)的主要區(qū)別在于node與proxy上.在master_node_client架構(gòu)中,每個(gè)node可以理解為一個(gè)小的server端,在自己的配置文件和數(shù)據(jù)庫(kù),node下游可以直接連接client,也可以再次經(jīng)過(guò)proxy代理后連接client。在master_node_client架構(gòu)中,master設(shè)備宕機(jī)不會(huì)影響node節(jié)點(diǎn)的正常工作。
既然進(jìn)程之間是流水線式的協(xié)作,我們看一下監(jiān)控?cái)?shù)據(jù)在三類進(jìn)程之間如何進(jìn)行輸入和輸出。首先,Trapper和poller進(jìn)程接收到的數(shù)據(jù)按照來(lái)源分為兩種,一種是來(lái)自proxy端,一種是來(lái)自agent端。由于來(lái)自proxy端的數(shù)據(jù)已經(jīng)由proxy完成了預(yù)處理,所以,這部分?jǐn)?shù)據(jù)會(huì)直接輸出到共享內(nèi)存,供historysyncer進(jìn)程使用。對(duì)于來(lái)自agent端的數(shù)據(jù),無(wú)論其監(jiān)控項(xiàng)是否設(shè)置了預(yù)處理步驟,都會(huì)通過(guò)unix域套接字傳遞給預(yù)處理進(jìn)程。預(yù)處理進(jìn)程接收到數(shù)據(jù)以后,如果發(fā)現(xiàn)該數(shù)據(jù)并沒(méi)有設(shè)置預(yù)處理步驟,則直接寫(xiě)入共享內(nèi)存,供historysyncer進(jìn)程使用;如果發(fā)現(xiàn)需要預(yù)處理,則在預(yù)處理完畢以后再寫(xiě)入共享內(nèi)存,供historysyncer進(jìn)程使用。對(duì)于historysyncer進(jìn)程來(lái)說(shuō),其輸入數(shù)據(jù)來(lái)自共享內(nèi)存,它會(huì)批量地從共享內(nèi)存讀取數(shù)據(jù)進(jìn)行處理,具體處理過(guò)程是先寫(xiě)入數(shù)據(jù)庫(kù),然后計(jì)算觸發(fā)器表達(dá)式生成event。Zabbix前端的高可用性如何?
Zabbix能監(jiān)視各種網(wǎng)絡(luò)參數(shù),保證服務(wù)器系統(tǒng)的安全運(yùn)營(yíng),并提供靈活的通知機(jī)制以讓系統(tǒng)管理員快速定位/解決存在的各種問(wèn)題。是一個(gè)基于WEB界面的提供企業(yè)級(jí)的開(kāi)源分布式系統(tǒng)監(jiān)視以及網(wǎng)絡(luò)監(jiān)視功能的企業(yè)級(jí)的開(kāi)源解決方案。Agent端:主機(jī)通過(guò)安裝agent方式采集數(shù)據(jù);Server端:通過(guò)收集agent發(fā)送的數(shù)據(jù),寫(xiě)入數(shù)據(jù)庫(kù)(MySQL,ORACLE),在通過(guò)php+apache/nginx在web前端展示。優(yōu)點(diǎn):基于兩款工具(cacti+Nagios)優(yōu)點(diǎn)于一身并更強(qiáng)大,實(shí)現(xiàn)企業(yè)級(jí)分布式監(jiān)控。缺點(diǎn):需在被監(jiān)控主機(jī)上安裝agent,所有數(shù)據(jù)都存在數(shù)據(jù)庫(kù)里,產(chǎn)生的數(shù)據(jù)量很大,瓶頸主要在數(shù)據(jù)庫(kù)。Zabbix 6.2將又一次提升新用戶和老用戶的用戶體驗(yàn)。企業(yè)級(jí)zabbix項(xiàng)目
在所有Zabbix Agent配置文件中的Server和ServerActive參數(shù)中列出Zabbix Server集群節(jié)點(diǎn)信息;企業(yè)級(jí)zabbix項(xiàng)目
各個(gè)大廠都有提供相關(guān)監(jiān)控產(chǎn)品,比如說(shuō)微軟的SCOM,IBM的Tivoli,華為的Esight,HP的BSM等,如果環(huán)境都是單一的某一家廠家的產(chǎn)品,用該廠家提供的監(jiān)控工具肯定是合適的,筆者就曾經(jīng)深度使用過(guò)SCOM,2005年還叫MOM,是SystemCenter中的一個(gè)套件,這個(gè)產(chǎn)品對(duì)于微軟周邊的產(chǎn)品如AD、Exchange、Windows、SQLServer、SharePoint、Lync等監(jiān)控非常深入,同時(shí)微軟官方還提供了相關(guān)故障知識(shí)庫(kù),報(bào)表也做得非常不錯(cuò)。但是,如果拿SCOM去監(jiān)控Linux、AIX、Oracle或者網(wǎng)絡(luò)通訊設(shè)備就顯得不合適了。Zabbix很好地平衡了監(jiān)控的深度和廣度,而且源于開(kāi)源的力量,在全球用戶的持續(xù)貢獻(xiàn)下,他的深度和廣度是在持續(xù)不斷地延展的。企業(yè)級(jí)zabbix項(xiàng)目
上海觀縱科技有限公司致力于傳媒、廣電,是一家服務(wù)型的公司。公司自成立以來(lái),以質(zhì)量為發(fā)展,讓匠心彌散在每個(gè)細(xì)節(jié),公司旗下webfunny前端監(jiān)控,webfunny前端埋點(diǎn),全鏈路應(yīng)用性能監(jiān)控,Argus-IT運(yùn)維監(jiān)控深受客戶的喜愛(ài)。公司注重以質(zhì)量為中心,以服務(wù)為理念,秉持誠(chéng)信為本的理念,打造傳媒、廣電良好品牌。在社會(huì)各界的鼎力支持下,持續(xù)創(chuàng)新,不斷鑄造高質(zhì)量服務(wù)體驗(yàn),為客戶成功提供堅(jiān)實(shí)有力的支持。