陜西運維監(jiān)控常見問題

來源: 發(fā)布時間:2023-06-21

遇到多集群場景問題

多達(dá)上百個集群數(shù),而有些業(yè)務(wù)系統(tǒng)擁有多個集群,其多集群場景特點有:

服務(wù)發(fā)現(xiàn)隔離:Prometheus的服務(wù)發(fā)現(xiàn)機制無法發(fā)現(xiàn)多個集群的被監(jiān)控對象;

網(wǎng)絡(luò)隔離:跨集群可能存在連通性問題;

業(yè)務(wù)需求:業(yè)務(wù)系統(tǒng)可能需要跨集群聚合數(shù)據(jù)。

只用Prometheus能解決嗎?

Prometheus本身只支持單機部署,沒有自帶支持集群部署,對于集群化和水平擴展,官方和社區(qū)都沒有銀彈,需要合理選擇VictoriaMetrics、Thanos等開源方案或自研方案。Prometheus的存儲空間也受限于單機磁盤容量,磁盤容量決定了單個Prometheus所能存儲的數(shù)據(jù)量,數(shù)據(jù)量大小又取決于被采集服務(wù)的指標(biāo)數(shù)量、服務(wù)數(shù)量、采集速率以及數(shù)據(jù)過期時間。在數(shù)據(jù)量大的情況下,我們可能就需要做很多取舍,比如丟棄不重要的指標(biāo)、降低采集速率、設(shè)置較短的數(shù)據(jù)過期時間等。 Argus運維監(jiān)控系統(tǒng)撥測分析模塊,從端口可用性等多個指標(biāo)、維度進(jìn)行撥測分析。陜西運維監(jiān)控常見問題

在發(fā)展“國內(nèi)循環(huán)為主體、國內(nèi)國際雙循環(huán)互相促進(jìn)的新發(fā)展格局”的關(guān)鍵時期,為了加強和完善國家創(chuàng)新體系建設(shè),提升產(chǎn)業(yè)基礎(chǔ)能力和產(chǎn)業(yè)鏈水平,在第十三屆全國人大會常務(wù)委員會中修訂通過了《中華人民共和國科學(xué)技術(shù)進(jìn)步法》,明確表示優(yōu)先采購國內(nèi)信息技術(shù)創(chuàng)新產(chǎn)品。據(jù)《2021年中國信創(chuàng)生態(tài)研究報告》顯示,未來在國家政策的推動下,中國信創(chuàng)行業(yè)發(fā)展?jié)摿Υ?,預(yù)計2025年市場規(guī)模將達(dá)8000億元。

觀縱始終走在自主研發(fā)的前沿,現(xiàn)在已經(jīng)形成了從IT運維監(jiān)控、電力運維到IoT運維的產(chǎn)業(yè)布局。作為在信創(chuàng)產(chǎn)業(yè)中持續(xù)耕耘的企業(yè),目前觀縱已經(jīng)申報專利和產(chǎn)品軟著,并獲得ISO、ITSS、AIOps標(biāo)準(zhǔn)符合性、高新、知識產(chǎn)權(quán)管理體系、CMMI等多項認(rèn)證,以及多家廠商對觀縱信創(chuàng)產(chǎn)品的適配認(rèn)證。 是什么運維監(jiān)控功能簡單聊聊運維監(jiān)控的其他用途。

相比傳統(tǒng)規(guī)則類監(jiān)控,日志異常檢測可以讓運維人員做到“輕松運維”——不用再設(shè)置大量繁瑣的監(jiān)控規(guī)則,也無需再設(shè)置多樣的告警觸發(fā)閾值,就可以快速檢測并發(fā)現(xiàn)日志的異常。這一功能還能降低對運維工程師經(jīng)驗的要求,幫助客戶減少因人員流動帶來的系統(tǒng)監(jiān)控不穩(wěn)定的風(fēng)險。當(dāng)前,Argus運維監(jiān)控系統(tǒng)已經(jīng)在運營商以及金融客戶的多個項目中得到了良好的實踐,能快速適應(yīng)業(yè)務(wù)日志變化,高效實現(xiàn)對不同業(yè)務(wù)場景的監(jiān)控覆蓋,幫助客戶提高日志運維故障診斷和維護的效率,提升企業(yè)的業(yè)務(wù)可用性及穩(wěn)定性。

Argus監(jiān)控運維系統(tǒng)采用高性能深度列式存儲集群,能提供超高壓縮比、順序存儲和自定義數(shù)據(jù)等功能,滿足企業(yè)PB級數(shù)據(jù)存儲的需求,實現(xiàn)海量數(shù)據(jù)毫秒級的響應(yīng)。以觀縱服務(wù)的某企業(yè)為例,該企業(yè)承擔(dān)著產(chǎn)業(yè)鏈上下游數(shù)百家企業(yè)海量電子信息的實時匯聚和處理,每天新生成日志數(shù)據(jù)達(dá)到數(shù)十TB。云智慧助力該客戶打造的數(shù)字化運維日志中心,數(shù)據(jù)存儲壓縮比達(dá)到了1:0.3,能支持10萬/秒并發(fā)數(shù)據(jù)實時分析處理,數(shù)據(jù)傳輸和平臺解析處理吞吐量達(dá)540MB/s,處理延時控制在300毫秒以內(nèi)。 argus運維監(jiān)控平臺讓運維工作不再繁瑣。

面向IT資源200+以上的各類型單位,產(chǎn)品提供一體化運維監(jiān)控功能,以幫助信息部門員高效管理IT運行環(huán)境、IT資產(chǎn),通過運維工具的自動化,提升單位IT服務(wù)質(zhì)量,提高運維效率,降低運維成本,減輕運維人員工作壓力。

Argus實時運維監(jiān)控分析系統(tǒng)是基于全球負(fù)有盛名的IT基礎(chǔ)監(jiān)控平臺Zabbix深度二次開發(fā)的運維監(jiān)控軟件,面向私有化及混合云數(shù)據(jù)中心提供多角度多層次的統(tǒng)一監(jiān)控和運維管理。幫助用戶實時對各類IT資源(網(wǎng)絡(luò)設(shè)備、服務(wù)器、存儲、數(shù)據(jù)庫、中間件等)執(zhí)行性能指標(biāo)監(jiān)控,實現(xiàn)事前運維。 Argus運維監(jiān)控事件聚合的同時, 保留了每一條事件的詳情, 以便深入分析。服務(wù)運維監(jiān)控客服電話

運維、監(jiān)控系統(tǒng)的本質(zhì)是通過發(fā)現(xiàn)故障、解決故障、預(yù)防故障來為了保障業(yè)務(wù)的穩(wěn)定。陜西運維監(jiān)控常見問題

整個餓了么監(jiān)控系統(tǒng)在演進(jìn)過程中主要分為如下3個階段:

第一階段:主要由Statsd/Graphite/Grafana負(fù)責(zé)業(yè)務(wù)層的監(jiān)控,ETrace負(fù)責(zé)全鏈路監(jiān)控,Zabbix負(fù)責(zé)服務(wù)器層面的監(jiān)控,ELog負(fù)責(zé)分布式日志搜索;

第二階段:整個餓了么也從單IDC演進(jìn)成異地多活架構(gòu),所以對監(jiān)控也提出了更高的要求,基于這個我們也自研LinDB,以支持多活架構(gòu)下的監(jiān)控,Zabbix慢慢被ESM/InfluxDB/Grafana所替換,使用ELK替換原來的日志方案;

第三階段:主要做一個減法,即把原來StatsD/Graphite/ETrace/ESM/InfluxDB統(tǒng)一到了EMonitor+LinDB這樣的平臺,以提供給用戶一套統(tǒng)一的監(jiān)控平臺,日志開始使用阿里云的SLS。 陜西運維監(jiān)控常見問題

上海觀縱科技有限公司一直專注于一般項目:技術(shù)服務(wù)、技術(shù)開發(fā)、技術(shù)咨詢、技術(shù)交流、技術(shù)轉(zhuǎn)讓、技術(shù)推廣;軟件開發(fā);人工智能基礎(chǔ)軟件開發(fā);人工智能應(yīng)用軟件開發(fā);數(shù)據(jù)處理服務(wù);信息技術(shù)咨詢服務(wù);信息系統(tǒng)集成服務(wù):信息系統(tǒng)運行維護服務(wù);計算機系統(tǒng)服務(wù);軟件銷售;計算機軟硬件及輔助設(shè)備批發(fā);計算機軟硬件及輔助設(shè)備零售;電子產(chǎn)品銷售;通信設(shè)備銷售;通訊設(shè)備銷售;咨詢策劃服務(wù);市場調(diào)查(不含涉外調(diào)查);廣告制作;廣告發(fā)布;廣告設(shè)計、代理;會議及展覽服務(wù);貨物進(jìn)出口。(除依法須經(jīng)批準(zhǔn)的項目外,憑營業(yè)執(zhí)照依法自主開展經(jīng)營活動) 許可項目:建筑智能化系統(tǒng)設(shè)計;建設(shè)工程施工;網(wǎng)絡(luò)文化經(jīng)營;互聯(lián)網(wǎng)信息服務(wù)。(依法須經(jīng)批準(zhǔn)的項目,經(jīng)相關(guān)部門批準(zhǔn)后方可開展經(jīng)營活動,具體經(jīng)營項目以相關(guān)部門批準(zhǔn)文件或許可證件為準(zhǔn)),是一家傳媒、廣電的企業(yè),擁有自己**的技術(shù)體系。公司目前擁有專業(yè)的技術(shù)員工,為員工提供廣闊的發(fā)展平臺與成長空間,為客戶提供高質(zhì)的產(chǎn)品服務(wù),深受員工與客戶好評。上海觀縱科技有限公司主營業(yè)務(wù)涵蓋webfunny前端監(jiān)控,webfunny前端埋點,全鏈路應(yīng)用性能監(jiān)控,Argus-IT運維監(jiān)控,堅持“質(zhì)量保證、良好服務(wù)、顧客滿意”的質(zhì)量方針,贏得廣大客戶的支持和信賴。一直以來公司堅持以客戶為中心、webfunny前端監(jiān)控,webfunny前端埋點,全鏈路應(yīng)用性能監(jiān)控,Argus-IT運維監(jiān)控市場為導(dǎo)向,重信譽,保質(zhì)量,想客戶之所想,急用戶之所急,全力以赴滿足客戶的一切需要。