欧美一区2区三区4区公司二百,国产精品婷婷午夜在线观看,自拍偷拍亚洲精品,国产美女诱惑一区二区

通過結(jié)合機(jī)器和人類智能加速根本原因分析

IT 工程師經(jīng)常提到術(shù)語“MTTR”(平均修復(fù)時(shí)間)。這是一個(gè)關(guān)鍵指標(biāo),表明 IT 團(tuán)隊(duì)可以多快地解決懸而未決的問題。盡管我們今天擁有更復(fù)雜的監(jiān)控工具,并且可能能夠比以前更早地收到警報(bào),但仍然需要不斷努力尋找根本原因分析解決方案并確定適當(dāng)?shù)难a(bǔ)救措施。這通常是 MTTR 花費(fèi)的時(shí)間比預(yù)期長得多的原因。

通過結(jié)合機(jī)器和人類智能加速根本原因分析

在這種情況下,根本原因分析可以通過結(jié)合過去的人類經(jīng)驗(yàn)和機(jī)器驅(qū)動(dòng)的數(shù)據(jù)處理能力來提供幫助,從而更快地提供可見性并建議最佳解決方案候選者。?在我們“馴服 IT 混亂”博客系列的第四篇文章中,我們將介紹使用機(jī)器學(xué)習(xí) (ML) 和相關(guān)技術(shù)的根本原因分析解決方案。

情境化警報(bào)

當(dāng)警報(bào)發(fā)生時(shí),可能有許多導(dǎo)致它的故障。更好地理解警報(bào)的第一步是將其上下文化。通常,可以應(yīng)用四種情境化:

  1. 垂直堆疊
  2. 水平交通路徑
  3. 交易流程
  4. 時(shí)間序列事件關(guān)聯(lián)

1.垂直堆疊

現(xiàn)代IT 基礎(chǔ)架構(gòu)由多個(gè)層組成:從物理網(wǎng)絡(luò)到主機(jī)、服務(wù)和應(yīng)用程序。每一層都有不同的監(jiān)控機(jī)制,比如網(wǎng)絡(luò)層的流量監(jiān)控,服務(wù)層和應(yīng)用層的服務(wù)檢查。將警報(bào)與每一層的監(jiān)控指標(biāo)相關(guān)聯(lián)是使警報(bào)上下文化的第一步,如下圖所示:

通過結(jié)合機(jī)器和人類智能加速根本原因分析

2. 橫向交通路徑

流量路徑是將警報(bào)上下文化的另一個(gè)維度。它嘗試將警報(bào)與監(jiān)控指標(biāo)以及流量連接起來。例如,網(wǎng)站問題的根本原因可以追溯到其相關(guān)的網(wǎng)關(guān)、Web 服務(wù)器、功能服務(wù)或搜索服務(wù),如下圖所示:

通過結(jié)合機(jī)器和人類智能加速根本原因分析

3. 交易流程

事務(wù)是隨后執(zhí)行的一系列動(dòng)作,共同完成一項(xiàng)任務(wù)。交易可以是由搜索、購物車操作和支付組成的高級(jí)電子商務(wù)流程。或者它可以是低級(jí)數(shù)據(jù)庫 SQL 執(zhí)行,包括多個(gè)內(nèi)存計(jì)算步驟和最終提交。建立警報(bào)與其事務(wù)流的關(guān)系將使 IT 操作員能夠?qū)I(yè)務(wù)目的與其底層操作聯(lián)系起來,并快速勾勒出警報(bào)的影響范圍,從而快速確定關(guān)鍵路徑。

4.時(shí)間序列事件關(guān)聯(lián)

所有 IT 事件都可以應(yīng)用到時(shí)間序列分析中,可以識(shí)別事件之間的順序關(guān)系,并對(duì)相關(guān)事件進(jìn)行分組和排序。順序關(guān)系不一定表示因果關(guān)系,然而,頻繁的、重復(fù)的順序關(guān)系可以被視為一種模式,當(dāng)與其他信息結(jié)合時(shí),可能會(huì)導(dǎo)致進(jìn)一步的發(fā)現(xiàn)。

過去事故的監(jiān)督培訓(xùn)

過去的經(jīng)驗(yàn)是解決當(dāng)今問題的寶貴財(cái)富。過去的警報(bào)數(shù)據(jù),以及所有上下文數(shù)據(jù)和解決方案信息,是機(jī)器學(xué)習(xí)的完美訓(xùn)練集。它通常是一個(gè)有監(jiān)督的學(xué)習(xí)過程,可以應(yīng)用多種學(xué)習(xí)模型,例如回歸、決策樹或神經(jīng)網(wǎng)絡(luò)。通常,沒有適合所有場景的單一模型或一個(gè)問題的完美解決方案。機(jī)器學(xué)習(xí)的美妙之處在于它可以結(jié)合多個(gè)模型的結(jié)果,并提供一系列按置信度分?jǐn)?shù)排序的解決方案。人類可以檢查機(jī)器學(xué)習(xí)模型建議的解決方案,進(jìn)一步研究或嘗試它們。

超越根本原因分析解決方案

借助與機(jī)器學(xué)習(xí)建議的每個(gè)解決方案相關(guān)的置信度分?jǐn)?shù),人類操作員甚至可以建立自我修復(fù)機(jī)制。對(duì)于負(fù)面影響也很低的高度自信的解決方案,如果應(yīng)用它們,人工操作員可以讓機(jī)器自動(dòng)執(zhí)行它們并監(jiān)控結(jié)果。當(dāng)機(jī)器智能學(xué)習(xí)和建模越來越多的經(jīng)驗(yàn)時(shí),需要的人工干預(yù)越來越少——即使是災(zāi)難性事件也是如此。這可能是邁向完全自動(dòng)化的第一步,這是 IT 運(yùn)營的終極夢想。

文章鏈接: http://m.qzkangyuan.com/6876.html

文章標(biāo)題:通過結(jié)合機(jī)器和人類智能加速根本原因分析

文章版權(quán):夢飛科技所發(fā)布的內(nèi)容,部分為原創(chuàng)文章,轉(zhuǎn)載請(qǐng)注明來源,網(wǎng)絡(luò)轉(zhuǎn)載文章如有侵權(quán)請(qǐng)聯(lián)系我們!

聲明:本站所有文章,如無特殊說明或標(biāo)注,均為本站原創(chuàng)發(fā)布。任何個(gè)人或組織,在未征得本站同意時(shí),禁止復(fù)制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書籍等各類媒體平臺(tái)。如若本站內(nèi)容侵犯了原著者的合法權(quán)益,可聯(lián)系我們進(jìn)行處理。

給TA打賞
共{{data.count}}人
人已打賞
IDC云庫

利用管理數(shù)據(jù)提高數(shù)據(jù)安全性的五種方法

2022-5-18 11:18:09

IDC云庫

DKIM是什么?它是如何工作的?為什么它很重要?

2022-5-18 13:58:46

0 條回復(fù) A文章作者 M管理員
    暫無討論,說說你的看法吧
?
個(gè)人中心
購物車
優(yōu)惠劵
今日簽到
有新私信 私信列表
搜索
主站蜘蛛池模板: 洛阳市| 石棉县| 嘉荫县| 红河县| 星座| 东乡族自治县| 通山县| 仁寿县| 云阳县| 灵璧县| 青海省| 舒城县| 丹巴县| 靖江市| 舟曲县| 普安县| 昌平区| 东阳市| 山东| 永新县| 昭平县| 卓资县| 浦县| 青神县| 墨竹工卡县| 清丰县| 习水县| 夏邑县| 汕头市| 郯城县| 犍为县| 乐业县| 临沭县| 临潭县| 化州市| 环江| 安岳县| 福清市| 巴楚县| 桐梓县| 台湾省|