上海2018年9月13日電 /美通社/ -- 近日,天旦發(fā)布開源端口鏡像工具 Packet Agent,幫助運維人員通過旁路方式簡單獲取業(yè)務過程數據而不需要硬件探針設備,跨越公有云、私有云、虛擬機、物理機等各種環(huán)境。目前,天旦 Packet Agent 已公開提供免費下載(關注天旦公眾號“天旦Netis”,即可獲得)。
隨著 Iaas 的興起,越來越多的企業(yè)將自己的 IT 基建托管到專業(yè)的服務商,將自己的業(yè)務構建在服務商的公有云虛擬機中。這帶給企業(yè)極大的輕便性和敏捷性,卻給運維帶來難題:一方面,只有極少數的公有云平臺能夠提供業(yè)務數據的鏡像端口,完整的業(yè)務過程數據無從獲取,業(yè)務何時消失在了監(jiān)控視野中無從察覺;另一方面,現有的工具要么開銷較大、要么功能單一,無法支持企業(yè)各種自有業(yè)務協議,甚至不支持數據的導出。天旦,作為國內領先的企業(yè)級軟件產品公司,多年來致力于業(yè)務與網絡性能管理產品的研究與開發(fā),得益于成熟的互聯數據核心算法以及豐富的行業(yè)實踐經驗,凝結為 Packet-Agent,一款開源的虛擬機端口鏡像工具,造福運維行業(yè)、回饋社區(qū)。而這也是天旦在 AIOps 實踐中一個小小的里程碑。
AI 與 Ops
早在2016年,Gartner 就已經提出了 AIOps 的概念并宣稱,到2020年,將近50%的企業(yè)將會在他們的業(yè)務和 IT運 維方面采用 AIOps,遠遠高于今天的10%。理解 AI 與 Ops 的關系,不如從 Gartner 的理解入手。
AIOps 在 Gartner 的詞庫中是 AlgorithmicIT Operations 的縮寫,字面的解釋是一種基于 AI 算法的運維方式,Gartner 在今年發(fā)布的《Market Guide for AIOps Platforms》報告中為 AIOps 作出如下定義:AIOps 平臺是結合大數據、人工智能 (AI) 或機器學習功能的軟件系統(tǒng),用以增強和部分取代廣泛應用的現有 IT 運維流程和事務,包括可用性和性能監(jiān)控、事件關聯和分析,IT 服務管理以及運維自動化。簡而言之,AI 是不需要人工干預,就能幫助運維人員提高生產力的一種途徑。未來,AI 是否可以完全取代人類思考,還未可知,但至少在目前看來,這種美好的預期還必須人的智慧去創(chuàng)造。
另一方面,當越來越多的業(yè)務系統(tǒng)、新技術應用承載于 IT 系統(tǒng)之上,IT 系統(tǒng)作為基礎設施也迅速拓建和創(chuàng)新:從過去的物理機,到虛擬化技術帶來的虛擬機運載,到當下正熱的 LXC 軟件容器,公有云和私有云的應用,運維監(jiān)控對象的數量和監(jiān)控難度都呈指數級增長。
天旦一直致力于通過旁路方式實現實時、全量、精準的的業(yè)務性能監(jiān)控,當一次在與國外用戶的交流溝通匯總發(fā)現,在云環(huán)境下,尤其大部分的公有云幾乎都不提供獲取流量的端口,租戶無法突破其封閉式的底層架構而獲得詳細的業(yè)務過程數據。一方面,這讓業(yè)務的性能變化過程“兩眼一抹黑”,無從即刻知曉;另一方面,一旦業(yè)務在非人為的情況下產生遷移,就會逃出運維人員的監(jiān)控視野。隨著云計算的普及,這將是廣泛存在的運維盲區(qū)。天旦研發(fā)人員基于 SDPM (Software Define Performance Management) 思維,應用歷年來互聯數據引擎的核心算法積累而開發(fā)了一款開源的鏡像工具,Packet Agent。
Packet-Agent 端口鏡像工具,旨在幫助用戶解決在云環(huán)境、虛擬機等復雜環(huán)境下無法實時獲取完整業(yè)務過程數據,感知業(yè)務變化的問題,而不需要網絡鏡像的硬件設備,可適用于 Linux,Unix,Mac,Windows 等各種操作系統(tǒng)。與 PacketBeat、Splunk App for Stream 等工具比較,天旦Packet Agent 大大節(jié)省了機器開銷,并且實現了自定義化的協議支持,甚至直接導出數據包(另2種工具尚且無法實現)等功能。(關注天旦公眾號“天旦Netis”,免費獲取 Packet-Agent 端口鏡像工具)
天旦認為,技術的問題,應當交給技術來解決。用 AIOps 去解決運維中的問題,釋放運維的潛力,給予運維人更多的時間去集中思考,找到合適的方法去攻克下一個難題。
AIOps,走出“有多少人,就有多少智能”的怪圈
Gartner 在《Market Guide for AIOps Platforms》報告中指出: 過去三年,IT 運營部門分別部署了大數據和機器學習技術,以支持 IT 運營的監(jiān)控。然而,在過去的6個月里,企業(yè)已經開始將面向 IT 運營的大數據和機器學習項目相結合,并將其擴展到服務臺和自動化。企業(yè)在 IT 運營 (AIOps) 平臺上使用人工智能來增強并取代傳統(tǒng)的應用性能監(jiān)控 (APM) 和網絡性能監(jiān)控與診斷 (NPMD) 工具。
人工智能算法的成長離不開隊海量案例的分析和學習,而現在許多所謂 AI 告警的定制化方案受限于缺乏充足的真實案例,需要在部署后耗費繁重的人工進行后期的調整和維護,原本想要解放勞動力的項目,卻成為了耗費人力和時間的黑洞,而且算法效果極不穩(wěn)定。
天旦作為企業(yè)級軟件產品公司,通過提供通用性的產品而非定制化的解決方案,使得智能算法真正成熟產品化。多年來,陪伴120+家銀行經歷數字化轉型的整個過程,每天保障超過200億筆交易的穩(wěn)定運行,積累了極其豐富的案例資源與經驗,為算法的不斷完善提供扎實的依據,并轉而進一步將成熟的智能化技術應用到產品功能的之中。
天旦業(yè)務性能管理 BPC,通過算法升級集合智能發(fā)現、智能梳理、智能告警、智能預測、智能排障五大模塊,使得運維人員只需簡單配置全面覆蓋的告警規(guī)則,結合自動故障定位和自動故障域分析,加速故障發(fā)現和分析流程,縮短故障恢復時間。
智能發(fā)現:5年自研專利解碼引擎,自動發(fā)現應用訪問關系,自動解析業(yè)務數據內容。
智能梳理:通過天旦 BPC 的核心組件 -- 服務路徑圖發(fā)現,自動梳理業(yè)務訪問關系,呈現以服務為中心的拓撲視圖,讓數以月計的業(yè)務梳理工作突破性地縮短到天。
智能告警:將告警場景歸納為五大類型,幾乎涵蓋所有常見的高頻故障場景。運維人員僅需選擇合適的告警場景,智能告警算法將自動匹配與之對應的告警邏輯,大大提高告警的配置效率。
智能預測:實時監(jiān)控,智能算法自動根據歷史表現繪制基線,直觀發(fā)現變化趨勢。
智能排障:自動定位故障節(jié)點,一鍵解析造成故障發(fā)生的維度和指標,無需專家介入。
正所謂“科學技術是第一生產力”。天旦相信,隨著智能化運維技術的不斷演進,AIOps脫離人力干預而自動處理運維問題的能力一定會得以實現。
未來:源于“人”
盡管 Google 助手可以幫助主人像真人一般溝通交流,但無法代替主人決心的每日行程;盡管自動駕駛技術可以如真人駕駛一般控制汽車,但無法代替人決定出行的意愿。AI 的使命在于為人類解決問題,而非控制或取代人類。
李開復在 TED 2018年度大會上發(fā)表演講說,工業(yè)革命把手工工匠的工作轉化成大量常規(guī)工作(如生產線工作),但是人工智能革命將徹底取代這些生產線工作。不出十五年,駕駛、電話銷售、卡車司機甚至是放射科醫(yī)生等類似工作和事務也將被人工智能取而代之。在這場人工智能摧毀工作的浩劫中,唯有創(chuàng)造性工作才能從中全身而退。在所有重復性工作上,人工智能都將高出人類一籌。但我們并非因為擅長重復性工作而為人。
天旦相信,隨著數字化轉型的深入,AIOps 必將成為運維組織高效運作的關鍵所在。運維過程中瑣碎、重復的工作終將被由智能化的工具所替代,但卻無法磨滅運維人的存在使命:基于運維系統(tǒng)的深刻理解,做智能化運維的指揮官,謀略布局。而天旦也將繼續(xù)精進算法、積累行業(yè)經驗,將智能化的技術植根于產品研發(fā)與功能設計的細節(jié)之中,幫助“運維指揮官”釋放運維的智慧潛力,為企業(yè)在數字化轉型之路上創(chuàng)造更多業(yè)務可能。
關注天旦公眾號“天旦Netis”,免費獲取 Packet Agent 端口鏡像工具。