數(shù)字化浪潮洶涌澎湃,上云也成為了企業(yè)實現(xiàn)數(shù)字化轉(zhuǎn)型的必經(jīng)之路,過去傳統(tǒng)IT運(yùn)維人員的運(yùn)維對象,也變成了與云有關(guān)的內(nèi)容。然而,隨著云上業(yè)務(wù)的規(guī)模與復(fù)雜度日趨増長,對云上的運(yùn)維、安全和管理也提出了新的挑戰(zhàn)。
為了讓企業(yè)以及運(yùn)維人士更好地緊跟技術(shù)變革,利用好云技術(shù)使能業(yè)務(wù)發(fā)展,2022年9月17日,華為云聯(lián)創(chuàng)營?云上綜合治理研討班來到了廈門,華為云攜手美圖共同打造了精品內(nèi)容與優(yōu)秀云上運(yùn)維實踐課程,與廈門數(shù)十位頭部互聯(lián)網(wǎng)企業(yè)的技術(shù)精英齊聚一堂,通過實踐分享,實操演練等形式,共同探討云上運(yùn)維治理體系優(yōu)化和創(chuàng)新路徑。在會上,華為云還重磅發(fā)布了《SRE確定性運(yùn)維專家培訓(xùn)》課程,以讓更多的企業(yè)技術(shù)人員,了解到如何進(jìn)行SRE確定性運(yùn)維流程的體系構(gòu)建和優(yōu)化,助力企業(yè)用好云、管好云。
美圖高級技術(shù)總監(jiān)王關(guān)勝表示,“技術(shù)只有在持續(xù)探討中才能取得長足進(jìn)步。美圖在2019年便實現(xiàn)了全量上華為云,積累了不少基于云上運(yùn)維治理的經(jīng)驗,希望通過聯(lián)創(chuàng)營這個技術(shù)交流的平臺,能與廈門企業(yè)實現(xiàn)更多互動,共同探索長效運(yùn)維新思路,這也是美圖與華為云共同舉辦活動的初衷。”
華為云福建互聯(lián)網(wǎng)業(yè)務(wù)部長張小龍在開場時表示,“華為云和美圖的技術(shù)團(tuán)隊共同舉辦的云上綜合治理研討班,是面向廈門互聯(lián)網(wǎng)企業(yè)搭建的一個交流平臺。希望未來更多企業(yè)技術(shù)精英加入,通過互相交流與學(xué)習(xí)探討,幫助企業(yè)更高效地構(gòu)建科學(xué)的企業(yè)運(yùn)維體系和綜合技術(shù)團(tuán)隊,以實現(xiàn)對公司業(yè)務(wù)更好地支撐?!?/p>
云上運(yùn)維復(fù)雜多變,尋求確定性運(yùn)維體系
在充滿不確定性的VUCA時代,企業(yè)、行業(yè)的發(fā)展比以往都更加復(fù)雜,云運(yùn)維的工作也需要在VUCA時代尋求新的出口,美圖高級運(yùn)維經(jīng)理石鵬先生分享了《與云共生,打造確定性運(yùn)維體系》。他表示,“美圖SRE把核心價值總結(jié)為穩(wěn)定性、效率、成本。面對不確定性,SRE需要回歸崗位價值,構(gòu)建一個可觀測、可掌控且持續(xù)進(jìn)化的、覆蓋業(yè)務(wù)全生命周期的確定性運(yùn)維體系?!?/p>
在穩(wěn)定性領(lǐng)域要做好日常的常規(guī)工作,持續(xù)構(gòu)建和完善統(tǒng)一的可觀測體系,在此基礎(chǔ)上做好應(yīng)急響應(yīng)、故障管理及災(zāi)備體系的建設(shè),打好穩(wěn)定性這個基礎(chǔ)。在效率方面,要對業(yè)務(wù)進(jìn)行多維度的度量和周期性的審視,對穩(wěn)定性和效能進(jìn)行回顧總結(jié),從而在業(yè)務(wù)架構(gòu)、工具流程、研發(fā)效能等方面做持續(xù)優(yōu)化。在成本方面,通過對資源使用量和利用率的持續(xù)監(jiān)測和動態(tài)調(diào)整,對成本數(shù)據(jù)的周期性分析,從而對成本實現(xiàn)全周期的管控。
此外,石鵬還分享了美圖在云運(yùn)維領(lǐng)域的實踐和探索。他表示,“美圖在可觀測分析領(lǐng)域,通過構(gòu)建相關(guān)工具完成日常巡檢、數(shù)據(jù)存儲、報告渲染、數(shù)據(jù)解讀等穩(wěn)定性運(yùn)營工作;同時,針對服務(wù)穩(wěn)定性制定了涵蓋監(jiān)控大盤、干預(yù)動作管理、預(yù)案編排、預(yù)案執(zhí)行的連貫工作流,以對不同的異常場景進(jìn)行快速干預(yù)和恢復(fù)?!?/p>
最后分享了美圖的“Dev-X-Ops”工具矩陣并展示了部分平臺的樣例,重點強(qiáng)調(diào)了運(yùn)維元數(shù)據(jù)的重要性,石鵬建議通過一個全局的視角來統(tǒng)籌規(guī)劃運(yùn)維領(lǐng)域及周邊的工具體系,用統(tǒng)一的運(yùn)維元數(shù)據(jù)來串聯(lián)相關(guān)系統(tǒng)、打破數(shù)據(jù)壁壘、貫穿完整流程,以形成更好的合力。
云上運(yùn)維在實踐中能夠發(fā)揮價值,背后也離不開工具、運(yùn)作機(jī)制的支撐。聚焦云上運(yùn)維體系搭建,華為云SRE首席產(chǎn)品經(jīng)理王萌萌分享了《華為云運(yùn)維平臺的演進(jìn)實踐》。他認(rèn)為,“運(yùn)維平臺的核心功能矩陣,需要有CMDB、監(jiān)控、自動化變更的能力、分析能力和流程管理的能力。從建設(shè)的角度來講,可以大致分為標(biāo)準(zhǔn)化、工具化、自動化、智能化四個階段?!?/p>
具體來看,在標(biāo)準(zhǔn)化階段,有了規(guī)范,資源模型、API規(guī)范、運(yùn)維流程、權(quán)限模型、部署架構(gòu)、公共組件、CMDB的標(biāo)準(zhǔn)統(tǒng)一之后,具備了基本框架,云上運(yùn)維即可啟動了。在工具化階段,需要做針對運(yùn)維進(jìn)行監(jiān)控、建立日志系統(tǒng)、容量管理系統(tǒng)、搭建作業(yè)平臺、采用和運(yùn)維系統(tǒng)結(jié)合的流程系統(tǒng)。在自動化階段,需要原子能力進(jìn)行構(gòu)建資源發(fā)放體系,在這基礎(chǔ)之上通過SRE進(jìn)行業(yè)務(wù)編排。最后便是智能化階段,以華為云為例,王萌萌講解了智能運(yùn)維場景的AIOps平臺,該平臺從異常檢測、智能告警、智能故障定位、智能故障自愈等層面,將云上運(yùn)維不斷推向智能,減少運(yùn)維人員重復(fù)性勞動,提升運(yùn)維效率,保障云上應(yīng)用持續(xù)穩(wěn)定運(yùn)行。
美圖云上運(yùn)維實踐,創(chuàng)建系統(tǒng)云上治理之道
云服務(wù)配合龐大的用戶數(shù)據(jù)群體,需要IDC在提供強(qiáng)大設(shè)備資源的同時,數(shù)據(jù)庫運(yùn)維必須具備高效、快捷、時效性強(qiáng)的數(shù)據(jù)傳輸能力以及對龐大數(shù)據(jù)的運(yùn)算能力,以保障業(yè)務(wù)的順利運(yùn)行。作為美圖DBA負(fù)責(zé)人肖維和許多正在經(jīng)歷深化上云的企業(yè)IT負(fù)責(zé)人一樣,不斷思考和尋找著新的云上綜合治理解決之道。
從美圖的實踐出發(fā),肖維在聯(lián)創(chuàng)營上分享了《美圖云上數(shù)據(jù)庫運(yùn)維和治理實踐》。他表示,數(shù)據(jù)庫的發(fā)展從早期單體的RBMS、到分布式的NewSQL、Tidb、時序數(shù)據(jù)庫,最后到云原生的數(shù)據(jù)庫,不斷變化的是網(wǎng)絡(luò)、存儲和計算能力。數(shù)據(jù)庫的選型需要跟業(yè)務(wù)匹配,DBA需要定義高穩(wěn)定性、高效率、低成本、高安全四個目標(biāo),以實現(xiàn)與數(shù)據(jù)庫的匹配,實現(xiàn)業(yè)務(wù)的穩(wěn)定運(yùn)行。
此外,肖維還詳細(xì)闡述了傳統(tǒng)DBA,云DBA的區(qū)別。他指出,相對于傳統(tǒng)DBA,云DBA可以賦能研發(fā),使傳統(tǒng)DBA工作的日常需求都可以自行研發(fā)完成,且架構(gòu)具備多樣化,安全性更高。同時在故障排查、主動預(yù)防領(lǐng)域可以做更多的探索。此外,通過云DBA資源云托管,還可以讓成本可控,提高交付效率。
在穩(wěn)定性治理實踐方面,肖維表示,美圖通過平臺層DBA小秘書、操作平臺MTDAS、云管平臺實現(xiàn)對所有資源在三個維度進(jìn)行撥測巡檢。同時配有容災(zāi)系統(tǒng),并且已經(jīng)介入到SRE的編排系統(tǒng),針對不同場景,只需要輸入相關(guān)參數(shù),系統(tǒng)就會自行處理工單系統(tǒng),診斷系統(tǒng)和日志系統(tǒng),并做出相應(yīng)預(yù)案。此外,面對數(shù)據(jù)的持續(xù)擴(kuò)張帶來的容量管理難題,美圖DBA建立了異常檢測、異常分析和異常處理體系。這其中,異常檢測,實現(xiàn)對監(jiān)控指標(biāo)的數(shù)據(jù)變化進(jìn)行快速識別;異常分析,則針對異常業(yè)務(wù)變化進(jìn)行量化分析;異常處理,是通過定時擴(kuò)縮容,自動百分比做擴(kuò)容,做SQL限流。系統(tǒng)之間嚴(yán)密的配合,保證了美圖云上服務(wù)的持續(xù)穩(wěn)定運(yùn)行。
《SRE確定性運(yùn)維專家培訓(xùn)》課程正式發(fā)布,助力企業(yè)全面擁抱云
面對企業(yè)上云之后帶來業(yè)務(wù)規(guī)模與復(fù)雜度的日趨增長,為了助力組織成員和企業(yè)打造適合自身的運(yùn)維體系,走向優(yōu)秀乃至卓越。在研討班上,華為云通過豐富的實踐積累、運(yùn)維探索,精心打造的《SRE確定性運(yùn)維專家培訓(xùn)》課程也正式發(fā)布。
華為云希望通過這項課程,讓更多的企業(yè)和技術(shù)人員,了解到如何進(jìn)行SRE確定性運(yùn)維流程的體系構(gòu)建和優(yōu)化,以及學(xué)習(xí)如何構(gòu)建與提升軟件工程能力的關(guān)鍵方法。最后通過了解在系統(tǒng)高可用性設(shè)計方面的知識,以賦能企業(yè)云上運(yùn)維,助推企業(yè)全面擁抱云,使能云上創(chuàng)新。
秉承“智者·同行·創(chuàng)想”的理念,華為云聯(lián)創(chuàng)營為行業(yè)客戶、伙伴打造了一個技術(shù)交流的陣地,在思維碰撞中探索新思路,打開新視野,迸發(fā)應(yīng)對挑戰(zhàn)的新智慧、新舉措。未來,華為云將持續(xù)通過打造系列性活動,為企業(yè)、技術(shù)人員搭建交流平臺,共同構(gòu)建健康可持續(xù)發(fā)展的云技術(shù)生態(tài),解決企業(yè)用云、管云中的“疑難雜癥”,構(gòu)建健康可持續(xù)發(fā)展的云技術(shù)生態(tài)。
- 新大航海時代“云上闖關(guān)”,阿里云筑牢技術(shù)“硬核后盾”,為中國企業(yè)出?!耙绘I通關(guān)”
- 阿里云CEO吳泳銘:與中國企業(yè)在全球并肩前行,共赴新的大航海時代
- 日經(jīng)新聞稱阿里通義千問已成日本AI開發(fā)基礎(chǔ)
- 阿里云基礎(chǔ)網(wǎng)絡(luò)技術(shù)5 篇論文入選全球網(wǎng)絡(luò)頂會NSDI 2025
- 2024年第四季度中國大陸云服務(wù)支出達(dá)到111億美元,阿里華為騰訊居前三
- 華為張修征:發(fā)揮“大雜燴”優(yōu)勢,四個方面投入推動AI應(yīng)用落地
- 華為云重磅發(fā)布CloudMatrix 384超節(jié)點,多項性能全面突破
- 鯤鵬開源開放創(chuàng)新成效卓著,計算產(chǎn)業(yè)革新行勝于言
- 浪潮云“分布式智能云”戰(zhàn)略正式發(fā)布 目標(biāo)年內(nèi)分布式智能云節(jié)點破千個
- IDC:2025年亞太地區(qū)云支出將達(dá)到2500億美元
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。