如何防止數(shù)據(jù)中心中斷?
每次數(shù)據(jù)中心中斷都代價高昂。隨著數(shù)字化步伐的加快,維持正常運行時間的壓力極具挑戰(zhàn)性。考慮到數(shù)據(jù)中心負載的增加,僅靠人類來處理由于復(fù)雜性的增加而產(chǎn)生的大量問題已經(jīng)不可能了。如今,IT運營團隊比以往任何時候都更需要管理復(fù)雜的IT基礎(chǔ)設(shè)施。再加上不斷增長的數(shù)據(jù)量,使得IT團隊的任務(wù)更加難以管理當今動態(tài)的、不斷變化的IT環(huán)境。這增加了中斷的可能性。
雖然有許多技術(shù)進步,但中斷很常見,且還在增加。Uptime Institute的2022年年度中斷分析報告強調(diào),五分之一的組織報告在過去三年中經(jīng)歷了“嚴重”或“嚴重”中斷,涉及重大財務(wù)損失、聲譽損害、合規(guī)違規(guī),在某些嚴重情況下,還會造成人員傷亡,這標志著重大中斷的發(fā)生率略有上升趨勢。根據(jù)Uptime的2022年數(shù)據(jù)中心彈性調(diào)查,80%的數(shù)據(jù)中心經(jīng)理和運營商在過去三年中經(jīng)歷過某種類型的中斷,比正常情況略有增加,在70%到80%之間波動。超過60%的數(shù)據(jù)中心失敗導(dǎo)致至少10萬美元的總損失,遠高于2019年的39%。在同一時期,損失超過100萬美元的中斷所占比例從11%上升到15%。
數(shù)據(jù)中心中斷的原因
中斷的原因各不相同。從網(wǎng)絡(luò)故障到硬件或軟件故障,再到斷電、網(wǎng)絡(luò)攻擊和人為錯誤,導(dǎo)致數(shù)據(jù)中心中斷的原因有很多。
下面來看看服務(wù)中斷的主要原因,并推薦最佳實踐來緩解這些問題:
網(wǎng)絡(luò)問題:根據(jù)Uptime的2022年數(shù)據(jù)中心彈性調(diào)查,在過去三年中,與網(wǎng)絡(luò)相關(guān)的問題已經(jīng)成為所有IT服務(wù)中斷事件的最大單一原因——無論嚴重程度如何。由于越來越多地使用云技術(shù)、軟件定義架構(gòu)和混合分布式架構(gòu)帶來的復(fù)雜性,導(dǎo)致軟件、網(wǎng)絡(luò)和系統(tǒng)問題導(dǎo)致的中斷正在增加。與電源相關(guān)的問題:與電源相關(guān)的中斷占被歸類為嚴重中斷(導(dǎo)致停機和經(jīng)濟損失)的43%。根據(jù)Uptime調(diào)查,電源事故的最大單一原因是不間斷電源(UPS)故障。人為錯誤:同一份Uptime調(diào)查顯示,絕大多數(shù)與人為錯誤相關(guān)的中斷都涉及忽略或不適當?shù)某绦?。?0%的組織在過去三年中遭受過由人為錯誤引起的重大中斷。在這些事件中,85%是由于員工未能遵守程序或程序本身存在缺陷。勒索軟件和DDoS:網(wǎng)絡(luò)攻擊也可能是導(dǎo)致中斷的主要原因。如今,由勒索軟件和DDoS攻擊引起的數(shù)據(jù)泄露很常見,可能會導(dǎo)致業(yè)務(wù)中斷。隨著勒索軟件變得越來越復(fù)雜和普遍,其在大企業(yè)的董事會中越來越重要。NTT Security Holdings的一份報告指出,勒索軟件的流行正在影響業(yè)務(wù)連續(xù)性,在過去24個月里,勒索軟件事件響應(yīng)業(yè)務(wù)增長了240%。防止中斷的最佳實踐
彈性是數(shù)據(jù)中心的一個關(guān)鍵屬性,每個企業(yè)都必須努力通過一系列舉措來防止中斷。首先,組織必須定期分析數(shù)據(jù)中心生態(tài)系統(tǒng)的每個重要組成部分的彈性,如電源、冷卻、連接、服務(wù)提供商。數(shù)據(jù)中心溫度與數(shù)據(jù)中心設(shè)備故障有直接關(guān)系。因此,監(jiān)測溫度對于防止任何可能的故障或設(shè)備關(guān)閉變得極其重要。
UPS系統(tǒng)的故障也可能導(dǎo)致中斷。由于大多數(shù)UPS系統(tǒng)在電源故障之前都沒有進行真正的測試,因此對UPS系統(tǒng)的一致遠程監(jiān)控有助于提供實時警報,并在潛在問題導(dǎo)致中斷之前向管理員發(fā)出警報。
軟件故障也可能導(dǎo)致中斷和停機。因此,有必要定期更新軟件和打補丁。為了確保定期更新補丁,人工智能可用于掃描漏洞,并在需要時進行軟件更新或補丁。AI還可用于主動識別與數(shù)據(jù)中心設(shè)備或應(yīng)用程序性能或安全相關(guān)的問題。
通過結(jié)合使用主動網(wǎng)絡(luò)監(jiān)控和使用自動化將人為錯誤的可能性降至最低,可以防止與網(wǎng)絡(luò)相關(guān)的中斷。網(wǎng)絡(luò)冗余也是可取的,這意味著如果一個網(wǎng)絡(luò)出現(xiàn)故障,可以使用不同服務(wù)提供商的替代網(wǎng)絡(luò)。
理想情況下,雇傭第三方服務(wù)提供商,可以對彈性進行審計,并提供獨立的、無偏見的評估,以理解和對標彈性。選擇正確的DR流程還可以幫助快速從中斷中恢復(fù)。
為了確保免受勒索軟件的攻擊,企業(yè)必須減少用戶權(quán)限,消除任何終端用戶管理員,并使用多因素身份驗證(MFA),因為這極大地限制了攻擊者橫向移動的機會。網(wǎng)絡(luò)分割可以減少攻擊向量,而基于策略隔離的用戶端點檢測和響應(yīng)(EDR)解決方案的實現(xiàn)可以幫助防止惡意軟件的傳播。
研究表明,許多數(shù)據(jù)中心的中斷是完全可以預(yù)防和避免的。如果組織投資于正確的設(shè)備、技術(shù)和流程,則可以避免大多數(shù)中斷的發(fā)生。
--------------------------峰會預(yù)告近期,由千家網(wǎng)主辦的2022年第23屆中國國際建筑智能化峰會將正式拉開帷幕,本屆峰會主題為“數(shù)智賦能,碳索新未來”,屆時將攜手全球知名建筑智能化品牌及專家,共同分享AI、云計算、大數(shù)據(jù)、IoT、智慧城市、智能家居、智慧安防等熱點話題與最新技術(shù)應(yīng)用,并探討如何打造“更低碳、更安全、更穩(wěn)定、更開放”的行業(yè)生態(tài),助力“雙碳”目標的實現(xiàn)。
歡迎建筑智能化行業(yè)同仁報名參會,分享交流!
報名方式
廣州站(2023年1月6日):https://www.huodongxing.com/event/2638587914600
西安站(2023年1月10日):https://www.huodongxing.com/event/4638585444400
上海站(2023年1月12日):https://www.huodongxing.com/event/3638582473900
北京站(待定):https://www.huodongxing.com/event/4638577546900
更多2022年峰會信息,詳見峰會官網(wǎng):http://summit.qianjia.com/
- 云安全挑戰(zhàn):從API管理開始到結(jié)束
- 將物聯(lián)網(wǎng)與傳統(tǒng)設(shè)備集成:為現(xiàn)有機器進行智能操作改造
- VR在教育中的未來:沉浸式學(xué)習(xí)體驗
- 智能數(shù)據(jù)云如何重塑企業(yè)個性化
- 建筑物內(nèi)移動覆蓋的電信基礎(chǔ)設(shè)施及其挑戰(zhàn)
- 如何利用人工智能和數(shù)據(jù)分析實現(xiàn)可持續(xù)綠色技術(shù)
- 了解網(wǎng)絡(luò)適配器:提高計算機網(wǎng)絡(luò)效率
- 如何為布線環(huán)境選擇合適的網(wǎng)絡(luò)電纜標簽
- 無線前傳的核心:CPRI無線模塊全面介紹
- 量子計算如何改善供應(yīng)鏈
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。