要用“+智能”強身健體,“心臟”做好準備了嗎?

原標題:要用“+智能”強身健體,“心臟”做好準備了嗎?

今年的《政府工作報告》中,首次寫入了“智能+”相關命題與討論。這一國家政策方針,指明了智能技術必須與產(chǎn)業(yè)結合,進入生產(chǎn)核心領域,才能達成為現(xiàn)有經(jīng)濟體解放生產(chǎn)力,提高生產(chǎn)效率的目標。

而“+智能”的實現(xiàn),也為各行各業(yè)和服務于全社會的ICT基礎設施提出了新的挑戰(zhàn)。當智能化浪潮襲來,各行各業(yè)都將提出對計算的新應用、新場景和新需求。而為了應對這些變量,其實還有大量棘手的問題需要解決。

其中最關鍵的問題,來自算力。

根據(jù)OpenAI統(tǒng)計,從2012年到2018年,全球?qū)?a href="http://m.intimacywithspirit.com/AI_1.html" target="_blank" class="keylink">AI算力的需求提高了30萬倍,而算力供給卻遠遠不足。而在普遍的算力饑渴中,最急待升級的算力輸出口,應該就是數(shù)據(jù)中心。

我們知道,在今天這個大數(shù)據(jù)時代,最主要的計算和存儲都已經(jīng)發(fā)生在了數(shù)據(jù)中心當中。數(shù)據(jù)中心就像整個計算世界的心臟,供給著所有計算相關的數(shù)據(jù)血液流動,驅(qū)動ICT產(chǎn)業(yè)正常運轉(zhuǎn)。

如果說+智能是一套新的武功,那么能不能快速將其融會貫通,很大程度上將取決于習武者是否有一顆“大心臟”。否則剛練了沒幾下,心臟供血先不足了,那豈不是自討沒趣?

為了練就智能計算時代強大的“心肺功能”,需要解決哪些問題?

據(jù)了解,從成立以來就接連有大動作出手的華為智能計算業(yè)務部,接下來將把目標對準計算世界的中央:數(shù)據(jù)中心與架設其中的服務器。那么不妨借這個機會,讓我們先來了解一下,數(shù)據(jù)中心這顆計算世界的心臟,在今天到底面臨著哪些問題。

計算需求在提速,數(shù)據(jù)中心跟得上嗎?

在云計算和互聯(lián)網(wǎng)帶來的通用計算時代,數(shù)據(jù)中心實質(zhì)上也就是全球計算系統(tǒng)的中樞。

1978年,英特爾推出了8060中央處理器,同時發(fā)布了x86指令集架構。此后,這一指令集成為了通用計算時代的代表。而隨著計算需求日益龐大,網(wǎng)絡傳輸能力日益增強,計算產(chǎn)業(yè)開始進行更加集成化的計算處理模式。于是就產(chǎn)生了集中計算、集中存儲的數(shù)據(jù)中心模式。而基于x86指令集的計算服務器,依舊是傳統(tǒng)數(shù)據(jù)中心的主要構成體。

然而隨著技術的不斷進步,數(shù)據(jù)中心也開始承擔越來越多的壓力。比如說視頻和圖像任務開始越來越多,AI更是提出了完全不同的、基于多層神經(jīng)網(wǎng)絡的運算任務需求,這些計算任務僅僅使用通用CPU計算,其效率會越來越差。

而隨著對AI等智能計算任務的需求量大幅提升,相關數(shù)據(jù)呈現(xiàn)爆炸趨勢,各行業(yè)開始產(chǎn)生不同的計算與存儲要求,這就讓傳統(tǒng)數(shù)據(jù)中心更加難以負載。

總體來說,這個問題有兩種解決方案,一就是興建更多大型數(shù)據(jù)中心,但這個顯然不能作為絕對方案,二就是對現(xiàn)有數(shù)據(jù)中心,尤其是其使用的服務器進行智能化升級,讓數(shù)據(jù)中心跟上智能時代的進化需求。

總體來說,數(shù)據(jù)中心的升級要解決兩個宏觀問題。

首先當然是針對視頻圖像、神經(jīng)網(wǎng)絡等新需求的算力提升,擺脫過度依賴CPU的歷史。讓算力供給充沛,把昂貴的算力成本降低,讓算力適應新的計算需求。

其次,是對數(shù)據(jù)中心的運維管理進行升級。今天隨著數(shù)據(jù)中心的處理數(shù)據(jù)越來越多,設備體系越來越復雜,已經(jīng)陸續(xù)出現(xiàn)了“建得起,管不起”的現(xiàn)象,以至于人力根本無法承受數(shù)據(jù)中心運維任務的復雜程度加速。

此外,大型數(shù)據(jù)中心還在變成新型的“電老虎”,而其實飽和制冷模式要浪費大量的能源,這也是數(shù)據(jù)中心需要重新審視的問題。

由以上邏輯可以看出,數(shù)據(jù)中心的智能時代升級,主要需要解決兩方面問題:內(nèi)在的服務器迭代,以及運維場景的全局進化。

智能計算的新需求:服務器本身的升級空間

讓我們先來看看第一個問題,數(shù)據(jù)中心服務器在今天要進行哪些升級進化?

AI的到來,事實上對計算提出了一個體系化的考驗。比如說在自動駕駛場景中,訓練計算需要處理視頻和圖像,這就需要對圖像任務進行處理的針對性算力。然后還要擁有深度神經(jīng)網(wǎng)絡等AI算法的專項加速能力,確保訓練效率可以達標。而在自動駕駛訓練過程中,數(shù)據(jù)吞吐量是異常龐大的,網(wǎng)絡需求和存儲需求也都較互聯(lián)網(wǎng)任務有著指數(shù)級提升。

一般來說,在智能計算的任務需求下,服務器被要求進行三個方面的能力進化。

1、性能更強,兼容性更好的異構計算能力,能夠適應不同數(shù)據(jù)類型的大規(guī)模處理。

2、強大的網(wǎng)絡處理能力,能夠融合不同網(wǎng)絡協(xié)議,確保低時延、大流量的網(wǎng)絡傳輸。

3、數(shù)據(jù)吞吐能力進一步升級,對主流數(shù)據(jù)庫有更好的性能加持。

服務器可以說是數(shù)據(jù)中心的核心,核心算力的進化才能確保智能進化準確完成。然而另一個角度看,數(shù)據(jù)中心本身也是一個不斷復雜化的場景。數(shù)據(jù)中心的運維與節(jié)能,對于整個計算產(chǎn)業(yè)來說也是至關重要的。

大數(shù)據(jù),大中心:大規(guī)模部署場景的進化

如果我們把數(shù)據(jù)中心看作一個工廠,就會發(fā)現(xiàn)今天這間工廠,正在經(jīng)歷從傳統(tǒng)工業(yè)的粗放型增長方式,逐步過渡到精細化、自動化增長方式的過度。

比如說,為了提高算力,數(shù)據(jù)中心普遍都在經(jīng)歷越建越大的變化過程。不斷增多的服務器,海量匯集的數(shù)據(jù)和存儲卡,意味著數(shù)據(jù)中心本身在變得越來越復雜。這種趨勢發(fā)展下去,將會面臨兩大問題,一是運維工作的復雜程度,很快將超過人工所能負載的極限;二是龐大的數(shù)據(jù)中心場景意味著飽和式制冷,將消耗過量的資源。

這兩大問題的出現(xiàn),要求數(shù)據(jù)中心自身的服務系統(tǒng)進行更多進化??偟貋碚f,數(shù)據(jù)中心場景正在呼喚“四個進化”:

1、運維進化,降低人工干預次數(shù)以及運維難度,推升利用智能技術解決運維問題的解決方案,讓復雜的運維變得簡單易操作。

2、智能服務器部署與軟件管理,對數(shù)據(jù)中心軟硬件部署和管理實現(xiàn)整體優(yōu)化,減少高頻次重復勞動。

3、自動診斷和修復,運用機器學習技術主動發(fā)現(xiàn)故障源,快速排查,機器自動修復,降低服務器故障率。

4、功耗管理邁上新臺階,將服務器的耗電與制冷需求進行連接,實現(xiàn)數(shù)據(jù)中心L1與L2的聯(lián)動。達成低功耗低能耗的目標,降低數(shù)據(jù)中心整體用電。

這四個進化,意味著數(shù)據(jù)中心的進化方向,也是ICT產(chǎn)業(yè)本身實現(xiàn)智能化的標志之一。

醞釀“大心臟“的華為

去年年底,華為成立了智能計算業(yè)務部,開始將智能計算產(chǎn)業(yè)作為整體需求,針對不同的計算需求與業(yè)務場景,提供相應的智能計算解決方案。

迄今為止,華為智能計算業(yè)務部發(fā)布了Atlas人工智能計算平臺(包括Atlas 200 AI加速模塊、Atlas 300 AI加速卡、Atlas 500智能小站和Atlas 800 AI一體機)、智能駕駛計算平臺心MDC 600、關鍵業(yè)務服務器KunLun V5等產(chǎn)品和解決方案,而下一步的重頭戲,則很有可能聚焦在數(shù)據(jù)中心與服務器,這個智能計算的核心場景中。將目前x86系列產(chǎn)品中的主打產(chǎn)品,F(xiàn)usionServer服務器進行進一步升級。將數(shù)據(jù)中心在今天可能面對的內(nèi)外兩個系統(tǒng)問題、多種升級阻礙一網(wǎng)打盡。

為醞釀一顆“大心臟”,迎接智能時代的快速到來,華為將在智能計算話題中給出哪些新的答案?讓我們一同期待4月3日的發(fā)布會吧。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2019-04-01
要用“+智能”強身健體,“心臟”做好準備了嗎?
而隨著對AI等智能計算任務的需求量大幅提升,相關數(shù)據(jù)呈現(xiàn)爆炸趨勢,各行業(yè)開始產(chǎn)生不同的計算與存儲要求,這就讓傳統(tǒng)數(shù)據(jù)中心更加難以負載。

長按掃碼 閱讀全文