科技云報到原創(chuàng)。
生成式AI,正在讓行業(yè)重新認識云的價值。
隨著企業(yè)在數(shù)字化轉(zhuǎn)型之路上越走越遠,一場新的技術(shù)革命正在發(fā)生。近幾年涌現(xiàn)的生成式AI技術(shù)正在迅速改變科技、商業(yè)和整個社會的格局。這種強大的技術(shù)能夠從數(shù)據(jù)中學(xué)習(xí)并生成預(yù)測性輸出,生成式AI既是未來的趨勢,也是一場實時顛覆各行各業(yè)的革命。
云計算和生成式AI的融合協(xié)同無疑充滿潛力,通過兩者的深度融合,企業(yè)可以獲得更強大的計算能力、更高效的數(shù)據(jù)處理方式,以及更多樣化的應(yīng)用場景。然而,如何平衡技術(shù)創(chuàng)新與可持續(xù)發(fā)展,以及如何解決數(shù)據(jù)安全、能源消耗等問題,將成為未來行業(yè)需要共同面對的挑戰(zhàn)。
云計算,生成式AI的冰山底部
如果用冰山來比喻,露在海面上方的冰山一角就是基礎(chǔ)模型。而在冰山的底部,需要大量的基礎(chǔ)模型以外的服務(wù)來支撐,如加速芯片、數(shù)據(jù)庫、數(shù)據(jù)分析、數(shù)據(jù)安全服務(wù)等等。云計算與生成式AI的發(fā)展處于彼此影響、互為促進的狀態(tài),沒有云計算的生成式AI就像是無源之水、無本之木,而沒有生成式AI的云計算,其潛力也無法最大限度發(fā)揮出來。
透過近兩年云計算廠商在生成式AI領(lǐng)域的布局可以看出,從亞馬遜云科技,到百度智能云、阿里云,在自家模型能力的基礎(chǔ)上,各家都在強調(diào)生成式AI的基礎(chǔ)設(shè)施和開放平臺能力。
在冰山的底部,以亞馬遜云科技為代表的全棧云廠商提供了完整的端到端的生成式AI技術(shù)堆棧,從底層的加速層如加速芯片、存儲優(yōu)化,到中間層模型構(gòu)建工具和服務(wù),再到最上層的生成式AI相關(guān)應(yīng)用,每一層都在針對客戶的不同需求持續(xù)創(chuàng)新。
云計算本身是企業(yè)去運用生成式AI最好的方式。生成式AI模型尤其是大規(guī)模語言模型,如GPT、BERT,需要在訓(xùn)練階段處理數(shù)十億甚至數(shù)百億個參數(shù),這對計算資源提出了巨大的需求。典型的大語言模型訓(xùn)練過程需要大量的GPU和TPU(張量處理單元)集群進行并行計算,而這些算力通常依賴于云計算平臺提供的彈性資源。云計算的按需擴展和靈活性使得企業(yè)能夠在短時間內(nèi)部署和訓(xùn)練生成式AI模型。
如: Anthropic與亞馬遜云科技合作,訓(xùn)練和部署Claude系列模型,并提供推理支持,企業(yè)用戶可以通過API訪問Claude模型,利用其生成內(nèi)容、回答問題和自動化任務(wù)。這種按需調(diào)用的模式展現(xiàn)了云計算的靈活性,以及生成式AI對計算資源的極大需求。反過來,云計算的創(chuàng)新也在不斷優(yōu)化模型的性能、速度和成本表現(xiàn)。
生成式AI模型不僅對計算能力提出了挑戰(zhàn),還需要處理大量的數(shù)據(jù)。云計算提供的分布式存儲和高速數(shù)據(jù)傳輸能力,能夠處理模型訓(xùn)練所需的海量數(shù)據(jù),并在推理階段高效地生成高質(zhì)量的內(nèi)容。數(shù)據(jù)存儲、處理和訪問的能力成為生成式AI模型在實際應(yīng)用中的核心基礎(chǔ)。
云平臺中的數(shù)據(jù)湖和數(shù)據(jù)倉庫技術(shù)進一步支持了AI模型對多樣化數(shù)據(jù)的高效處理,提升了生成內(nèi)容的準確性與多樣性。
生成式AI技術(shù)的發(fā)展使得云平臺進一步完善了AI即服務(wù)(AIaaS)的生態(tài)系統(tǒng)。各大云服務(wù)提供商,如亞馬遜云科技、谷歌云、微軟Azure等都推出了基于生成式AI的預(yù)訓(xùn)練模型及其API,以及快速使用模型的平臺型服務(wù),幫助開發(fā)者和企業(yè)快速集成生成式AI的功能。通過這些云端AI服務(wù),企業(yè)無需具備深厚的AI技術(shù)背景,也可以輕松利用生成式AI進行產(chǎn)品創(chuàng)新。
例如,Google Cloud推出的AI Platform,包含了對文本生成、圖像生成以及自動編程的支持,使得開發(fā)者能夠快速創(chuàng)建AI驅(qū)動的應(yīng)用程序。
生成式AI模型的高度復(fù)雜性和多樣化應(yīng)用場景,使得云計算服務(wù)需要更加靈活和定制化。不同企業(yè)在使用生成式AI時,對計算資源、存儲和網(wǎng)絡(luò)的要求各不相同。例如,在內(nèi)容生成領(lǐng)域,媒體企業(yè)需要快速生成高質(zhì)量的文本和圖像,這要求云平臺提供高性能計算集群和低延遲的推理服務(wù)。
為了應(yīng)對這些多樣化需求,云服務(wù)提供商正在開發(fā)針對行業(yè)的定制化解決方案。例如,亞馬遜云科技通過Amazon SageMaker平臺為生成式AI提供了定制的訓(xùn)練和部署方案,使用戶能夠靈活調(diào)整資源配置,并根據(jù)模型大小、復(fù)雜度和應(yīng)用場景進行優(yōu)化。
生成式AI的廣泛應(yīng)用,促進了云計算中的高性能計算(HPC)技術(shù)的快速發(fā)展。為了滿足生成式AI對算力的極高需求,云服務(wù)提供商正在整合HPC集群、分布式計算技術(shù)以及圖形處理單元(GPU)等高性能硬件資源。云計算平臺越來越多地提供針對AI的專用硬件加速器,如亞馬遜云科技新推出的Trainium2、Google的TPU、NVIDIA的A100GPU,這些硬件極大提高了生成式AI模型的訓(xùn)練速度和推理效率。
生成式AI的普及也推動了無服務(wù)器計算架構(gòu)的演進。在傳統(tǒng)云計算模式中,用戶需要管理底層基礎(chǔ)設(shè)施,而無服務(wù)器架構(gòu)讓用戶無需關(guān)心服務(wù)器配置或負載平衡等技術(shù)細節(jié)。這一架構(gòu)與生成式AI的按需計算需求高度契合,用戶可以通過無服務(wù)器平臺在需要時調(diào)用AI生成內(nèi)容,降低了計算資源的閑置成本。
Amazon Lambda和Google Cloud Functions就是典型的無服務(wù)器計算平臺。值得一提的是,亞馬遜云科技在生成式AI領(lǐng)域的關(guān)鍵服務(wù)Amazon Bedrock也是一項無服務(wù)器服務(wù)。這些服務(wù)使企業(yè)能夠靈活調(diào)用生成式AI模型,快速響應(yīng)用戶需求,尤其適用于生成內(nèi)容量波動較大的應(yīng)用場景。
生成式AI的全棧聯(lián)動
當(dāng)前的云計算廠商,正在面臨激烈的競爭,從今年的花式降價信息也能看出白熱化程度。一直以來,云廠商的差異化競爭愈演愈烈,以往大家主要拼基礎(chǔ)設(shè)施,或者進行單點突破。
但是目前來看,“一招鮮吃遍天”的時代已經(jīng)過去了。對于大廠而言,如果只做云、或者只做大模型、只做芯片都會存在短板。事實上,全球巨頭們都已經(jīng)在這些領(lǐng)域有所布局,云和大模型不必多言,芯片的競賽也更加兇猛。比如谷歌TPU的研發(fā)已久,已經(jīng)推出第五代芯片TPUv5e,用于大模型訓(xùn)練和推理;微軟也發(fā)布了首款自研AI芯片Azure Maia 100 AI芯片和Cobalt 100 CPU;而涉足自研芯片最早的亞馬遜云科技,新近推出了Trainium2和64核的超級集群,并透露出了下一代3nm制程的Trainium3。
業(yè)界的共識是,至少要涉足,才能有更多可能性,或者說企業(yè)需要要懂這個領(lǐng)域,才能更好地開展系統(tǒng)性的AI業(yè)務(wù)。拓展大模型也好、芯片也好,并非要做成主營業(yè)務(wù),但是為長遠計不能沒有這些產(chǎn)品線,尤其是對大廠來說,需要標配這些要素。
從云基礎(chǔ)設(shè)施擴展到芯片和大模型的過程中,新的戰(zhàn)場已經(jīng)開啟,在生成式AI的征程上,云廠商也有各自路徑。云廠商三巨頭在生成式AI發(fā)展策略上從AI硬件基礎(chǔ)設(shè)施投資、AI軟件基礎(chǔ)設(shè)施服務(wù)規(guī)劃、AI基礎(chǔ)模型開發(fā)、ModelOps服務(wù)編排、應(yīng)用開發(fā)賦能、解決方案側(cè)重、模型生態(tài)構(gòu)建、關(guān)聯(lián)開發(fā)與應(yīng)用服務(wù)協(xié)同、商業(yè)投資方式等諸多領(lǐng)域都各有差異。
亞馬遜云科技的核心理念是將應(yīng)用程序分解為幾個核心構(gòu)建單元,通過構(gòu)建優(yōu)秀的服務(wù),讓用戶自由搭建這些單元,滿足特定場景下的業(yè)務(wù)需求。這種模塊化的思路不僅體現(xiàn)了亞馬遜云科技對客戶需求的深刻理解,也是其持續(xù)創(chuàng)新的動力源泉。
在計算服務(wù)領(lǐng)域,亞馬遜云科技提供的計算實例類型比其他任何云服務(wù)提供商都要多。Amazon EC2為用戶提供了更多選擇、更多實例類型和更多功能,讓客戶能為應(yīng)用和工作負載找到更具性價比的解決方案。Amazon Nitro System的推出,更是將虛擬化系統(tǒng)的性能推向了新的高度,提供了裸機性能、高安全性、隔離性和靈活性,推動了計算領(lǐng)域的創(chuàng)新。
在存儲領(lǐng)域中,Amazon S3作為亞馬遜云科技在2006年推出的首個服務(wù),徹底改變了人們管理數(shù)據(jù)的方式。如今,Amazon S3存儲的對象數(shù)量已突破400萬億,這一數(shù)字的背后是亞馬遜云科技對數(shù)據(jù)爆炸式增長的深刻洞察和前瞻性設(shè)計。Amazon S3 Tables和Amazon S3 Metadata的推出,進一步提升了數(shù)據(jù)湖的查詢速度和元數(shù)據(jù)管理能力,為數(shù)據(jù)分析和AI應(yīng)用場景提供了更強大的支持。
在數(shù)據(jù)庫服務(wù)領(lǐng)域,亞馬遜云科技提供了多種適用于不同場景下專門構(gòu)建的數(shù)據(jù)庫。Amazon Aurora作為完全兼容MySQL和PostgreSQL的數(shù)據(jù)庫服務(wù),迎來了其發(fā)布10周年的紀念。Amazon Aurora DSQL的推出,結(jié)合Amazon Time Sync服務(wù),采用完全無服務(wù)器設(shè)計,可在多區(qū)域?qū)崿F(xiàn)近乎無限擴展,可用性高達99.999%,支持強一致性,具備低延遲的讀寫性能,完全兼容PostgreSQL。
另外,數(shù)據(jù)分析服務(wù)是亞馬遜云科技的另一個重要構(gòu)建單元。新一代Amazon SageMaker的推出,整合了最全面的數(shù)據(jù)分析和AI工具,覆蓋了分析、數(shù)據(jù)處理、搜索、數(shù)據(jù)準備、AI模型訓(xùn)練和推理等必需的功能,所有功能都可以通過統(tǒng)一的企業(yè)數(shù)據(jù)視圖實現(xiàn)。
亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建表示:“亞馬遜云科技不僅在云的核心服務(wù)層面持續(xù)創(chuàng)新,更在從芯片到模型,再到應(yīng)用的每一個技術(shù)堆棧取得突破,讓不同層級的創(chuàng)新相互賦能、協(xié)同進化。我相信,只有這樣全棧聯(lián)動的大規(guī)模創(chuàng)新才能真正滿足當(dāng)今客戶的發(fā)展需求,加速前沿技術(shù)的價值釋放,助力各行各業(yè)重塑未來?!?/p>
生成式AI作為當(dāng)前技術(shù)發(fā)展的熱點,其背后正是亞馬遜云科技的全棧聯(lián)動創(chuàng)新,包括上面提到的計算、存儲、數(shù)據(jù)庫、分析,更有生成式AI領(lǐng)域三層技術(shù)棧的爆發(fā)式聯(lián)動創(chuàng)新。
Amazon Nova系列模型的推出,標志著亞馬遜云科技在生成式AI領(lǐng)域的深入布局。Nova Micro、Nova Lite、Nova Pro以及即將推出的Nova Premier,這些模型覆蓋了從文本到文本到多模態(tài)的全方位需求,為用戶提供了豐富的選擇,無論在什么樣的應(yīng)用場景,都能找到一個最適合的模型。
亞馬遜云科技還對Amazon SageMaker、Amazon Bedrock及Amazon Q等核心服務(wù)進行了強化,并提供更多樣化的模型選項,深化應(yīng)用場景的融合,降低訓(xùn)練與推理成本,致力于讓企業(yè)更便捷、更經(jīng)濟地將生成式AI技術(shù)融入業(yè)務(wù)實踐,全面推動企業(yè)加快生成式AI的創(chuàng)新步伐。
而Amazon Bedrock作為構(gòu)建和擴展生成式AI應(yīng)用的關(guān)鍵平臺,為客戶提供了將推理功能整合到生產(chǎn)環(huán)境所需的工具。Amazon Bedrock推出的延遲優(yōu)化選項、模型蒸餾功能、知識庫支持GraphRAG、自動推理檢查功能和多智能體協(xié)作功能,都是亞馬遜云科技在生成式AI領(lǐng)域的重要創(chuàng)新。
亞馬遜云科技一個最大的差異化是具有廣泛的模型選擇??梢园迅嗟腖LM放到Amazon Bedrock上,為客戶提供豐富的自由選擇的空間,包括目前Anthropic發(fā)布的最新Claude 3.5模型。
一方面,亞馬遜云科技擁有自研芯片的技術(shù),Anthropic選擇亞馬遜云科技作為其主要云服務(wù)提供商,并使用Amazon Trainium和Amazon Inferentia芯片進行訓(xùn)練和部署未來的基礎(chǔ)模型。所以可以直接從Anthropic獲得很多一手的反饋,用于芯片技術(shù)的完善。另一方面,亞馬遜云科技在大模型上既有外部的合作伙伴,還有Amazon Nova系列基礎(chǔ)模型,應(yīng)用范圍廣泛。
隨著亞馬遜云科技在re:Invent 2024全球大會上一系列新品的重磅發(fā)布,其作為全球云計算開創(chuàng)者和引領(lǐng)者的地位再次得到鞏固,同時也彰顯亞馬遜云科技作為企業(yè)構(gòu)建和應(yīng)用生成式AI首選平臺的強大實力。
從云的核心服務(wù)到芯片、模型再到應(yīng)用,亞馬遜云科技在每一個技術(shù)堆棧上都取得顯著突破,實現(xiàn)全棧聯(lián)動的大規(guī)模創(chuàng)新。這種創(chuàng)新模式將滿足當(dāng)今客戶的發(fā)展需求,推動前沿技術(shù)的價值釋放,助力更多企業(yè)實現(xiàn)數(shù)字化轉(zhuǎn)型與業(yè)務(wù)增長。
【關(guān)于科技云報到】企業(yè)級IT領(lǐng)域Top10新媒體。聚焦云計算、人工智能、大模型、網(wǎng)絡(luò)安全、大數(shù)據(jù)、區(qū)塊鏈等企業(yè)級科技領(lǐng)域。原創(chuàng)文章和視頻獲工信部權(quán)威認可,是世界人工智能大會、數(shù)博會、國家網(wǎng)安周、可信云大會與全球云計算等大型活動的官方指定傳播媒體之一。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。