5月20日消息(九九)5月17日,2025世界電信和信息社會(huì)日“智算產(chǎn)業(yè)創(chuàng)新發(fā)展論壇”在南昌舉辦,華為昇騰計(jì)算業(yè)務(wù)副總裁王慶文在演講中指出,大模型的性能在很多方面已經(jīng)可以與人類(lèi)媲美,并且在快速收斂,從原來(lái)的千模百態(tài)收斂到十來(lái)家,隨著推理成本的大幅下降開(kāi)始在很多行業(yè)獲得應(yīng)用,為醫(yī)療診斷、工業(yè)質(zhì)檢、AI教學(xué)等方面帶來(lái)卓有成效的提升。
Gartner預(yù)測(cè),未來(lái)兩年80%中國(guó)企業(yè)將部署生成式AI,60%會(huì)將AI融入產(chǎn)品服務(wù),標(biāo)志著企業(yè)AI應(yīng)用從通用場(chǎng)景向核心生產(chǎn)場(chǎng)景滲透的“奇點(diǎn)時(shí)刻”到來(lái),企業(yè)AI部署已進(jìn)入全面深化階段。
王慶文進(jìn)一步指出,運(yùn)營(yíng)商憑借領(lǐng)先的泛在多級(jí)訓(xùn)推資源,既能滿足中小企業(yè)的靈活需求,也能支撐大型企業(yè)核心業(yè)務(wù)及海量用戶場(chǎng)景,并通過(guò)多租戶部署技術(shù),保障大租戶資源獨(dú)立、中小租戶性能提升的同時(shí)全方位確保數(shù)據(jù)安全。
王慶文介紹,昇騰從基礎(chǔ)硬件、算子到推理系統(tǒng)全面創(chuàng)新,面向不同的推理場(chǎng)景需求,為包含運(yùn)營(yíng)商在內(nèi)的客戶及伙伴提供集高性能、高可靠、易部署、開(kāi)源開(kāi)放于一體的推理解決方案。
面向大型企業(yè)、C端超級(jí)應(yīng)用等需要大規(guī)模推理算力資源的場(chǎng)景,高并發(fā)、低時(shí)延下的吞吐性能是關(guān)鍵。昇騰國(guó)內(nèi)首創(chuàng)大規(guī)模專(zhuān)家并行集群推理方案:通過(guò)將MoE模型的多專(zhuān)家權(quán)重?cái)?shù)據(jù) 分散部署到更多的卡上,降低單卡權(quán)重加載時(shí)延,讓模型解碼輸出更快;單卡內(nèi)存容量占用的降低,也能夠支持更大用戶并發(fā)所需的KV緩存,實(shí)現(xiàn)系統(tǒng)的更大吞吐性能,平均單卡吞吐性能提升3倍以上,大幅降低每Token推理成本,幫助運(yùn)營(yíng)商構(gòu)筑高性能的AI算力基礎(chǔ)設(shè)施,為行業(yè)客戶帶來(lái)更優(yōu)的業(yè)務(wù)體驗(yàn)。
面向中小企業(yè)、學(xué)校和醫(yī)院等機(jī)構(gòu)需要快速部署、快速落地AI應(yīng)用的需求,昇騰使能運(yùn)營(yíng)商打造大模型應(yīng)用一體機(jī)。打包量化、調(diào)優(yōu)等工具鏈顯著提升50%部署效率,通過(guò)MLA(Multi-Head Latent Attention)親和等特性,提升吞吐性能90%,從模型部署到應(yīng)用上線實(shí)現(xiàn)“即開(kāi)即用”,降低AI部署門(mén)檻,幫助運(yùn)營(yíng)商賦能千行萬(wàn)業(yè)智能化轉(zhuǎn)型。目前已有超140家合作伙伴基于昇騰發(fā)布大模型應(yīng)用一體機(jī)產(chǎn)品,為各行業(yè)場(chǎng)景提供廣泛的智能應(yīng)用。
演講的最后,王慶文表示,昇騰將致力于打造堅(jiān)實(shí)的算力底座,攜手運(yùn)營(yíng)商及ISV等產(chǎn)業(yè)伙伴破解算力供給與場(chǎng)景落地的關(guān)鍵挑戰(zhàn),加速AI在千行萬(wàn)業(yè)的落地應(yīng)用,為產(chǎn)業(yè)融合升級(jí)注入強(qiáng)勁動(dòng)能。
- 什么是數(shù)據(jù)中心布線以及主要布線標(biāo)準(zhǔn)?
- 機(jī)器人在智慧城市中的作用:未來(lái)趨勢(shì)
- 可靠光纖網(wǎng)絡(luò)的6條光纖極性基本規(guī)則
- 物聯(lián)網(wǎng)將在UPI3.0生態(tài)系統(tǒng)中扮演什么角色?
- 如何在光纖盒系統(tǒng)中保持光纖極性
- 云端AI如何變革醫(yī)療保?。?025年的實(shí)際用例
- 重型計(jì)算:AI數(shù)據(jù)中心的“重量”問(wèn)題
- 冷卻的回歸:液冷推動(dòng)更智能的數(shù)據(jù)中心回遷
- 【倒計(jì)時(shí) 5 天!】2025 廣州低碳智慧建筑創(chuàng)新技術(shù)論壇重磅來(lái)襲,共赴綠色智慧新未來(lái)!
- 人工智能代理:如何實(shí)現(xiàn)從潛力到實(shí)效的突破?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。