5月20日,電商年中大促“618”正式開啟,各家電商平臺還在忙著統(tǒng)計首日戰(zhàn)報,大模型價格戰(zhàn)已經率先打響,甚至比618還要猛烈。
21日上午,阿里云拋出重磅炸彈,通義千問GPT-4級主力模型Qwen-Long,API(應用程序編程接口)輸入價格從0.02元/千Tokens降至0.0005元/千Tokens,直降97%,相當于GPT-4價格的約1/400。
上周,字節(jié)跳動發(fā)布豆包大模型,并宣布豆包通用模型pro-32k版的推理輸入價格為0.0008元/千Tokens,首次將大模型價格帶入“厘時代”。如今,通義千問的價格比豆包大模型還要便宜。
按照上述價格計算,1元能買到豆包主力模型的125萬Tokens,相當于3本《三國演義》,而1元也可以買到通義千問主力模型的200萬Tokens,相當于5本《新華字典》。
這還沒完,當天下午,百度直接宣布,旗下兩款大模型ERNIE Speed、ERNIE Lite免費。這兩款產品是今年3月百度推出的“輕量級”大模型,相比通用大模型,輕量級大模型的推理成本也會更低。
那么,問題來了,字節(jié)、阿里、百度三家大廠已相繼宣布大模型降價,騰訊會不會跟進?
日前,騰訊云副總裁、騰訊云智能負責人吳運聲在接受采訪時,沒有明確回答是否會加入大模型價格戰(zhàn),他表示,“騰訊更關注大模型能力的提升,致力于為行業(yè)提供能力和價格兼具的產品。”
從卷技術到卷價格
前兩年,大模型公司還沉浸在拼參數(shù)量、拼文本長度。今年以來,整個行業(yè)從卷技術到卷價格,大模型降價已成趨勢。
在字節(jié)等大廠紛紛宣布降價之前,已經有不少廠商下調大模型使用價格。
5月6日,AI公司DeepSeek發(fā)布全新第二代MoE大模型DeepSeek-V2,該模型API定價為:每百萬Tokens輸入1元、輸出2元(32K上下文),僅是GPT-4的近百分之一。
5月11日,智譜大模型官宣新的價格體系,入門級產品GLM-3 Turbo模型調用價格從5元/百萬Tokens降至1元/百萬Tokens,降幅高達80%。
這樣的趨勢,同樣在國外發(fā)生。今年2月底,法國AI公司Mistral AI發(fā)布最新大模型Mistral Large,該模型輸入、輸出價格比GPT-4 Turbo便宜約20%。
而自去年以來,OpenAI已經進行了4次降價,其最新發(fā)布的多模態(tài)大模型GPT-4o,不僅性能有了很大提升,價格也下調了50%。
降價背后是大模型結構、訓練等成本的持續(xù)優(yōu)化。李彥宏曾在Create 2024百度AI開發(fā)者大會上透露,與一年前相比,文心大模型推理性能實現(xiàn)了105倍增長,而推理成本卻降到了原來的1%。
今日,創(chuàng)新工場董事長兼CEO李開復在接受媒體采訪時表示,在一定程度上,整個行業(yè)每年降低10倍推理成本,這是可以期待的,而且是必然也應該發(fā)生的?!敖裉炜赡苁翘幵谝粋€比較低的點,但是我覺得如果說以后大約有一年降價10倍來看的話,這是一個好消息,對整個行業(yè)都是好消息?!?/p>
此外,火山引擎總裁譚待也曾表示,市場對降價的呼聲比較高,平臺必須把試錯成本做到非常低,才能讓大家用起來。只有大的使用量,才能打磨出好模型,也能大幅降低模型推理的單位成本。
為什么要打價格戰(zhàn)?
現(xiàn)在,大模型還是一個高投入、低產出的行業(yè),為什么廠商還要打價格戰(zhàn)?答案也很簡單:加速商業(yè)化落地。
大模型卷到2024年,一個新的賽季已經打響,應用場景的落地成為競爭主旋律。大模型定價的持續(xù)走低有望帶來更快的商業(yè)化落地。
上周,OpenAI、谷歌、字節(jié)跳動、騰訊四家大廠相繼披露在大模型領域的最新進展,無一不聚焦在應用側。
硬核如OpenAI,對于最新發(fā)布的多模態(tài)大模型GPT-4o,也沒有以往對參數(shù)指標的生硬強調,而是選擇集中展示多場景下的用戶體驗。這被認為是OpenAI加速應用落地的表現(xiàn)。
在騰訊云生成式AI產業(yè)應用峰會上,吳運聲在談及大模型商業(yè)化的問題時表示,技術的突破未來一定會帶來商業(yè)化的機會,而且會呈現(xiàn)跨越式的增長態(tài)勢。AI要真正落地實用,推理成本的降低、工程性能的極致優(yōu)化至關重要,是未來商業(yè)化取得突破的重要因素。
當天,騰訊集團副總裁蔣杰在大會上宣布,騰訊混元大模型通過持續(xù)迭代,目前整體性能已居國內第一梯隊,部分中文能力已追平GPT-4。
值得一提的是,目前大模型的應用還在早期階段,仍有很大的發(fā)展空間。QuestMobile數(shù)據顯示,截至今年3月,基于大模型的AIGC行業(yè)用戶量為7380萬,盡管同比增長了8倍,也僅占移動互聯(lián)網用戶量的6%。
海通證券5月17日研報指出,伴隨國產AI大模型的持續(xù)升級,2024年有望成國產AI大模型全面商業(yè)落地的元年,先進的AI大模型能力也將逐漸轉化為落地實際場景的產品應用,從而帶動AI大模型在金融、教育、法律、醫(yī)療等眾多垂直行業(yè)的持續(xù)落地,AI2B與AI2C的需求天花板也有望全面打開,在這個過程中,AI的投資也從映射和跟隨,變?yōu)橐I。(周小白)
- Palantir首席執(zhí)行官卡普:人工智能很危險,要么我們贏要么中國贏
- AI編程工具Cursor融資9億美元,一年三輪融資估值飆升至99億美元
- OpenAI宣布付費企業(yè)版用戶突破300萬,三個月新增100萬
- 《逆水寒》手游與可靈AI合作,圖片秒變動圖,游戲體驗顛覆想象!
- 英偉達創(chuàng)新強化學習技術,只需訓練2000步,打造全球最強AI推理模型
- 微軟開源 Athena 智能體,Teams 工作流大升級,代碼審查提速58%:效率革命!
- Anthropic 挖谷歌及 OpenAI 高層行動:安全重于泰山,人才爭奪彰顯行業(yè)未來
- AMD揭秘:以Brium破英偉達AI硬件壟斷,劍指下一場科技大戰(zhàn)
- 亞馬遜搶快遞員飯碗?用人形機器人送貨上門,未來物流競爭升級!
- 谷歌CEO皮查伊:AI大潮來襲,工程師招募加速!新篇章即將開啟!
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。