9月19日消息,2024云棲大會上,阿里云CTO周靖人發(fā)布通義千問新一代開源模型Qwen2.5,旗艦模型Qwen2.5-72B性能超越Llama 405B,再登全球開源大模型王座。
Qwen2.5全系列涵蓋多個尺寸的大語言模型、多模態(tài)模型、數(shù)學模型和代碼模型,每個尺寸都有基礎版本、指令跟隨版本、量化版本,總計上架100多個模型,刷新業(yè)界紀錄。
據(jù)介紹,Qwen2.5全系列模型都在18T tokens數(shù)據(jù)上進行預訓練,相比Qwen2,整體性能提升18%以上,擁有更多的知識、更強的編程和數(shù)學能力。Qwen2.5-72B模型在MMLU-rudex基準(考察通用知識)、MBPP 基準(考察代碼能力)和MATH基準(考察數(shù)學能力)的得分高達86.8、88.2、83.1。
Qwen2.5支持高達128K的上下文長度,可生成最多8K內(nèi)容。模型擁有強大的多語言能力,支持中文、英文、法文、西班牙文、俄文、日文、越南文、阿拉伯文等 29 種以上語言。模型能夠絲滑響應多樣化的系統(tǒng)提示,實現(xiàn)角色扮演和聊天機器人等任務。在指令跟隨、理解結(jié)構(gòu)化數(shù)據(jù)(如表格)、生成結(jié)構(gòu)化輸出(尤其是JSON)等方面Qwen2.5都進步明顯。
語言模型方面,Qwen2.5開源了7個尺寸,0.5B、1.5B、3B、7B、14B、32B、72B,它們在同等參數(shù)賽道都創(chuàng)造了業(yè)界最佳成績,型號設定充分考慮下游場景的不同需求,3B是適配手機等端側(cè)設備的黃金尺寸;32B是最受開發(fā)者期待的“性價比之王”,可在性能和功耗之間獲得最佳平衡,Qwen2.5-32B的整體表現(xiàn)超越了Qwen2-72B。
在MMLU-redux等十多個基準測評中,Qwen2.5-72B表現(xiàn)超越Llama3.1-405B
72B是Qwen2.5系列的旗艦模型,其指令跟隨版本Qwen2.5-72B-Instruct在MMLU-redux、MATH、MBPP、LiveCodeBench、Arena-Hard、AlignBench、MT-Bench、MultiPL-E等權(quán)威測評中表現(xiàn)出色,在多個核心任務上,以不到1/5的參數(shù)超越了擁有4050億巨量參數(shù)的Llama3.1-405B,繼續(xù)穩(wěn)居“全球最強開源大模型”的位置。
專項模型方面,用于編程的 Qwen2.5-Coder 和用于數(shù)學的 Qwen2.5-Math都比前代有了實質(zhì)性進步。Qwen2.5-Coder 在多達5.5T tokens 的編程相關數(shù)據(jù)上作了訓練,當天開源1.5B和7B版本,未來還將開源32B版本;Qwen2.5-Math支持使用思維鏈和工具集成推理(TIR) 解決中英雙語的數(shù)學題,是迄今為止最先進的開源數(shù)學模型系列,本次開源了1.5B、7B、72B三個尺寸和一款數(shù)學獎勵模型Qwen2.5-Math-RM。
多模態(tài)模型方面,廣受期待的視覺語言模型Qwen2-VL-72B正式開源,Qwen2-VL能識別不同分辨率和長寬比的圖片,理解20分鐘以上長視頻,具備自主操作手機和機器人的視覺智能體能力。日前權(quán)威測評LMSYS Chatbot Arena Leaderboard發(fā)布最新一期的視覺模型性能測評結(jié)果,Qwen2-VL-72B成為全球得分最高的開源模型。
Qwen2-VL-72B在權(quán)威測評LMSYS Chatbot Arena Leaderboard成為成為全球得分最高的開源視覺理解模型
自從2023年8月開源以來,通義在全球開源大模型領域后來居上,成為開發(fā)者尤其是中國開發(fā)者的首選模型。性能上,通義大模型日拱一卒,逐步趕超美國最強開源模型Llama,多次登頂Hugging Face全球大模型榜單;生態(tài)上,通義從零起步、開疆拓土,與海內(nèi)外的開源社區(qū)、生態(tài)伙伴、開發(fā)者共建生態(tài)網(wǎng)絡,截至2024年9月中旬,通義千問開源模型下載量突破4000萬,Qwen系列衍生模型總數(shù)超過5萬個,成為僅次于Llama的世界級模型群。
HuggingFace數(shù)據(jù)顯示,截至9月中旬Qwen系列原生模型和衍生模型總數(shù)超過5萬個
- 谷歌被判22.5億元天價賠償背后:安卓數(shù)據(jù)暗箱操作的五年拉鋸戰(zhàn)
- HDC 2025:開發(fā)者搭上“鴻蒙快車”,鴻蒙生態(tài)加速前行
- HarmonyOS 6開發(fā)者Beta正式啟動:打造無處不在的AI體驗
- 馬蜂窩發(fā)布夏季“旅行蜂向標”,進山、玩水、擁抱草原是最受關注的夏季玩法
- 餓了么灰測“悅享會員”加碼用戶體驗,提供一系列專屬優(yōu)惠和個性化服務
- 啟信寶2025奶茶趣味報告:奶茶企業(yè)5年激增140%,40萬家共筑3500億帝國
- 《黑神話:悟空》PS5國行版將于6月18日正式發(fā)售,建議零售價268元起
- 報告:2029年美國AI搜索廣告支出將達260億美元,占比13.6%
- 重塑內(nèi)生安全體系 實現(xiàn)AI時代安全突圍 ——2025北京網(wǎng)絡安全大會(BCS)開幕
- 覆蓋上百國家!啟信慧眼全球供應鏈“風險地圖”助力中企安全“出?!?/a>
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。