國內(nèi)首個!文心X1 Turbo獲信通院“4+級”最高評級

5月20日,百度AI Day活動在北京舉辦,百度集團副總裁吳甜、中國信息通信研究院人工智能研究所平臺與工程化部主任曹峰及文心一言用戶代表陳君航現(xiàn)場分享了文心大模型最新技術、全球大模型發(fā)展及大模型能力測評、文心一言使用體驗等?;顒蝇F(xiàn)場,中國信通院發(fā)布大模型推理能力評估結果。結果顯示,百度文心X1 Turbo在24項能力評估中,16項達5分、7項達4分、1項達3分,綜合評級獲當前最高級“4+級”,成為國內(nèi)首款通過該測評的大模型。文心X1 Turbo邏輯推理、代碼推理、推理效果優(yōu)化等技術能力及工具支持度、安全可靠度等應用能力均獲得滿分。

文心大模型新版本技術詳解

活動現(xiàn)場,吳甜對文心大模型最新版本的技術創(chuàng)新進行了系統(tǒng)性的講解。她介紹,文心大模型4.5是多模態(tài)基礎大模型,文心4.5 Turbo源自文心4.5,效果更好、成本更低;基于文心4.5 Turbo,文心X1升級到X1 Turbo,性能提升的同時,具備更先進的思維鏈,問答、創(chuàng)作、邏輯推理、工具調用和多模態(tài)能力進一步增強。

國內(nèi)首個!文心X1 Turbo獲信通院“4+級”最高評級

百度集團副總裁吳甜

文心4.5和4.5 Turbo實現(xiàn)了文本、圖像和視頻的混合訓練。針對不同模態(tài)數(shù)據(jù)在結構、規(guī)模、知識密度上的差異,通過多模態(tài)異構專家建模、自適應分辨率視覺編碼、時空重排列的三維旋轉位置編碼、自適應模態(tài)感知損失計算等技術,大幅提升跨模態(tài)學習效率和多模態(tài)融合效果,學習效率提高近2倍,多模態(tài)理解效果提升超過30%。

后訓練方面,百度研制了自反饋增強的技術框架,基于大模型自身的生成和評估反饋能力,實現(xiàn)了“訓練-生成-反饋-增強”的模型迭代閉環(huán),讓大模型擁有了自我迭代的“最強大腦”,不僅解決了大模型對齊過程中,數(shù)據(jù)生產(chǎn)難度大、成本高、速度慢等問題,而且顯著降低了模型幻覺,模型理解和處理復雜任務的能力大幅提升。

在訓練階段,通過融合偏好學習的強化學習技術,實現(xiàn)多元統(tǒng)一獎勵機制,提升了對結果質量判別的準確率。通過離線偏好學習和在線強化學習統(tǒng)一優(yōu)化,進一步提升了數(shù)據(jù)利用效率和訓練穩(wěn)定性,并增強了模型對高質量結果的感知。此外,通過偏好信號與獎勵信號的融合運用,模型的理解、生成、邏輯和記憶等能力全面提升。

深度思考方面,突破了僅基于思維鏈優(yōu)化的范式,在思考路徑中結合工具調用,構建了融合思考和行動的復合思維鏈,模型解決問題能力得到顯著提升,模型輸出結果思路清晰、邏輯嚴密,表達自然。同時,結合多元統(tǒng)一的獎勵機制,實現(xiàn)了思考和行動鏈的端到端優(yōu)化,大幅提升了跨領域的問題解決能力。

數(shù)據(jù)方面,打造了“數(shù)據(jù)挖掘與合成 - 數(shù)據(jù)分析與評估 - 模型能力反饋”的數(shù)據(jù)建設閉環(huán),為模型訓練源源不斷地生產(chǎn)知識密度高、類型多樣、領域覆蓋廣的大規(guī)模數(shù)據(jù)。同時,數(shù)據(jù)建設流程具備良好的可擴展性,能夠輕松遷移到全新的數(shù)據(jù)類型,實現(xiàn)快速、高效的數(shù)據(jù)生產(chǎn)。

此外,吳甜也指出,大模型的能力進一步拓展、效率進一步提升之后,可以探索更前瞻、更有想象力的創(chuàng)新應用。

以數(shù)字人為例,超擬真數(shù)字人需要具備出色的表現(xiàn)力、吸引人的內(nèi)容、數(shù)字人與場景、物品的互動等,需要綜合運用多模態(tài)AI技術。百度研制了“劇本”驅動多模協(xié)同的超擬真數(shù)字人技術,實現(xiàn)了語言、聲音、形象的協(xié)調一致。目前這套技術已經(jīng)支持超過10萬數(shù)字人主播,直播轉化率達31%,降低80%直播開播成本。在代碼場景上,基于文心大模型的語言和代碼能力,百度研制了代碼智能體和智能代碼助手——文心快碼。百度每天新增的代碼中,文心快碼生成的代碼占比已超過40%。截至目前,文心快碼向全社會開放,累計服務760萬開發(fā)者。

文心大模型的能力拓展和效率提升,得益于飛槳文心的聯(lián)合優(yōu)化,包括框架模型的聯(lián)合優(yōu)化,也包括框架算力的聯(lián)合優(yōu)化。通過訓練和推理的技術創(chuàng)新,文心4.5 Turbo訓練吞吐達到文心4.5的5.4倍,推理吞吐達到8倍。公開數(shù)據(jù)顯示,飛槳文心開發(fā)者數(shù)量已超過2185萬,服務超過67萬家企業(yè),創(chuàng)建的模型達到110萬。基于飛槳深度學習平臺和文心大模型,百度在上海、廣州、南京、武漢、廈門、寧波、南昌、無錫等多地落地產(chǎn)業(yè)賦能中心、數(shù)據(jù)生態(tài)中心和教育創(chuàng)新中心,以科技+人才+創(chuàng)新的模式打造區(qū)域人工智能公共技術服務平臺,匯聚行業(yè)高價值數(shù)據(jù)集、培養(yǎng)新型復合型人才、賦能本地AI產(chǎn)品研發(fā),構建圍繞人工智能核心能力的“政產(chǎn)學研用”協(xié)同發(fā)展機制,加快區(qū)域產(chǎn)業(yè)智能化升級。

國內(nèi)首個!文心X1 Turbo獲信通院“4+級”最高評級

中國信息通信研究院人工智能研究所平臺與工程化部主任曹峰從全球大模型發(fā)展、從測評看大模型能力演進以及文心大模型推理能力評測解讀等行業(yè)視角在現(xiàn)場進行了趨勢解讀。他指出,2024年人工智能能力持續(xù)進化,在多任務語言理解、競賽級數(shù)學、博士級科學問題等之前具有挑戰(zhàn)性的基準測試中超越了人類的表現(xiàn)。

國內(nèi)首個!文心X1 Turbo獲信通院“4+級”最高評級

中國信息通信研究院人工智能研究所平臺與工程化部主任曹峰現(xiàn)場分享

現(xiàn)場,曹峰公布了信通院大模型推理能力評估結果。百度文心X1 Turbo在24項能力評估中,16項達5分、7項達4分、1項達3分,綜合評級獲當前最高級“4+級”,成為國內(nèi)首款通過該測評的大模型。

他進一步表示,評估結果表明,文心X1 Turbo擅長結構化的邏輯思考,并具備平衡模型能力與效率的優(yōu)化技術,其有效的數(shù)據(jù)機制保障了模型的可信及可用程度,其推理服務能廣泛支持各類應用。文心X1 Turbo強化推理泛化能力,拓寬工具鏈應用生態(tài),加強安全機制建設,構筑可信應用保障壁壘。

16歲高中生:打開文心一言,就像打開新華字典一樣

活動現(xiàn)場,一位16歲高中學生陳君航分享了他使用文心一言的經(jīng)歷。他從2023年開始接觸文心一言,自那以后,文心一言幾乎陪伴了他整個中考備考過程。

君航回憶,初次接觸文心一言時,他正為語文作文的修改發(fā)愁,于是就把作文和老師點評發(fā)給文心一言,讓它逐句分析給出修改建議。他坦言,“我打開文心一言,就像打開新華字典一樣頻繁。在它的陪伴下,我的寫作能力得到很大提升。”

君航表示,文心一言不僅幫他量身定制過階段性的學習規(guī)劃,還能解析搜題軟件無法解析的原創(chuàng)題目。“在學習方面,文心一言就像我 24 小時在線的全能老師。”

國內(nèi)首個!文心X1 Turbo獲信通院“4+級”最高評級

陳君航現(xiàn)場分享與文心一言的故事

這位高一學生不僅自己愛用文心一言,還把他帶給了母親、同學、老師們。也讓大家對AI有了新的認知。

“我從小學時就開始對編程產(chǎn)生興趣,但家人一直認為學編程只夠作為一項興趣愛好,反對我投入過多的時間在編程研究上。因此,到了晚上規(guī)定的時間,爸媽都會準時關閉電腦,要求我去學習或者休息。”

但后來發(fā)生的事,讓君航媽媽對他在編程上花時間的態(tài)度發(fā)生了轉變。君航的媽媽是一位小學老師,平時在繁重的教學任務中,還要抽時間做很多案頭工作。“我經(jīng)常看到她一邊批卷子一邊熬夜寫點評,五十幾份,一句句手打。”所以君航想:“我能不能做點什么?”于是他開始嘗試用文心一言,為媽媽設計了一個“智能文案生成器”,原本三天的工作僅需幾小時就可以完成。這讓君航的媽媽對編程有了新的認知,也激發(fā)了她自己對大模型的使用興趣。

當大模型學會像人類一樣感知世界,像人類一樣思考和行動并自我進化,技術進步便真正轉化為普惠的社會紅利。正如陳君航同學所說:“技術真正的魅力不是驚艷誰,而是真正解決一個又一個真實的問題”。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2025-05-21
國內(nèi)首個!文心X1 Turbo獲信通院“4+級”最高評級
5月20日,百度AI Day活動在北京舉辦,百度集團副總裁吳甜、中國信息通信研究院人工智能研究所平臺與工程化部主任曹峰及文心一言用戶代表陳君航現(xiàn)場分享了文心大模

長按掃碼 閱讀全文