文小言上新:能方言交流、會拍照解題、能生成吉卜力風圖片和視頻

3月31日消息,在百度推出最新最強多模態(tài)大模型文心4.5和推理大模型文心X1后,今天百度旗下AI助手文小言APP正式功能升級。

此次升級,文小言聚焦模型開放與功能創(chuàng)新,支持多模型融合調度,升級全新語音大模型、圖片問答、AI生圖生視頻等多項能力,為用戶帶來更智能、更高效的AI體驗。

其中,文小言此次升級的核心亮點在于“多模型融合調度”。通過整合百度自研的文心X1、文心4.5等頂尖模型,并接入DeepSeek-R1、可靈等第三方優(yōu)質模型,文小言實現(xiàn)了多模型間的智能協(xié)同。

接入全新的端到端語音語言大模型后,文小言不僅能支持更擬真的語聊效果,而且支持重慶、廣西、河南、廣東、山東等特色方言。據(jù)介紹,語音大模型具備極低的訓練和使用成本,極快的推理響應速度,語音交互時,可將用戶等待時長從行業(yè)常見的3-5秒降低至1秒左右。

圖片問答功能讓用戶可以通過拍攝或上傳圖片,以文字或語音提問直接獲取深度解析。

目前,以上這些大模型能力,用戶在文小言APP內選擇“自動模式”,即可一鍵調用最優(yōu)模型組合,也可以根據(jù)需求靈活選擇單一模型完成特定任務。

從用戶角度來看,目前的文小言不僅能聽得懂方言、能跟用戶直接方言交流外,還可以“化身”老師解題答疑。

最近,OpenAI的多模態(tài)大模型GPT-4o因能生成吉卜力動漫風的圖片而大受追捧?,F(xiàn)在,文小言不僅能通過文生圖來生成吉卜力風的圖片,還能生成該風格的視頻。

百度AI產品創(chuàng)新業(yè)務負責人薛蘇強調:“AI的未來不再是單純的技術參數(shù)比拼,而是如何通過多模型協(xié)同,真正為用戶創(chuàng)造價值。文小言希望通過開放生態(tài),整合頂尖模型能力,做出更強大、更簡單的AI產品。”

那么就一起來看看文小言的表現(xiàn):

1、讓文小言設計三種風格的南偏東客廳效果圖

文小言能夠精準解析裝修風格差異,調用文心X1完成深度推理,生成三幅風格迥異但視角一致的裝修效果圖,圖文混排專業(yè)講解,效果更直觀。

2、拍攝一道數(shù)學題,讓文小言解題

將上述數(shù)學題用文小言拍照輸入,文小言就給出了一下解答結果。

還實時生成了一個由數(shù)字人講解的解說視頻。

3、讓文小言生成吉卜力風格圖片和視頻

在文小言app中選擇圖片創(chuàng)作,或者直接在對話框中輸入希望生成的圖片的描述,

例如:

請畫一個宮崎駿風格圖片,比例為9:16,內容為個女孩站在盛開的櫻花樹下,身旁有小貓咪。女孩扎著麻花辮,仰頭望向櫻花樹,欣賞飄落的櫻花。背景是戶外鄉(xiāng)村環(huán)境,有一棵櫻花樹,粉色櫻花密集綻放,本古樸木屋。地面上綠草如茵,

整體氛圍清新、寧靜、美好,充滿春日的生機與愜意。

文小言就會生成2張相關圖片。

然后,選擇“視頻生成”按鈕,文小言就能根據(jù)圖片生成一段5s中的小視頻。

4、講方言

文小言會說多種方言,包括重慶話、河南話、廣西話等都能聊??梢匀ヂ犚宦犓v得怎么樣。

百度語音首席架構師賈磊透露,文小言接入了百度在業(yè)界首個推出、基于全新互相關注意力(Cross-Attention)的端到端語音語言大模型。在語音場景滿足一定交互指標下,大模型調用成本比行業(yè)平均降低50%-90%,推理響應速度極快,將語音交互等待時間壓縮至1秒左右,極大提升了交互流暢性。同時,在大模型加持下,實現(xiàn)了流式逐字的LLM驅動的多情感語音合成,情感飽滿、逼真、擬人,交互聽感也得到極大提升。(宜月)

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2025-03-31
文小言上新:能方言交流、會拍照解題、能生成吉卜力風圖片和視頻
3月31日消息,在百度推出最新最強多模態(tài)大模型文心4.5和推理大模型文心X1后,今天百度旗下AI助手文小言APP正式功能升級。

長按掃碼 閱讀全文