阿里云開(kāi)源全模態(tài)模型Qwen2.5-Omni-7B,手機(jī)上就能部署

3月27日消息,阿里云宣布通義千問(wèn)Qwen2.5-Omni-7B正式開(kāi)源。

Qwen2.5-Omni支持文本、圖像、音頻和視頻等多種輸入形式,并實(shí)時(shí)生成文本與自然語(yǔ)音合成輸出。

阿里云介紹,在權(quán)威的多模態(tài)融合任務(wù)OmniBench等測(cè)評(píng)中,Qwen2.5-Omni全維度遠(yuǎn)超Google的Gemini-1.5-Pro等同類模型。在語(yǔ)音理解、圖片理解、視頻理解、語(yǔ)音生成等領(lǐng)域的測(cè)評(píng)分?jǐn)?shù),均領(lǐng)先于專門的Audio或VL模型,且語(yǔ)音生成測(cè)評(píng)分?jǐn)?shù)(4.51)達(dá)到了與人類持平的能力。

目前,Qwen2.5-Omni已在魔搭社區(qū)和Hugging Face 同步開(kāi)源,開(kāi)發(fā)者和企業(yè)可免費(fèi)下載商用Qwen2.5-Omni,手機(jī)等終端智能硬件也可輕松部署運(yùn)行。另外,用戶也可在Qwen Chat上直接體驗(yàn)。

2025-03-27
阿里云開(kāi)源全模態(tài)模型Qwen2.5-Omni-7B,手機(jī)上就能部署
阿里云宣布通義千問(wèn)Qwen2.5-Omni-7B正式開(kāi)源。Qwen2.5-Omni支持文本、圖像、音頻和視頻等多種輸入形式,并實(shí)時(shí)生成文本與自然語(yǔ)音合成輸出。

長(zhǎng)按掃碼 閱讀全文