新京報貝殼財經(jīng)訊(記者羅(luó)亦丹)3月27日,阿裏巴巴發布並開源首個端到端全模態(tài)大模型通(tōng)義千問(wèn)Qwen2.5-Omni-7B,可一起處理文本、圖畫、音頻和視頻等多種輸入,並(bìng)實時生成文本與天然語音(yīn)組成輸出(chū)。
在威望的多(duō)模態交融使命OmniBench等測評中,Qwen2.5-Omni改寫業界紀錄,全維度逾越Google的(de)Gemini-1.5-Pro等同類模(mó)型。Qwen2.5-Omni以挨近人類的(de)多感官(guān)方法“立體”認知(zhī)國際(jì)並與之實時交互,還能經過音(yīn)視頻辨認心情。現在開(kāi)發者和(hé)企(qǐ)業(yè)可(kě)免費下載商用Qwen2.5-Omni,手機等終端智能硬件也可布置運轉。
修改(gǎi) 嶽彩周。
校正 楊許麗。