每日經(jīng)濟(jì)新聞 2025-09-19 09:27:18
每經(jīng)AI快訊,據(jù)Xiaomi MiMo微信公眾號(hào)消息,9月19日,小米正式開源首個(gè)原生端到端語音模型——Xiaomi-MiMo-Audio,它基于創(chuàng)新預(yù)訓(xùn)練架構(gòu)和上億小時(shí)訓(xùn)練數(shù)據(jù),首次在語音領(lǐng)域?qū)崿F(xiàn)基于ICL的少樣本泛化,并在預(yù)訓(xùn)練觀察到明顯的“涌現(xiàn)”行為。據(jù)介紹,在通用語音理解及對(duì)話等多項(xiàng)標(biāo)準(zhǔn)評(píng)測(cè)基準(zhǔn)中,MiMo-Audio大幅超越了同參數(shù)量的開源模型,取得7B最佳性能;在音頻理解基準(zhǔn)MMAU的標(biāo)準(zhǔn)測(cè)試集上,MiMo-Audio超過Google閉源語音模型Gemini-2.5-Flash;在面向音頻復(fù)雜推理的基準(zhǔn)Big Bench Audio S2T任務(wù)中,MiMo-Audio同樣超越了OpenAI閉源的語音模型GPT-4o-Audio-Preview。
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP