3月19日,小米正式宣布推出三款大模型——MiMo-V2-Pro、Omni和TTS,并提供限時免費體驗一周。這三款模型代號為“HunterAlpha”,此前在全球最大API聚合平臺OpenRouter上引發(fā)熱議,一度登上大模型調(diào)用榜第一。小米MiMo大模型負責(zé)人羅福莉表示,這是小米首款真正為智能體時代打造的全棧產(chǎn)品系列。1T基礎(chǔ)模型幾個月前就開始訓(xùn)練,最初的目標(biāo)是提高長上下文推理的效率。混合注意力機制帶來了真正的創(chuàng)新,1M上下文窗口和MTP推理實現(xiàn)超低延遲和成本。
羅福莉還提到,真正改變一切的是復(fù)雜的智能體框架——“精心編排的語境”。她強調(diào),骨干網(wǎng)和基礎(chǔ)設(shè)施研究周期很長,需要一年的戰(zhàn)略決心才能看到回報。訓(xùn)練后敏捷性是一種不同的能力,產(chǎn)品直覺驅(qū)動評估,迭代周期縮短,范式轉(zhuǎn)變及早發(fā)生。她還承諾,新的MiMo-V2系列模型會開源,當(dāng)模型足夠穩(wěn)定,值得開源的時候。


來源:一電快訊
返回第一電動網(wǎng)首頁 >
以上內(nèi)容由AI創(chuàng)作,如有問題請聯(lián)系admin#d1ev.com(#替換成@)溝通,AI創(chuàng)作內(nèi)容并不代表第一電動網(wǎng)(www.cbbreul.com)立場。
文中圖片源自互聯(lián)網(wǎng)或AI創(chuàng)作,如有侵權(quán)請聯(lián)系郵件刪除。