小米集團(tuán)宣布正式發(fā)布并全面開源其具身大模型MiMo-Embodied。該模型是業(yè)界首個(gè)成功打通自動(dòng)駕駛與具身智能的跨域具身基座模型,實(shí)現(xiàn)了兩大領(lǐng)域任務(wù)的統(tǒng)一建模,標(biāo)志著通用具身智能研究的重要進(jìn)展。MiMo-Embodied具備三大核心技術(shù)亮點(diǎn):跨域能力覆蓋、雙向協(xié)同賦能和全鏈優(yōu)化可靠,同步支持具身智能和自動(dòng)駕駛的關(guān)鍵任務(wù),驗(yàn)證了室內(nèi)交互與道路決策的知識(shí)轉(zhuǎn)移協(xié)同效應(yīng),并采用多階段訓(xùn)練策略提升模型的部署可靠性。

在涵蓋感知、決策與規(guī)劃的29項(xiàng)核心基準(zhǔn)測(cè)試中,MiMo-Embodied確立了性能新標(biāo)桿,全面優(yōu)于現(xiàn)有的開源、閉源及專用模型。在具身智能領(lǐng)域,MiMo-Embodied在17個(gè)基準(zhǔn)測(cè)試上取得SOTA成績(jī),重新定義了任務(wù)規(guī)劃、可供性預(yù)測(cè)及空間理解的能力邊界。在自動(dòng)駕駛領(lǐng)域,該模型在12個(gè)基準(zhǔn)測(cè)試上表現(xiàn)卓越,實(shí)現(xiàn)了環(huán)境感知、狀態(tài)預(yù)測(cè)與駕駛規(guī)劃的全鏈路性能突破。此外,在通用視覺語(yǔ)言領(lǐng)域,MiMo-Embodied也展現(xiàn)了卓越的泛化性。模型與代碼現(xiàn)已開源,可通過(guò)相關(guān)鏈接訪問(wèn)。此外,小米創(chuàng)辦人、董事長(zhǎng)兼 CEO 雷軍在微博發(fā)文稱小米組合輔助駕駛系統(tǒng)第 4 版“HAD 增強(qiáng)版”這幾天就會(huì)推送。

CONTACT US
ICC APP