我們擅長(cháng)商業(yè)策略與用戶(hù)體驗的完美結合。
歡迎瀏覽我們的案例。
2月10日上午消息,阿里巴巴達摩院發(fā)布具身智能大腦基礎模型RynnBrain,并一次性開(kāi)源了包括30B MoE在內的7個(gè)全系列模型。RynnBrain首次讓機器人(17.560, -0.03, -0.17%)擁有了時(shí)空記憶和空間推理能力,智能水平實(shí)現大幅躍升,在16項具身開(kāi)源評測榜單上刷新紀錄(SOTA),超越谷歌Gemini Robotics ER 1.5等行業(yè)頂尖模型。
據介紹,達摩院的RynnBrain模型創(chuàng )造性地引入了時(shí)空記憶和物理世界推理,這是機器人與環(huán)境互動(dòng)所需的兩項基本能力。時(shí)空記憶能力可讓機器人在其完整的歷史記憶中定位物體、目標區域,甚至預測運動(dòng)軌跡,從而賦予機器人全局時(shí)空回溯能力。物理空間推理不同于傳統的純文本推理范式,RynnBrain 采用文本與空間定位交錯進(jìn)行的推理策略,確保其推理過(guò)程緊密扎根于物理環(huán)境,大大減弱了幻覺(jué)問(wèn)題。
RynnBrain在Qwen3-VL基礎上訓練,使用自研的RynnScale架構進(jìn)行訓練優(yōu)化,同等資源加速兩倍,訓練數據超過(guò)2000萬(wàn)對。結果顯示,RynnBrain能力全面,性能領(lǐng)先,在16項具身開(kāi)源評測榜單上刷新紀錄(SOTA),包括環(huán)境感知與對象推理、第一人稱(chēng)視覺(jué)問(wèn)答、空間推理、軌跡預測等,超越了谷歌Gemini Robotics ER 1.5、英偉達 Cosmos Reason 2等具身頂尖模型。
RynnBrain還擁有良好的可拓展性,能夠快速后訓練出導航、規劃、動(dòng)作等多種具身模型,有望成為具身行業(yè)的基礎模型。以具身規劃模型為例,其需要強大預測能力和場(chǎng)景解析能力,但基于RynnBrain為基礎,只需幾百條數據微調,效果就能超越Gemini 3 Pro,輕松實(shí)現SOTA。
以開(kāi)源完整的推理與訓練代碼的方式,達摩院此次開(kāi)源了RynnBrain全系列模型,共計7個(gè),包含全尺寸基礎模型與后訓練專(zhuān)有模型,其中有業(yè)界首個(gè)MoE架構的30B具身模型,只需要3B的推理激活參數就能超越業(yè)界的72B模型效果,因此能讓機器人動(dòng)作更快、更絲滑。同時(shí),達摩院還開(kāi)源了全新評測基準 RynnBrain-Bench,用于評測時(shí)空細粒度具身任務(wù),填補了行業(yè)空白。
達摩院具身智能實(shí)驗室負責人趙德麗表示:“RynnBrain 首次實(shí)現了大腦對物理世界的深度理解與可靠規劃,為大小腦分層架構下的通用具身智能邁出關(guān)鍵一步。我們期待它加速 AI 從數字世界走向真實(shí)物理場(chǎng)景的落地進(jìn)程。”
