在人類的具身活動中,“大腦”“小腦”與“本體”協 同運作:大腦主導感知、記憶、學習與決策,小腦負責運動協調與精細控制,而本體則提供與外部環境互動的物理基礎。這種緊密協作機制為具身智能系統的設計提供了重要的生物學啟發,尤其是人類大腦相關腦區在具身活動(如環境中導航、與物體交互)中表現出的特定激活模式與功能分工,為具身系統“大腦”架構構建提供了參考,如圖2(a) 所示。
在具身活動中,位于大腦半球中部,溝后方D 葉是人類感知的重要腦葉之一。D葉感覺處理區接收 并整合來自皮膚、關節和肌肉的觸覺與感覺信號,角回 負責處理空間關系與抽象符號,將三維環境的內在邏 輯與數學符號轉化為空間認知²。此外,位于大腦半球 后部的枕葉,專注于視覺信息的深度解演,其中所包含 的初J、次J和高J視皮層如同像素解析器,將光線分 解為輪廓、色彩與運動軌跡。同時枕葉中的視覺處理 區進一步識別物體概念與場景語義。
在學習與記憶層面,顳葉內的海馬體是人腦的記 憶中樞。海馬體實現學習和記憶的生物學基礎是神 經的可塑性3。這種可塑性包含多種機制,長時程增強 機制強化與情境信息相關的突觸通路,而長期未強化 的冗余連接則被長時程抑制修剪,使神經網絡在感知 刺激下不斷重塑,這些機制讓海馬體將感官信息與情 境細節編織成情景記憶。海馬體相鄰的杏仁核為記憶 賦予情感權重并推動短期記憶向長期存儲轉化。同時 記憶需要在學習后的離線階段(如睡眠)通過“重放”活 動來鞏固46。通過人腦的學習與記憶的過程,人類就 可以形成記憶并用學到的信息完成后續的決策任務7。
在決策與行動層面,近年來的研究表明,決策并非 某一個腦區的“d角戲”,而是全腦范圍內的共同任務。前額葉皮層作為參與決策層面的重要腦區8,可以 評估信息價值并抑制沖動反應,同時調度工作記憶暫 存多任務信息。海馬體通過θ波節律實現和位于額葉 的眼窩額皮質的同步,共同參與到決策當中9。由多個 腦區結合產生的決策,會通過運動皮層等區域將決策 轉化為動作序列,Z終完成行動過程。
為了使具身智能系統可以像人類一樣完成具身活 動,具身智能系統應包括感知、記憶與學習、決策三大核心功能模塊,如圖2(b) 所示,它們彼此緊密協作,形成類似人腦的感知、記憶與學習、決策的閉環。
感知模塊是系統獲取外界信息的門戶。它模擬人 腦中枕葉和D葉等區域的功能,負責采集和處理來自 外部環境的多模態信息(如視覺、聽覺、語言等),并結 合上下文對信息進行解析。這一過程不僅為后續的記 憶與決策提供輸入,也通過實時感知支持短期反應和 環境適應,是具身智能系統感知與理解世界的基礎。
記憶與學習模塊承擔著對環境知識的抽象和積 累,類似于人腦中海馬體的作用,它通過對感知信息進 行場景建模與經驗總結,形成對環境規律和交互情境 的內化知識。這些知識不僅包括對過去情境的存儲, 也支持通過主動學習不斷優化,實現知識的遷移與泛化。
決策模塊類似人腦額葉的功能,承擔綜合判斷與行動輸出。它將來自感知的實時信息與記憶中的長期 知識進行融合,用于行為預測、任務規劃、路徑選擇和 語言交互等操作,從而驅動系統產生具體的身體行 為。這一模塊不僅是系統輸出的“發動機”,也會根據 反饋調整未來的學習與感知重點。
這3個模塊之間不僅存在信息傳遞關系,更構成了一個高度耦合、動態協同的整體認知結構。感知不 僅接收信息輸入,還是決策過程的依據;記憶不僅存儲 信息,還參與感知特征的選擇與策略決策;決策不僅輸 出行為規劃,還通過自主學習調節感知關注的重點。 整個系統在具身活動過程中是一個不斷循環迭代、自 我調節的認知體。
此外,上述具身系統大腦中的智能功能與身體行為和環境之間同樣緊密耦合,大腦和身體通過行為與感知的持續循環而動態連接在一起。感知不僅是對視覺和語言的理解,更是服務于環境與身體,即視覺理 解要支持身體在環境中的避障,語言理解要引導身體 在環境中的交互行為,身體行為也會反過來影響智能 系統的認知狀態。例如,身體位置和運動路徑的變化 會重新定義觀察坐標系與感知范圍,從而改變對場景 的理解。這種耦合關系說明具身智能不只是大腦的產 物,而是大腦、身體和環境整體協調的結果。這種耦合 關系構成了具身智能系統d有的認知閉環,也是其區 別于傳統離身式的感知與推理系統的根本所在。
![]() |
| 機器人底盤 Disinfection Robot 消毒機器人 講解機器人 迎賓機器人 移動機器人底盤 商用機器人 智能垃圾站 智能服務機器人 大屏機器人 霧化消毒機器人 展廳機器人 服務機器人底盤 具身智能教育機器人 智能配送機器人 導覽機器人 |