近日,群核科技在首屆技術開放日(TechDay)上正式發布其空間大模型最新成果:新一代空間語言模型SpatialLM 1.5與空間生成模型SpatialGen。SpatialLM 1.5支持用戶通過對話交互系統SpatialLM-Chat進行可交互場景的端到端生成,它打破傳統大語言模型對物理世界幾何與空間關系的理解局限,可生成物理正確的結構化場景。SpatialGen是一款基于擴散模型架構的多視角圖像生成模型,可生成3D高斯(3DGS)場景和渲染漫游視頻。
在TechDay 的現場,一個養老場景的演示讓在場觀眾眼前一亮:工作人員在 SpatialLM-Chat 對話系統中輸入 “去客廳餐桌拿藥”,短短幾秒后,系統不僅識別出 “客廳”“餐桌”“藥” 三個關鍵對象,還自動調用路徑規劃工具,生成了一條避開茶幾、椅子的最優行動路線。
SpatialLM的空間參數化生成能力,可以高效創建具備物理準確性的訓練場景:首先基于自然語言描述生成結構化空間方案,繼而自動匹配素材庫構建三維環境,最終輸出可供機器人進行路徑仿真的可交互場景。
圖說:SpatialLM 1.5 機器人訓練演示demo
從技術迭代的角度來看,SpatialLM 1.5 的進步是建立在 SpatialLM 1.0 的基礎上的。今年 3 月,群核開源 SpatialLM 1.0 后,該模型迅速登上 Hugging Face 趨勢榜前三,成為空間大模型領域的 “熱門工具”。更關鍵的是,已有初創企業基于 SpatialLM 1.0 的代碼和架構,訓練出了適合自身場景的空間模型。
SpatialLM技術突破的背后,是群核構建的「空間智能飛輪」正加速轉動。基于酷家樂這一全球最大的空間設計平臺,群核科技構建了“空間編輯工具-空間合成數據-空間大模型”的空間智能飛輪,讓工具沉淀數據,用數據加速模型訓練,用模型提升工具體驗,再在工具的廣泛應用中沉淀更為豐富的場景數據。正如快手依托短視頻生態推動可靈迭代一樣,群核憑借酷家樂沉淀的海量室內物理數據,正在空間智能領域復現“工具—數據—模型”的技術增強回路。
數據顯示,截至2025年6月30日,群核科技擁有包含超過4.41億個3D模型及超過5億個結構化3D空間場景。從酷家樂的數據積累到群核空間大模型的戰略升級,群核的技術飛輪效應正在持續兌現。