4 篇中稿 CVPR/ICRA！地瓜機器人 2026 頂會捷報，解鎖具身智能四大核心突破

本文作者：陳淑瑜

2026-05-26 15:09

專題：CVPR 計算機視覺與模式識別會議

導語：地瓜機器人 4 篇論文強勢入選 CVPR 2026（計算機視覺頂會）與 ICRA 2026（機器人頂會）

來源：地瓜機器人

原文鏈接：https://mp.weixin.qq.com/s/WQiXlk18j1ls8XHiGkQpcQ

四大核心技術拆解：從學術創新到落地價值

CVPR 2026 | 3D-Fixer：

單圖生成可交互 3D 場景，解鎖 “原位補全” 新范式

4 篇中稿 CVPR/ICRA！地瓜機器人 2026 頂會捷報，解鎖具身智能四大核心突破

鏈接：

https://openreview.net/login?redirect=/forum?id%3Dc0ei5M02Ej%26referrer%3D%255BAuthor%2520Console%255D%2528%252Fgroup%253Fid%253Dthecvf.com%252FCVPR%252F2026%252FConference%252FAuthors%2523your-submissions%2529

核心痛點：

傳統 3D 場景生成難平衡推理效率與幾何保真度，復雜遮擋下重建邊界模糊。首創「原位補全」范式，無需顯式姿態對齊，以場景幾何線索為錨點，通過 “粗結構補全 + 精細形狀優化” 雙模塊，融合 2D 紋理與 3D 幾何特征，解決遮擋重建難題。行業突破：開源全球最大場景級數據集 ARSG-110K（110K + 場景、300 萬 + 標注圖），實現 SOTA 級幾何重建精度，同時保持高效前饋推理。落地價值：為元宇宙場景構建、機器人 3D 環境感知提供低成本高效解決方案。

CVPR 2026 | Uni3R：

純視覺多任務 “一體機”，打破表征割裂壁壘

文章：

https://arxiv.org/pdf/2508.03643

核心痛點：

現有 3D 方案存在計算冗余，感知、重建、渲染任務相互割裂，協同效率低。技術亮點：創新「感知 - 重建 - 渲染一體化」架構，僅需純視覺輸入，在統一隱式表征空間內并行完成高保真 3D 重建、語義分割、新視角合成三大任務。行業認可：代碼開源即獲 GitHub 115+ Stars，成為多任務空間感知領域標桿方案。落地價值：降低機器人、AR/VR 設備的多任務處理成本，提升復雜場景適配能力。

Uni3R 旨在解決現有 3D 方案中存在的計算冗余與表征割裂痛點。該方案創新性地提出了一套感知-重建-渲染一體化架構，僅需純視覺輸入，即可在統一的隱式表征空間內，并行實現高保真 3D 重建、精細化語義分割與新視角合成三大核心任務，顯著提升了多任務協同效率。代碼開源后迅速獲得社區高度認可（115+ Stars）。模型架構分為 Geometry Foundation Model 和 Semantic Foundation Model，通過 Cross-View Transformer 處理后，分別進入 GS Head、Feat Head 和 Point Head，實現多任務輸出。

CVPR 2026 | MarketGen：

超市場景仿真 “神器”，加速商業機器人落地

文章：

https://arxiv.org/abs/2511.21161

核心痛點：

商業場景仿真缺失，傳統平臺局限于家居 / 桌面，商超機器人訓練缺乏真實場景支撐。技術亮點：基于智能體 + PCG 框架，支持文本 / 圖片多模態輸入，自動生成結構化超市場景；內置 1100 + 商品 3D 資產庫，配套收銀臺卸貨、通道取貨兩大評估基準。落地價值：為商超服務機器人提供低成本、高保真訓練環境，大幅縮短商業機器人研發周期。

ICRA 2026 | VO-DP：

純視覺操作 “逆襲” 3D 點云，突破硬件依賴瓶頸

文章：

https://arxiv.org/pdf/2510.15530v1

核心痛點：

傳統純視覺機器人操作精度不足，3D 點云方案依賴昂貴深度傳感器，落地成本高。技術升級：將 CNN 策略頭升級為 DiT（擴散 Transformer）架構，支持多視角輸入，融合語義 - 幾何自適應特征。性能突破：純視覺方案實現與 3D 點云方案性能 “對齊甚至超越”，無需昂貴硬件即可達成高精度操作。落地價值：適配家用 / 商用機器人多場景，降低硬件門檻，推動消費級機器人規模化落地。

技術硬實力背后：地瓜機器人的創新基因

4 篇頂會論文的突破，源于地瓜機器人對具身智能核心技術的深耕 —— 核心團隊來自華科、北科、北航、復旦、中科院、地平線研究院等頂尖院校與企業，聚焦 “純視覺感知”“復雜場景適配”“低成本落地” 三大方向，通過開源數據集、代碼庫反哺行業，推動技術生態共建。

0人收藏

專題

CVPR 計算機視覺與模式識別會議

本專題其他文章

陳淑瑜

編輯

發私信

當月熱門文章