0
| 本文作者: 二維馬曉寧 | 2026-06-23 18:58 |
雷峰網(wǎng)(公眾號:雷峰網(wǎng))消息 6月23日,面向物理智能的具身智能企業(yè)正行創(chuàng)新(Striding AI)已完成近億美元天使輪系列融資。投資方包括正大集團、華勤技術、九安醫(yī)療等多家上市企業(yè),多位國內外知名企業(yè)家,以及多家一線投資機構。資本的集中加持,反映出市場對其技術判斷與商業(yè)路徑的認可。
據(jù)悉,正行創(chuàng)新本輪募集的資金將主要投入三大方向:一是持續(xù)引進全球頂尖算法、工程與商業(yè)化人才,完善全鏈條人才梯隊布局;二是加大世界動作模型、強化學習等核心技術的迭代與應用,夯實具身智能基礎設施能力;三是加速零售、工業(yè)等場景的落地驗證與產(chǎn)品化落地。
正行創(chuàng)新成立于2026年初,由連續(xù)創(chuàng)業(yè)者姚頌、著名跨國產(chǎn)業(yè)集團正大集團、清華知名青年學者于超聯(lián)合發(fā)起,以“用物理智能給世界帶來便利”為使命,致力于探索物理智能的技術邊界,通過世界動作模型與強化學習技術,推動將人形機器人大規(guī)模部署至真實商業(yè)與工業(yè)場景,目標成為全球可信賴的機器人服務提供商。

連續(xù)成功創(chuàng)業(yè)者與知名青年學者領銜,打造持續(xù)進化的全棧人才矩陣
物理智能賽道的競爭,本質是算法創(chuàng)新與系統(tǒng)工程能力的綜合比拼,既要求團隊有深厚的技術底層積累,也需要豐富的產(chǎn)業(yè)落地經(jīng)驗。在正行創(chuàng)新看來,物理智能的長期競爭力,不只來自某個單點的技術突破,更來自將算法、軟件、硬件、數(shù)據(jù)與場景整合為一個持續(xù)進化系統(tǒng)的組織能力。
正行創(chuàng)新的創(chuàng)始團隊由連續(xù)成功創(chuàng)業(yè)者與清華知名青年學者領銜。創(chuàng)始人兼CEO姚頌是國內硬科技領域少有的連續(xù)跨行業(yè)創(chuàng)業(yè)者,曾聯(lián)合創(chuàng)立AI芯片公司深鑒科技并出任CEO,帶領團隊開展高能效AI芯片在輔助駕駛、智慧城市等場景的落地;此后又以聯(lián)合創(chuàng)始人兼聯(lián)席CEO身份創(chuàng)立東方空間,帶隊創(chuàng)造了全球最大固體運載火箭等多項商業(yè)航天行業(yè)紀錄。
聯(lián)合發(fā)起人于超博士現(xiàn)任清華大學深圳國際研究生院助理教授、博士生導師,師從清華大學汪玉教授,與姚頌師出同門。她長期深耕強化學習與機器人研究,主導提出的多智能體強化學習算法MAPPO已成為領域基準方法;團隊開源的具身智能訓練框架RLinf上線半年便在GitHub上獲得超過3800顆星標,被海內外多家頂尖高校與頭部機器人、AI Infra企業(yè)采用。
在創(chuàng)始團隊的帶領下,正行創(chuàng)新已搭建起一支資深的全棧研發(fā)團隊。成員畢業(yè)于清華、上海交大、中科大、華中科大、哈工大等國內頂尖高校,并擁有蔚來、智元、海康、大疆、主線等頭部企業(yè)的研發(fā)與產(chǎn)品化經(jīng)驗,能力覆蓋基座模型、強化學習、具身智能體系統(tǒng)、運動控制、人機交互、嵌入式軟件、人形機器人整機設計、場景解決方案以及大規(guī)模量產(chǎn)交付等關鍵環(huán)節(jié),形成從算法“大腦”到硬件“本體”的完整人才矩陣。
以真實場景為起點,構建“數(shù)據(jù)—模型—基礎設施”協(xié)同的系統(tǒng)性創(chuàng)新路徑
當前,具身智能技術發(fā)展普遍面臨諸多痛點:真實數(shù)據(jù)稀缺、遙操作數(shù)據(jù)采集效率低、純VLA模型結構難以有效掌握物理世界規(guī)律,導致真實環(huán)境中操作成功率低下。針對這些行業(yè)問題,正行創(chuàng)新提出了“數(shù)據(jù)—模型—基礎設施”協(xié)同進化的技術路線,以真實產(chǎn)業(yè)需求為研發(fā)起點,構建系統(tǒng)性的技術競爭壁壘。
數(shù)據(jù)層面,依托真實場景資源,構建百萬小時級數(shù)據(jù)壁壘。正行創(chuàng)新依托正大集團、華勤技術等產(chǎn)業(yè)伙伴的真實門店、產(chǎn)線與服務場景,正在推進百萬小時級真實世界數(shù)據(jù)采集,不斷匯集真實環(huán)境中天然存在的復雜變化與長尾問題,為訓練高可用性、高穩(wěn)定性、高泛化性機器人提供高價值的數(shù)據(jù)來源。
模型層面,讓AI在隱空間中,高效學習物理法則和物理規(guī)律。正行創(chuàng)新團隊認為,物理智能模型的本質不在于像素生成,而應在一個可實時處理的輕量模型中學習諸如牛頓運動定律、動量守恒、能量守恒等基礎物理法則,以及各種物理常識。基于這一判斷,正行創(chuàng)新與清華大學團隊聯(lián)合開發(fā)新一代機器人基座模型,目前已完成“隱空間世界動作模型”的階段性驗證,讓機器人在更高效的隱空間中學習物理狀態(tài)變化,推動人類動作與機器人動作的對齊遷移,使機器人能從海量人類視頻中習得通用動作規(guī)律,減少對昂貴遙操作數(shù)據(jù)的單一依賴。
系統(tǒng)層面,構建Agent Loop,推進“人在環(huán)路”閉環(huán)建設。正行創(chuàng)新正在構建面向真實場景的具身智能體系統(tǒng),通過“感知—規(guī)劃—執(zhí)行—反饋—恢復”的Agent Loop,將單點操作能力組織為場景級長流程任務的穩(wěn)定執(zhí)行能力。與此同時,團隊還在推進“人在環(huán)路”的強化學習后訓練與數(shù)據(jù)閉環(huán)建設,針對真實運行數(shù)據(jù)中包含的成功、失敗、接管和低效行為等多元信息,通過創(chuàng)新方法識別其中真正推動任務完成的高價值動作,并將交互數(shù)據(jù)轉化為可用于模型迭代的優(yōu)質訓練數(shù)據(jù)。據(jù)了解,該技術方向在真實機器人任務中已將任務成功率最高提升3倍。
基礎設施層面,以端云協(xié)同部署,降低模型迭代成本。正行創(chuàng)新判斷,不具備Infra基礎設施能力的公司,很難最終成為領先的物理智能公司。正行創(chuàng)新將與合作伙伴開展聯(lián)合研究,建設面向機器人預訓練、大規(guī)模強化學習與端云協(xié)同部署的系統(tǒng)基礎設施,通過更高效的數(shù)據(jù)處理、訓練調度與仿真評測體系,持續(xù)降低機器人智能能力迭代所需的算力與時間成本。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。