0
今年年初,FSD推送了V12.3版本,標志著特斯拉的純視覺自動駕駛系統進入了一個新的階段。
4月28日馬斯克訪華,在不到24小時的時間里,特斯拉中國先后兩次在官方微博發聲,均提及加速自動駕駛技術落地。這在智駕圈和車企圈內再次掀起一輪討論——智能化,仍然是當下最熱門的話題之一。
國內,從一開始就走純視覺路線的一個車企玩家是極越。
在2024北京車展上,極越汽車旗下的第二款車型——極越07首發亮相,并將于下半年正式上市。
智能化是極越一直想要傳達給外界的形象。近日,極越發布2024五一假期AI出行報告,數據統計時間為4月30日至5月5日。極越的智駕滲透率達78.8%,單車平均 PPA 里程為181.6公里;自動泊車功能滲透率達73.1%,單車單日自動泊車最多達20次。

車展期間,雷峰網參加了極越汽車高層群訪,與極越智能軟件副總裁潘云鵬展開交流。
潘云鵬表示,“我們現在是全中國唯一,全世界唯二純視覺高階輔助駕駛的方案。”
與在車展之前英偉達吳新宙所分享的類似觀點,潘云鵬也強調了“軟件定義汽車”以及“AI定義汽車”的區別:前者成功的要素是SOA軟硬解耦、高算力SOC,以及軟硬件背后所帶來的組織架構的優化;后者則是需要高質量數據、大算力、大參數模型,靠的就是Scaling Laws(大力出奇跡)。
極越把自己的汽車定位成“汽車機器人”,這個汽車機器人具備三大基礎能力:自然交流、自由移動、自我成長。其中,在自由移動層面,主要包括兩個部分:行泊一體以及純視覺。
極越一開始所投入的純視覺智駕路線,已經成為行業主流,很多廠商推出了沒有激光雷達的方案。
2023年,小鵬和蔚來分別宣布各自的第二品牌——MONA和樂道,明確采用純視覺路線。今年4月新發布的智界S7,個別車型也取消激光雷達,用視覺直接實現全國高速和城市快速路智駕領航輔助和智能泊車。

極越技術架構
廣汽集團也正式推出了無圖純視覺智能駕駛技術,目前在廣州核心城區的高速、城市NOA功能已經基本實現無圖純視覺。
潘云鵬表示,在極越01的開發階段,是保留了激光雷達的,在保險杠燈下面的位置。后來,極越決定要去掉激光雷達,主要有幾個方面的原因:
第一,從人類駕駛的模式來看,頭上沒頂一個主動光傳感器,還是通過視覺,人腦手腳配合形成一個動作。車上的攝像頭包括毫米波雷達的覆蓋范圍比人類廣,完全可以替代掉額外的激光雷達,完成駕駛的動作。
第二,激光雷達的成本問題,即便成本下降很快,但比起攝像頭還是有很大差別,BOM成本是攝像頭的5-10倍。售后維修成本高。
第三,當激光雷達給的結果和其它感知的結果不一致時,難以仲裁。而且激光得滿足光學基本的物理屬性,在一些有金屬表面反射比較強的場景之下,必須得消除偽影和鬼影,這些東西的長尾效應比較明顯,需要導入大量的成本。
第四,激光雷達的布置,現在車企基本都是把激光雷達放在車頂,這個對設計提出挑戰。
在背靠百度智駕能力、積累了一億公里數據以后,極越在2023年決定徹底舍棄激光雷達。當然,純視覺方案的挑戰也很明顯:深度信息的天然缺失,需要花費大量精力進行數據的升維,從2D到3D進行轉換。
潘云鵬在2023年的時候判斷,2024年是一個拐點。“從去年10月27號發布這款車1.1版本,到現在的1.4版本,以及即將推出的1.5版本,每一個版本都會發現它的視覺性能,包括智駕的體驗都極大提升,這也印證了我們當年對視覺路線的判斷,一旦拐點到來之后,它的迭代周期頻率更敏捷。”
潘云鵬表示,“(智能駕駛)這個行業里觀點越來越類似,有幾個關鍵詞,一個是去圖化,一個是激光雷達,還有一個端到端。做純視覺方案時,大家會聊激光雷達會聊成本和可靠性,我們純視覺把售后成本壓低,但是研發成本是提高的,對數據量提升,對算力的要求越來越大,總體而言,一定是每家公司根據自己的特點選擇的最合適的路線。
純視覺的上限高,但是下限也低,一切取決于數據和算力的支撐。
比如,特斯拉今年1月剛剛追加了5億美元新投資,購買約1萬個英偉達H100 GPU,用于自動駕駛的訓練。有數據顯示,特斯拉擁有H100 GPU的數量可能超過3萬個。
抵達北京的那天,馬斯克就說,今年特斯拉將會投資約100億美元用于AI的訓練和推理,而推理主要用于汽車。而任何支出達不到每年100億美元水平或者無法高效部署的公司,都無法在市場上競爭。
極越的視覺大模型,包含了四大基礎能力:
第一,把之前的智駕小模型匯集成更大的大模型。原先每個功能都有自己的感知模型、控制模型,預測模型。極越01上對這些模型做了重構,有一個比較大的基礎模型。這個基礎模型具備幾個能力,一,具備在線繪圖的能力,是幫助極越去泛化、開城,主要是應對地圖數據不完善、不準確的場景,可以做一些實時線圖,這是為什么極越可以很快開放全國的原因之一。
第二,目標監測和持續跟蹤,對行人的目標軌跡,行人識別,可以做到持續的追蹤,持續的預測,讓車有一些預處理的能力,而不是變成“鬼探頭”的場景。
第三,OCC的占用網絡。不需要對障礙物進行識別,直接看到在目前的行駛區域或者行駛路徑被遮擋后繞開,極大的提升障礙物檢測和安全性能。
今年1月,在極越預告的V1.3版本OTA中,加入OCC占用網絡的“BEV+OCC+Transformer”智能駕駛方案,被正式命名為“B.O.T三向箔”。
相較于目前市場主流的“BEV+ Transformer”方案,OCC技術為整車智駕帶來的最大變化是感知識別能力的提升,能夠對障礙物進行3D精細刻畫,模型精度可達厘米級,比肩甚至超越激光雷達。
最后是場景理解,基于所有基礎能力的加持,可以對每幀視頻的數據做出最準確的判斷,跟看圖說話類似,可以幫助智駕在預測和溝通的過程中,做出更好的判斷。
潘云鵬表示,“在合并一些模型之后,發現它的性能有很大的提升,算力要求在減小,因為我們之前小模型的數量比較多,而且得益于數據訓練之后,所有的行車和泊車場景都有收益,這也是感知和基礎的大模型帶來自動駕駛泛化能力和性能提升的例子。”
據雷峰網了解,PPA開通之后的日均滲透率在50%,極越將會在5月中旬發布1.5版本。
在開城計劃上,今年極越的PPA功能將實現全國都能開。具體來講,將先開放一百個城市,主要是用戶最多的一些地方,在未來的一到兩個月逐步開放到300至360城的范圍,到2024年,所有的鄉間道路都能開。
具體的車輛功能上,自動轉向燈和屏幕換擋也用到純視覺的能力。
1.4版本的時候,極越通過車的角度判斷是否有變道的意圖,從而控制轉向燈以及屏幕換擋。潘云鵬表示,極越很快還有自動換擋的功能,通過視覺的能力,知道車主想前進還是后退,對視覺的范疇進行進一步豐富
2024北京車展上,我們能看到,許多車企在智能化上持續發力,技術的演變節奏不斷加快。
潘云鵬表示,“技術越有多樣性,對用戶來講是個好事,最后還是用戶體驗來說話,用數據來說話。最終應該是百花齊放,純視覺、非純視覺、5顆激光雷達,8顆激光雷達,這都不重要,只要用戶的成本是可接受的,體驗是安全舒心的,這都是挺好的。”雷峰網(公眾號:雷峰網)
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。