• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
    此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
    人工智能學(xué)術(shù) 正文
    發(fā)私信給陳彩嫻
    發(fā)送

    0

    MIT博士生楊珩:從L1到L5,自動駕駛的“攔路虎”可能是一個數(shù)學(xué)問題

    本文作者: 陳彩嫻 2021-10-10 12:14
    導(dǎo)語:越來越多人發(fā)現(xiàn),只是搞搞神經(jīng)網(wǎng)絡(luò)是無法實(shí)現(xiàn)自動駕駛的。

    上個月,我們報(bào)道了MIT在讀中國博士生、清華大學(xué)機(jī)械工程系校友楊珩開發(fā)用于提高自動駕駛安全性的可認(rèn)證感知算法一文,引起了部分讀者的關(guān)注。然而,當(dāng)時(shí)的報(bào)道較簡略,因此AI科技評論親自聯(lián)系了楊珩本人,圍繞「可認(rèn)證感知算法」這一較為陌生的概念再次進(jìn)行了補(bǔ)充交流。

    那么,什么叫做「可認(rèn)證感知算法」(Certifiable Perception Algorithm)?它對自動駕駛,或其他機(jī)器人(Robotics)方向的研究意義是什么?它的研究難點(diǎn)又是什么?

    事實(shí)上,「可認(rèn)證感知算法」最早是一個數(shù)學(xué)上的概念,在2016年由蘇黎世聯(lián)邦理工學(xué)院(ETH)數(shù)學(xué)系的教授、2018年斯隆研究獎獲得者 Afonso S. Bandeira 在“A Note on Probably Certifiably Correct Algorithms”一文中提出。

    針對許多優(yōu)化問題在獲得一個解時(shí)、沒有后驗(yàn)(a posteriori)證明該解是否為最優(yōu)解的情況,Bandeira 提出了一個 PCC(Probably Correct Certifiable)算法,不僅可以解決經(jīng)典的優(yōu)化實(shí)例問題,還可以提供一個「后驗(yàn)證書」(a posteriori certificate),向研究人員證明該解為最優(yōu)解。

    在 Bandeira 的這篇工作中,PCC算法也被應(yīng)用于機(jī)器學(xué)習(xí)的某些場景,比如學(xué)習(xí)隨機(jī)塊模型(stochastic block model)。本質(zhì)上,“certificate”是一個數(shù)學(xué)測度,揭示了研究人員求得的解與全局最優(yōu)解之間的差距。例如,當(dāng)差距非常小,只有一億分之一時(shí),那么研究人員就能知道,該解已是近似最優(yōu),可以視為全局最優(yōu)。

    受此啟發(fā),楊珩從2018年開始研究可認(rèn)證感知算法,如今已取得一系列成果。


    1. 什么是可認(rèn)證算法?

    在自動駕駛中,可認(rèn)證感知算法存在的核心意義,是提高車輛在駕駛過程中的安全性,防止意外事故的發(fā)生。

    如下圖所示,自動駕駛車輛A(即“robot”,機(jī)器人)在路上行駛的過程中,如“看”到一輛車B,用攝像頭拍攝一張照片,照片中會包含該車輛 B。我們假設(shè)車輛A的內(nèi)存里有B的3D模型,而車輛A的任務(wù)是估測B的位置和姿態(tài)(6D pose, 3D rotation and translation)。這時(shí),A 會用一個神經(jīng)網(wǎng)絡(luò)檢測出所攝2D平面圖像上的所有關(guān)鍵點(diǎn)(keypoints),如車輪、車燈、鏡子等等,然后將這些所識別出的目標(biāo)與3D模型上的關(guān)鍵點(diǎn)進(jìn)行數(shù)據(jù)關(guān)聯(lián)(data association),識別物體是車鏡、車燈或其他元件。

    MIT博士生楊珩:從L1到L5,自動駕駛的“攔路虎”可能是一個數(shù)學(xué)問題

    如果神經(jīng)網(wǎng)絡(luò)所檢測出的關(guān)鍵點(diǎn)與數(shù)據(jù)關(guān)聯(lián)都是正確的,那么自動駕駛的視覺感知挑戰(zhàn)(比如估測車輛B的位置和姿態(tài))在轉(zhuǎn)為數(shù)學(xué)優(yōu)化問題時(shí)則相對好解。但在實(shí)踐中,神經(jīng)網(wǎng)絡(luò)往往會出錯。神經(jīng)網(wǎng)絡(luò)的前端可能會輸出錯誤的關(guān)鍵點(diǎn),比如,有可能將檢測出來的鏡子識別為汽車的輪子,從而建立一些不正確的關(guān)聯(lián),也就是所謂的「異常值」(outliers,上圖的紅色連線)。

    在這種情況下,我們往往難以區(qū)分 2D 平面圖像與 3D 汽車模型中的對應(yīng)關(guān)系中,哪些是正確數(shù)據(jù)(inliers)、哪些是異常數(shù)據(jù)(outliers)。這時(shí),自動駕駛車輛 A 在估測車輛 B 的姿態(tài)時(shí),如果估計(jì)正確,那么線框圖會對應(yīng)地重疊在 A 所拍攝的 2D 圖像上;若估計(jì)錯誤,則 2D 圖像上會出現(xiàn)許多紅點(diǎn)(如上圖最右上角所示)。

    一旦估計(jì)出錯,自動駕駛車輛則可能發(fā)生碰撞等安全事故問題。比方說,自動駕駛車輛A感知到同時(shí)行駛在一條馬路上的車輛 B 的存在。B 距離 A 實(shí)際只有3米,但如果估計(jì)錯誤,判斷 B 距離 A 有10米,那么 A 可能就會加速行駛,造成嚴(yán)重的事故。

    所以,用于估計(jì)車輛姿態(tài)的算法不僅要告訴研究人員一個正確的結(jié)果,還要解釋這個結(jié)果有多么地正確(即解與最優(yōu)解之間的距離)。當(dāng)算法失敗時(shí),算法也應(yīng)向駕駛自動車輛的人(或者系統(tǒng))傳遞一個信號,使駕駛員能采取其他的行動,比如接管方向盤、停車或及時(shí)尋求他人支援等。這,也是「可認(rèn)證感知算法」的具體內(nèi)涵。因此,在「安全第一」的自動駕駛領(lǐng)域,可認(rèn)證感知算法具有深遠(yuǎn)的現(xiàn)實(shí)意義。

    但話說回來,「可認(rèn)證算法」所扮演的角色雖然聽起來很簡單,研究起來卻并不容易,因?yàn)樵谶@個研究的過程中涉及到了對截?cái)嘧钚《朔ǎ═runcated Least Squares, TLS)的求解。TLS是一個非凸優(yōu)化問題,其可行域集合可能存在局部最優(yōu)點(diǎn),但求解全局最優(yōu)的難度相當(dāng)于NP難題。

    因此,盡管早期歐洲有些學(xué)校也沿著可認(rèn)證算法的方向研究,但他們解決問題的切入點(diǎn)只停留在建模階段,且面向的場景為沒有異常值的情況。

    基于Bandeira的工作,楊珩與他的博士導(dǎo)師 Luca Carlone 還就「可認(rèn)證算法」制定了更高的標(biāo)準(zhǔn)。

    假設(shè)算法為 A,A 的目標(biāo)是解決優(yōu)化問題 P,而優(yōu)化問題取決于輸入數(shù)據(jù) D。那么,如果該算法是可認(rèn)證的,則必須同時(shí)滿足三個條件:

    1)A 必須是多項(xiàng)式算法(polynomial algorithm),理論上必須要快;

    2)在解決 P 后,A 要么得到一個全局最優(yōu)解,以及證明該解為全局最優(yōu)的“證書”(certificate);要么失敗,沒有得到全局最優(yōu)解,只得到所謂的“measurable suboptimality”,即所求得的解與全局最優(yōu)解之間的距離;

    3)對于大部分 D,A 都能將 P 解到全局最優(yōu)。

    第三個條件由楊珩與 Luca Carlone 添加,目的是為了排除近似算法。所謂“近似算法”(approximate algorithm),指的是算法得到的解永遠(yuǎn)只能是近似最優(yōu)。在自動駕駛中,近似算法相當(dāng)于在任何情況下都無法取得全局最優(yōu)解,一直“報(bào)錯”,這會對駕駛安全造成極大隱患。

    所以,在楊珩與團(tuán)隊(duì)的假設(shè)中,A 只有在處理大多數(shù)不同情形時(shí)能得到全局最優(yōu)解,才能被稱為「可認(rèn)證算法」,滿足自動駕駛的安全需求。


    2. “非凸”轉(zhuǎn)“凸”

    2018年12月,楊珩加入麻省理工學(xué)院信息與決策系統(tǒng)實(shí)驗(yàn)室(Laboratory for Information & Decision Systems, LIDS),師從MIT萊納多職業(yè)發(fā)展副教授 Luca Carlone,開始從事計(jì)算機(jī)視覺與機(jī)器人的結(jié)合研究。

    一開始,他們只是從一個小的點(diǎn)云配準(zhǔn)/重建(point cloud registration)問題出發(fā)。所謂“點(diǎn)云配準(zhǔn)”,指的是求兩個點(diǎn)云之間的旋轉(zhuǎn)平移矩陣,將源點(diǎn)云變換到與目標(biāo)點(diǎn)云相同的坐標(biāo)系下。比如,一輛車無人車分別處在 a 點(diǎn)與 b 點(diǎn),用無人車點(diǎn)雷達(dá)分別對著一棟樓掃一下,再把兩張掃描的圖融合在一起。

    他們針對這個問題設(shè)置了一個可認(rèn)證算法,并在2019年1月投了一篇文章到機(jī)器人頂會 RSS(Robotics: Science and System),文章被接收。在這篇工作中,他們使用TLS來重新設(shè)計(jì)點(diǎn)云優(yōu)化估測問題,使估計(jì)對大部分虛假的點(diǎn)到點(diǎn)對應(yīng)關(guān)系不敏感,可以容忍高達(dá) 99% 的異常值(outliers)。

    MIT博士生楊珩:從L1到L5,自動駕駛的“攔路虎”可能是一個數(shù)學(xué)問題


    圖注:楊珩被 RSS 2019 接收的工作,論文地址為 https://arxiv.org/pdf/1903.08588.pdf

    但是,他們在 RSS 2019 中提出的可認(rèn)證算法精確度并不夠突出,有時(shí)無法滿足上述所說的第三個條件(對大部分輸入數(shù)據(jù)都能獲得最優(yōu)解)。許多時(shí)候,該算法得到的差距至多是 1e-2、1e-3,而不是1e-6或1e-10等接近0的差距。

    從 RSS 2019 開始,他們就一直在研究可認(rèn)證算法。

    2019年2月左右,楊珩用兩周時(shí)間獨(dú)自琢磨,看了許多數(shù)學(xué)資料,嘗試換一種對原問題(TLS)的求解方法。他從一個數(shù)學(xué)思維出發(fā),提出了半正定規(guī)劃(Semidefinite Programming)松弛,將非凸優(yōu)化問題 TLS 轉(zhuǎn)化為凸優(yōu)化問題。這個方法十分成功,他們投到了 ICCV 2019,被成功接收。

    MIT博士生楊珩:從L1到L5,自動駕駛的“攔路虎”可能是一個數(shù)學(xué)問題

    圖注:楊珩被 ICCV 2019 接收的工作,論文地址為 https://arxiv.org/pdf/1905.12536.pdf

    對楊珩來說,ICCV 2019 的這篇工作有里程碑式的紀(jì)念意義:因?yàn)槟瞧恼率堑谝粋€能將有異常值(outliers)的機(jī)器人感知問題在多項(xiàng)式時(shí)間內(nèi)(polynomial time)解到全局最優(yōu)(global optimality)的工作。我們設(shè)計(jì)的半正定規(guī)劃松弛(SDP relaxation)是extremely tight,那個算法幾乎對所有問題都能得到全局最優(yōu),而且它解的原問題是一個帶有二元變量(+1 和 -1,mixed integer)的非凸問題。這種問題是一個NP-hard問題。

    Wahba 問題,又稱為“旋轉(zhuǎn)搜索”,旨在找到最佳旋轉(zhuǎn)以在給定的對應(yīng)關(guān)系下對齊兩組向量觀察,是許多計(jì)算機(jī)視覺和機(jī)器人應(yīng)用中的基本研究(比如可以用作衛(wèi)星的定位)。在 ICCV 2019 中,楊珩針對大量向量觀測值為異常值(outliers)的情況,提出了第一個多項(xiàng)式時(shí)間可證明的最優(yōu)方法來解決 Wahba 問題。

    在這篇工作中,除了使用 TLS 成本來制定 Wahba 問題,他們還開發(fā)了凸半定規(guī)劃(SDP)松弛來解決非凸問題。他們提出可認(rèn)證算法 QUASAR (基于 QUAternion 的半定松弛法,用于魯棒對齊),即使在面臨大量噪聲與異常值的情況下(比如多余95%的異常值),他們的松弛也很“緊”,算出可證明的全局最優(yōu)解(即松弛是精確的),優(yōu)于魯棒的局部優(yōu)化算法 RANSAC。

    “非凸”轉(zhuǎn)“凸”,是楊珩提出的算法能夠在大部分輸入數(shù)據(jù)中求得全局最優(yōu)解的關(guān)鍵點(diǎn)。憑借這一主導(dǎo)思想以及后續(xù)的一系列工作,楊珩獲得 ICRA 2020 的機(jī)器視覺最佳論文獎,還入圍了 RSS 2021 最佳論文獎最終名單。

    如前所述,TLS是一個非凸優(yōu)化問題,基本框架如下:

    MIT博士生楊珩:從L1到L5,自動駕駛的“攔路虎”可能是一個數(shù)學(xué)問題

    非凸問題幾乎是無法快速求得全局最優(yōu)解的,但是,我們可以通過凸松弛方法,將非凸問題轉(zhuǎn)為凸問題。這個過程就相當(dāng)于以退為進(jìn):當(dāng)你面對一道難題(如非凸問題)、不知所措時(shí),你可以先把它轉(zhuǎn)化成一個較為簡單的問題(如凸問題),然后去求解這個簡單的問題。解完簡單的問題后,你會知道簡單的問題 B 與原問題 A 是否等價(jià)。

    更有意思的是,在解出簡單問題 B 之前,你并不知道簡單問題 B 是否與難問題 A 是否等價(jià)。但當(dāng)你解完 B 后,你會檢驗(yàn)該解是否滿足原問題的某些條件、從而推測問題 B 與問題 A 是否等價(jià)。如果滿足,那么凸問題被解,實(shí)際上也就意味著原來的非凸問題已經(jīng)解決。

    「有點(diǎn)“事后諸葛亮”的感覺。」楊珩形容。從理論上講,一般性的凸問題也是NP-hard問題,目前在多項(xiàng)式時(shí)間內(nèi)是不可求解的,但極個別凸問題,比如SDP的優(yōu)點(diǎn)是:可以在多項(xiàng)式時(shí)間內(nèi)求出全局最優(yōu)解。在這個凸問題中,所有局部最優(yōu)都是全局最優(yōu)。

    在“非凸”轉(zhuǎn)“凸”的過程中,楊珩的靈感也源自一個非常著名的數(shù)學(xué)“松弛”理論:2001年,法國數(shù)學(xué)家 Jean B. Lasserre 在數(shù)學(xué)頂刊《SIAM Journal on Optimization》上發(fā)表了一篇著名的文章,叫“Global optimization with polynomials and the problem of moments”(引用量已超過2600),里面提到:

    非凸問題永遠(yuǎn)不可能等價(jià)于凸問題,但如果滿足一定條件,我們就可以用一個足夠大的凸問題來逼近/解決一個非凸問題。不過,我們并不明確該非凸問題有多大,它可能是無限大。

    這是一個十分優(yōu)美的理論。假設(shè)非凸問題是迷霧中的一座小島,那么凸問題就是一片不斷在尋找島嶼邊界的汪洋,摸索,定義,直至幾乎全部包圍,不斷接近真實(shí)的全貌。

    但也不難推測,在這個“松弛”的過程中,研究會面臨兩個難點(diǎn):

    1)如何用一個足夠小的凸問題來解決非凸問題?比方說,原來的非凸問題可能只有100個參數(shù)要求解,但你要解的凸問題可能有100萬個參數(shù)。也就是說,你需要解一個非常大的凸問題,才能解原來的非凸問題。

    2)楊珩觀察到,雖然只要解決一個包含100萬參數(shù)的凸問題、就能解原來只有100個參數(shù)的凸問題,但目前在數(shù)學(xué)上,沒有一個求解器可以解決這么大的凸問題。在楊珩的研究中,他所用于求解非凸問題的凸問題是“半正定規(guī)劃”問題(Semidefinite Programming, SDP),屬于凸問題里最難的一類。

    從理論上講,要解決原來的非凸問題 TLS,轉(zhuǎn)換的凸問題可能要無限大,不止100萬個參數(shù),也可能是1000萬、1億、10億甚至上百億。針對第一個難點(diǎn),楊珩及團(tuán)隊(duì)用真實(shí)計(jì)算顯示:轉(zhuǎn)化的凸問題(即SDP問題)不需要無限大,只需要一個最小的凸問題(參數(shù)量為100萬),即可解決原來的非凸問題。

    而且,在將非凸問題(下圖左)轉(zhuǎn)為凸問題(下圖右)的過程中,算法不僅在凸問題上求解,還會將凸問題的解投射到原來的非凸問題中,來回求解。在這個過程中,非凸問題的解會加速凸問題的求解,非凸問題的局部最優(yōu)也可以映射到凸問題的頂點(diǎn)(vertexes),加速求解。目前,他們的工作是第一次在SDP求解中用到了這種「不舍原問題」的求解思想,極具創(chuàng)新。

    MIT博士生楊珩:從L1到L5,自動駕駛的“攔路虎”可能是一個數(shù)學(xué)問題

    而對于第二個難點(diǎn),楊珩他們所面臨的難點(diǎn)是:目前市面上現(xiàn)有的求解器最多只能求解規(guī)模為小到中等的 SDP 問題。所以,他們只能自己研發(fā)求解器。


    3. 研發(fā)求解器 STRIDE

    找到全局最優(yōu)解,與證明全局最優(yōu)解,是兩碼事。比如,在ICRA 2020的機(jī)器視覺最佳論文獎中,楊珩所提出的算法便能快速找到全局最優(yōu)解,但是無法證明該解是全局最優(yōu),即找不到一個明確的“證書”(certificate)來佐證。

    楊珩解釋,從本質(zhì)上看,Robotics(關(guān)于機(jī)器的學(xué)科)的核心是優(yōu)化,車輛的3D姿態(tài)估計(jì)便是在解一個優(yōu)化問題。不僅是感知,自動駕駛中的車輛控制、規(guī)劃等,都是在解決優(yōu)化問題。

    針對不同的優(yōu)化問題,研究人員會使用不同的優(yōu)化框架,并根據(jù)某個特定的框架尋找是否有合適的求解器。研究分為兩步進(jìn)行:建模(modeling)與求解(solving)。

    所謂「建模」,就是將一個真實(shí)世界的問題(如上述所說的自動駕駛汽車感知周圍事物)轉(zhuǎn)化為一個數(shù)學(xué)問題。建模完成后,解決這個數(shù)學(xué)優(yōu)化問題的過程就叫做「求解」。一般情況下,目前在機(jī)器人(Robotics)領(lǐng)域,大多數(shù)工作都是只做建模,僅依靠現(xiàn)存的求解器來解決數(shù)學(xué)上的優(yōu)化問題。楊珩的博士導(dǎo)師 Luca Carlone 此前便主要做建模。

    但在研究可認(rèn)證算法的過程中,他們發(fā)現(xiàn),如果只做建模是無法解決100萬參數(shù)量的問題。市面上也沒有成熟的SDP求解器可以幫助他們解決這個問題,所以他們只能自己去開發(fā)求解器。

    從2019年開始,他們就在尋找適合的求解器。一開始,他們的問題也沒有包含那么多的變量,現(xiàn)有求解器已能滿足這個凸問題的計(jì)算要求。直到去年9月,他們的研究要面臨越來越多的參數(shù)量,才發(fā)現(xiàn)「還是得自己開發(fā)求解器,因?yàn)楝F(xiàn)有的求解器解決不了我們的問題。」

    從去年9月到今年4月,他們一直在嘗試不同的求解器,發(fā)現(xiàn)結(jié)果均不盡如人意。于是,他們就去找了新加坡國立大學(xué)數(shù)學(xué)系的系主任 Kim-Chuan Toh 和他的學(xué)生 Ling Liang,與他們一起合作,針對待解凸問題的特質(zhì),用大約 4 個月的時(shí)間開發(fā)出了一個主要面向 SDP 問題的約束求解器——STRIDE。(STRIDE的源碼目前已在Github上公開:https://github.com/MIT-SPARK/STRIDE)

    開發(fā)求解器的難點(diǎn),主要是利用好待解決問題的優(yōu)勢。半正定規(guī)劃(SDP)是一個很大的數(shù)學(xué)問題,而楊珩要解決的SDP問題除了通用特征,還有一些特殊的性質(zhì)。比如,它的最優(yōu)解是低階(low rank)。

    而有了 STRIDE 的助力后,楊珩所提出的可認(rèn)證感知算法在求解速度與準(zhǔn)確度上均有了明顯的提升。

    如下圖所示,原來的非凸問題 TLS 只有 54 個變量時(shí),它所對應(yīng)的凸問題 SDP 至少有 8154 個變量;TLS 只有 1004 個變量時(shí),SDP 問題的變量超過了 300 萬。MOSEK 與 SDPT3 被視為目前最出色的 SDP 求解器,但隨著問題的變量越來越多,MOSEK 與 SDPT3 不僅無法求解,甚至連存儲該問題的內(nèi)存都沒有。

    MIT博士生楊珩:從L1到L5,自動駕駛的“攔路虎”可能是一個數(shù)學(xué)問題

    在上圖中,1e-10、1e-12等數(shù)值為精確度。數(shù)值越低,求解的精確度越高。從第 1 行到第 5 行,優(yōu)化的問題越來越大,測度(measurement)越來越多。回到一開始的例子,就是自動駕駛車輛周圍的汽車越來越多,汽車的關(guān)鍵點(diǎn)與連線也會越來越多。

    實(shí)驗(yàn)證明,當(dāng)問題的維度(dimension)較低時(shí),SDPT3 和 MOSEK 可以求解,但速度不到 STRIDE 的二分之一。比如,在維度為 104 時(shí),MOSEK 的求解時(shí)間是 870 秒,而 STRIDE 只需 45 秒;維度為 204 時(shí),MOSEK 無法求解,而其他算法雖然可以解,但卻解不到全局最優(yōu),精確度不夠。當(dāng)維度達(dá)到 1004 時(shí),即使給再多的運(yùn)行時(shí)間,其他求解器也無法達(dá)到與 STRIDE 相匹配的精確度。

    楊珩介紹,他們所提出的算法是目前唯一能夠解決大規(guī)模一階(rank-one)SDP問題的方法。他們在百度的自動駕駛數(shù)據(jù)集 Apollo Scape (圖像采集自北京、上海與深圳)上做過實(shí)驗(yàn),STRIDE 的性能明顯優(yōu)于 MOSEK 等求解器。

    MIT博士生楊珩:從L1到L5,自動駕駛的“攔路虎”可能是一個數(shù)學(xué)問題

    此前,他們的工作曾發(fā)表在 NeurIPS 2020 上,但當(dāng)時(shí),算法只解決了 4 個常見的感知問題。加上 STRIDE 后,他們嘗試將算法拓展至更廣泛的設(shè)置下進(jìn)行,解決了 6 個感知問題,包括單點(diǎn)旋轉(zhuǎn)均勻(single rotation averaging)、多點(diǎn)旋轉(zhuǎn)均勻(multiple rotation averaging)、點(diǎn)云配準(zhǔn)、網(wǎng)格配準(zhǔn)、絕對姿態(tài)估計(jì)與分類感知。

    MIT博士生楊珩:從L1到L5,自動駕駛的“攔路虎”可能是一個數(shù)學(xué)問題

    求解器的核心思想是優(yōu)化與決策,而自動駕駛的運(yùn)行就是“robot”(汽車)一直在做決策。比如,自動駕駛車輛要從 a 點(diǎn)走到 b 點(diǎn),而 a 點(diǎn)與 b 點(diǎn)之間有一個障礙物,那么,規(guī)劃一條從 a 點(diǎn)到 b 點(diǎn)的最短路線,便是一個近似優(yōu)化問題。

    楊珩還介紹,STRIDE求解器不僅可以解決機(jī)器視覺問題,還有望解決一些數(shù)學(xué)問題。他們最近做了一些新的工作,便計(jì)劃投到數(shù)學(xué)類的期刊與會議上。


    4. 數(shù)學(xué)不可或缺

    目前,楊珩的工作還處于學(xué)者討論的階段,距離落地還有一段很長的距離。

    盡管他們的算法在求解速度上已經(jīng)很快,但實(shí)際的求解時(shí)間也要 1 個小時(shí)。如果可認(rèn)證算法要在現(xiàn)實(shí)中落地,那么求解時(shí)間至少要從 1 個小時(shí)縮減到 1 秒。雷鋒網(wǎng)

    「很多人認(rèn)為自動駕駛很簡單,那或許是因?yàn)樗麄冞€沒有體會到數(shù)學(xué)和科學(xué)計(jì)算有多難。」楊珩感嘆,「從 L1 到 L5,自動駕駛要解決的都是數(shù)學(xué)問題。越來越多人發(fā)現(xiàn),自動駕駛不是只依靠神經(jīng)網(wǎng)絡(luò)就能成功。」雷鋒網(wǎng)

    盡管如此,楊珩的可認(rèn)證感知算法仍有存在的意義:「我可以認(rèn)證,只是我現(xiàn)在認(rèn)證的時(shí)間比較長而已。」在未來,計(jì)算硬件的提升可能會帶來問題的突破。

    對楊珩等癡迷理論研究的科研者來說,在研究可認(rèn)證算法的過程中,「非凸」轉(zhuǎn)「凸」的成功,才是一件比求解時(shí)間從 1 小時(shí)縮減到 1 秒更令人激動的突破。

    在研究的過程中,楊珩受到許多數(shù)學(xué)知識的幫助與啟發(fā),也取得了不少突破性的成果。因此,他覺得數(shù)學(xué)在視覺算法研究(和其他科學(xué)研究)中是一門十分重要的學(xué)科:

    硬核數(shù)學(xué)問題會非常考驗(yàn)人的耐心。我覺得有時(shí)候也不是難不難的問題,而是你能不能花一天的時(shí)間看一篇數(shù)學(xué)文章,搞懂這篇文章的所有細(xì)節(jié)。有可能你看了5遍之后,你就會醍醐灌頂。在那一瞬間,這個方法成為了你自己的方法。一旦你掌握了這個方法之后,你就會發(fā)現(xiàn)這個方法特別地 powerful(強(qiáng)大),可以將它應(yīng)用到很多別的方案中。雷鋒網(wǎng)

    如果有一天,你能想明白數(shù)學(xué)家是怎么理解問題的,可能你的境界就高了一層。

    談到未來的研究方向,楊珩的愿望之一是用可認(rèn)證算法來指導(dǎo)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程,提高神經(jīng)網(wǎng)絡(luò)的安全性。

    少年新馬,未來可期。

    參考鏈接:

    1. A. Bandeira. A note on probably certifiably correct algorithms. Comptes Rendus Mathematique, https://arxiv.org/pdf/1509.00824.pdf


    雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

    MIT博士生楊珩:從L1到L5,自動駕駛的“攔路虎”可能是一個數(shù)學(xué)問題

    分享:
    相關(guān)文章
    當(dāng)月熱門文章
    最新文章
    請?zhí)顚懮暾埲速Y料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗(yàn)證郵箱
    您的郵箱還未驗(yàn)證,完成可獲20積分喲!
    請驗(yàn)證您的郵箱
    立即驗(yàn)證
    完善賬號信息
    您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
    立即設(shè)置 以后再說
    主站蜘蛛池模板: 4399理论片午午伦夜理片| 久热香蕉精品视频在线播放| 精品尤物国产尤物在线看| 老司机精品影院一区二区三区| 中文天堂最新版www| 亚洲日韩图片专区第1页| 18禁无遮挡国产免费观看| 日本xxxx色视频在线观看| 日本精品毛片| 精品国产女同疯狂摩擦2| 久久国产免费观看精品3| 国产精品一区二| 国产一区国产精品自拍| 五月婷婷中文字幕| 丰满爆乳一区二区三区| 69视频99视频| 99久久久无码国产精品9| 99精品久久毛片a片| 日韩精品成人一区二区三| 岛国无码AV| 武装少女在线观看高清完整版免费| 美女丝袜诱惑一区二区三区| 国产成人精品三级麻豆| 国产精品成人午夜久久| 人妻av一区二区三区| 精品无码一区二区三区视频| 医院人妻闷声隔着帘子被中出 | 欧美性爱在线| A级毛片免费完整视频| 国产免费av网站| 国产乱人伦精品| 久久国产综合尤物免费观看| 一本一本久久a久久综合精品| 欧美又黄又大又爽a片三年片| 国产精品 精品国内自产拍| 在线免费观看亚洲天堂av| 中文字幕乱偷乱码亚洲| 亚洲欧美中文日韩v在线97| 日韩精品一区二区高清视频| 久久久久久久av| 国产亚洲精品综合99久久|