• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能學術 正文
    發(fā)私信給陳彩嫻
    發(fā)送

    0

    一份來自賈揚清的AI青年修煉指南:不存在算法工程師、調(diào)參俠沒有市場

    本文作者: 陳彩嫻 2020-09-01 17:06
    導語:在討論中,賈揚清認為:沒有算法工程師這個角色,只有兩個角色,一個是算法的研究人員,一個是應用的工程師,而“調(diào)參俠”沒有市場。

    一份來自賈揚清的AI青年修煉指南:不存在算法工程師、調(diào)參俠沒有市場

    算法工程師不僅需要具備牛逼的算法能力,還要精通業(yè)務、善于溝通?(小本子趕緊記下來!)

    8月23日晚,知乎直播“AI時代聽大咖聊”邀請到AI領域的兩個大神,分別是阿里云智能高級研究員賈揚清,以及知乎CTO李大海。

    在直播中,賈揚清與李大海就國內(nèi)外AI研究區(qū)別、在校生/職場新人如何培養(yǎng)自己的AI才能、AI應用落地,以及AI在未來的發(fā)展趨勢展開討論。

    在討論中,賈揚清認為:沒有算法工程師這個角色,只有兩個角色,一個是算法的研究人員,一個是應用的工程師,而“調(diào)參俠”沒有市場。

    另外,作為Caffe、PyTorch和Tensorflow曾經(jīng)的核心開發(fā)者,他還提到,深度學習框架并不會出現(xiàn)大一統(tǒng)的局面,因為現(xiàn)實中需求很多,并沒有一家機器學習框架能夠囊括所有的需求。

    一份來自賈揚清的AI青年修煉指南:不存在算法工程師、調(diào)參俠沒有市場視頻鏈接:https://www.zhihu.com/zvideo/1280989974280634368

    AI科技評論對本次分享作了不改變原意的整理與編輯:


    1

    “專業(yè)”除草,沒想到賣了3億美元

    Q1:能否請兩位聊一下國內(nèi)外做AI領域的研究有什么區(qū)別?

    賈揚清:首先,國內(nèi)外的工程師都很用功,而且都追求最新的技術。個人認為國內(nèi)的工程師更關注如何把方法與業(yè)務結合起來,而國外在AI方面有一些很好玩的事情。

    舉兩個例子:一個是,如今很多農(nóng)產(chǎn)品(比如黃瓜)在運去超市前需要篩選出大小、質(zhì)量等許多方面合格的產(chǎn)品。以前都是用手分揀的,很麻煩,但自從有了深度學習的框架TensorFlow之后,有精通工程的年輕農(nóng)民就結合算法,使用機器學習自動對黃瓜進行分類,實現(xiàn)了:大一點的黃瓜送超市,小一點的拿去做零售。

    第二個是,我有一個研究生同學把Raspberry Pi放在后院,后院里有一個喂鳥的地方,松鼠經(jīng)常過來,他就拿那個Raspberry Pi識別松鼠,松鼠一來就把它趕走。這些技術看著好像沒有什么用處,但后來產(chǎn)生了非常多應用。硅谷有一個公司叫Blue River Technology,他們做的事情是運用技術在田間地頭找雜草、除雜草,有點類似篩黃瓜、找松鼠。這個公司后來被美國最大的農(nóng)機制造商約翰迪爾公司以3億美元收購了。他們很多時候是出于純粹的技術好奇心,但后來創(chuàng)造了一個產(chǎn)業(yè)。我覺得這是國外蠻有意思的一點。

    一份來自賈揚清的AI青年修煉指南:不存在算法工程師、調(diào)參俠沒有市場直播截圖 

    李大海:揚清講的這個公司我有印象,他們通過識別雜草、然后定點噴灑除草劑,雜草率可以降低到原來的10%。硅谷的公司一直有這個文化。當時我在谷歌的時候,Eric(谷歌執(zhí)行董事長)曾經(jīng)講過一個很好玩的故事:當時在谷歌有一個柜子專門放T恤。在谷歌,無論發(fā)生什么,他們都會把事件印在T恤上,不定期往柜子里塞,然后大家去搶。當時柜子附近有一個攝像頭,Eric就基于攝像頭寫了一些代碼去監(jiān)控這個柜子。一旦識別出這個柜子附近有人,攝像頭就會發(fā)出“警報”來通知Eric,然后Eric一看到有人往柜子里面塞T恤就去搶。在美國,這些工程師會自發(fā)地去做這種(技術應用的)微創(chuàng)新。

    國內(nèi)工程師在創(chuàng)新方面與國外可能有一些差別。目前國內(nèi)的AI應用場景已經(jīng)很廣。比如說,在知乎的工程團隊里,大概1/6的人都是算法工程師。在工業(yè)界,算法確實已經(jīng)滲透到應用場景的方方面面。第二點是,AI應用從互聯(lián)網(wǎng)開始逐漸推向越來越多的傳統(tǒng)企業(yè)和傳統(tǒng)行業(yè)。但在個人層面,與國外相比,國內(nèi)的工程師可能較少會自發(fā)去發(fā)現(xiàn)一些微小的創(chuàng)新機會,并實現(xiàn)它。


    2

    如何優(yōu)雅入“AI”這個坑

    Q2:作為一個在校生,我要如何將學習與業(yè)務結合,如何培養(yǎng)自己的AI能力、才能進入比較好的互聯(lián)網(wǎng)公司呢?

    李大海:我們一般稱掌握了AI知識的同學為“算法工程師”。算法工程師在本質(zhì)上首先是一個工程師,所以一個工程師所具備的能力,算法工程師也應該具備,例如說:1)代碼能力,能夠通過代碼實現(xiàn)自己的想法;2)數(shù)據(jù)能力,即能夠對數(shù)據(jù)進行分析,并發(fā)現(xiàn)數(shù)據(jù)所包含的重點,同時對數(shù)據(jù)進行處理;3)與人溝通的能力,因為算法工程師都是在團隊里面工作,不是單打獨斗,所以需要能夠與同組的其他工程師、產(chǎn)品經(jīng)理、測試和其他同事進行溝通。

    第二點是算法工程師需要培養(yǎng)業(yè)務能力,即對業(yè)務的理解。工程師首先要掌握業(yè)務應用的知識。業(yè)務場景非常多,但每個場景所面臨的問題是不一樣的,所以算法工程師一定要理解業(yè)務到底是需要解決什么問題,具備定位問題、發(fā)現(xiàn)問題、拆解問題和解決問題的能力。

    綜上,對于在校生來說,擁有對算法的理解能力是非常重要的特質(zhì)。雖然算法工程師都喜歡自黑,稱自己是“調(diào)參俠”,但除了調(diào)參之外,還需要知道算法背后的原理。我們現(xiàn)在處于深度學習時代,但是在“前深度學習時代”有很多淺層模型,這些模型因為沒有深度學習碾壓式的表達能力,所以在淺層模型上做了很多思考。

    個人認為:“當年”那些模型所用到的技巧對于培養(yǎng)機器學習的能力和解決現(xiàn)實問題是非常重要。

    一份來自賈揚清的AI青年修煉指南:不存在算法工程師、調(diào)參俠沒有市場       直播截圖

    賈揚清:同意大海的觀點:分析問題,定義問題,然后解決問題的整個邏輯非常重要。在校生得到的訓練更多是:如何解決問題的能力。但其實如果問題定義清楚了,解決問題的方法就會出現(xiàn)很多。

    另外,從工程的角度補充兩點:第一,如何獲取最新的技術和算法?現(xiàn)在整個開源領域進展迅速。其實,不光是開源,也有很多開發(fā)支持平臺。所以,大家可以保持好奇心,然后多帶著玩的心態(tài)進行嘗試。例如三年前,名為叫Neural Style Transfer的AI應用,將拍的照片上傳之后,就可以轉換成一張類似梵高風格的藝術照。

    一份來自賈揚清的AI青年修煉指南:不存在算法工程師、調(diào)參俠沒有市場

    第二是,“摸透”應用的實現(xiàn)流程。落地應用是“曇花一現(xiàn)”,但應用背后所涉及的工程步驟,例如把算法快速地迭代出來、如何做算法優(yōu)化、如何把算法放到手機上,如何上線,等等。這種實際操作的流程和只看論文和demo是不一樣的。今天,我們有GitHub這類的開源社區(qū),很多實際操作都比以前更加容易。

    李大海:我想補充一點。有段時間我訂閱過arXiv上面的 topic,但我發(fā)現(xiàn)這是個坑。arXiv最近在機器學習領域非常火熱,每天都大量的論文發(fā)布出來,其中包含很多不同領域的或大或小的突破,這其實會讓人眼花繚亂。所以在這種情況下,我給學生們的建議是:自己先抓住一個重點(領域),至于其他領域,簡單了解那些技術和突破是什么就好。

    Q3:假設一個同學已經(jīng)入職了,已經(jīng)成為算法工程師,他可能會經(jīng)歷初級、中級、高級三個階段。所以,關于初級算法工程師怎么晉升到中級算法工程師,以及中級算法工程師怎么晉升到高級算法工程師,兩位有何看法?

    賈揚清:我覺得挺重要的一點是學習是所謂的engineering practice(工程實踐)。很多時候,我們在寫研究代碼時,跟研究本質(zhì)是一樣的,因為研究是快速迭代,不需要做工程實現(xiàn)。假如,今天要上線一個功能,不僅要保證它的整個foundation(基礎)是solid(堅固)的。這時候,我們怎么做代碼的管理、協(xié)同、review(審查)、測試、CD和上線?怎么做 performance(性能)的benchmark(基準)跟profiling ?這一系列的工程流程也挺重要。

    第二點是保持好奇心。其實任何一個公司的平臺都是挺大的。拿阿里大數(shù)據(jù)和AI平臺來舉例子,像ODPS(Open Data Processing Service)大數(shù)據(jù)平臺是10年前開始建造的,今天平臺非常復雜,包括上層的C語言庫、中間的 Query Optimization(查詢優(yōu)化)和底層的執(zhí)行調(diào)度,肯定不能完全把握。在這個時候,算法工程師就要與他人保持交流,多提問、多討論。就像T型,對系統(tǒng)的某一點了解特別深,對系統(tǒng)的其他部分就觸類旁通。逐漸成為一個高級算法工程師之后呢,成為一個架構師所擁有的能力,其實也能使得我們在更看得更寬、看得更大的同時,有一個更加全局的系統(tǒng)架構的視野。

    Q4:揚清有沒有一些具體的建議?比如說你在學生時代是怎么學習的?用什么途徑獲取到新的 AI資訊,遇到問題怎么解決?

    賈揚清:在我學生時代,當時大家了解深度學習的算法是通過看論文,看完論文后大概就知道怎么做架構設計。在看論文的過程中會有非常多的輸入,比如我們學到,人們最開始寫深度學習框架的時候(Torch是2000年左右出來的,Theano是2008年出來的),它們的架構設計怎么做神經(jīng)網(wǎng)絡、怎么做layer(層數(shù))等等,這對我們后來設計其他的框架,像Caffe、MXNet、PyTorch等等,是非常有幫助的。再比如說,我們怎么樣做模型civilization的格式化等等,這時候谷歌的ProtoBuf又是一個很好的測試框架,如G test。這些現(xiàn)有的工程實踐以及設計有現(xiàn)成的代碼、文檔和應用,看這些其實能夠在實際中提升自己的能力。

    李大海:我非常贊同揚清的觀點,就是在學校的時候我們會更關注代碼的算法上是否足夠精妙,但是對架構和工程的關注度是不夠的。我自己在早年的時候也犯過這樣的錯誤,像我們數(shù)學系畢業(yè)的,在工程上接受到的培訓是偏少的,但進入公司以后,工程實踐卻變得很重要。揚清之前在一次線下分享中曾提到的一句話我也很贊同,就是:AI是一個系統(tǒng)工程,90%的時間里所做的事情都跟算法無關。在現(xiàn)實中也確實是這樣。

    那么,作為剛入職的同學,其實首先我認為入職已經(jīng)晚了,在入職前就應該挑選一個在工程上相對規(guī)范的公司去入職。如果是一個小公司,自己又沒有工程上的 sense(意識),那么你進入的是一個工程規(guī)范很亂的一家公司,這對于個人的職業(yè)發(fā)展和工程能力的培養(yǎng)是很有問題的。

    Q5:想請問兩位 AI從業(yè)者,你們覺得跟其他AI從業(yè)者比,你們最大的優(yōu)勢是什么?

    賈揚清:在AI領域里,在業(yè)界做得非常成功的人或團隊都有一個特點,就是業(yè)務化。他們不光懂算法,而且懂得怎么用算法。因為在今天,算法已經(jīng)迅速普及,找一個研究生,兩分鐘就能搞出ResNet。

    另外,AI算法的創(chuàng)新在逐漸變慢。比如說,Bert在NLP領域,ResNet在CV領域都已經(jīng)比較成熟。雖然算法創(chuàng)新還可以稍微提升一下,但算法已經(jīng)不是一個核心的differentiate(區(qū)別點)。在這種情況下,怎么樣找到實際應用場景,如何把算法和應用結合起來,我覺得這是最能體現(xiàn)出價值的地方。所以,如今AI的突破可能不是在算法上,而是“算法+系統(tǒng)+應用”,而且應用可能會變得越來越重要。

    李大海:我們還處于AI的應用層。AI現(xiàn)在已經(jīng)是一個非常大的框,里面可以放非常多東西,領域也非常廣。我覺得我們更像是AI行業(yè)的從業(yè)者,是把AI當成一個功能強大的工具去使用。

    我們的團隊內(nèi)部曾經(jīng)很喜歡一個國外經(jīng)濟學家寫的一本書,叫《與運氣競爭》。

           一份來自賈揚清的AI青年修煉指南:不存在算法工程師、調(diào)參俠沒有市場       

    里面講到,當我們手上有一把鉆子的時候,很容易想到的是我拿著鉆子可以干嘛?但其實很多時候,用戶可能只需要鉆一個孔來掛衣服。所以,如果你想的總是“如何提高鉆頭的合金程度”、“讓它變得更好看”,這可能根本就不是用戶想要的。

    總的來說,工具非常重要,我們對于 AI的理解和AI前沿技術的跟蹤也很重要,但更重要的事情是:用戶的需求到底在哪里,我們能解決什么問題。


    3

    感知大神VS決策白癡

    Q6:現(xiàn)在人工智能處于什么發(fā)展階段?它未來會給我們帶來哪些改變?它的長期規(guī)劃可能是什么樣的?

    李大海:如果要判斷AI目前處于什么階段,我們得先知道AI的全景是什么樣子,但這個很難預測。這時又會涉及到:人工智能最后到底能走到什么階段?它能不能達到強人工智能的狀態(tài)?我的觀點是偏悲觀的,我覺得強人工智能可能永遠都達不到。

    但說到應用,我們可以看到,人工智能在許多領域里已經(jīng)打敗人了,比如說圖片分類。所以在應用層面上我是很樂觀的。人工智能的歷史始于20世紀初,后來經(jīng)歷了一些起起伏伏。

    到今天,AI可能有一些泡沫,但這個泡沫其實是AI公司在商業(yè)模式上遇到的問題。但從技術層面上講,AI這個工具越來越強大,數(shù)據(jù)量越來越大,這些都是毋庸置疑的事情,所以在應用層面上我是很看好的。

    賈揚清:從歷史的角度來看,計算機誕生的目的是為了更加智能化地處理人與世界交互的問題。在人工智能最早的時候,大家都在處理決策的問題。等決策系統(tǒng)做了一堆工作后,我們發(fā)現(xiàn),其實我們首先都還不知道這個世界是如何從一個像素、語音“導入”到計算機邏輯的系統(tǒng)里。所以在前面這幾年,深度學習其實是在從決策層面轉到感知層面,從而來解決感知的問題。

    從感知的角度來說,今天已經(jīng)相對較成熟。例如2014年,圖像識別的正確率在一個限定的范圍內(nèi)已經(jīng)超過人類。

    回過頭來看決策,人工智能的決策發(fā)展還不行。比如說,在自動駕駛里,我能感知這里有一輛車、那里有一個人,但是知道后如何做決策?邏輯是什么?甚至在一些更復雜的場景,例如限速25,但前面的車都超速往前開了,這時候我又怎么辦呢?這些事情都是要在決策層面上解決的。人工智能很有可能會先解決感知/認知問題,然后在感知的基礎上做決策。

    綜上,分領域來看,人工智能在認知領域已經(jīng)到達非常成熟的階段,但在決策領域可能還處于初期的探索。


    4

    AI離不開云

    Q7:有一句話叫“AI是云的內(nèi)核,云是AI的必然形態(tài)。”如何看AI和云的關系,以及AI在云里面扮演的角色。

    賈揚清:為什么今天我們說云和AI是一個強結合的狀態(tài)呢?我覺得原因可能有兩點:一是算力,二是數(shù)據(jù)。從算力的角度來說,以前我們在學校做實驗或自己創(chuàng)業(yè)的時候都搭過機器。搭機器很痛苦,而且運維機器在一定程度上不產(chǎn)生價值,然后AI又對GPU有非常強烈的需求。GPU又是一個很惡心的事,有時候運行不錯,有時候又會過熱,有時候又需要我們做資源的調(diào)度等等。任何一個實驗室都會遇到資源調(diào)度問題:一個是科研人員在那找GPU的時候發(fā)現(xiàn)找不著,然后系統(tǒng)工程師跑去一看,說:“哇天啊!利用率好低!”一邊是starvation(饑餓),一邊是satiation(飽和)。

    如今,云可以很好地解決算力問題。30年前,所有的單位都有一個發(fā)電機,但今天沒有人用發(fā)電機了,因為底層的基礎設施已經(jīng)非常成熟,可以低成本、大規(guī)模地給社會提供電力。在今天,云的計算力就像水電煤一般的基礎設施,我們不需要擔心哪天機器哪里出了問題。比如說,今天我突然要拉起一個大量的應用,這個時候云可以“soo”一聲彈上來,不要了就放掉。這是算力方面。

    第二個是數(shù)據(jù)。前段時間,許多人關注深度學習領域,如圖像、語音等等。但許多AI應用其實是跟結構化數(shù)據(jù)綁在一塊的。咱們舉個例子。比如說像知乎有大量的用戶內(nèi)容,這涉及到兩方面:一方面是自然語言的處理,另一方面是用戶和內(nèi)容的匹配。這時候,其實是在一個大數(shù)據(jù)底座(像Hadoop和MaxComput)上面做結構化數(shù)據(jù)的人工智能。

    這和一個大規(guī)模分布式系統(tǒng)是分不開的,因為我不可能今天說把這些數(shù)據(jù)放到一個GPU機器上面,拿三個SSD把它給接起來。所以這時候就需要一套比較完整的系統(tǒng),從數(shù)據(jù)的存儲、處理、分析到計算,到上層去進行任務的編排、模型的開發(fā)、模型的上線,以及數(shù)據(jù)的回流。無論用戶是自己搭一個系統(tǒng)(我們叫“私有云”),還是在公有云上面進行,云都是AI不可或缺的一個環(huán)境。

    今天的AI,越來越多會關注到系統(tǒng)、云。這也標志著AI未來發(fā)展的必然形態(tài)。目前,算法能夠“單機”開發(fā),但是如何運用算法,則需要算力和數(shù)據(jù)的支持,因此也會需要云和云相關的技術。

    我現(xiàn)在在做的工作是把AI和大數(shù)據(jù)進行結合。例如,前段時間我們發(fā)現(xiàn):深度學習的工程師會發(fā)現(xiàn)目前的大數(shù)據(jù)平臺不能滿足需求。因為過去需要數(shù)據(jù)庫管理結構化數(shù)據(jù),而如今需要大數(shù)據(jù)逐漸向這種深度學習的應用領域進行改變。

    另一方面,對于結構化的應用工程師來說,當存在推薦系統(tǒng)的需求時,所需要的并不是把所有的代碼寫出來,而是通過更加靈活的“拖拉拽”等方式。因此,過去是從大數(shù)據(jù)的角度進行AI落地,而未來一到兩年內(nèi)需要從系統(tǒng)的層面,推動非結構化深度學習場景和結構化“傳統(tǒng)經(jīng)濟學產(chǎn)品”進步。


    5

    算法工程師的未來“兇多吉少”

    Q8:AI工程師和AI算法工程師之間有何不同?各自的發(fā)展趨勢是怎樣的?兩者會不會融合?

    李大海:在谷歌內(nèi)部,AI的工作是普通的工程師在進行,只要把問題描述清楚,然后放到“系統(tǒng)”上,系統(tǒng)就能夠給出一個大概的解決方案。在未來,隨著技術的發(fā)展,AI和AI工程的門檻會越來越低。這就意味著AI工程師的從業(yè)門檻也會越來越低。

    但是有許多缺口需要AI工程師補充,所以,AI工程師也需要積累算法。因此,從這個角度來看,AI工程師既需要懂架構,又需要懂算法。對于學生或者剛進入工作的職場新人而言,需要好好塑造自己的方法論,快速補充自己,根據(jù)自己的業(yè)務需求讓自己的能力變強。

    其實,無論是在谷歌還是在知乎,我們招聘工程師都有一個標準,即希望工程師足夠聰明,能夠快速學習,可以根據(jù)自己的業(yè)務補充“技能樹”。

    綜上,無論是算法還是工程,其基礎能力和學習能力非常重要。

    賈揚清:我來討論可能相對比較有爭議性的話題:個人認為沒有算法工程師這個角色,只有兩個角色,一個是算法的研究人員,一個是應用的工程師,而“調(diào)參俠”沒有市場。因為,有的調(diào)參工作只需要寫for 循環(huán)語句即可。

    算法的科研人員更多是攻堅“更好的算法”,例如在計算機視覺領域,可能要把模型做得更大、更準,在某些問題上需要把模型做得更小。當然,在具體量化的過程中,需要在兩者之間進行平衡。也就是說,科研人員更多是思考如何在一些“普遍”的場景下對算法進行創(chuàng)新。

    在具體的應用過程中,調(diào)參只是一個手段。例如,在無人駕駛領域,其場景和機場的云點識別的場景非常類似,但是其數(shù)據(jù)的分布不一樣,所要做的事情不一樣。應用工程師更多的是了解其背后的業(yè)務場景差距和限制,例如傳統(tǒng)的約束滿足問題(CSP)。所以,應用工程師更多的是對端到端進行整合,找到最優(yōu)的方向進行調(diào)參,也就是說,調(diào)參只是一個手段。綜上,調(diào)參俠沒有市場,現(xiàn)實中只存在算法科研人員和應用工程師。


    6

    小板凳蹲阿里、知乎的AI展望

    Q9:AI的發(fā)展情況如何?在知乎和阿里有哪些技術沉淀?未來的應用情況、重點投入的AI方向是什么?

    李大海:目前的AI工作和場景結合緊密。抽象來看,(知乎)有三大方向:一是內(nèi)容生產(chǎn),如何利用AI讓內(nèi)容生產(chǎn)進行更有效率,例如創(chuàng)作者匹配、激活創(chuàng)作者;二是內(nèi)容理解,建立內(nèi)容概述,對內(nèi)容質(zhì)量有初步把握,例如內(nèi)容底線內(nèi)容在哪里?內(nèi)容是不是帶有辱罵性質(zhì)?是不是有極端(仇恨)情緒;三是內(nèi)容分發(fā),這個方向建立在第二個方向基礎之上,但不再僅僅局限在內(nèi)容的理解上,還需要對用戶進行理解。具體而言有兩種情況,一是用戶主動搜索,將AI算法賦能到搜索引擎里;二是,被動推薦,將高質(zhì)量內(nèi)容推薦給合適用戶。

    那知乎在文本方面(NLP)有哪些工作呢?主要有兩個方面,一是分詞,例如最近的一次迭代結果是:F1的值從91%上漲到93.5%。二是詞性的判斷,這類工作包括命名實體識別、消歧等等。

    賈揚清:阿里有很多團隊在研究AI,例如阿里的PAI團隊致力于AI的開發(fā)和治理的平臺,基本上阿里的所有工程師都會在上面做開發(fā),達摩院的同學就會在上面構建很多應用和落地的算法,包含圖片、語音等等。

    具體而言,阿里在開發(fā)和工程平臺上基本上有三方面的應用,首先是AI和大數(shù)據(jù)的結合,目的是在傳統(tǒng)機器學習領域里,如何讓應用工程師、或者數(shù)據(jù)科學家更加容易使用數(shù)據(jù)和算法。換句話說,更加豐富、更加成熟、更加高效的算法的結合,目的是為公司提供需要的場景化的解決方案。最典型的例子有兩個,一個是搜索推薦,另外一個是金融風控。這兩個領域對AI存在強需求。如果存在場景化的解決方案,那么就能讓其更容易將領域數(shù)據(jù)和AI相結合。

    第二是更加云原生、順暢的AI的深度學習的體驗。以往的大數(shù)據(jù)、深度學習平臺其結構往往比較重,使用云原生“容器化”的能力可以構建出一個和“自己”的開發(fā)環(huán)境相符合的“產(chǎn)品”。例如在無人駕駛場景中,可以實現(xiàn)非常靈活的深度學習開發(fā),構建靈活的深度學習應用。

    第三是更加成熟的工程化的AI算法的部署,旨在解決模型的穩(wěn)定程度和彈性以及檢測模型的性能。再者,如果有新的模型上線,如何進行A/B 測試?如何回流模型的用戶反饋?等等都是需要考慮的問題。

    在阿里我們還進行了一些“隱形”的工程能力。例如,針對系統(tǒng)利用率低,我們做了資源調(diào)度、資源的編排管理等工作。具體而言,我們在OSDI這一會議發(fā)布了異構相關文章,還發(fā)布了在推理的框架里如何自動生成代碼等論文。這些工作在產(chǎn)品中顯現(xiàn)不清楚,但是確確實實能夠幫助平臺降成本,增效率。

    Q10:有何展望?阿里云會不會有自己的深度學習框架?接下來有哪些新的產(chǎn)品形態(tài)?

    賈揚清:接下來在產(chǎn)品形態(tài)上會把產(chǎn)品做得更加成熟,更加模塊化。目的是讓大家根據(jù)自己的需求進行靈活選擇,模塊化的靈活組合。

    另外,也會著重強調(diào)穩(wěn)定性和用戶體驗。關于深度學習框架,個人邏輯是:從需求出發(fā)。TensorFlow和Pytorch其出現(xiàn)的原因也是這個邏輯,例如TensorFlow能夠迎合“在一個大規(guī)模的彈性系統(tǒng)上面,靈活構建高性能AI的需求”。

    但是TensorFlow也有學習難度比較大的弱點。所以針對學習難度問題,出現(xiàn)了Pytorch。目前,這兩者也在相互借鑒,例如TensorFlow在增強用戶體驗,Pytorch在增強系統(tǒng)能力。所以,從需求的角度來看,這兩者在一定程度上很好的解決了用戶體驗問題。

    設計深度學習框架切記不要 meet to product,即和TensorFlow和PyTorch在結構上不一樣,但是所能夠滿足的需求,能夠做的事情是一樣的。(賈揚清意思是:這種框架不值得)

    其實,個人認為,當前最重要的價值是如何更好的對接軟硬件的協(xié)同設計,不光是大規(guī)模的系統(tǒng),如何將眾多的芯片(例如平頭哥芯片、AMD芯片、蘋果芯片)和框架進行對接,也是一個非常現(xiàn)實的工程問題。

    所以,軟硬件系統(tǒng)的設計才是核心問題,能否出現(xiàn)新的深度學習框架,這個框架將會解決什么問題,也都會圍繞這個核心問題。


    7

    精挑細選的問答

    問答1:作為CTO,管理著上百人的技術團隊,你們一天的工作內(nèi)容是什么?

    李大海:技術體系的工作分為兩種,第一種是建體制,即從機制層面思考創(chuàng)造讓團隊認真工作的環(huán)境。讓大家覺得工作更愉悅,工作目標更明確。如果這個問題解決不好,直接會影響工程團隊的組織能力,會影響到團隊的文化氛圍。

    第二種是對重點的工作領域進行分類,在幾百人的團隊里,我們的工作覆蓋面非常廣,所以我會關注到哪些領域的重要程度最高,然后判斷現(xiàn)狀和重要程度之間的差距如何。雷鋒網(wǎng)

    最后,我作為全局領導者,擁有的信息比較全面。也會關注擁有部分信息的員工所作出的決策,如果他出現(xiàn)錯誤,我會進行糾正。雷鋒網(wǎng)

    賈揚清:有四個方面,第一做事情,即如何搭建平臺,如何進行業(yè)務,這里涉及到和阿里云的其他團隊進行對接,討論需求,商量決策。雷鋒網(wǎng)

    第二是如何通過團隊之間的良好溝通,確保團隊的戰(zhàn)斗力。這需要考慮人的喜怒哀樂,需要考慮組織溫度。

    第三,如何構建機制,我們的做法是通過“戰(zhàn)役”進行確定重點方向,例如針對用戶體驗,用戰(zhàn)役的機制進行討論、執(zhí)行,確保能夠做出用戶需要的產(chǎn)品。

    第四,自我學習。在做管理的時候,感覺自身有很多不足的地方。并且,我的知識儲備和團隊相比并不會雄厚。所以,需要自我學習,提升能力,從而更好的管理團隊。

    總結一下,我在阿里云做管理,涉及到的工作是:人、機制、自我學習。

    問答2:會不用有一個大一統(tǒng)深度學習框架?

    賈揚清:我覺得不會, 例如可口可樂和百事可樂;安卓和ios ,mac和windows。曾經(jīng)看到過這么一個經(jīng)濟學觀點,我們的現(xiàn)實需求很多,并沒有一家能夠囊括所有的需求。例如在最好的語言評選中,數(shù)據(jù)科學家更傾向于Python,系統(tǒng)工程師會選擇C++。因此,不會有一個一統(tǒng)江湖的框架,也不會存在一成不變的框架。(編者注:賈揚清說的可能是政治經(jīng)濟學里面的“壟斷并不會消除競爭”~)

    李大海:同意賈揚清的觀點,但是我想從另一個角度討論這個問題。例如微信只有一個,但是其他產(chǎn)品可能會出現(xiàn)并存。是否形成一家獨大的判斷標準,我認為是是否有網(wǎng)絡效益。機器學習平臺并沒有那么強的網(wǎng)絡效益,需求的點有很多,不同的需求可能存在不同的平臺。所以,Tensorflow和Pytorch這兩大主流平臺可能會長期存在,而在某些垂直領域還可能出現(xiàn)某些“小而美”的平臺。

    問題3:有哪些好的學習方法,最近在看的書可以分享?

    賈揚清:學習方法在于好的知識輸入渠道,推薦四個:1、知乎;2、Hacker News;3、TechCrunch;4、Reddit machine learning group。關于書籍,最近在看一些管理方面的書籍,例如《公司的進化》。

    雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知

    一份來自賈揚清的AI青年修煉指南:不存在算法工程師、調(diào)參俠沒有市場

    分享:
    相關文章
    當月熱門文章
    最新文章
    請?zhí)顚懮暾埲速Y料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 内射视频在线观看| 国产欧美精品aaaaaa片| 国产精品林美惠子在线观看| 精品日本一区二区视频| 悠悠色成人综合在线观看| 亚洲av自拍| 日本成人字幕在线不卡| 亚洲avav天堂av在线网爱情| 女同国产精品一区二区| 99精品视频九九精品| 国产乱人伦AV在线麻豆A| 久草福利资源站| 国产毛片片精品天天看视频| 国产最新AV在线播放不卡| 精品偷拍一区二区三区在| 一区二区三区欧美| 欧美88888| 国产精品亚洲а∨天堂2021| 欧美?日韩?人妻| 日本色视频| 4399理论片午午伦夜理片| 一区二区三区av天堂| 国产AV无码国产AV毛片| www.日韩.com| 免费无码黄十八禁网站| 丰满人妻翻云覆雨呻吟| 久久久久亚洲AV无码专区首| 亚洲色偷拍区另类无码专区| 人妻丝袜AV中文系列先锋影音| aⅴ天堂αv国产| 最新福利姬在线视频国产观看| 亚洲精品二区在线播放| 国产AV一区二区三区| 国产丝袜熟女一区二区在线| 亚洲中文字幕一二三四| 九九热免费在线观看视频| 99这里只有精品免费视频| 国产精品一区二区在线影院| 亚洲精品中文字幕无乱码| 亚洲综合伊人久久大杳蕉| 欧美乱伦视频|