一份來自賈揚清的AI青年修煉指南：不存在算法工程師、調(diào)參俠沒有市場

本文作者：陳彩嫻

2020-09-01 17:06

導語：在討論中，賈揚清認為：沒有算法工程師這個角色，只有兩個角色，一個是算法的研究人員，一個是應用的工程師，而“調(diào)參俠”沒有市場。

算法工程師不僅需要具備牛逼的算法能力，還要精通業(yè)務、善于溝通？（小本子趕緊記下來！）

8月23日晚，知乎直播“AI時代聽大咖聊”邀請到AI領域的兩個大神，分別是阿里云智能高級研究員賈揚清，以及知乎CTO李大海。

在直播中，賈揚清與李大海就國內(nèi)外AI研究區(qū)別、在校生/職場新人如何培養(yǎng)自己的AI才能、AI應用落地，以及AI在未來的發(fā)展趨勢展開討論。

在討論中，賈揚清認為：沒有算法工程師這個角色，只有兩個角色，一個是算法的研究人員，一個是應用的工程師，而“調(diào)參俠”沒有市場。

另外，作為Caffe、PyTorch和Tensorflow曾經(jīng)的核心開發(fā)者，他還提到，深度學習框架并不會出現(xiàn)大一統(tǒng)的局面，因為現(xiàn)實中需求很多，并沒有一家機器學習框架能夠囊括所有的需求。

一份來自賈揚清的AI青年修煉指南：不存在算法工程師、調(diào)參俠沒有市場視頻鏈接：https://www.zhihu.com/zvideo/1280989974280634368

AI科技評論對本次分享作了不改變原意的整理與編輯：

“專業(yè)”除草，沒想到賣了3億美元

Q1：能否請兩位聊一下國內(nèi)外做AI領域的研究有什么區(qū)別？

賈揚清：首先，國內(nèi)外的工程師都很用功，而且都追求最新的技術。個人認為國內(nèi)的工程師更關注如何把方法與業(yè)務結合起來，而國外在AI方面有一些很好玩的事情。

舉兩個例子：一個是，如今很多農(nóng)產(chǎn)品（比如黃瓜）在運去超市前需要篩選出大小、質(zhì)量等許多方面合格的產(chǎn)品。以前都是用手分揀的，很麻煩，但自從有了深度學習的框架TensorFlow之后，有精通工程的年輕農(nóng)民就結合算法，使用機器學習自動對黃瓜進行分類，實現(xiàn)了：大一點的黃瓜送超市，小一點的拿去做零售。

第二個是，我有一個研究生同學把Raspberry Pi放在后院，后院里有一個喂鳥的地方，松鼠經(jīng)常過來，他就拿那個Raspberry Pi識別松鼠，松鼠一來就把它趕走。這些技術看著好像沒有什么用處，但后來產(chǎn)生了非常多應用。硅谷有一個公司叫Blue River Technology，他們做的事情是運用技術在田間地頭找雜草、除雜草，有點類似篩黃瓜、找松鼠。這個公司后來被美國最大的農(nóng)機制造商約翰迪爾公司以3億美元收購了。他們很多時候是出于純粹的技術好奇心，但后來創(chuàng)造了一個產(chǎn)業(yè)。我覺得這是國外蠻有意思的一點。

一份來自賈揚清的AI青年修煉指南：不存在算法工程師、調(diào)參俠沒有市場直播截圖

李大海：揚清講的這個公司我有印象，他們通過識別雜草、然后定點噴灑除草劑，雜草率可以降低到原來的10%。硅谷的公司一直有這個文化。當時我在谷歌的時候，Eric（谷歌執(zhí)行董事長）曾經(jīng)講過一個很好玩的故事：當時在谷歌有一個柜子專門放T恤。在谷歌，無論發(fā)生什么，他們都會把事件印在T恤上，不定期往柜子里塞，然后大家去搶。當時柜子附近有一個攝像頭，Eric就基于攝像頭寫了一些代碼去監(jiān)控這個柜子。一旦識別出這個柜子附近有人，攝像頭就會發(fā)出“警報”來通知Eric，然后Eric一看到有人往柜子里面塞T恤就去搶。在美國，這些工程師會自發(fā)地去做這種（技術應用的）微創(chuàng)新。

國內(nèi)工程師在創(chuàng)新方面與國外可能有一些差別。目前國內(nèi)的AI應用場景已經(jīng)很廣。比如說，在知乎的工程團隊里，大概1/6的人都是算法工程師。在工業(yè)界，算法確實已經(jīng)滲透到應用場景的方方面面。第二點是，AI應用從互聯(lián)網(wǎng)開始逐漸推向越來越多的傳統(tǒng)企業(yè)和傳統(tǒng)行業(yè)。但在個人層面，與國外相比，國內(nèi)的工程師可能較少會自發(fā)去發(fā)現(xiàn)一些微小的創(chuàng)新機會，并實現(xiàn)它。

如何優(yōu)雅入“AI”這個坑

Q2：作為一個在校生，我要如何將學習與業(yè)務結合，如何培養(yǎng)自己的AI能力、才能進入比較好的互聯(lián)網(wǎng)公司呢？

李大海：我們一般稱掌握了AI知識的同學為“算法工程師”。算法工程師在本質(zhì)上首先是一個工程師，所以一個工程師所具備的能力，算法工程師也應該具備，例如說：1）代碼能力，能夠通過代碼實現(xiàn)自己的想法；2）數(shù)據(jù)能力，即能夠對數(shù)據(jù)進行分析，并發(fā)現(xiàn)數(shù)據(jù)所包含的重點，同時對數(shù)據(jù)進行處理；3）與人溝通的能力，因為算法工程師都是在團隊里面工作，不是單打獨斗，所以需要能夠與同組的其他工程師、產(chǎn)品經(jīng)理、測試和其他同事進行溝通。

第二點是算法工程師需要培養(yǎng)業(yè)務能力，即對業(yè)務的理解。工程師首先要掌握業(yè)務應用的知識。業(yè)務場景非常多，但每個場景所面臨的問題是不一樣的，所以算法工程師一定要理解業(yè)務到底是需要解決什么問題，具備定位問題、發(fā)現(xiàn)問題、拆解問題和解決問題的能力。

綜上，對于在校生來說，擁有對算法的理解能力是非常重要的特質(zhì)。雖然算法工程師都喜歡自黑，稱自己是“調(diào)參俠”，但除了調(diào)參之外，還需要知道算法背后的原理。我們現(xiàn)在處于深度學習時代，但是在“前深度學習時代”有很多淺層模型，這些模型因為沒有深度學習碾壓式的表達能力，所以在淺層模型上做了很多思考。

個人認為：“當年”那些模型所用到的技巧對于培養(yǎng)機器學習的能力和解決現(xiàn)實問題是非常重要。

一份來自賈揚清的AI青年修煉指南：不存在算法工程師、調(diào)參俠沒有市場直播截圖

賈揚清：同意大海的觀點：分析問題，定義問題，然后解決問題的整個邏輯非常重要。在校生得到的訓練更多是：如何解決問題的能力。但其實如果問題定義清楚了，解決問題的方法就會出現(xiàn)很多。

另外，從工程的角度補充兩點：第一，如何獲取最新的技術和算法？現(xiàn)在整個開源領域進展迅速。其實，不光是開源，也有很多開發(fā)支持平臺。所以，大家可以保持好奇心，然后多帶著玩的心態(tài)進行嘗試。例如三年前，名為叫Neural Style Transfer的AI應用，將拍的照片上傳之后，就可以轉換成一張類似梵高風格的藝術照。

一份來自賈揚清的AI青年修煉指南：不存在算法工程師、調(diào)參俠沒有市場

第二是，“摸透”應用的實現(xiàn)流程。落地應用是“曇花一現(xiàn)”，但應用背后所涉及的工程步驟，例如把算法快速地迭代出來、如何做算法優(yōu)化、如何把算法放到手機上，如何上線，等等。這種實際操作的流程和只看論文和demo是不一樣的。今天，我們有GitHub這類的開源社區(qū)，很多實際操作都比以前更加容易。

李大海：我想補充一點。有段時間我訂閱過arXiv上面的 topic，但我發(fā)現(xiàn)這是個坑。arXiv最近在機器學習領域非常火熱，每天都大量的論文發(fā)布出來，其中包含很多不同領域的或大或小的突破，這其實會讓人眼花繚亂。所以在這種情況下，我給學生們的建議是：自己先抓住一個重點（領域），至于其他領域，簡單了解那些技術和突破是什么就好。

Q3：假設一個同學已經(jīng)入職了，已經(jīng)成為算法工程師，他可能會經(jīng)歷初級、中級、高級三個階段。所以，關于初級算法工程師怎么晉升到中級算法工程師，以及中級算法工程師怎么晉升到高級算法工程師，兩位有何看法？

賈揚清：我覺得挺重要的一點是學習是所謂的engineering practice（工程實踐）。很多時候，我們在寫研究代碼時，跟研究本質(zhì)是一樣的，因為研究是快速迭代，不需要做工程實現(xiàn)。假如，今天要上線一個功能，不僅要保證它的整個foundation（基礎）是solid（堅固）的。這時候，我們怎么做代碼的管理、協(xié)同、review（審查）、測試、CD和上線？怎么做 performance（性能）的benchmark（基準）跟profiling ？這一系列的工程流程也挺重要。

第二點是保持好奇心。其實任何一個公司的平臺都是挺大的。拿阿里大數(shù)據(jù)和AI平臺來舉例子，像ODPS（Open Data Processing Service）大數(shù)據(jù)平臺是10年前開始建造的，今天平臺非常復雜，包括上層的C語言庫、中間的 Query Optimization（查詢優(yōu)化）和底層的執(zhí)行調(diào)度，肯定不能完全把握。在這個時候，算法工程師就要與他人保持交流，多提問、多討論。就像T型，對系統(tǒng)的某一點了解特別深，對系統(tǒng)的其他部分就觸類旁通。逐漸成為一個高級算法工程師之后呢，成為一個架構師所擁有的能力，其實也能使得我們在更看得更寬、看得更大的同時，有一個更加全局的系統(tǒng)架構的視野。

Q4：揚清有沒有一些具體的建議？比如說你在學生時代是怎么學習的？用什么途徑獲取到新的 AI資訊，遇到問題怎么解決？

賈揚清：在我學生時代，當時大家了解深度學習的算法是通過看論文，看完論文后大概就知道怎么做架構設計。在看論文的過程中會有非常多的輸入，比如我們學到，人們最開始寫深度學習框架的時候（Torch是2000年左右出來的，Theano是2008年出來的），它們的架構設計怎么做神經(jīng)網(wǎng)絡、怎么做layer（層數(shù)）等等，這對我們后來設計其他的框架，像Caffe、MXNet、PyTorch等等，是非常有幫助的。再比如說，我們怎么樣做模型civilization的格式化等等，這時候谷歌的ProtoBuf又是一個很好的測試框架，如G test。這些現(xiàn)有的工程實踐以及設計有現(xiàn)成的代碼、文檔和應用，看這些其實能夠在實際中提升自己的能力。

李大海：我非常贊同揚清的觀點，就是在學校的時候我們會更關注代碼的算法上是否足夠精妙，但是對架構和工程的關注度是不夠的。我自己在早年的時候也犯過這樣的錯誤，像我們數(shù)學系畢業(yè)的，在工程上接受到的培訓是偏少的，但進入公司以后，工程實踐卻變得很重要。揚清之前在一次線下分享中曾提到的一句話我也很贊同，就是：AI是一個系統(tǒng)工程，90%的時間里所做的事情都跟算法無關。在現(xiàn)實中也確實是這樣。

那么，作為剛入職的同學，其實首先我認為入職已經(jīng)晚了，在入職前就應該挑選一個在工程上相對規(guī)范的公司去入職。如果是一個小公司，自己又沒有工程上的 sense（意識），那么你進入的是一個工程規(guī)范很亂的一家公司，這對于個人的職業(yè)發(fā)展和工程能力的培養(yǎng)是很有問題的。

Q5：想請問兩位 AI從業(yè)者，你們覺得跟其他AI從業(yè)者比，你們最大的優(yōu)勢是什么？

賈揚清：在AI領域里，在業(yè)界做得非常成功的人或團隊都有一個特點，就是業(yè)務化。他們不光懂算法，而且懂得怎么用算法。因為在今天，算法已經(jīng)迅速普及，找一個研究生，兩分鐘就能搞出ResNet。

另外，AI算法的創(chuàng)新在逐漸變慢。比如說，Bert在NLP領域，ResNet在CV領域都已經(jīng)比較成熟。雖然算法創(chuàng)新還可以稍微提升一下，但算法已經(jīng)不是一個核心的differentiate（區(qū)別點）。在這種情況下，怎么樣找到實際應用場景，如何把算法和應用結合起來，我覺得這是最能體現(xiàn)出價值的地方。所以，如今AI的突破可能不是在算法上，而是“算法+系統(tǒng)+應用”，而且應用可能會變得越來越重要。

李大海：我們還處于AI的應用層。AI現(xiàn)在已經(jīng)是一個非常大的框，里面可以放非常多東西，領域也非常廣。我覺得我們更像是AI行業(yè)的從業(yè)者，是把AI當成一個功能強大的工具去使用。

我們的團隊內(nèi)部曾經(jīng)很喜歡一個國外經(jīng)濟學家寫的一本書，叫《與運氣競爭》。

一份來自賈揚清的AI青年修煉指南：不存在算法工程師、調(diào)參俠沒有市場

里面講到，當我們手上有一把鉆子的時候，很容易想到的是我拿著鉆子可以干嘛？但其實很多時候，用戶可能只需要鉆一個孔來掛衣服。所以，如果你想的總是“如何提高鉆頭的合金程度”、“讓它變得更好看”，這可能根本就不是用戶想要的。

總的來說，工具非常重要，我們對于 AI的理解和AI前沿技術的跟蹤也很重要，但更重要的事情是：用戶的需求到底在哪里，我們能解決什么問題。

感知大神VS決策白癡

Q6：現(xiàn)在人工智能處于什么發(fā)展階段？它未來會給我們帶來哪些改變？它的長期規(guī)劃可能是什么樣的？

李大海：如果要判斷AI目前處于什么階段，我們得先知道AI的全景是什么樣子，但這個很難預測。這時又會涉及到：人工智能最后到底能走到什么階段？它能不能達到強人工智能的狀態(tài)？我的觀點是偏悲觀的，我覺得強人工智能可能永遠都達不到。

但說到應用，我們可以看到，人工智能在許多領域里已經(jīng)打敗人了，比如說圖片分類。所以在應用層面上我是很樂觀的。人工智能的歷史始于20世紀初，后來經(jīng)歷了一些起起伏伏。

到今天，AI可能有一些泡沫，但這個泡沫其實是AI公司在商業(yè)模式上遇到的問題。但從技術層面上講，AI這個工具越來越強大，數(shù)據(jù)量越來越大，這些都是毋庸置疑的事情，所以在應用層面上我是很看好的。

賈揚清：從歷史的角度來看，計算機誕生的目的是為了更加智能化地處理人與世界交互的問題。在人工智能最早的時候，大家都在處理決策的問題。等決策系統(tǒng)做了一堆工作后，我們發(fā)現(xiàn)，其實我們首先都還不知道這個世界是如何從一個像素、語音“導入”到計算機邏輯的系統(tǒng)里。所以在前面這幾年，深度學習其實是在從決策層面轉到感知層面，從而來解決感知的問題。

從感知的角度來說，今天已經(jīng)相對較成熟。例如2014年，圖像識別的正確率在一個限定的范圍內(nèi)已經(jīng)超過人類。

回過頭來看決策，人工智能的決策發(fā)展還不行。比如說，在自動駕駛里，我能感知這里有一輛車、那里有一個人，但是知道后如何做決策？邏輯是什么？甚至在一些更復雜的場景，例如限速25，但前面的車都超速往前開了，這時候我又怎么辦呢？這些事情都是要在決策層面上解決的。人工智能很有可能會先解決感知/認知問題，然后在感知的基礎上做決策。

綜上，分領域來看，人工智能在認知領域已經(jīng)到達非常成熟的階段，但在決策領域可能還處于初期的探索。

AI離不開云

Q7：有一句話叫“AI是云的內(nèi)核，云是AI的必然形態(tài)。”如何看AI和云的關系，以及AI在云里面扮演的角色。

賈揚清：為什么今天我們說云和AI是一個強結合的狀態(tài)呢？我覺得原因可能有兩點：一是算力，二是數(shù)據(jù)。從算力的角度來說，以前我們在學校做實驗或自己創(chuàng)業(yè)的時候都搭過機器。搭機器很痛苦，而且運維機器在一定程度上不產(chǎn)生價值，然后AI又對GPU有非常強烈的需求。GPU又是一個很惡心的事，有時候運行不錯，有時候又會過熱，有時候又需要我們做資源的調(diào)度等等。任何一個實驗室都會遇到資源調(diào)度問題：一個是科研人員在那找GPU的時候發(fā)現(xiàn)找不著，然后系統(tǒng)工程師跑去一看，說：“哇天啊！利用率好低！”一邊是starvation（饑餓），一邊是satiation（飽和）。

如今，云可以很好地解決算力問題。30年前，所有的單位都有一個發(fā)電機，但今天沒有人用發(fā)電機了，因為底層的基礎設施已經(jīng)非常成熟，可以低成本、大規(guī)模地給社會提供電力。在今天，云的計算力就像水電煤一般的基礎設施，我們不需要擔心哪天機器哪里出了問題。比如說，今天我突然要拉起一個大量的應用，這個時候云可以“soo”一聲彈上來，不要了就放掉。這是算力方面。

第二個是數(shù)據(jù)。前段時間，許多人關注深度學習領域，如圖像、語音等等。但許多AI應用其實是跟結構化數(shù)據(jù)綁在一塊的。咱們舉個例子。比如說像知乎有大量的用戶內(nèi)容，這涉及到兩方面：一方面是自然語言的處理，另一方面是用戶和內(nèi)容的匹配。這時候，其實是在一個大數(shù)據(jù)底座（像Hadoop和MaxComput）上面做結構化數(shù)據(jù)的人工智能。

這和一個大規(guī)模分布式系統(tǒng)是分不開的，因為我不可能今天說把這些數(shù)據(jù)放到一個GPU機器上面，拿三個SSD把它給接起來。所以這時候就需要一套比較完整的系統(tǒng)，從數(shù)據(jù)的存儲、處理、分析到計算，到上層去進行任務的編排、模型的開發(fā)、模型的上線，以及數(shù)據(jù)的回流。無論用戶是自己搭一個系統(tǒng)（我們叫“私有云”），還是在公有云上面進行，云都是AI不可或缺的一個環(huán)境。

今天的AI，越來越多會關注到系統(tǒng)、云。這也標志著AI未來發(fā)展的必然形態(tài)。目前，算法能夠“單機”開發(fā)，但是如何運用算法，則需要算力和數(shù)據(jù)的支持，因此也會需要云和云相關的技術。

我現(xiàn)在在做的工作是把AI和大數(shù)據(jù)進行結合。例如，前段時間我們發(fā)現(xiàn)：深度學習的工程師會發(fā)現(xiàn)目前的大數(shù)據(jù)平臺不能滿足需求。因為過去需要數(shù)據(jù)庫管理結構化數(shù)據(jù)，而如今需要大數(shù)據(jù)逐漸向這種深度學習的應用領域進行改變。

另一方面，對于結構化的應用工程師來說，當存在推薦系統(tǒng)的需求時，所需要的并不是把所有的代碼寫出來，而是通過更加靈活的“拖拉拽”等方式。因此，過去是從大數(shù)據(jù)的角度進行AI落地，而未來一到兩年內(nèi)需要從系統(tǒng)的層面，推動非結構化深度學習場景和結構化“傳統(tǒng)經(jīng)濟學產(chǎn)品”進步。

算法工程師的未來“兇多吉少”

Q8：AI工程師和AI算法工程師之間有何不同？各自的發(fā)展趨勢是怎樣的？兩者會不會融合？

李大海：在谷歌內(nèi)部，AI的工作是普通的工程師在進行，只要把問題描述清楚，然后放到“系統(tǒng)”上，系統(tǒng)就能夠給出一個大概的解決方案。在未來，隨著技術的發(fā)展，AI和AI工程的門檻會越來越低。這就意味著AI工程師的從業(yè)門檻也會越來越低。

但是有許多缺口需要AI工程師補充，所以，AI工程師也需要積累算法。因此，從這個角度來看，AI工程師既需要懂架構，又需要懂算法。對于學生或者剛進入工作的職場新人而言，需要好好塑造自己的方法論，快速補充自己，根據(jù)自己的業(yè)務需求讓自己的能力變強。

其實，無論是在谷歌還是在知乎，我們招聘工程師都有一個標準，即希望工程師足夠聰明，能夠快速學習，可以根據(jù)自己的業(yè)務補充“技能樹”。

綜上，無論是算法還是工程，其基礎能力和學習能力非常重要。

賈揚清：我來討論可能相對比較有爭議性的話題：個人認為沒有算法工程師這個角色，只有兩個角色，一個是算法的研究人員，一個是應用的工程師，而“調(diào)參俠”沒有市場。因為，有的調(diào)參工作只需要寫for 循環(huán)語句即可。

算法的科研人員更多是攻堅“更好的算法”，例如在計算機視覺領域，可能要把模型做得更大、更準，在某些問題上需要把模型做得更小。當然，在具體量化的過程中，需要在兩者之間進行平衡。也就是說，科研人員更多是思考如何在一些“普遍”的場景下對算法進行創(chuàng)新。

在具體的應用過程中，調(diào)參只是一個手段。例如，在無人駕駛領域，其場景和機場的云點識別的場景非常類似，但是其數(shù)據(jù)的分布不一樣，所要做的事情不一樣。應用工程師更多的是了解其背后的業(yè)務場景差距和限制，例如傳統(tǒng)的約束滿足問題(CSP)。所以，應用工程師更多的是對端到端進行整合，找到最優(yōu)的方向進行調(diào)參，也就是說，調(diào)參只是一個手段。綜上，調(diào)參俠沒有市場，現(xiàn)實中只存在算法科研人員和應用工程師。

小板凳蹲阿里、知乎的AI展望

Q9：AI的發(fā)展情況如何？在知乎和阿里有哪些技術沉淀？未來的應用情況、重點投入的AI方向是什么？

李大海：目前的AI工作和場景結合緊密。抽象來看，（知乎）有三大方向：一是內(nèi)容生產(chǎn)，如何利用AI讓內(nèi)容生產(chǎn)進行更有效率，例如創(chuàng)作者匹配、激活創(chuàng)作者；二是內(nèi)容理解，建立內(nèi)容概述，對內(nèi)容質(zhì)量有初步把握，例如內(nèi)容底線內(nèi)容在哪里？內(nèi)容是不是帶有辱罵性質(zhì)？是不是有極端（仇恨）情緒；三是內(nèi)容分發(fā)，這個方向建立在第二個方向基礎之上，但不再僅僅局限在內(nèi)容的理解上，還需要對用戶進行理解。具體而言有兩種情況，一是用戶主動搜索，將AI算法賦能到搜索引擎里；二是，被動推薦，將高質(zhì)量內(nèi)容推薦給合適用戶。

那知乎在文本方面（NLP）有哪些工作呢？主要有兩個方面，一是分詞，例如最近的一次迭代結果是：F1的值從91%上漲到93.5%。二是詞性的判斷，這類工作包括命名實體識別、消歧等等。

賈揚清：阿里有很多團隊在研究AI，例如阿里的PAI團隊致力于AI的開發(fā)和治理的平臺，基本上阿里的所有工程師都會在上面做開發(fā)，達摩院的同學就會在上面構建很多應用和落地的算法，包含圖片、語音等等。

具體而言，阿里在開發(fā)和工程平臺上基本上有三方面的應用，首先是AI和大數(shù)據(jù)的結合，目的是在傳統(tǒng)機器學習領域里，如何讓應用工程師、或者數(shù)據(jù)科學家更加容易使用數(shù)據(jù)和算法。換句話說，更加豐富、更加成熟、更加高效的算法的結合，目的是為公司提供需要的場景化的解決方案。最典型的例子有兩個，一個是搜索推薦，另外一個是金融風控。這兩個領域對AI存在強需求。如果存在場景化的解決方案，那么就能讓其更容易將領域數(shù)據(jù)和AI相結合。

第二是更加云原生、順暢的AI的深度學習的體驗。以往的大數(shù)據(jù)、深度學習平臺其結構往往比較重，使用云原生“容器化”的能力可以構建出一個和“自己”的開發(fā)環(huán)境相符合的“產(chǎn)品”。例如在無人駕駛場景中，可以實現(xiàn)非常靈活的深度學習開發(fā)，構建靈活的深度學習應用。

第三是更加成熟的工程化的AI算法的部署，旨在解決模型的穩(wěn)定程度和彈性以及檢測模型的性能。再者，如果有新的模型上線，如何進行A/B 測試？如何回流模型的用戶反饋？等等都是需要考慮的問題。

在阿里我們還進行了一些“隱形”的工程能力。例如，針對系統(tǒng)利用率低，我們做了資源調(diào)度、資源的編排管理等工作。具體而言，我們在OSDI這一會議發(fā)布了異構相關文章，還發(fā)布了在推理的框架里如何自動生成代碼等論文。這些工作在產(chǎn)品中顯現(xiàn)不清楚，但是確確實實能夠幫助平臺降成本，增效率。

Q10：有何展望？阿里云會不會有自己的深度學習框架？接下來有哪些新的產(chǎn)品形態(tài)？

賈揚清：接下來在產(chǎn)品形態(tài)上會把產(chǎn)品做得更加成熟，更加模塊化。目的是讓大家根據(jù)自己的需求進行靈活選擇，模塊化的靈活組合。

另外，也會著重強調(diào)穩(wěn)定性和用戶體驗。關于深度學習框架，個人邏輯是：從需求出發(fā)。TensorFlow和Pytorch其出現(xiàn)的原因也是這個邏輯，例如TensorFlow能夠迎合“在一個大規(guī)模的彈性系統(tǒng)上面，靈活構建高性能AI的需求”。

但是TensorFlow也有學習難度比較大的弱點。所以針對學習難度問題，出現(xiàn)了Pytorch。目前，這兩者也在相互借鑒，例如TensorFlow在增強用戶體驗，Pytorch在增強系統(tǒng)能力。所以，從需求的角度來看，這兩者在一定程度上很好的解決了用戶體驗問題。

設計深度學習框架切記不要 meet to product，即和TensorFlow和PyTorch在結構上不一樣，但是所能夠滿足的需求，能夠做的事情是一樣的。（賈揚清意思是：這種框架不值得）

其實，個人認為，當前最重要的價值是如何更好的對接軟硬件的協(xié)同設計，不光是大規(guī)模的系統(tǒng)，如何將眾多的芯片（例如平頭哥芯片、AMD芯片、蘋果芯片）和框架進行對接，也是一個非常現(xiàn)實的工程問題。

所以，軟硬件系統(tǒng)的設計才是核心問題，能否出現(xiàn)新的深度學習框架，這個框架將會解決什么問題，也都會圍繞這個核心問題。

精挑細選的問答

問答1：作為CTO，管理著上百人的技術團隊，你們一天的工作內(nèi)容是什么？

李大海：技術體系的工作分為兩種，第一種是建體制，即從機制層面思考創(chuàng)造讓團隊認真工作的環(huán)境。讓大家覺得工作更愉悅，工作目標更明確。如果這個問題解決不好，直接會影響工程團隊的組織能力，會影響到團隊的文化氛圍。

第二種是對重點的工作領域進行分類，在幾百人的團隊里，我們的工作覆蓋面非常廣，所以我會關注到哪些領域的重要程度最高，然后判斷現(xiàn)狀和重要程度之間的差距如何。雷鋒網(wǎng)

最后，我作為全局領導者，擁有的信息比較全面。也會關注擁有部分信息的員工所作出的決策，如果他出現(xiàn)錯誤，我會進行糾正。雷鋒網(wǎng)

賈揚清：有四個方面，第一做事情，即如何搭建平臺，如何進行業(yè)務，這里涉及到和阿里云的其他團隊進行對接，討論需求，商量決策。雷鋒網(wǎng)

第二是如何通過團隊之間的良好溝通，確保團隊的戰(zhàn)斗力。這需要考慮人的喜怒哀樂，需要考慮組織溫度。

第三，如何構建機制，我們的做法是通過“戰(zhàn)役”進行確定重點方向，例如針對用戶體驗，用戰(zhàn)役的機制進行討論、執(zhí)行，確保能夠做出用戶需要的產(chǎn)品。

第四，自我學習。在做管理的時候，感覺自身有很多不足的地方。并且，我的知識儲備和團隊相比并不會雄厚。所以，需要自我學習，提升能力，從而更好的管理團隊。

總結一下，我在阿里云做管理，涉及到的工作是：人、機制、自我學習。

問答2：會不用有一個大一統(tǒng)深度學習框架？

賈揚清：我覺得不會，例如可口可樂和百事可樂；安卓和ios ，mac和windows。曾經(jīng)看到過這么一個經(jīng)濟學觀點，我們的現(xiàn)實需求很多，并沒有一家能夠囊括所有的需求。例如在最好的語言評選中，數(shù)據(jù)科學家更傾向于Python，系統(tǒng)工程師會選擇C++。因此，不會有一個一統(tǒng)江湖的框架，也不會存在一成不變的框架。（編者注：賈揚清說的可能是政治經(jīng)濟學里面的“壟斷并不會消除競爭”~）

李大海：同意賈揚清的觀點，但是我想從另一個角度討論這個問題。例如微信只有一個，但是其他產(chǎn)品可能會出現(xiàn)并存。是否形成一家獨大的判斷標準，我認為是是否有網(wǎng)絡效益。機器學習平臺并沒有那么強的網(wǎng)絡效益，需求的點有很多，不同的需求可能存在不同的平臺。所以，Tensorflow和Pytorch這兩大主流平臺可能會長期存在，而在某些垂直領域還可能出現(xiàn)某些“小而美”的平臺。

問題3：有哪些好的學習方法，最近在看的書可以分享？

賈揚清：學習方法在于好的知識輸入渠道，推薦四個：1、知乎；2、Hacker News；3、TechCrunch；4、Reddit machine learning group。關于書籍，最近在看一些管理方面的書籍，例如《公司的進化》。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權禁止轉載。詳情見轉載須知。

3人收藏

陳彩嫻

編輯

發(fā)私信

當月熱門文章