• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    政企安全 正文
    發私信給李勤
    發送

    0

    AI博士從“解放”鑒黃師起步,十年專注安全AI

    本文作者: 李勤 2019-04-30 12:45
    導語:十年前你在干什么?

    2009 年,主要從事數字信號和圖像處理研究、博士剛剛畢業的薛暉拿到了阿里巴巴的 offer,那一年淘寶的全年交易額已經達到 2083 億元,薛暉激動地搓搓小手,阿里巴巴的網站上有大量未被挖掘利用的數據,比如照片、視頻、語音以及非結構化的文本,如果能讓機器做到看清和讀懂這些信息,一定是一件非常有意義和有價值的事。

    AI博士從“解放”鑒黃師起步,十年專注安全AI

    薛暉的構想很美好,要將圖像識別的技術應用到阿里巴巴的搜索、廣告以及安全審核中。然而,正經如薛博士,萬萬沒有想到,公司先給了他一項重要的任務:解放千千萬萬奮斗在電腦前的鑒黃師們。

    “我來的時候,要解決的最大問題是淘寶的審核問題,當時淘寶有很多違規圖片,色情圖片或是其他違法圖片。鑒別文字時,我們還能通過關鍵詞或者變體詞匯來審核,但是對待圖片,完全沒有能力,都靠人工?!毖煂卒h網說。

    所以,接下來雷鋒網要講述的是十年 AI 大佬如何從“解放”鑒黃師起步的故事。

    AI博士從“解放”鑒黃師起步,十年專注安全AI【阿里安全圖靈實驗室負責人 薛暉】


    有些學霸選專業,哪里分數高,就去哪里。

    十年前,阿里巴巴搜索部技術很牛,于是,薛暉雄心勃勃地來到搜索部,并在 2010 年,與兩個男同事提出了一個非常創新的方案:將搜圖應用在電商場景,比如用戶搜索時設置顏色導航,只要搜一件格子襯衫,蹦出一個調色板,點選顏色后,就會出來顏色一樣的格子襯衫,他們甚至提出了現在非常流行的“以圖搜圖”的設想。

    AI博士從“解放”鑒黃師起步,十年專注安全AI

    想象很美好,現實很殘忍。那會,多數人手里還拿著諾基亞,超過 1 M流量,可能要被運營商收走 5 塊錢,這樣“超前”的業務理念夭折了。

    深度學習技術和高性能計算服務器并未成熟,移動端的各類應用也未普及,薛暉還覺得,自己對業務痛點和場景的理解不足,對技術天花板的判斷不足,特別是當兩者遇到矛盾時找不到可以妥善解決的方法。

    隨著淘寶業務量的大量級提升,包括商品和社區板塊的 UGC 信息量增長很快,原有的規則加人工的審核模式無法滿足需求,也就是說,幾十個淘寶小二(鑒黃師)面對數據海量增長,筋疲力竭。阿里內部愈發發現,安全更加重要,以淘寶安全為基礎,阿里集團安全部正式成立。

    這個部門吸引了薛暉的注意力。

    學霸內心一盤算,阿里是一個典型的技術要與業務高度結合的公司,要把之前的技術推下去,得有應用場景??!鑒于之前在搜索部初試反擊黃賭毒有一定效果,薛暉覺得,自己推行的技術在安全領域可能比較容易落地,于是,他主動申請轉崗到阿里安全部。

    薛暉把黃圖鑒別和以圖搜圖的技術用到了這里。最早,他采用的是利用黑樣本圖片找到類似圖片的方法,并逐漸加上了 OCR 和人臉識別技術,當然,這些都是基于傳統技術,當初并沒有深度學習技術的應用。

    比如,當時薛暉等人是這樣區別一張色情圖片與正常圖片的:

    • 有大面積的接近皮膚顏色的像素

    • 像素之間是有連通性而不是很分散

    • 紋理特征接近皮膚

    • 存在類似軀干比例的矩形或橢圓

    • 皮膚區域是否集中在人臉以下的特定位置等

    所有這些特征的權重組合通過機器學習模型決定,也因此,機器通過顏色、紋理、形狀來識別黃圖,大量肉色的沙發、地板會被“無辜牽連”,機器鑒黃也只能識別正經臉的蒼老師,動漫版、大幅度傾斜的小黃圖無法識別。

    薛暉還面臨剛起步需要“證明自己”的問題——這項業務看起來還沒有那么重要,大家不相信他們可以做出來什么,所以薛暉等人要不到研究的錢和資源。比如,他們要想申請一臺幾萬塊的物理訓練機,要把報告打到高層老板那里。

    要想證明項目可行,就要提效省錢。

    雖然上述首次使用的基于統計模型的機器學習方法現在早已被迭代,但在過去,它能把效率提升幾十甚至上百倍。“當時全人工審核沒法篩選圖片,降人力是最關鍵的,也是最直接的。”薛暉說,幾年間,數據量呈線性增長,剛開始負責人工審核的小二是幾十個人,現在依然是幾十個人。

    薛暉一邊解放著人肉鑒黃師的人力,一邊迎來人工智能發展的大勢。

    2016 年,Alpha-go 戰勝了李世石,谷歌也正式發布了基于神經網絡的機器翻譯系統,神經網絡通過各種應用正在重塑圖像識別、自然語言處理等領域。同一年,阿里安全部將薛暉所在的整個基礎算法團隊更名為“阿里安全圖靈實驗室”。

    薛暉忙著將負責業務的模型往深度學習上的遷移,一邊與團隊一起將人工智能技術落地到更多的場景,如知識產權、身份核驗以及各種基于人臉識別技術的 IOT 應用等。

    比如,他們將這套鑒黃體系以產品形式推了出來——有“AI 鑒黃師之稱的阿里巴巴“綠網”用人工智能識別網絡上包括色情、暴力在內的違規信息,通過人工智能、深度學習等技術,識別千萬張正常圖片與色情圖片,最終生成一個智能鑒黃模型。

    淘寶店鋪邁向實人認證也是其中的應用之一。剛開始,上傳到后臺的信息都由人工比對,兩個人是不是同一個人?身份證號碼是否和人匹配?2016 年,實人認證進入了完全自動化時代,很少有人知道,一個機器大腦正在處理這個龐大的信息庫。店鋪用戶上傳的所有信息經過機器之手,人類卻無權調用。

    薛暉所在的團隊在證明可以“提效省錢”的基礎上,面臨了“賺錢”的挑戰。

    上面提到的“綠網”是在阿里提出生態戰略的背景下被阿里云“集成”的技術,這款提供內容安全、實人認證的云服務產品推出伊始,瞄準的是阿里體系的生態企業,現在也包括阿里云上的客戶。

    “本來對內服務的產品,走到到一個充分面向市場競爭的環境,一下子還不太適應?!毖煱l現,在阿里內部場景積累的經驗和模型并不可以直接拿來使用,尤其是面對云上形形色色的非電商行業客戶。從阿里內部跳出來看,“綠網”的競爭對手并不是傳統意義的巨頭企業,而是各類做計算機視覺、自然語言處理的獨角獸和創業公司。

    沒什么別的好辦法,只有不斷在標準化、通用性、技術先進性上打磨產品。對于“被集成”的綠網,要靠業績說話,薛暉對雷鋒網透露,綠網現在每年為阿里云貢獻了不少收入。

    證明了自己對業務的重要性后,阿里安全圖靈實驗室從二十幾人一下躍升到幾十人的規模,并且在北京建立了新的小分隊,薛暉不斷在北京和杭州間來回,讓新團隊跟上節奏。

    他們的節奏不得不提起來了。

    對薛暉而言,更多技術的落地并沒有那么容易。光拿下阿里杭州園區的門禁,他們就費了一番力氣。園區的行政部門的同事對使用門禁刷臉有顧慮:

    • 識別率到底高不高?園區里這么多人,誤識別了怎么辦?

    • 無人值守這些人臉識別設備時,會不會有人就拿著照片或者手機屏幕直接破解?

    • 上班人流高峰期,過人臉識別這一關快不快?不要大家都擠在一起上不了班。

    • 最重要的是,你讓我們增加高清攝像頭,成本會不會蹭蹭上漲?

    薛暉帶著人一步一步去說服,通過一些數據和 ROI 的分析說服了業務愿意試點,一開始是在一個卡口上進行,為了取得最好的調試效果,工程師們自己扛著攝像頭到現場進行參數調試和角度安裝,甚至要考慮安裝在室外的閘機是否受到環境光照影響,還要人工審核、分析每一個錯誤識別的案例,到底哪里出了幺蛾子。

    把攝像頭放在線下的外部商場里,提供線下新零售的安全解決方案更難。

    首先是成本控制問題,不能用太貴的攝像頭,還要解決人群、人體、貨架的遮擋,每個店的地理環境甚至都有影響,比如,有些店是長廊形式,但有些店面是完全開放的,甚至沒有明確的邊界,入口和出口的數量不一,攝像頭擺放的角度和數量都有講究,而這些都只是為背后的“安全 AI 大腦”助力的觸手。

    薛暉等人還要解決的是“人”都很難解決的問題。

    人工智能技術在很多場景能應用好依賴于幾個條件:第一,場景比較封閉,是一個比較容易定義的問題。第二,有大量的標注數據。第三,計算能力。

    線上結構化的信息可以告訴你,那些是垃圾賬號,哪些注冊地和登陸地時常修改,客戶下單的正常、非正常路徑是哪些,依靠這些數據,AI 可以洞悉一切不安全。但是,到了線下,小偷可以從任何一張門進來,買貨之前可能有無數正常的路徑,還可以躲在各種遮擋背后。

    上面那些條件很難成立,薛暉只能再次向實際的保安或安全人員學習抓小偷的經驗,再用機器實現。

    “現在我們有團隊直接在商場里點對點做,就是不停地去調現場的問題,不停地跟他們的店長、店員、安全人員溝通,這是一個非常復雜的問題?!毖熣f。

    除了內容安全、知識產權保護、實人認證與身份核驗、安防以及新零售的線下安全,薛暉還想把 AI 推到更垂直的安全場景中。

    3 月 30 日 18 時,四川省涼山州木里縣一個名為雅礱江鎮立爾的村落村,發生嚴重的森林火災。30 名滅火員犧牲,其中 27 名消防員,最小的才 18 歲。

    薛暉認認真真想了兩天,以前開玩笑說要用 AI 解放全人類,這種高危的場景下更應該有 AI 的應用。比如,火災防控也會涉及到很多圖像和視覺的問題,是否有更好的制定戰術控制火勢的方法?

    “30 個人員犧牲,這代價是非常大的,我女兒小學班的家長里有人是消防員,曾經組織過小學生和家長去參觀消防隊怎么工作,所以我也特別想到這個點,這是非常重要的工作,我們身邊也會有人在做這件事情,我有時候在想,這屬不屬于 AI 安全或者是安全 AI ,讓我們今天從事的工作更安全,這也是保護人?!毖熣f。

    十年前,薛暉隔壁實驗室的同學現在已經做出了卓越的成就——嫦娥四號向地球傳回了世界上第一張近距離拍攝的月背影圖像。

    有些人“上了天”,薛暉想做的,是讓人工智能和安全“落了地”。

    4 月 10 日,坐在雷鋒網編輯面前的薛暉聊了這些故事。18 天后,阿里安全圖靈實驗室將 AI 圖像識別技術應用在 AI 安全廚房解決方案,這個值守廚房的“AI 防火員”開啟了薛暉夢想的第一步。

    AI博士從“解放”鑒黃師起步,十年專注安全AI

    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。

    分享:
    相關文章

    編輯、作者

    跟蹤互聯網安全、黑客、極客。微信:qinqin0511。
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 久久99精品久久久久久青青| 中文字幕av久久波多野结| 男女免费视频看看网站| 最新色站| www.夜夜操.com| 5g影院天天看5g天天爽| 亚洲人妻系列中文字幕| 亚洲精品国产一卡二卡| 一级一级特黄女人精品毛片| 中文字幕乱码无遮挡精品视频| 国产高清在线精品一区二区三区| 午夜福利看片在线观看| 九九热在线免费播放视频| 女人18毛片a级毛片视频| 亚洲成人精品| 亚洲AV日韩精品久久久久 | 日本男人精品一区二区| 国产亚洲一本大道中文在线| 国产乱子伦一区二区三区四区五区 | 国产高潮视频在线观看| 国产精品免费中文字幕| 成人瑟瑟| 久久三级视频| 中文字幕一二区| 黑人猛精品一区二区三区| 亚洲区精品久久一区二区三区| 久久久国产不卡一区二区| 西西人体44rt高清大胆| 粉嫩在线一区二区三区视频 | 日韩一区二区三区精品视频第3页 日韩视频?一区二区 | 国产精品综合色区在线观| 妺妺窝人体色WWW在线一| 狼友麻豆| 欧美日韩人人模人人爽人人喊| 亚洲色大成网站WWW永久麻豆| 少妇久久久被弄到高潮| 亚洲国产精品人人做人人爱| 亚洲免费婷婷综合| 尤物视频免费看| 午夜福利无码不卡在线观看| 麻豆精品一区二区三区蜜臀|