0
| 本文作者: 三川 | 2017-03-10 17:15 |
百度發布 PaddlePaddle 新 API,以及免費手冊《使用 PaddlePaddle 進行深度學習》
微軟更新 Linux 平臺的數據科學虛擬機(DSVM)
谷歌發布機器學習數據清理服務 Cloud Dataprep
每日推薦閱讀
什么是數據虛擬化:一個數據的大超市
昨日,百度宣布已完成 PaddlePaddle 新 API 的內測版本。PaddlePaddle 是百度研發的深度學習開源平臺,于去年 9 月對公眾開放,稱得上是國內機器學習開源項目的領軍者。雷鋒網獲悉,該新 API 接口大幅精簡了 PaddlePaddle 的代碼量。下面百度官方公布的對比圖,左為舊 API 上的 CNN 程序,右為新 API。

如圖所示,新 API 的代碼非常簡潔。百度表示,這主要是由于三個方面的改進:
新的概念模型
提供“訓練、“測試”、“推理”等新的高級 API,并支持 Kubernetes 。
組合的 data bricks
此外,百度還開放了《使用 PaddlePaddle 進行深度學習》的使用手冊,其中有示例教程。
手冊下載地址:http://book.paddlepaddle.org/index.en.html
詳情:http://research.baidu.com/paddlepaddles-new-api-simplifies-deep-learning-programs/

該虛擬機全稱是 Data Science Virtual Machine,一個基于微軟 Azure 云服務的定制虛擬機鏡像,內置一系列數據科學和機器學習的開發工具,旨在方便開發者開發和部署機器學習應用軟件。
DSVM 有兩個平臺的版本:Windows 和 Linux。微軟宣布更新了 Linux 版的 DSVM,加入了對 Spark、Hadoop、Microsoft R Server 等平臺的支持, 并在工具包中提供 JuliaPro。

在昨日的 Google Cloud Next 谷歌云開發者大會上,谷歌發布了一項新服務—— Google Cloud Dataprep。它能自動檢索數據中的模式(schemas)、連接(joins)以及異常部分,比如缺失或者重負的值,并在這一過程中不需要人工寫代碼干預。這一過程中它利用了機器學習技術,以篩選出符合用戶要求的數據清理規則。 簡單來說, Cloud Dataprep 能幫助開發者為機器學習準備、清理數據。
外媒 VentureBeat 指出, Cloud Dataprep 事實上是谷歌版的 Wrangler Enterprise app,后者是初創公司 Trifacta 所推出,讓開發者在簡單易用的交互界面上清理數據。
目前 Cloud Dataprep 的公測版本已可下載。但據雷鋒網了解,谷歌計劃把 Cloud Dataprep 作為一項收費服務。
與此同時,谷歌還宣布了 BigQuery 的一系列改進。
詳情:http://venturebeat.com/2017/03/09/google-launches-cloud-dataprep-an-embedded-version-of-trifacta/
如題,以超市做比喻,解釋什么是數據虛擬化(data virtualization)。非常生動自然,有助于初學者進行理解。
地址:http://www.datasciencecentral.com/profiles/blogs/data-virtualization-a-supermarket-for-data
欄目介紹:AI 開發者頭條是雷鋒網旗下 AI 研習社推出的資訊欄目,周一到周五更新,匯總每天 AI 開發圈的重磅新聞,并推薦技術干貨。你所關注的 AI 技術資訊,盡在開發者頭條。
關注 AI 研習社公眾號,獲取每日頭條推送。
相關文章:
谷歌公布 Video Intelligence API 助力視頻內容搜索;Facebook 開源新一代機器學習 GPU 服務器 Big Basin | AI 開發者頭條
Google Cloud Next 云技術大會開幕;英偉達發布全新 Jetson TX2 嵌入式開發組件 | AI 開發者頭條
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。