谷歌開放TPU!與Tensorflow軟硬聯合,或將佔獨家地勢

大數據文摘作品

作者:錢天培、小魚

就在剛才,Google宣布TPU測試版對外開放!

9個月前,Google在I/O大會上揭開TPU的神秘面紗。(點擊查看大數據文摘相關報道)

當時,僅有極少部分開發者有幸能夠一探其究竟。而從今天起,所有開發者都可以在Google Cloud Platform試用雲端TPU!

據Google稱,每個雲端TPU都由四個定製的ASIC構成,每個板卡可以提供高達180 teraflops的浮點性能和64 GB的高帶寬內存。作為對比,目前市面上廣泛試用的英偉達Tesla P100 GPU性能則為每秒21 teraflops,即便是最新發布的V100也只是剛剛突破100 teraflops的大關。

Advertisements

TPU全稱為Tensor Processing Unit。一如其名字所示,這款晶元是專門為加速Google的機器學習開源軟體Tensorflow所設計。

不出意料,今天發布的這款TPU實現了與Tensorflow的無縫融合。

幾乎無需改動,Tensorflow的代碼就可以被TPU加速運行。此外,Google也開源發布了幾款圖像分類、物體識別和機器翻譯的高效模型,包括ResNet-50、Transformer和RetinaNet。只需提供數據,這些模型可以使用TPU在Tensorflow上即刻運行。

Google TPU的對外開放進一步表明,包括Google、Microsoft和Amazon在內的互聯網巨頭早已搖身一變,成為了硬體大佬。如今Amazon有AWS,Microsoft手握Azure,谷歌此番讓TPU和Tensorflow軟硬聯合,或將突破重圍,佔據獨家地勢。

Advertisements

谷歌官方博客的博文內容如下:

Google Photo已經可以通過機器學習把照片根據人物,地點,時間進行分類。一個很方便的新增功能是你可以讓谷歌自動把你想要分享的照片發送給你指定的人。比如你可以設置把每一張你所拍攝的你家寶寶的照片自動發送到你老婆的Google Photo照片庫里。

今天起,谷歌TPUs beta版在谷歌雲平台開源,以幫助機器學習專家更好地訓練和運行機器學習模型。

雲端TPU是Google設計的硬體加速器系列,為加速、擴展特定的TensorFlow機器學習工作負載而優化。 每個雲端TPU都由四個定製的ASIC構成,每個板卡可以提供高達180萬次的浮點性能和64GB的高帶寬內存。

這些主板可以單獨使用,也可以通過超快專用網路連接在一起,形成所謂的「TPU pod」的機器學習超級計算機。今年晚些時候,谷歌將在GCP上供應這種大型超級計算機。

谷歌設計雲端TPU的目標,是為TensorFlow工作負載提供更高質優惠的差異性能,並使機器學習工程師和研究人員能夠更快地迭代學習。

例如:

  • 無需使用共享計算機群集完成任務,使用者可以通過控制並支持自定義的Google Compute Engine虛擬機,訪問連接網路的雲端TPU。

  • 與其等上幾天或幾周來訓練業務關鍵的ML模型,使用者可以在晚上通過Cloud TPU上訓練同一模型的一系列變體,並在第二天部署生成的、最精確的訓練模型。

  • 使用單個雲端TPU並按照本教程,使用者可以在不到一天的時間內將ResNet-50訓練到ImageNet水平的預期準確度,而且費用不到200美元!

    機器學習模型訓練,輕鬆搞定

    Google Photo已經可以通過機器學習把照片根據人物,地點,時間進行分類。一個很方便的新增功能是你可以讓谷歌自動把你想要分享的照片發送給你指定的人。比如你可以設置把每一張你所拍攝的你家寶寶的照片自動發送到你老婆的Google Photo照片庫里。

    過去,為定製ASIC和超級計算機編寫程序需要深入的專業知識。 相比之下,使用高級版TensorFlow API可以編程雲端TPU,並且,谷歌也開源了一套參考高性能雲端TPU模型實現,可以立刻上手:

    • 運行ResNet-50和其他流行的圖像分類模型

    • 實現機器翻譯和語言建模的變換

    • 利用RetinaNet進行對象檢測

    為了提高性能,谷歌不斷測試這些模型實現的性能和收斂性,以達到標準數據集的預期精度。

    隨著時間的推移,我們將開放源代碼模型實現。 Adventurous ML專家可以使用谷歌提供的文檔和工具,自行優化其他雲端TPU中的TensorFlow模型。

    如果現在開始使用雲端TPU,當谷歌在今年晚些時候推出TPU pods時,使用者可以從時間以及精確度的改善中受益。 正如在NIPS 2017上宣布的那樣,如果ResNet-50和Transformer訓練的好的話,可能要花費一天時間,而現在使用TPU pods訓練時間到不到30分鐘,而且無需更改代碼。

    領先的投資管理公司Two Sigma對Cloud TPU的性能和易用性印象深刻。

    「我們決定將我們的深度學習研究集中在雲端的原因有很多,但主要是為了獲得最新的機器學習基礎設施,Google 雲端TPU技術不僅新穎而且發展迅速,而且支持運行深度學習演算法,我們發現將TensorFlow工作負載移至TPU,可大大降低編程新模型的複雜性以及訓練它們所需的時間,從而提高了我們的工作效率。使用雲端TPU讓我們能夠專註於構建模型,而不會被管理集群通信模式的複雜性分散注意力 。」——Two Sigma首席技術官Alfred Spector

    可擴展的機器學習平台

    Google Photo已經可以通過機器學習把照片根據人物,地點,時間進行分類。一個很方便的新增功能是你可以讓谷歌自動把你想要分享的照片發送給你指定的人。比如你可以設置把每一張你所拍攝的你家寶寶的照片自動發送到你老婆的Google Photo照片庫里。

    雲端TPU還對規劃和管理ML計算資源進行了簡化:

    • 使用者可以為自己的團隊提供最先進的ML加速,並根據需求動態調整容量。

    • 無需擔心設計所需要投入的資本、時間和技術,也無須擔心安裝和維護在線ML計算集群的專門電源、散熱性能、網路鏈接、存儲要求和所需的資金,使用者可以從谷歌多年來大量優化的、大規模緊和密集成的ML基礎設施中受益。

    • 再無需讓司機費力更新大量的工作站和伺服器集群。 雲端TPU已經進行了預先配置 - 也無需安裝驅動程序!

    • 使用者受到和Google Cloud服務的同樣複雜的安全保護機制。

    「自從使用Google 雲端TPU以來,我們對它們的速度和印象都非常深刻——通常需要幾天的時間才能做完的事情,現在可能需要只需要幾個小時。 深度學習正迅速成為自動駕駛車輛軟體運行的中堅力量。 隨著訓練數據的不斷增加,軟體運行結果會變得更好,並且每周都有重大的突破。現在,雲端TPU通過整合來自我們車隊的最新導航相關數據和研究界最新的演算法,幫助自動駕駛行業的迅速發展。」—— Lyft L5 自動駕駛軟體主管Anantha Kancherla

    在Google Cloud上,我們希望為客戶提供每個ML工作負載最適合的雲端TPU,並提供各種高性能CPU(包括英特爾Skylake)和GPU(包括NVIDIA Tesla V100)。

    Google Photo已經可以通過機器學習把照片根據人物,地點,時間進行分類。一個很方便的新增功能是你可

    雲端TPU使用指南

    現在因為雲端TPU的數量有限,谷歌以秒計費,費用為6.50美元/TPU /小時。

    原文鏈接:

    https://cloudplatform.googleblog.com/2018/02/Cloud-TPU-machine-learning-accelerators-now-available-in-beta.html

    Advertisements

    你可能會喜歡