似懂非懂Google TPU 2.0

前面剛學習了Google的第一代TPU,寫了篇《似懂非懂Google TPU》,很多朋友一起討論,紛紛議論說好像也不是很牛逼?怎麼可能,Google在技術上還是很有追求的。

這還沒過幾個月,Google CEO Sundar Pichai 在 5月18日I/O 大會上正式公布了第二代 TPU,又稱 Cloud TPU 或 TPU 2.0,繼續來看下TPU 2.0有什麼神奇之處。

第一代 TPU 它被做為一種特定目的晶元而專為機器學習設計,並用在 AlphaGo 的人工智慧系統上,是其預測和決策等技術的基礎。隨後,Google 還將這一晶元用在了其服務的各方面,比如每一次搜索都有用到 TPU 的計算能力,最近還用在了 Google 翻譯、相冊等軟體背後的機器學習模型中。

Advertisements

Google 宣布第二代的 TPU 系統已經全面投入使用,並且已經部署在 Google Compute Engine 平台上。它可用於圖像和語音辨識、機器翻譯和機器人等領域。

新的 TPU 包括了 4 個晶元,每秒可處理 180 萬億次浮點運算。Google 還找到一種方法,使用新的電腦網路將 64 個 TPU 組合到一起,升級為所謂的TPU Pods,可提供大約 11,500 萬億次浮點運算能力。

強大的運算能力為 Google 提供了優於競爭對手的速度,和做實驗的自由度。Google 表示,公司新的大型翻譯模型如果在 32 塊性能最好的 GPU 上訓練,需要一整天的時間,而八分之一個 TPU Pod 就能在 6 個小時內完成同樣的任務。之所以開發新晶元,部分也是因為 Google 的機器翻譯模型太大,無法如想要的那麼快進行訓練。

Advertisements

除了速度,第二代 TPU 最大的特色,是相比初代 TPU 它既可以用於訓練神經網路,又可以用於推理。初代的 TPU 只能做推理,要依靠 Google 雲來即時收集資料併產生結果,而訓練過程還需要額外的資源。

機器學習的能力已經逐漸在消費級產品中體現出來,比如 Google 翻譯幾乎可以即時將英語句子變成中文,AlphaGo 能以超人的熟練度玩圍棋。所有這一切都要靠訓練神經網路來完成,而這又需要計算能力。所以硬體越強大,得到的結果就越快。如果將每個實驗的時間從幾周縮短到幾天或幾個小時,就可以提高每個機器學習者快速反覆運算,並進行更多實驗的能力。由於新一代 TPU 可以同時進行推理和訓練,研究人員能比以前更快地部署 AI 實驗。

總結起來,Google TPU 2.0已經不局限於推理,還進入到了訓練場景,挑戰這個領域的壟斷者 Nvidia 的 GPU 。

具體細節,Google還沒有公布,同學們還可以再等等Google公布論文細節,總的來說,Google是決心在AI分一杯羹的,以Google的技術實力,還是非常值得期待的。



歡迎大家關注公眾號《大數據和雲計算技術》,獲取最新技術分析。

Advertisements

你可能會喜歡