機器學習是下一個統計學
譯者:明明如月
我一直在思考一種描述機器學習究竟有多大的概念,最近想到了一個很恰當的描述:
機器學習是下一個統計學。
為什麼是統計學
因為統計學是近幾十年來我們從數據中學習的主要方式。他是一種查看數據和從中分析出價值的一門學科。也就是數據的獲取和分析。
這就是機器學習的要做的事情。
一方面機器學習可以...學習。隨著獲取數據的增加而不斷完善。普通的統計學卻無法到達這個效果。隨著數據的增多機器學習會變得更加智能,但是普通的統計學分析本身卻無法做到這一點。機器學習就做到了。
我在這裡要傳達的不僅是機器學習是一項新的領域、新的趨勢甚至是一個里程碑。這和即時訊息、智能手機都不一樣。
機器學習的範圍更廣
這就是將信息看做是個體的集合還是看到信息當前趨勢的區別。這也像是一系列靜態圖和一個故事的區別。這也像是信息和數據的區別。這也像是現象和智能的區別。
Advertisements
我要表達的是數據分析到機器學習的變革要比原始信息到數據分析的變革要大很多。
我並不是每個領域的專家,但是我稱之為現實分析的4個等級。
等級1:分析隨機的事件給出隨機的解釋。
等級2:根據隨機的事件將其融入到過去。
等級3:分析隨機事件並將其與其他隨機事件想比較。和很多其他元數據相比較來分析其趨勢。
等級4:根據第3等級,不斷提高獲取從數據中持續並自動的完善模型來達到新更好的效果。
等級5:是提高你提高能力的能力,但是我想這已經或者將會包含在機器學習的體系中。
簡而言之,機器學習不僅僅是對我們現實世界理解的線性提升,而將是指數型的。
現在我們只需要整合多種方式獲取現實世界狀態的實時數據,然後會繼續我們的規劃。
註釋:
Advertisements
1 當我說 「下一個」統計學工具的時候,並不是說是相同的或者影響一樣的。我認為由於機器學習能給自我進化,機器學習影響更大。
ps:
本文只是翻譯外國的文章,傳播一些觀念和知識。
本人並非研究機器學習領域的,如果有差錯還請諒解,不喜勿噴。
英文源:https://danielmiessler.com/blog/machine-learning-new-statistics/