解析大數據的工具統計學

解析大數據的工具統計學

一是統計學是什麼?

統計學是一門通過搜索、整理、分析數據的手段,以達到推斷所測對象的本質,甚至預測對象未來的一門綜合性科學。通過尋找和挖掘現象,把現象變成可用數字標識的數據,並把數據進行匯總,從而找出事物的本質和規律。其核心思想是把大量具備一定偶然性的事件匯總,從中找出規律。因為單個是件是偶然的,但是大量事件匯總就會具備一定的必然性。

二是統計學的發展。

統計學發展經歷了三個階段:1.城邦政情:為抵禦入侵,對城邦的人口、軍隊、經濟、糧食等方面進行統計,來分析抵禦外來入侵的能力。2.政治算術統計方法與數學計算、推理方法開始結合,分析社會經濟問題的方式,更加註重用定量分析的方法。延續至今,城邦政情已經演變成國家和社會經濟、社會發展的統計,現在大家經常聽到GDP\CPI\基尼係數就屬於統計學的重要工作。3.大數據時代:大數據用於形容那些數量龐大到無法用人工,甚至用簡單的計算機軟體進行處理的海量數據。商場客戶購買信息、人口普查。如晚飯後三小時19:00-22:00依然是網民最活躍的時段。

Advertisements

三是統計學讓大數據成為現實

大數據正在成為一種概念,也就是用大量的數據信息進行統計,從看似沒有關聯的事物中獲取有價值的規律。京東商場表明:只有女性用戶超過一半,才有機會賺錢。所有這些,都離不開統計學。所以說,大數據時代,我們離不開統計學,否則,大數據時代的建立和數據的實際運用就是一場空談。數據大小怎麼算大數據的主要特點為數據量大(Volume)\數據類別複雜(Variety)\數據處理速度快(Velocity)以及數據真實性高(Veracity),合起來被稱為4V.

Advertisements

你可能會喜歡