互聯網吞噬世界,「大數據」吞噬互聯網!(水木然)

作者:水木然今日頭條首發+轉載

美國政府甚至將大數據稱為「未來的新石油」,誰掌控了數據流誰就將主宰未來世界。

早在工業3.0時,我們就用「信息大爆炸」來形容世界上數據的增長速度,如今到了工業4.0時期,產品和服務都由「標準化、量產化」步入「定製化、個性化」,這個世界的每絲每毫、每分每刻都在產生數據。數據又開始幾何級增長。

1989年到2010年這20年時間,全球的數據的數量增長了100倍,從2010年到2015年的這5年,大約又增長了200倍!這種增長速度已經不是「爆炸」二字可以形容的!根據國際數據公司(IDC)的《數據宇宙》報告顯示:2008年全球數據量為0.5ZB,2010年為1.2ZB,人類正式進入ZB時代。更為驚人的是,2020年以前全球數據量仍將保持每年40%多的高速增長,大約每兩年就翻一倍,預計2020年將突破35ZB。

Advertisements

什麼是ZB呢?我們先來看幾組關於數據衡量單位的公式:

1B=8bit

1KB=1024Bytes≈byte=1000byte

1MB=1024KB≈byte=1000000byte

1GB=1024MB≈byte=1000000000byte

1TB=1024GB≈byte=1000000000000byte

1PB=1024TB≈byte=1000000000000000byte

1EB=1024PB≈byte=1000000000000000000byte

1ZB=1024EB≈byte=1000000000000000000000byte

1YB=1024ZB≈byte=1000000000000000000000000byte

Advertisements

美國國會圖書館是全球最重要的圖書館之一,1EB約等於4462個美國國會圖書館的數據存儲量!《紅樓夢》共有87萬字(含標點),每個漢字佔兩個位元組,即1個漢字=2B,由此計算1EB約等於6626億部紅樓夢!

任何事物,當量變到一定程度必然要發生質變,量的積累引起起質的飛躍。我們知道,當速度抵達光速時,時間就可以倒流。而大數據的價值已經不再是只是巨大的社會和商業價值那麼簡單。在工業3.0時代之前,科學技術是第一生產力,而在工業4.0時代,大數據才是第一生產力!

水木然認為,互聯網的本質是橫線的「連接」,大數據的本質是「縱向」的統一。互聯網用連接改變一切。它的結構是「網」狀的,可以「網羅天下」,因為那時萬物的形態都是有形並可以被描述的。而在大數據時代,所有的物體形態都將變成無形的「點」,一個物體就是一個數據,萬物都被「縱向」統一了起來,這時再用這張「網」去歸攏天下就行不通了。「網羅天下」也就不復存在,未來應該是「以點帶面」。互聯網的本質是手段、是過程,大數據的本質是結果、是決策。我們甚至可以有了結果再去尋找過程。

大數據時代,人們思維方式最大轉變在於:在以前,我們遇到問題總是在問:「為什麼?」。通過知曉事物的來龍去脈去發明和創造。而在大數據時代,人們最想做的是:「是什麼?」,直接探知結果,根據已知的推斷未知的,過程被忽略。

我們知道,每個人都有自己的基因,即24種不同的染色體,其中最大的染色體約含有2億5千萬個鹼基對,最小的則約有3800萬個鹼基對。這種基因就決定了你今後的生長和發育。在工業4.0時代,不僅人有基因,萬物皆有基因,每一個產品在生產之前都被各種數據「描繪」好的,這同人的基因一樣,也是與生俱來的。

人類基因組計劃(humangenomeproject,HGP),與曼哈頓計劃和阿波羅計劃並稱為三大科學計劃,是由美國科學家於1985年率先提出,旨在為30多億個鹼基對構成的人類基因組精確測序息,基因的本質就是大數據。研究大數據就是研究世界的基因,掌握世間萬象的規律。

關於大數據,目前還有一個很大的誤讀:很多人以為收集起了海量的數據就是大數據。比如我們經常看到某些機構發布的盤點、排名、信息公示等等。真正的大數據並不只是搜集起了這些信息,而是能在海量數據的基礎上,找出內在邏輯,並給出結論性意見。

比如,谷歌地圖的價值並不是告訴你前面這條路上一共有多少車,而是根據路面的車輛情況,計算出前面哪個路口可以更快的到達目的地。比如,某醫院搜集了很多孩子的哭聲,然後根據某個小孩的哭聲資料庫來判斷這個孩子的病狀。他們還可以通過積累了很多病人的脈搏、血壓、心電等數據,來判斷或預警某病人可能產生的病情等。

大數據,未來的第一生產力!

通用電氣CEO傑夫•伊梅爾特曾說:如果昨晚你睡覺時,GE還是一家工業公司,那麼今天醒來就會變成一家軟體和數據分析公司。

這個時代發展太快,當很多企業還在考慮該如何「互聯網化」的時候,大數據時代就壓過來了,今後商業的產業鏈上的每一個環節都需要大數據。

工廠對大數據存在渴求:我只知道誰幫我賣,但不知道誰在買,我的產品該如何改進?我下次該生產多少才沒有庫存?

零售業對大數據存在渴求:我只知道誰在買,但不知道他因何而買?我該在什麼環節採取什麼措施才能提高購買率?

電子商務也需要大數據:比如開一家淘寶店,我們能做的只有做廣告去引流量,或者用「贈送」和「服務」拚命提高轉化率,卻不知道每一個消費IP背後的動向:消費者有跟其他商家比過價嗎?是評價還是價格打動了他?

香港有家海鮮店,老闆會安排專人通過攝像頭查看食客點餐的順序、夾菜的順序、剩菜的種類和分量,通過這些信息分析進而用於第二天的採購決策,循環反覆,以此降低生意成本,這就實現採購的信息化管理。

大數據可以預知未來?

任何行為,皆有前兆。但在現實世界中,缺少實時記錄的工具,許多行為看起來是「人似秋鴻有來信,事如春夢了無痕」。在互聯網世界則完全不同,是「處處行跡處處痕」。要買商品,必先瀏覽、對比、詢價;要搞活動,必先徵集、討論、策劃。互聯網的「請求」加「響應」機制恰恰在伺服器上保留了人們大量的前兆性的行為數據,把這些數據搜集起來,進一步分析挖掘,就可以發現隱藏在大量細節背後的規律,依據規律,預測未來。

這就讓人們看到了解決未來預測問題的一絲曙光。通過利用大數據技術,可以預測預測自然、天氣的變化,預測個體未來的行為,甚至預測某些社會事件的發生。它會讓我們的生活更為從容,讓決策不再盲目,讓社會更加高效的運轉。這就是大數據技術帶給我們的好處。全球複雜網路權威巴拉巴西認為,人類行為93%是可以預測的。我的確不知道這位老先生是怎麼計算出來93%這個數字的,但大數據可以預測未來是顯而易見的,這是首個使人類具備了預測短期未來的技術。

聽起來似乎很玄妙,大數據不就是算命先生么?

其實,或多或少,人們都具備預測的能力。譬如,兒子跟小夥伴們瘋玩,我知道他肯定在7點之前會回家,因為他餓了。再如,家鄉流傳的很多諺語,其中一句「八月十五雲遮月,正月十五雪打燈」,說明大自然就有許多規律性的東西。估計現在的科學也沒有辦法解釋幾乎半年跨度內氣象間的因果關係,但是幾千年的觀察和積累,卻發現了它。自然、社會、商業無不服從某些規律,大國興衰、王朝更替亦有規律可循。只是過去囿於技術條件人們無法記錄下造成某件事情發生的先兆數據,無法去計算其中的因果關係。這些規律要麼被神秘化,要麼被庸俗化。

任何事情的發生,都會有蛛絲馬跡的前兆表露出來。如果我們不去關注一支股票的行情走勢,就不會去買賣這支股票;如果我們從不去詢問某件商品的價格,也很難產生購買行為;如果事先沒有聯絡溝通,人們就很難聚在一起;如果沒有悶熱的天氣,似乎就沒有透心涼的大雨。關於地震前種種異象,更是被許多書籍、文章大肆渲染。

假定有一種技術可以記錄下所有這些先兆,人們就獲得了未卜先知的能力。利用大數據技術,能夠廣泛採集各種各樣的數據類型,進行統計分析,從而預測未來。大數據影響之深遠,波及之廣泛,遠非一般的信息技術可比。以上摘抄自趙國棟大數據書籍《大數據時代的歷史機遇》

那麼問題來了:

假如,我收集了100萬個人的面相特徵(或者手紋、生辰八字),再結合這些人在不同人生節點遇到的事情,是不是就可以找出面相(或者手紋、生辰八字)和命運的規律?

假如,我收集了100萬個住宅周邊環境,再結合主人的不同人生節點遇到的事情,總結出來一套規律,是不是就是風水?

好了,我們不怪力亂神。接下來就談談我們的中醫吧!

中醫和大數據

關於中醫,為什麼會有爭論呢?就是因為中醫在很多人眼裡找不到根據。它不像西醫,有很多臨床實驗和量化的指標。實際上中醫的本質就是在「反覆實踐」摸索出來的規律,是一種古老和樸實的「大數據」。

2000多年前,張仲景在《傷寒論》序言寫到「勤求古訓、博採眾方」。其實他就是把大家和前任積累的經驗給總結了,然後再總結提煉了一套防治傷寒病的方法。《傷寒論》至今我們還在應用,說明是有作用的,所以馬克思也說:實踐是檢驗真理的唯一標準。

中醫之所以能夠發展2000多年長盛不衰,是因為有確實的療效。但是,中醫無法被量化,這就不符合現代科學精神。如果我們能夠把中醫的藥材、診斷、過程、和結果都數據化,那麼「中醫」肯定能成為一門非常偉大又令人信服的學科。

這裡還有一個問題就是:是因果關係更重要?還是必然關係更重要?比如《傷寒論》中的「白虎湯」、「麻杏石甘湯」等古代經典名方,常常可以救治危重大病,而且不帶有副作用。但是知道現在,藥物個病症的「因果關係」還是沒能被徹底搞清。這這並不妨礙我們現在還在用這些療法治療相關病症。

水木然點評:大數據給人類思想的第一個衝擊,很可能使人們從渴求事物之間的「因果」關係當中解脫出來,開始尋找複雜數據中的「必然」關係。

所以,在大數據時代,中醫完全可以給自己正名。但是一定要做到數據化,也就是量化。大部分老中醫都習慣了憑感覺和經驗從醫,如果一直是這樣的話,中醫就很難有本質上的提升。而且我更相信,只有當我們把變化用數據表示出來時,才能更進一步發現更新的規律,因為量變才能引起質變,經驗可以是樸素的,但是學科必須是嚴謹的。

中國大數據的現狀

中國互聯網的三大巨頭BAT。騰訊依靠的社交,阿里巴巴依靠的是電子商務,而百度依靠的就是大數據。

百度搜索本身就是基於大數據實現的技術。作為天然的大數據企業,百度擁有完整、領先的大數據技術,通過對全網大數據進行處理,百度成功推出百度指數、百度商情、百度司南等一系列大數據商業化應用,以及「百度遷徙」、「景點舒適度預測」、「城市旅遊預測」等大數據社會化產品,便於公眾和企業使用百度開放的大數據資源。

百度的做法是把開放雲、數據工廠、百度大腦組成「大數據引擎」,把大數據存儲、分析和智能化處理等一整套核心能力通過平台化、介面化的方式對外開放,這將是各個企業向擁抱大數據的一座橋樑。

然而,中國真正的大數據,還需時日。尋找大數據的價值,但是就去沙灘中淘金一樣,首先沙灘要足夠大。但是隔行如隔山。大數據需要跨行業、跨領域去融合數據資源。而中國不同平台的數據往往是孤立的,之間沒有共享的介面。是一座座「數據孤島」,這就給大數據的實現帶來很大阻礙。

另外,從技術方面來說,中國企業在數據存儲、數據分析挖掘以及智能化能力也都存在著難以突破的瓶頸。

以上兩點,都迫切需要外力來整合。

「情感」永遠都會比「大數據」更勝一籌嗎?

水木然點評:道可道,非常道。凡是能表達出來的道理,都不是永恆的道理。可能無論多麼完美的數據,也不能完全代表事物的動向。因為人之所以是萬物之精華,宇宙的靈長,是因為人的感情,比如當我們經常心血來潮時,那麼這個事情的情感會瞬間動蕩,這是一種包含了人性和情感等多種因素的微妙變化,這就如同「速度」無法超越「光速」一樣,「數據」恐怕也是無法超越「情感」的。當然,這只是作者個人的想法。

未來戰爭形態——數據戰爭

未來世界的本質就是數據,一切的競爭歸結到最後都是數據的競爭。在生活方面,想想看,你的存款、你的通訊錄、你的社交、你的一切都是由一堆數字組成的,如果有人篡改了它們呢?

在軍事方面,大數據正在逐步取代傳統的軍事偵察手段,成為軍隊高層進行決策的重要依據。不僅偵查搜集,作戰兵器、戰場動態、指揮命令等等都是以數據的形式存,這些瞬息萬變海量信息,構成了最基本的戰場生態。

在未來戰爭中,大數據是信息庫,也是撒手鐧。美國國防科學委員會發布的研究報告,建議美國國家安全局引入大數據技術,在科學家和工程師的電子郵件中,搜索相關國家發展核武器的證據,作為採取進一步措施的依據。

在大數據技術支撐下,跨網或離網攻擊都將成為可能。即便是與互聯網完全物理隔離的軍事指揮控制系統和數據系統,都將成為利用大數據技術進行攻擊的對象。

未來,誰擁有了對海量數據佔有、控制、分析、處理的「數據主導權」,就擁有「戰爭主動權」,這也將是贏得戰爭的決定性因素。

在軍隊組織形態上,扁平結構、層次簡捷、高度集成、體系融合,是大數據時代軍隊體制編製的基本特徵。而今後軍隊的發力點在於:縮短從「感測器到射手」的時間差,實現「發現即打擊」「發現即摧毀」的作戰目標。

美國國防部每年投資2.5億美元用於大數據建設。在美國國防部的資助下,美國「記錄未來」公司,專門研究如何通過分析互聯網信息,特別是「臉譜」、「推特」等社交網站,預先察知恐怖襲擊、突發疾病等重大事件。正是在大數據技術的支撐下,海量的數據與農業時代的糧食土地、工業時代的石油鋼鐵一樣,成為關鍵戰略資源。所以,這就是我們開頭所說的那句話了:美國政府已將大數據稱為「未來的新石油」!

作者:水木然。此文為長篇書籍《工業4.0時代,你準備好了嗎》的部分章節,工業4.0不是工業的問題,而是一場深刻的社會變革!每個人都無法與之撇清關係。該書正在微信公眾賬號「水木然」和今日頭條上持續更新,歡迎關注水木然微信公眾賬號:smr8700查看,或者在今日頭條上訂閱水木然如能給予一定的意見和指導,作者將感激不盡!水木然個人微信號:vv5923,歡迎交流!

《工業4.0時代,你準備好了嗎》一書有電子工業出版社出版,今年3月份上市發行。本書探討的問題包括:生活方式的變遷;職業和分工的變化;企業如何轉型;未來世界格局;以及對於前景的暢想等,涉及的領域有移動互聯網、大數據、雲計算、物聯網、可穿戴設備等。

Advertisements

你可能會喜歡