發表於2024-12-26
《數據之巔》作者開中國大數據之先河,《數據之巔》內容更加豐富,觀點更加震撼,堪稱作者集大成之作。《數據之巔》將再次掀起全民閱讀大數據的熱潮。
作者是中國數據文化的首倡者,提齣把科技符號變成文化符號的理念,倡導數據治國的理論。
數據,科學的生機和命脈;數據之巔,進入科學的殿堂,*領未來的思索。記住,我們要用數據來說話,用科學來思考。
史學傢許倬雲、招行前行長馬蔚華、中國寬帶資本董事長田溯寜聯袂推薦;神州數碼公司董事局主席郭為、中信銀行行長硃小黃、萬嚮集團副董事長肖風傾情解讀。
《數據之巔》案例豐富,生動,讀起來趣味盎然,又不失科學的風采和素養。
數據,自古就有,人口普查、農業統計、軍事戰爭、政治計算……數據雖小,卻有助於治國安邦。美國之所以繁榮鼎盛,數據文化根基牢不可破概是主因之一。
信息爆炸、互聯互通、智慧城市時代,大數據,更以排山倒海之勢席捲全球,政府施政、企業掘金,大眾要公平與正義,大數據被賦予瞭新的曆史使命。
在《數據之巔:大數據革命,曆史、現實與未來》這本書中,從小數據時代到大數據的崛起,作者以宏大的曆史觀、文化觀、大數據觀,給我們描繪瞭一幅數據科學、智慧文化的全景圖。全書從美國建國之基講起,通過闡述初數時代、內戰時代、鍍金時代、進步時代、抽樣時代、大數據時代的特徵,係統梳理瞭美國數據文化的形成,闡述瞭其數據治國之道,論述瞭中國數據文化的薄弱之處,展望瞭未來數據世界的遠景。
“尊重事實,用數據說話”,“推崇知識和理性,用數據創新”,作者不僅意在傳承黃仁宇“數目字”管理的薪火,還試圖把數據這個科技符號在中國轉變為文化符號,形成一種文化話語體係。大數據正在撬動中國的製度創新、科技創新。閱讀此書,曆史與現實相互融閤,知識與激情相互交織,思想與觀念相互碰撞,未來與前景必定豁然開朗。
塗子沛,江西吉安人,現居美國矽榖。2012年其著作《大數據》在中國社會開大數據之先河,引發瞭大數據戰略、數據治國和開放數據的討論,曆史學傢許倬雲先生盛贊其“為華文世界開創瞭一個重要話題”。本書為作者第二本著作,全書對大數據追根溯源,提齣當前信息技術的發展,已經讓中國獲得瞭後發優勢,中國要在大數據時代的全球競爭中勝齣,必須把大數據從科技符號提升成為文化符號,在全社會倡導數據文化。
作者本科畢業於華中科技大學計算機係,研究生畢業於中山大學和卡內基梅隆大學,獲公共管理碩士和信息科學碩士學位。
★塗子沛先生開啓瞭一道大門,我相信,後麵會有更多的發展,讓大傢進入這一個重要的現代文化園地。
——許倬雲知名曆史學傢、美國匹茲堡大學曆史係榮譽講座教授
★在《數據之巔》這本書中,塗先生跳到瞭哲學思考的層麵,以統計學的社會應用為切入點,解構數據文化在美國政治、經濟乃至軍事發展上起到的關鍵作用,一環扣一環,構思精巧,故事生動,邏輯清晰,讀起來實在“解渴”。感謝塗先生的智慧,為時代貢獻瞭一部傑作!
——郭為神州數碼控股有限公司董事局主席
★塗子沛先生的《數據之巔》通過追溯梳理美國的數據曆史、展望人類的數據未來,給中國社會提齣瞭一個數據時代的新命題——如何構建數據文化?本書引人入勝、發人深思,是不可不讀的好書。
——馬蔚華招商銀行前行長
★數據本無大小,但運用數據的立場卻分齣大小,是謂大數據。數據錶示的是過去,但錶達的是未來,所以觀察數據需要有曆史觀。塗子沛先生的這本新作《數據之巔》以大曆史、大數據、大社會、大進步的格局,通過數據將遙遠拉近,將悠久縮短,將巨大歸聚,將過程簡直。無論你從事何業或研究何題,都值得認真閱讀這部*峰之作。
——硃小黃中信銀行行長、中信集團監事長
★大數據是互聯網金融的基礎支柱。互聯網金融是雲計算、大數據、社交網絡這個移動互聯大時代裏的小時代。時代潮流,浩浩蕩蕩!塗子沛先生的大數據係列著作,帶您觀時代大潮!
——肖風通聯數據董事長、萬嚮信托董事長
★塗子沛先生《數據之巔》一書的曆史高度和現實意義,超齣瞭他的《大數據》。如果說他上部書開啓瞭中國人對大數據的認識,此書則從曆史的角度來說明,對數據的理解和掌握是人類文明進步的標誌。中國人在“初數時代”是被動的、落後的,黃仁宇在他的名著《萬曆十五年》中也將中國明朝未能走嚮資本主義歸結為中國人不能在“數目字上管理國傢”。在新世紀的大數據時代,我們能否成為參與者甚至領導者?子沛這本書中有諸多可貴的思考和啓示,我嚮讀者推薦。
——田溯寜中國寬帶資本董事長
★塗先生深思熟慮,用語殷殷,穿行在中美兩國的曆史中,努力發掘各個大數據改變觀念,改造社會,改革製度的故事,無論人與事件,都是栩栩如生,發人深省。這本書讓我們有目標有信心,也給我們創新的無限空間。
——王巍中國金融博物館理事長
★大數據的江湖有兩派,國傢治理派和産業升級派。塗子沛先生無疑是國傢治理派的宗師,這本書在美國200多年的政界商海、刀光劍影中勾勒齣雄渾的數據思維、文化、價值觀和方法論。臨到尾處,我的期待愈來愈強。他的一本書《大數據》在通篇的曆史視角、西方視角後,煞費苦心附上一篇“挑戰中國”的尾聲,把人拉迴當下、令人掩捲憂思;這次果不其然,子沛以整整一章的濃墨重彩,挑戰瞭“智慧城市”這一兼具進行時和未來時的話題,而當涉及中國元素時,子沛的行文中齣現瞭暖色調,那種欣賞和希冀讓人寬慰之極、意猶未盡!期待《數據之巔》之後,山不窮,峰更高。
——吳甘沙英特爾中國研究院院長
★塗子沛先生已經成為中國大數據和數據分析領域*前沿的思想者和專傢,如果您想瞭解大數據的曆史、現實和未來,這本書將是您的必讀書目。
——托馬斯·H·達文波特巴布森學院教授,麻省理工學院數字商務中心研究員
第七章 大數據時代:通往計算型的智能社會
大數據是人類文明新的土壤,在這片土壤之上,人類將開始建設一個智能社會。
—本書作者,2014年
世上本沒有數:正解大數據
傳統意義上的“數據”,是指“有根據的數字”,數字之所以産生,是因為人類在實踐中發現,僅僅用語言、文字和圖形來描述這個世界是不精確的,也是遠遠不夠的。例如,有人問“姚明有多高”,如果迴答說“很高”、“非常高”、“*高”,彆人聽瞭,隻能得到一個抽象的印象,因為每個人對“很”、“非常”有不同的理解,“*”也是相對的,但如果迴答說“2.26米”,就一清二楚。除瞭描述世界,數據還是我們改造世界的重要工具。人類的一切生産、交換活動,可以說都是以數據為基礎展開的,例如度量衡、貨幣的背後都是數據,它們的發明和齣現,都極大地推動瞭人類文明的進步。
數據*早來源於測量,所謂“有根據的數字”,是指數據是對客觀世界測量結果的記錄,而不是隨意産生的。測量是從古至今科學研究*主要的手段,可以說,沒有測量,就沒有科學;也可以說,一切科學的本質都是測量。就此而言,數據之於科學的重要性,就像語言之於文學、音符之於音樂、形色之於美術一樣,離開數據,就沒有科學可言。
除瞭測量,新數據還可以由老數據經計算衍生而來。測量和計算都是人為的,也就是說,世上本沒有數,一切數據都是人為的産物。我們說的“原始數據”,並不是“原始森林”這個意義上的“原始”,原始森林是指天然就存在的,而原始數據僅僅是指第*手的、沒有經過人為修改的數據。
傳統意義上的數據,和信息、知識也是完全不同的概念:數據是信息的載體,信息是有背景的數據,而知識是經過人類的歸納和整理,*終呈現規律的信息。
圖7–1 傳統意義上的數據和信息的區彆
但進入信息時代之後,“數據”二字的內涵開始擴大:不僅指代“有根據的數字”,還統指一切保存在電腦中的信息,包括文本、圖片、視頻等。其中的原因是,20世紀60年代軟件科學取得瞭巨大進步、發明瞭數據庫,此後,數字、文本、圖片都不加區分地保存在電腦的數據庫中,數據也逐漸成為“數字、文本、圖片、視頻”等的統稱,也即“信息”的代名詞。
文本、音頻、視頻本身就已經是信息,而且其來源也不是對世界的測量,而是對世界的一種記錄,所以信息時代的數據又多瞭一個來源:記錄。
圖7–2 數據的三大來源
圖7–3 現代意義上的“數據”:範疇比信息還要大
注:進入信息時代之後,數據成為信息的代名詞,兩者可以交替使用。一封郵件雖然包含很多條信息,但從技術的角度齣發,可能還是“一個數據”,就此而言,現代意義上的數據的範疇,其實比信息還大。
除瞭內涵的擴大,數據庫發明之後,還齣現瞭另外一個重要現象,那就是數據的總量在不斷增加,而且增加的速度不斷加快。
20世紀80年代,美國就有人提齣瞭“大數據”的概念。這個時候,其實還沒有進入數據大爆炸的時代,但有人預見到,隨著信息技術的進步,軟件的重要性將下降,數據的重要性將上升,因此提齣“大數據”的概念。這時候的“大”,如“大人物”和“大轉摺”之“大”,主要指價值上的重要性;到瞭21世紀前10年,尤其是2004年社交媒體産生之後,數據開始爆炸,大數據的提法又重新進入大眾的視野並獲得瞭更大的關注。這個時候的“大”,含義也更加豐富瞭:一是指容量大,二是指價值大。
從這個角度齣發,大數據可以首先理解為傳統的小數據加上現代的“大記錄”,這種大記錄的主要錶現形式是文本、圖片、音頻、視頻等,和傳統的測量完全是兩迴事。而且大數據之所以“大”,主要是“大記錄”的增長,基於信息技術的進步,人類記錄的範圍在不斷擴大:
大數據 = 傳統的小數據 + 現代的大記錄
(源於測量) (源於記錄)
但到底多大纔算大呢?針對這一問題,十多年來爭議頗多。這首先涉及衡量數據大小的單位,2000年的時候,一般認為,“太”(T)級彆的數據就是大數據瞭,當時擁有“太”級彆數據的企業並不多,但自此之後,互聯網企業開始崛起,這些企業擁有各種各樣的數據,其中大部分都是文本、圖片和視頻,其數據量之大,傳統企業根本無法望其項背。
理解幾個主要的存儲單位
一首音樂 ≈ 4兆(M)
一部電影 ≈ 1吉(G,1吉=1 024兆,相當於250首歌麯的大小)
一個普通圖書館的藏書 ≈ 1太(T,1太=1 024吉,相當於1 024部電影的大小)
我認為,不僅僅是互聯網行業,其實各行各業的數據都在爆炸,隻是規模不同。如果僅僅把大數據的標準限定在互聯網企業,認為隻有互聯網企業纔擁有大數據,那就嚴重窄化瞭大數據的意義。畢竟容量隻是錶象,價值纔是本質,而且大容量並不一定代錶大價值,大數據的真正意義還在於大價值,價值主要是通過數據的整閤、分析和開放而獲得。大數據是指人類有*所*有的能力來使用海量的數據,在其中發現新知識、創造新價值,從而為社會帶來“大知識”、“大科技”、“大利潤”和“大智能”等發展機遇。
以上論述,是從概念上分析“數據”和“大數據”的區彆,而掌握一個概念*好的方法,還是從動態上瞭解其成因。大數據的成因,還是人類信息技術的進步,而且是信息技術領域不同時期多個進步交互作用的結果,其中*重要的原因,當數摩爾定律。
改變世界的三股力量:大數據的成因
1965年,英特爾的創始人之一戈登·摩爾(Gordon Moore)在考察瞭計算機硬件的發展規律之後,提齣瞭著名的摩爾定律。該定律認為,同一麵積芯片上可容納的晶體管數量,一到兩年將增加一倍。1
要理解這種增加的意義,並不簡單。摩爾的本意是,由於單位麵積芯片上晶體管的密度增加瞭,計算機硬件的處理速度、存儲能力,即其主要性能一到兩年將提升一倍。本來性能提升瞭,價格也應該上升纔對,但現實卻很詭異:半個多世紀以來,硬件的性能不斷提高,價格卻持續下降。之所以這樣,竟然還是因為晶體管越做越小,這種體積的縮小也導緻其成本下降,再加上人類對晶體管的需求越來越大,大規模的生産也導緻價格不斷下降。
迴顧這半個多世紀的曆史,硬件的發展基本符閤摩爾定律。以物理存儲器為例,其性能確實不斷上升,與此同時,價格不斷下降。1955年,IBM推齣瞭第*款商用硬盤存儲器,一兆字節的存儲量需要6 000多美元,此後,其價格不斷下降:1960年,一兆字節下降到3 600美元;1993年,下降到大概1美元;2000年,再降至1美分左右;到2010年,每兆價格約為0.005美分。半個多世紀,存儲器的價格下降瞭1億多倍,這種變化的速度既巨大又劇烈,令人瞠目結舌。事實上,考察人類全部的曆史,沒有其他任何一種産品的價格下降空間能夠如此巨大!
圖7–4 1971~2011年中央處理器上的晶體管數量和摩爾定律
注:縱坐標為晶體管數量,橫坐標為年份。該麯綫錶明,在1971~2011年,大概每兩年相同麵積的中央處理器集成電路上的晶體管數量就增加1倍。需要注意的是,縱坐標從2 300到10 000再到
100 000,其實不成比例,如果嚴格按比例作圖,這將是一條非常陡峭的麯綫,頁麵將無法容納。(資料來源:維基百科)
晶體管的産量多過全世界的大米顆粒
……
進入一個重要的現代文化園地
許倬雲 著名曆史學傢、美國匹茲堡大學曆史係榮譽講座教授
塗子沛先生所著的這部大作,是大數據時代的應時之作。
他將數據用在管理和研究方麵的發展史,以其在美國的發展過程,作為主要內容。他從美國開國時期的人口普查,作為起點,討論民主製度如何經過數據的調查,纔能發展成為“一人一票”的製度。接著,19世紀中葉,美國嚮西開發,美國的工程兵團,進行丈量和調查,使美國的地理狀況和疆域,都有明白的依據。20世紀,“打孔”的計算方法,開創瞭後世計算器管理大量數據的技術。到今天,我們日常生活中,因為計算機和網絡的普及,無處沒有數據的存在。以我老病人為例,疾病的性質,或藥物的效果,都必須靠大量的數據,作為診斷和治療的依據。凡此,都是數據的使用。
美國的社會愈來愈復雜,資本主義的國傢,證券交易乃是一樁大事。單單用統計來管理證券,已經不太夠用。大概在*近30來年,許多大證券商,為瞭要預測經濟的起落和某一種産業的興衰,大量地使用不同産業之間的關係,也顧及國際貿易的情形。這些私營的企業界,幾乎都能相當精準地判斷市場的情形。於是,管理證券交易的美聯儲,實際上就是美國的中央銀行,也必須更細密地運用許多數據,以掌握經濟的全貌,然後再決定對市場供應的貨幣是從寬還是從緊。這纔是“大數據”的第*次使用。
中國古代兵書《孫子兵法》就說過:“算則勝,不算則不勝;多算勝,少算則不勝。”此處的“算”字,就是如何利用數字,來估計各種因素。一個能乾的將領,打一次戰役,要考慮到天時、地利、人和,這都是可以用數字錶現的。但是,一個治國的領袖,在上述因素以外,還得考慮許多其他的條件。1942年,日本偷襲珍珠港,以為可以一棒打死美國。他們沒
數據之巔 大數據革命 曆史 現實與未來 計算機網絡 數據庫 管理 管理信息係統 智能經濟 下載 mobi epub pdf txt 電子書 格式
數據之巔 大數據革命 曆史 現實與未來 計算機網絡 數據庫 管理 管理信息係統 智能經濟 下載 mobi pdf epub txt 電子書 格式 2024
數據之巔 大數據革命 曆史 現實與未來 計算機網絡 數據庫 管理 管理信息係統 智能經濟 下載 mobi epub pdf 電子書數據之巔 大數據革命 曆史 現實與未來 計算機網絡 數據庫 管理 管理信息係統 智能經濟 mobi epub pdf txt 電子書 格式下載 2024