數據密集型應用係統設計

數據密集型應用係統設計 下載 mobi epub pdf 電子書 2026

Martin Kleppmann
圖書標籤:
想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
前言 .....................................................1
第一部分 數據係統基礎
第1章 可靠、可擴展與可維護的應用係統 ................... 11
認識數據係統 ...........................................12
可靠性 ..................................................14
可擴展性 ................................................18
可維護性 ................................................25
小結 .....................................................28
第2章 數據模型與查詢語言 ............................... 33
關係模型與文檔模型 .......................................34
數據查詢語言 ...........................................46
圖狀數據模型 ......................................52
小結 ...................................................65
第3章 數據存儲與檢索 .................................. 71
數據庫核心:數據結構 ...................................72
事務處理與分析處理 ...................................89
列式存儲 .........................................94
小結 ..............................................101
第4章 數據編碼與演化 .............................. 109
數據編碼格式 .................................... 110
數據流模式 ......................................124
小結 .............................................134
第二部分 分布式數據係統
第5章 數據復製 ................................. 145
主節點與從節點 ..................................146
復製滯後問題 ......................................154
多主節點復製 .......................................160
無主節點復製 .....................................168
小結 ..............................................181
第6章 數據分區 ............................... 189
數據分區與數據復製 .................................190
鍵-值數據的分區 ...................................190
分區與二級索引 ...................................195
分區再平衡 ....................................198
請求路由 ..................................202
小結 .................................204
第7章 事務 .............................. 211
深入理解事務 ......................................212
弱隔離級彆 .................................221
串行化 ...........................................237
小結 ...........................................250
第8章 分布式係統的挑戰 ...................... 259
故障與部分失效 ...............................260
不可靠的網絡 ..................................262
不可靠的時鍾 ..................................271
知識,真相與謊言 ...............................282
小結 ..........................................292
第9章 一緻性與共識 ..................... 303
一緻性保證 ....................................304
可綫性化 ........................................305
順序保證 ........................................319
分布式事務與共識 .................................330
小結 ...............................................349
第三部分 派生數據
第10章 批處理係統 ................................ 367
使用UNIX工具進行批處理 .............................368
MapReduce與分布式文件係統 .........................375
超越MapReduce ....................................394
小結 ............................................403
第11章 流處理係統 .............................. 413
發送事件流 .......................................414
數據庫與流 .......................................424
流處理 .........................................435
小結 ............................................449
第12章 數據係統的未來 ............................ 461
數據集成 .........................................461
分拆數據庫 .......................................469
端到端的正確性 ....................................484
做正確的事情 .......................................500
小結 ..............................................509
術語錶 ............................................ 521
· · · · · · (收起)

具體描述

全書分為三大部分:

第一部分,主要討論有關增強數據密集型應用係統所需的若乾基本原則。首先開篇第1章即瞄準目標:可靠性、可擴展性與可維護性,如何認識這些問題以及如何達成目標。第2章我們比較瞭多種不同的數據模型和查詢語言,討論各自的適用場景。接下來第3章主要針對存儲引擎,即數據庫是如何安排磁盤結構從而提高檢索效率。第4章轉嚮數據編碼(序列化)方麵,包括常見模式的演化曆程。

第二部分,我們將從單機的數據存儲轉嚮跨機器的分布式係統,這是擴展性的重要一步,但隨之而來的是各種挑戰。所以將依次討論數據遠程復製(第5章)、數據分區(第6章)以及事務(第7章)。接下來的第8章包括分布式係統的更多細節,以及分布式環境如何達成一緻性與共識(第9章)。

第三部分,主要針對産生派生數據的係統,所謂派生數據主要指在異構係統中,如果無法用一個數據源來解決所有問題,那麼一種自然的方式就是集成多個不同的數據庫、緩存模塊以及索引模塊等。首先第10章以批處理開始來處理派生數據,緊接著第11章采用流式處理。第12章總結之前介紹的多種技術,並分析討論未來構建可靠、可擴展和可維護應用係統可能的新方嚮或方法。

用戶評價

評分

##自Stevens 博士全係書籍以及 jcip 以後,讀過的最好的工程理論書籍。作者技術功力深厚又富有人文情懷。(就是最後一章翻譯的有些糟糕,錯彆字和不通順的地方太多,多人聯閤翻譯痕跡也比較重,有些詞匯翻譯不專業尤其前後不一緻,但這又是一本講一緻性的書,有點諷刺也不應該。)

評分

##自Stevens 博士全係書籍以及 jcip 以後,讀過的最好的工程理論書籍。作者技術功力深厚又富有人文情懷。(就是最後一章翻譯的有些糟糕,錯彆字和不通順的地方太多,多人聯閤翻譯痕跡也比較重,有些詞匯翻譯不專業尤其前後不一緻,但這又是一本講一緻性的書,有點諷刺也不應該。)

評分

##上帝視角細數各類數據相關係統優劣得失,用學術研究的方式來寫書,本質上就是一本大綜述,真是太適閤我瞭,太棒瞭。信息量超大,將我平時瞭解的各種零散概念關聯串結起來。又買瞭一本英文原版的書,本書需放案頭常翻,一本不會過時的書

評分

##CRUD程序員進階必讀之書。近年來讀的最爽的技術書,很多方麵在實際工作中都涉及到瞭,並且給齣瞭自己的解決方案,但是看完本書,想把以前的再實現一下——雖然這是幾乎不可能的。

評分

##數據存儲,數據應用的共性問題的分析與總結。能看到很多市麵上常用中間件的影子。提綱挈領,高屋建瓴。

評分

##學習分布式的好書,包羅萬象:數據庫、緩存、消息隊列、RPC;MAPREDUCE,一緻性算法,流式設計等等,後麵的參考文獻也很有價值,關於分布式的好書太少,感覺還是要看paper啊。具體細分領域不熟悉導緻部分內容理解不是很深刻,感覺以後有必要再讀一遍。讀完纔發現現在的係統都是麵嚮數據設計的。

評分

##看瞭這本書,我纔知道我之前看的九章算法係統設計班很多很多知識都是這本書裏的,乾

評分

##前麵幾章啓發很大,關於各種存儲模型。有時間會動手實現一個分布式lsm存儲係統。後麵對於流處理的論述沒太讀懂。

評分

##名不虛傳,分布式係統的基本問題都提到瞭,而且各種解決方案的優缺點都有。講的沒有那麼實用,也沒有那麼理論,在工業與學術之間平衡的很好。

本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2026 book.teaonline.club All Rights Reserved. 圖書大百科 版權所有