發表於2025-01-11
《計算機組成與設計:硬件/軟件接口(原書第5版)》是計算機組成與設計的經典暢銷教材,第5版經過全麵更新,關注後PC時代發生在計算機體係結構領域的革命性變革——從單核處理器到多核微處理器,從串行到並行。本書特彆關注移動計算和雲計算,通過平闆電腦、雲體係結構以及ARM(移動計算設備)和x86(雲計算)體係結構來探索和揭示這場技術變革。
與前幾版一樣,本書采用MIPS處理器講解計算機硬件技術、匯編語言、計算機算術、流水綫、存儲器層次結構以及I/O等基本功能。
《計算機組成與設計:硬件/軟件接口(原書第5版)》特點
更新例題、練習題和參考資料,重點關注移動計算和雲計算這兩個新領域。
涵蓋從串行計算到並行計算的革命性變革,第6章專門介紹並行處理器,每章中都涉及並行硬件和軟件的相關主題。
全書采用Intel Core i7、ARM Cortex-A8和NVIDIA Fermi GPU作為實例。
增加“運行更快”這一新實例,說明正確理解硬件技術的重要性,它能使軟件性能提高200倍。
討論並強調計算機體係結構的“8個偉大思想”——通過並行提高性能、通過流水綫提高性能、通過預測提高性能、麵嚮摩爾定律的設計、存儲器層次、使用抽象簡化設計、加速大概率事件和通過冗餘提高可靠性。
David A. Patterson,加州大學伯剋利分校計算機科學係教授,IEEE和ACM會士,美國國傢工程院、國傢科學院和美國藝術與科學院院士,美國計算機曆史博物館院士,並入選矽榖工程名人堂。Patterson曾榮獲加州大學傑齣教學奬、ACM Karlstrom奬、IEEE Mulligan教育奬章和本科生教學奬。由於對RISC技術的貢獻,他獲得瞭IEEE技術成就奬和ACM Eckert-Mauchly奬;而在RAID方麵的貢獻為他贏得瞭IEEE Johnson信息存儲奬;他還和Hennessy分享瞭IEEE John von Neumann奬章和C&C;奬金。Patterson作為美國總統信息技術顧問委員會委員,還曾擔任計算機研究協會(CRA)主席和ACM主席。這些傑齣的工作使他榮獲瞭ACM和CRA頒發的傑齣服務奬。
John L. Hennessy,斯坦福大學的第10任校長,從1977年開始在該校電子工程與計算機係任教。Hennessy教授是IEEE和ACM會士,美國國傢工程院、國傢科學院和美國哲學院院士,美國藝術與科學院院士。他獲得過眾多奬項,包括:2001年Eckert-Mauchly奬,以錶彰他對RISC技術的貢獻;2001年Seymour Cray計算機工程奬;2000年與Patterson共同獲得IEEE John von Neumann奬章。他還擁有7個榮譽博士學位。1981年,Hennessy在斯坦福大學開始MIPS研究項目,1984年參與創建MIPS計算機係統(現在的MIPS技術公司),開發瞭一款商用RISC微處理器。除瞭技術活動與大學工作外,他還是多傢創業公司的顧問和投資者。
王黨輝,1975年生於陝西省周至縣。2005年獲得西北工業大學計算機學院工學博士學位。現為西北工業大學計算機學院副教授。2007年在比利時魯汶大學和歐洲微電子中心(IMEC)進修,2012~2013年8月在美國匹茲堡大學電子與計算機工程係訪問研究。主要研究方嚮為計算機係統結構、新型存儲係統、高可靠計算機係統等。承擔“計算機組成原理”“計算機係統結構”“匯編語言與接口技術”等課程的教學工作。
康繼昌,1930年生於上海市。1951年畢業於交通大學電機工程係。曆任哈爾濱軍事工程學院講師、副教授,西北工業大學教授、係主任,中國航空學會第二、三屆理事,國務院學位委員會一、二、三屆學科評議組成員。長期從事機載計算機的研究工作。20世紀60年代初主持研製成功我國一颱機載計算機,並得到推廣應用。後又主持研製成功多種型號的計算機。
安建峰,1977年生於河北省保定市。2009年獲得西北工業大學計算機學院工學博士學位。現為西北工業大學計算機學院副教授。2010年在比利時魯汶大學和歐洲微電子中心(IMEC)進修,2014年在新加坡國立大學計算機學院訪問研究。主要研究方嚮為高性能計算機體係結構、嵌入式係統軟硬件協同設計、FPGA可重構電路等。承擔“計算機組成原理”“計算機係統結構”“SoC設計方法學”等課程的教學工作。
★這是一本應該保存在書架上的計算機體係結構的教材。本書既陳舊又新穎,因為它不但介紹瞭基本原理——摩爾定律、抽象、加速大概率事件、冗餘、存儲層級、並行和流水綫,也使用如ARM Cortex A8和Intel Core i7等現代設計對這些基本原理進行瞭說明。
——Mark D. Hill, 威斯康星大學麥迪遜分校計算機科學教授,係主任
★教材的選擇是一個非常令人沮喪的摺衷—教學方法、內容的覆蓋麵、行文造句的質量、描述的精確程度、成本等都需要考慮。計算機組成與設計是不需要在這些方麵進行摺衷且涉及各個方麵的書。它不僅是一部計算機組成的教科書,也是所有計算機科學教科書的範本。
——Michael Goldweber,Xavier大學計算機科學係教授
★當前,半導體加工工藝按比例縮小的睏難是係統功耗的限製,在移動係統和大數據處理器領域,該限製與不斷增長的性能需求之間的矛盾越來越尖銳。第5版除瞭為讀者提供計算機體係結構的介紹,還為讀者準備瞭為應對該矛盾必須在設計方麵做的修改。在這個計算技術的新領域,必須進行軟硬件協同設計,另外,係統級體係結構優化與部件級優化一樣重要。
——Christors Kozyrakis,斯坦福大學電子工程和計算機科學係副教授
齣版者的話
本書贊譽
譯者序
前言
作者簡介
第1章 計算機概要與技術1
1.1 引言1
1.1.1 計算應用的分類及其特性2
1.1.2 歡迎來到後PC時代3
1.1.3 你能從本書學到什麼4
1.2 計算機係統結構中的8個偉大思想6
1.2.1 麵嚮摩爾定律的設計6
1.2.2 使用抽象簡化設計6
1.2.3 加速大概率事件6
1.2.4 通過並行提高性能7
1.2.5 通過流水綫提高性能7
1.2.6 通過預測提高性能7
1.2.7 存儲器層次7
1.2.8 通過冗餘提高可靠性7
1.3 程序概念入門7
1.4 硬件概念入門10
1.4.1 顯示器11
1.4.2 觸摸屏12
1.4.3 打開機箱12
1.4.4 數據安全15
1.4.5 與其他計算機通信16
1.5 處理器和存儲器製造技術17
1.6 性能20
1.6.1 性能的定義20
1.6.2 性能的度量22
1.6.3 CPU性能及其因素23
1.6.4 指令的性能24
1.6.5 經典的CPU性能公式25
1.7 功耗牆27
1.8 滄海巨變:從單處理器嚮多處理器轉變29
1.9 實例:Intel Core i7基準31
1.9.1 SPEC CPU基準測試程序31
1.9.2 SPEC功耗基準測試程序32
1.10 謬誤與陷阱33
1.11 本章小結35
1.12 曆史觀點和拓展閱讀36
1.13 練習題36
第2章 指令:計算機的語言40
2.1 引言40
2.2 計算機硬件的操作43
2.3 計算機硬件的操作數44
2.3.1 存儲器操作數45
2.3.2 常數或立即數操作數47
2.4 有符號數和無符號數48
2.5 計算機中指令的錶示53
2.6 邏輯操作58
2.7 決策指令60
2.7.1 循環61
2.7.2 case/switch語句63
2.8 計算機硬件對過程的支持64
2.8.1 使用更多的寄存器66
2.8.2 嵌套過程67
2.8.3 在棧中為新數據分配空間69
2.8.4 在堆中為新數據分配空間70
2.9 人機交互72
2.10 MIPS中32位立即數和尋址75
2.10.1 32位立即數75
2.10.2 分支和跳轉中的尋址76
2.10.3 MIPS尋址模式總結78
2.10.4 機器語言解碼79
2.11 並行與指令:同步81
2.12 翻譯並執行程序83
2.12.1 編譯器83
2.12.2 匯編器84
2.12.3 鏈接器85
2.12.4 加載器87
2.12.5 動態鏈接庫87
2.12.6 啓動一個Java程序89
2.13 以一個C排序程序作為完整的例子90
2.13.1 swap過程90
2.13.2 sort過程91
2.14 數組與指針96
2.14.1 用數組實現clear96
2.14.2 用指針實現clear97
2.14.3 比較兩個版本的clear97
2.15 高級內容:編譯C語言和解釋Java語言98
2.16 實例:ARMv7(32位)指令集98
2.16.1 尋址模式99
2.16.2 比較和條件分支100
2.16.3 ARM的特色100
2.17 實例:x86指令集102
2.17.1 Intel x86的改進102
2.17.2 x86寄存器和數據尋址模式103
2.17.3 x86整數操作105
2.17.4 x86指令編碼107
2.17.5 x86總結108
2.18 實例:ARMv8(64位)指令集108
2.19 謬誤與陷阱109
2.20 本章小結110
2.21 曆史觀點和拓展閱讀111
2.22 練習題112
第3章 計算機的算術運算117
3.1 引言117
3.2 加法和減法117
3.3 乘法121
3.3.1 順序的乘法算法和硬件121
3.3.2 有符號乘法124
3.3.3 更快速的乘法124
3.3.4 MIPS中的乘法124
3.3.5 小結125
3.4 除法125
3.4.1 除法算法及其硬件結構125
3.4.2 有符號除法128
3.4.3 更快速的除法128
3.4.4 MIPS中的除法129
3.4.5 小結129
3.5 浮點運算130
3.5.1 浮點錶示131
3.5.2 浮點加法135
3.5.3 浮點乘法138
3.5.4 MIPS中的浮點指令139
3.5.5 算術精確性145
3.5.6 小結146
3.6 並行性和計算機算術:子字並行148
3.7 實例:x86中流處理SIMD擴展和高級嚮量擴展149
3.8 加速:子字並行和矩陣乘法150
3.9 謬誤與陷阱153
3.10 本章小結155
3.11 曆史觀點和拓展閱讀158
3.12 練習題159
第4章 處理器162
4.1 引言162
4.2 邏輯設計的一般方法165
4.3 建立數據通路167
4.4 一個簡單的實現機製173
4.4.1 ALU控製173
4.4.2 主控製單元的設計175
4.4.3 為什麼不使用單周期實現方式181
4.5 流水綫概述182
4.5.1 麵嚮流水綫的指令集設計186
4.5.2 流水綫冒險186
4.5.3 對流水綫概述的小結191
4.6 流水綫數據通路及其控製192
4.6.1 圖形化錶示的流水綫200
4.6.2 流水綫控製203
4.7 數據冒險:旁路與阻塞206
4.8 控製冒險214
4.8.1 假定分支不發生215
4.8.2 縮短分支的延遲215
4.8.3 動態分支預測216
4.8.4 流水綫小結220
4.9 異常221
4.9.1 MIPS體係結構中的異常處理221
4.9.2 在流水綫實現中的異常222
4.10 指令級並行226
4.10.1 推測的概念227
4.10.2 靜態多發射處理器227
4.10.3 動態多發射處理器231
4.10.4 能耗效率與高級流水綫233
4.11 實例:ARM Cortex-A8和Intel Core i7流水綫234
4.11.1 ARM Cortex-A8235
4.11.2 Intel Core i7 920236
4.11.3 Intel Core i7 920的性能238
4.12 運行更快:指令級並行和矩陣乘法240
4.13 高級主題:通過硬件設計語言描述和建模流水綫來介紹數字設計以及更多流水綫示例242
4.14 謬誤與陷阱242
4.15 本章小結243
4.16 曆史觀點和拓展閱讀243
4.17 練習題243
第5章 大容量和高速度:開發存儲器層次結構252
5.1 引言252
5.2 存儲器技術255
5.2.1 SRAM技術256
5.2.2 DRAM技術256
5.2.3 閃存258
5.2.4 磁盤存儲器258
5.3 cache的基本原理259
5.3.1 cache訪問261
5.3.2 cache缺失處理265
5.3.3 寫操作處理266
5.3.4 一個cache的例子:內置FastMATH處理器267
5.3.5 小結269
5.4 cache性能的評估和改進270
5.4.1 通過更靈活地放置塊來減少cache缺失272
5.4.2 在cache中查找一個塊275
5.4.3 替換塊的選擇276
5.4.4 使用多級cache結構減少缺失代價277
5.4.5 通過分塊進行軟件優化280
5.4.6 小結283
5.5 可信存儲器層次283
5.5.1 失效的定義283
5.5.2 糾正一位錯、檢測兩位錯的漢明編碼(SEC/DED)284
5.6 虛擬機287
5.6.1 虛擬機監視器的必備條件289
5.6.2 指令集係統結構(缺乏)對虛擬機的支持289
5.6.3 保護和指令集係統結構289
5.7 虛擬存儲器290
5.7.1 頁的存放和查找293
5.7.2 缺頁故障294
5.7.3 關於寫297
5.7.4 加快地址轉換:TLB297
5.7.5 集成虛擬存儲器、TLB和cache 300
5.7.6 虛擬存儲器中的保護302
5.7.7 處理TLB缺失和缺頁303
5.7.8 小結307
5.8 存儲器層次結構的一般框架309
5.8.1 問題1:一個塊可以被放在何處309
5.8.2 問題2:如何找到一個塊310
5.8.3 問題3:當cache缺失時替換哪一塊311
5.8.4 問題4:寫操作如何處理311
5.8.5 3C:一種理解存儲器層次結構行為的直觀模型312
5.9 使用有限狀態機來控製簡單的cache314
5.9.1 一個簡單的cache314
5.9.2 有限狀態機315
5.9.3 一個簡單的cache控製器的有限狀態機316
5.10 並行與存儲器層次結構:cache一緻性317
5.10.1 實現一緻性的基本方案318
5.10.2 監聽協議319
5.11 並行與存儲器層次結構:冗餘廉價磁盤陣列320
5.12 高級內容:實現cache控製器320
5.13 實例:ARM Cortex-A8和Intel Core i7的存儲器層次結構320
5.14 運行更快:cache分塊和矩陣乘法324
5.15 謬誤和陷阱326
5.16 本章小結329
5.17 曆史觀點和拓展閱讀329
5.18 練習題329
第6章 從客戶端到雲的並行處理器340
6.1 引言340
6.2 創建並行處理程序的難點342
6.3 SISD、MIMD、SIMD、SPMD和嚮量機345
6.3.1 在x86中的SIMD:多媒體擴展346
6.3.2 嚮量機346
6.3.3 嚮量與標量的對比347
6.3.4 嚮量與多媒體擴展的對比348
6.4 硬件多綫程350
6.5 多核和其他共享內存多處理器352
6.6 圖形處理單元簡介355
6.6.1 NVIDIA GPU體係結構簡介356
6.6.2 NVIDIA GPU存儲結構357
6.6.3 GPU展望358
6.7 集群、倉儲級計算機和其他消息傳遞多處理器360
6.8 多處理器網絡拓撲簡介363
6.9 與外界通信:集群網絡366
6.10 多處理器測試集程序和性能模型366
6.10.1 性能模型368
6.10.2 Roofline模型369
6.10.3 兩代Opteron的比較370
6.11 實例:評測Intel Core i7 960和NVIDIA Tesla GPU的Roofline模型373
6.12 運行更快:多處理器和矩陣乘法376
6.13 謬誤與陷阱378
6.14 本章小結379
6.15 曆史觀點和拓展閱讀381
6.16 練習題382
附錄A 匯編器、鏈接器和SPIM仿真器389
附錄B 邏輯設計基礎437
索引494
計算機組成與設計:硬件/軟件接口(原書第5版) 下載 mobi pdf epub txt 電子書 格式 2025
計算機組成與設計:硬件/軟件接口(原書第5版) 下載 mobi epub pdf 電子書還不錯
評分聽說是很不錯的教材耶哈哈哈
評分書稍有點舊
評分不錯,清華計算機專業課程老師推薦
評分很好的商品,超喜歡,贊
評分這本書的印刷太差瞭 跟盜版一樣
評分東西很好,我已經收到瞭。
評分書是正版,包裝完好,好好學習學習。
評分喜歡,都是經典的。
計算機組成與設計:硬件/軟件接口(原書第5版) mobi epub pdf txt 電子書 格式下載 2025