本書介紹了異構(gòu)計算系統(tǒng)的發(fā)展歷程、當下主流的異構(gòu)計算系統(tǒng)所使用的程序設(shè)計模型以及若干典型的異構(gòu)計算應(yīng)用。本書主要以CPUGPU異構(gòu)計算系統(tǒng)為代表進行介紹,同時在第8章中簡要介紹了FPGA 異構(gòu)計算系統(tǒng),以使讀者了解不同類型的異構(gòu)計算系統(tǒng)之間的差異。書中具體討論了用于CPU-GPU異構(gòu)計算系統(tǒng)的線程池模型的設(shè)計與實現(xiàn)。
本書適合GPU程序設(shè)計、高性能計算、計算機體系結(jié)構(gòu)等相關(guān)領(lǐng)域的從業(yè)人員和科研人員使用,也適合對異構(gòu)計算感興趣并具有一定基礎(chǔ)知識的讀者閱讀。
更多科學(xué)出版社服務(wù),請掃碼獲取。
第1章概述
1.1算與計算工具
1.2處理器
1.2.1微處理器
1.2.2 協(xié)處理器
1.3異構(gòu)計算簡介
1.3.1 GPGPU 計算
1.3.2異構(gòu)計算應(yīng)用
本章小結(jié)
第2章異構(gòu)計算系統(tǒng)結(jié)構(gòu)
2.1 GPU體系結(jié)構(gòu)
2.2CPU-GPU異構(gòu)計算系統(tǒng)
2.2.1體系結(jié)構(gòu)視角的CPU-GPU異構(gòu)計算系統(tǒng)
2.2.2單結(jié)點單GPU異構(gòu)計算系統(tǒng)
2.2.3單結(jié)點多GPU異構(gòu)計算系統(tǒng)
2.3 GPU與AI計算
本章小結(jié)
第3章異構(gòu)計算編程模型
3.1CUDA程序設(shè)計模型
3.1.1 CUDA線程模型
3.1.2 CUDA存儲模型
3.1.3 CUDA編譯流程
3.2 CUDA 相關(guān)軟件庫
3.3CUDA性能分析工具
本章小結(jié)
第4章線程池計算模型
4.1 模型設(shè)計
4.1.1 線程池模型
4.1.2 基本設(shè)計原理和優(yōu)點
4.1.3模型結(jié)構(gòu)設(shè)計·..
4.1.4支持單結(jié)點多GPU 的 CAGTP 模型
4.2模型運行機制
4.2.1 CAGTP模型構(gòu)造
4.2.2 分配任務(wù)槽
4.2.3計算線程塊級任務(wù)調(diào)度
4.2.4 啟動任務(wù)復(fù)用 Kernel 函數(shù)
4.3 程序設(shè)計接口
4.4模型擴展變體
4.4.1無任務(wù)隊列的CAGTP 模型
4.4.2 帶有輪轉(zhuǎn)雙任務(wù)槽的 CAGTP 模型.
4.4.3支持流多處理器劃分的CAGTP模型·
4.5模型性能測試與分析
4.5.1 模型討論
4.5.2 性能分析
4.5.3微基準測試
本章小結(jié)
第5章線性代數(shù)算法實現(xiàn)
5.1 通用稠密矩陣乘
5.1.1 概述
5.1.2 GEMM 的 CAGTP 實現(xiàn)
5.1.3 GEMM在CAGTP 上的性能分析
5.2批量細度GEMM的CAGTP實現(xiàn)與性能分析
5.3 Cholesky分解
5.3.1 Cholesky 分解介紹
5.3.2 Cholesky分解的CAGTP 實現(xiàn)
5.3.3 Cholesky分解在CAGTP 上的性能分析
5.4混合任務(wù)計算
5.4.1 SPMV與Black Scholes 算法介紹
5.4.2混合任務(wù)計算的CAGTP 實現(xiàn)
5.4.3混合任務(wù)計算在CAGTP 上的性能分析
……
第6章機器學(xué)習(xí)算法實現(xiàn)
第7章高光譜圖像分類算法實現(xiàn)
第8章FPGA異構(gòu)計算
參考文獻