書馨卡幫你省薪 2024個人購書報告 2024中圖網(wǎng)年度報告
歡迎光臨中圖網(wǎng) 請 | 注冊
> >>
ASCEND C異構(gòu)并行程序設計—— 昇騰算子編程指南

ASCEND C異構(gòu)并行程序設計—— 昇騰算子編程指南

出版社:人民郵電出版社出版時間:2024-12-01
開本: 16開 頁數(shù): 189
中 圖 價:¥46.6(7.8折) 定價  ¥59.8 登錄后可看到會員價
加入購物車 收藏
運費6元,滿39元免運費
?新疆、西藏除外
本類五星書更多>

ASCEND C異構(gòu)并行程序設計—— 昇騰算子編程指南 版權(quán)信息

ASCEND C異構(gòu)并行程序設計—— 昇騰算子編程指南 本書特色

1、作者本身是哈工大軟件學院副院長,具備教學經(jīng)驗和科研經(jīng)驗,且出版了兩本?N騰方面的圖書,具有一定的寫作經(jīng)驗;

2、合作作者來自華為?N騰團隊,是?N騰首席架構(gòu)師,保證圖書的技術(shù)是新且準確的;

3、本書介紹基于?N騰架構(gòu)的人工智能編程在大模型等前沿領域的應用,覆蓋新熱點,適合ICT和人工智能行業(yè)工程師學習,也適合高校學生閱讀。

ASCEND C異構(gòu)并行程序設計—— 昇騰算子編程指南 內(nèi)容簡介

本書以昇騰算子編程語言Ascend C的高效開發(fā)為核心,系統(tǒng)介紹華為面向人工智能的昇騰AI處理器架構(gòu)、硬件抽象及其軟件棧。本書由淺入深,通過案例講解知識點,理論與實踐并重。全書分為6章,分別介紹了昇騰AI處理器軟硬件架構(gòu)、Ascend C 快速入門、Ascend C編程模型與編程范式、Ascend C算子開發(fā)流程、Ascend C算子調(diào)試調(diào)優(yōu)和Ascend C大模型算子優(yōu)化。 本書適合人工智能產(chǎn)業(yè)的研發(fā)人員閱讀,也適合軟件工程、人工智能、信息安全、大數(shù)據(jù)、物聯(lián)網(wǎng)等專業(yè)的本科生學習。

ASCEND C異構(gòu)并行程序設計—— 昇騰算子編程指南 目錄

第 1 章 ?N騰AI處理器軟硬件架構(gòu) 11.1 Atlas硬件計算平臺 11.1.1 Atlas服務器 11.1.2 Atlas集群 31.2 ?N騰AI處理器 31.3 達 芬奇架構(gòu) 51.3.1 計算單元 6第 1 章 ?N騰AI處理器軟硬件架構(gòu) 11.1 Atlas硬件計算平臺 11.1.1 Atlas服務器 11.1.2 Atlas集群 31.2 ?N騰AI處理器 31.3 達 芬奇架構(gòu) 51.3.1 計算單元 61.3.2 存儲系統(tǒng) 131.3.3 控制單元 171.3.4 指令集設計 191.4 硬件感知 201.5 ?N騰異構(gòu)計算架構(gòu) 221.6 小結(jié) 231.7 測驗題 231.8 實踐題 24第 2 章 Ascend C快速入門 252.1 并行計算的基本原理 252.1.1 并行體系結(jié)構(gòu)的分類 262.1.2 大模型并行加速的基本原理 282.1.3 并行效率量化的原理 292.2 Ascend C開發(fā)環(huán)境準備 302.2.1 版本選擇 302.2.2 環(huán)境依賴 312.2.3 安裝開發(fā)套件軟件包 312.3 Ascend C算子的開發(fā)調(diào)用 322.3.1 CANN算子的類型 322.3.2 運行時和任務調(diào)度 342.3.3 兩種核函數(shù)的調(diào)用方式 382.3.4 調(diào)用一個?N騰算子 392.4 ?N騰向量加法程序的加速比 432.5 小結(jié) 432.6 測驗題 432.7 實踐題 44第 3 章 Ascend C編程模型與編程范式 453.1 Ascend C編程模型 453.1.1 AI Core硬件抽象 453.1.2 SPMD編程模型 473.1.3 流水線編程范式 483.2 Ascend C語法擴展 503.2.1 Ascend C API概述 513.2.2 數(shù)據(jù)存儲 533.2.3 任務間通信與同步模塊 563.2.4 資源管理模塊 573.2.5 臨時變量 583.3 向量編程范式 593.3.1 算子分析 603.3.2 核函數(shù)的定義與封裝 613.3.3 算子的數(shù)據(jù)通路 623.3.4 算子類的實現(xiàn) 633.3.5 算子的切分策略 673.4 矩陣編程范式 683.4.1 基礎知識 683.4.2 高階API實現(xiàn)Matmul算子流程概述 723.4.3 Matmul算子Kernel側(cè)的開發(fā) 723.4.4 Matmul算子Host側(cè)的開發(fā) 783.5 混合編程范式 813.5.1 matmul_leakyrelu算子的基本概念 813.5.2 matmul_leakyrelu算子Kernel側(cè)的開發(fā) 823.6 更多Ascend C算子樣例 883.6.1 雙曲正弦函數(shù)算子核函數(shù)的實現(xiàn) 893.6.2 Strassen矩陣乘法算子核函數(shù)的實現(xiàn) 913.6.3 LayerNorm核函數(shù)的實現(xiàn) 1013.7 小結(jié) 1053.8 測驗題 1063.9 實踐題 106第 4 章 Ascend C算子開發(fā)流程 1084.1 算子開發(fā)流程概述 1084.2 自動生成算子工程 1094.3 算子開發(fā)流程:Kernel側(cè) 1114.3.1 函數(shù)原型的聲明 1134.3.2 算子類的實現(xiàn) 1134.4 算子開發(fā)流程:Host側(cè) 1144.4.1 Tiling實現(xiàn) 1144.4.2 shape推導等函數(shù)的實現(xiàn) 1174.4.3 算子原型的注冊 1184.5 算子工程的編譯部署 1194.5.1 算子工程的編譯 1194.5.2 算子包的部署 1214.6 PyTorch算子調(diào)用 1224.6.1 PyTorch算子調(diào)用的基本原理 1224.6.2 安裝PyTorch框架 1224.6.3 安裝torch_npu插件 1234.6.4 安裝APEX模塊 1244.6.5 調(diào)用測試腳本 1254.7 Ascend C算子在整網(wǎng)中的替換 1264.7.1 替換算子的工程開發(fā)及編譯部署 1264.7.2 PyTorch適配插件的開發(fā) 1274.7.3 算子替換 1294.8 小結(jié) 1304.9 測驗題 1304.10 實踐題 131第 5 章 Ascend C算子調(diào)試調(diào)優(yōu) 1325.1 算子調(diào)試工具 1325.1.1 孿生調(diào)試 1325.1.2 CPU域的調(diào)試 1325.1.3 NPU域的調(diào)試 1355.2 算子調(diào)優(yōu)工具 1395.2.1 算子性能調(diào)優(yōu)原理 1395.2.2 算子調(diào)優(yōu)基本流程 1425.3 算子異常檢測工具 1435.3.1 算子內(nèi)存的檢測原理 1435.3.2 算子競爭的檢測原理 1465.3.3 異常檢測工具的使用方法 1465.4 ?N騰算子性能的優(yōu)化方法 1475.4.1 算子計算流程優(yōu)化 1475.4.2 代碼實現(xiàn)優(yōu)化 1505.4.3 層次化訪存優(yōu)化 1525.4.4 計算資源利用優(yōu)化 1535.5 小結(jié) 1545.6 測驗題 1545.7 實踐題 155第 6 章 Ascend C大模型算子優(yōu)化 1566.1 大模型與自注意力算子的基礎知識 1566.1.1 大模型的奠基石——Transformer 1566.1.2 自注意力算子在GPU上加速計算的發(fā)展 1566.2 自注意力算子的優(yōu)化算法 1606.2.1 自注意力算子在?N騰AI處理器上的優(yōu)化思路 1606.2.2 自注意力算子的前向傳播優(yōu)化 1616.3 自注意力算子前向傳播的實現(xiàn) 1676.3.1 矩陣切分 1686.3.2 矩陣乘法計算 1706.3.3 Softmax計算 1716.3.4 第二次矩陣乘法及輸出合并計算 1736.4 自注意力算子的測試 1766.4.1 生成算子API 1766.4.2 編寫測試項目 1786.4.3 編譯與運行 1886.5 小結(jié) 1886.6 測驗題 1896.7 實踐題 189
展開全部

ASCEND C異構(gòu)并行程序設計—— 昇騰算子編程指南 作者簡介

蘇統(tǒng)華 哈爾濱工業(yè)大學軟件學院副院長,教授,博士生導師。主要科研方向為深度學習與異構(gòu)計算、圖像生成與安全等。承擔國家重點研發(fā)課題、國家自然科學基金等科研項目30余項,發(fā)表論文80余篇,出版專著和譯著15本。獲聘首批華為?N騰領軍人物(MVP,全國14人),擔任首屆MindSpore社區(qū)技術(shù)治理委員會成員(全球13人),擔任華為?N騰專家,連續(xù)4年評為全國GPU教育工作者。 杜 鵬 博士,浙江大學計算機輔助設計與圖形學國家重點實驗室專職研究員,主要研究方向為圖形學與CAD、人工智能、異構(gòu)計算。在SIGGRAPH、CVPR等會議發(fā)表論文10余篇,出版《?N騰A處理器CANN架構(gòu)與編程》《?N騰AI處理器CANN應用與實戰(zhàn)——基于Atas硬件的人工智能案例開發(fā)指南》。獲2021年度浙江省科學技術(shù)進步獎一等獎、2022年上海市技術(shù)發(fā)明獎一等獎。 閆長江 ?N騰CANN首席架構(gòu)師,負責?N騰AI處理器與異構(gòu)計算架構(gòu)CANN的架構(gòu)設計,負責華為?N騰處理器的市場商用業(yè)務。在數(shù)據(jù)通信和計算機體系架構(gòu)設計領域有超過20年的行業(yè)經(jīng)驗。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服