歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊(cè)

利用Dask擴(kuò)展Python性能

出版社:清華大學(xué)出版社出版時(shí)間:2024-08-01
開本: 32開 頁數(shù): 432
中 圖 價(jià):¥62.3(7.0折) 定價(jià)  ¥89.0 登錄后可看到會(huì)員價(jià)
加入購物車 收藏
運(yùn)費(fèi)6元,滿39元免運(yùn)費(fèi)
?新疆、西藏除外
本類五星書更多>

利用Dask擴(kuò)展Python性能 版權(quán)信息

利用Dask擴(kuò)展Python性能 本書特色

Dask 是一個(gè)使用 Python 進(jìn)行并行計(jì)算的框架,使得并行計(jì)算可以從一臺(tái)機(jī)器上的多 個(gè)核心擴(kuò)展到擁有數(shù)千臺(tái)機(jī)器的數(shù)據(jù)中心。它具有低級(jí)任務(wù) API 和更高級(jí)別的以數(shù)據(jù)為 中心的 API。低級(jí)任務(wù) API 支持 Dask 與各種 Python 庫的集成。擁有公共 API 使得工具 生態(tài)系統(tǒng)能夠圍繞 Dask 得以發(fā)展,以適應(yīng)各種用例。

利用Dask擴(kuò)展Python性能 內(nèi)容簡(jiǎn)介

本書詳細(xì)闡述了與Dask 擴(kuò)展 Python 性能相關(guān)的基本知識(shí),主要包括了解 Dask、Dask 基礎(chǔ)操作、Dask的工作原理、Dask DataFrame、Dask的集合、高級(jí)任務(wù)調(diào)度、添加可變狀態(tài)和Dask Actor、評(píng)估Dask的組件和庫、遷移現(xiàn)有的分析工程、使用GPU和其他特殊資源的Dask、使用Dask進(jìn)行機(jī)器學(xué)習(xí)、生產(chǎn)化Dask等內(nèi)容。此外,本書還提供了相應(yīng)的示例、代碼,以幫助讀者進(jìn)一步理解相關(guān)方案的實(shí)現(xiàn)過程。
本書適合作為高等院校計(jì)算機(jī)及相關(guān)專業(yè)的教材和教學(xué)參考書,也可作為相關(guān)開發(fā)人員的自學(xué)用書和參考手冊(cè)。

利用Dask擴(kuò)展Python性能 目錄

第1章 了解Dask 1.1 需要使用Dask的理由 1.2 Dask在生態(tài)系統(tǒng)中的定位 1.2.1 大數(shù)據(jù) 1.2.2 數(shù)據(jù)科學(xué) 1.2.3 并行分布式Python 1.3 Dask社區(qū)庫 1.3.1 加速Python 1.3.2 SQL引擎 1.3.3 工作流程調(diào)度 1.4 Dask的局限性 1.5 小結(jié) 第2章 Dask基礎(chǔ)操作 2.1 本地安裝Dask 2.2 Hello World 2.2.1 Hello World任務(wù) 2.2.2 分布式集合 2.2.3 Dask DataFrame 2.3 小結(jié) 第3章 Dask的工作原理:基礎(chǔ)知識(shí) 3.1 執(zhí)行后端 3.1.1 本地后端 3.1.2 分布式后端(Dask客戶端和調(diào)度程序) 3.2 Dask的診斷用戶界面 3.3 序列化和Pickling 3.4 分區(qū)/分塊集合 3.4.1 Dask數(shù)組 3.4.2 Dask bag 3.4.3 Dask DataFrame 3.4.4 打亂 3.4.5 加載期間分區(qū) 3.5 任務(wù)、圖和惰性評(píng)估 3.5.1 惰性評(píng)估 3.5.2 任務(wù)依賴關(guān)系 3.5.3 可視化 3.5.4 中間任務(wù)結(jié)果 3.5.5 任務(wù)規(guī)模調(diào)整 3.5.6 當(dāng)任務(wù)圖變得太大時(shí) 3.5.7 組合計(jì)算 3.5.8 持久化、緩存和記憶化 3.6 容錯(cuò)能力 3.7 小結(jié) 第4章 Dask DataFrame 4.1 Dask DataFrame的構(gòu)建方式 4.2 加載和寫入 4.2.1 格式 4.2.2 文件系統(tǒng) 4.3 索引 4.4 打亂數(shù)據(jù) 4.4.1 滾動(dòng)窗口和map_overlap 4.4.2 聚合 4.4.3 打亂 4.4.4 分區(qū) 4.5 尷檻尬的并行操作 4.6 使用多個(gè)DataFrame 4.6.1 組合DataFrame的常用函數(shù)解析 4.6.2 多DataFrame內(nèi)部原理 4.6.3 缺失的功能 4.7 無法使用的功能 …… 第5章 Dask的集合 第6章 任務(wù)調(diào)度:Futures 第7章 添加可變狀態(tài)和DaskActor 第8章 評(píng)估Dask的組件和庫 第9章 遷移現(xiàn)有的分析工程 0章 使用GPU和其他特殊資源的Dask 1章 使用Dask進(jìn)行機(jī)器學(xué)習(xí) 2章 生產(chǎn)化Dask:Notebook、部署、調(diào)整和監(jiān)控 附錄A Dask用戶的關(guān)鍵系統(tǒng)概念 附錄B 可擴(kuò)展的DataFrame 附錄C 調(diào)試Dask 附錄D 使用Streamz和Dask進(jìn)行流式處理
展開全部

利用Dask擴(kuò)展Python性能 作者簡(jiǎn)介

Holden Karau, is transgender Canadian, and an active open source contributor.When not in San Francisco working as a software development engineer at IBM's Spark Technology Center, Holden talks internationally on Apache Spark and holds office hours at coffee shops at home and abroad. She is a Spark committer with fre- quent contributions, specializing in PySpark and Machine Learning. Prior to IBM she worked on a variety of distributed, search, and classification problems at Alpine, Databricks, Google, Foursquare, and . She graduated from the University of Waterloo with a Bachelor of Mathematics in Computer Science. Outside of software she enjoys playing with fire, welding, scooters, poutine, and dancing.

商品評(píng)論(0條)
暫無評(píng)論……
書友推薦
編輯推薦
返回頂部
中圖網(wǎng)
在線客服