-
>
決戰(zhàn)行測5000題(言語理解與表達(dá))
-
>
軟件性能測試.分析與調(diào)優(yōu)實(shí)踐之路
-
>
第一行代碼Android
-
>
深度學(xué)習(xí)
-
>
Unreal Engine 4藍(lán)圖完全學(xué)習(xí)教程
-
>
深入理解計(jì)算機(jī)系統(tǒng)-原書第3版
-
>
Word/Excel PPT 2013辦公應(yīng)用從入門到精通-(附贈(zèng)1DVD.含語音視頻教學(xué)+辦公模板+PDF電子書)
PYTHON數(shù)據(jù)分析與大數(shù)據(jù)處理從入門到精通 版權(quán)信息
- ISBN:9787301307656
- 條形碼:9787301307656 ; 978-7-301-30765-6
- 裝幀:平裝-膠訂
- 冊(cè)數(shù):暫無
- 重量:暫無
- 所屬分類:>>
PYTHON數(shù)據(jù)分析與大數(shù)據(jù)處理從入門到精通 本書特色
《Python數(shù)據(jù)分析與大數(shù)據(jù)處理從入門到精通》主要講解數(shù)據(jù)分析與大數(shù)據(jù)處理所需的技術(shù)、基礎(chǔ)設(shè)施、核心概念、實(shí)施流程。從編程語言準(zhǔn)備、數(shù)據(jù)采集與清洗、數(shù)據(jù)分析與可視化,到大型數(shù)據(jù)的分布式存儲(chǔ)與分布式計(jì)算,貫穿了整個(gè)大數(shù)據(jù)項(xiàng)目開發(fā)流程。本書輕理論、重實(shí)踐,目的是讓讀者快速上手。1篇首先介紹了Python的基本語法、面向?qū)ο箝_發(fā)、模塊化設(shè)計(jì)等,掌握Python的編程方式。然后介紹了多線程、多進(jìn)程及其相互間的通信,讓讀者對(duì)分布式程序有個(gè)基本的認(rèn)識(shí)。第2篇介紹了網(wǎng)絡(luò)數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)存儲(chǔ)等技術(shù)。第3篇介紹了Python常用的數(shù)據(jù)分析工具,擴(kuò)展了更多的數(shù)據(jù)清洗、插值方法,為*終的數(shù)據(jù)可視化奠定基礎(chǔ)。第4篇是大數(shù)據(jù)分析的重點(diǎn)。首先介紹了Hadoop的框架原理、調(diào)度原理,MapReduce原理與編程模型、環(huán)境搭建,接著介紹了Spark框架原理、環(huán)境搭建方式,以及如何與Hive等第三方工具進(jìn)行交互,還介紹了**的結(jié)構(gòu)化流式處理技術(shù)。第5篇通過三個(gè)項(xiàng)目實(shí)例,綜合介紹了如何分析網(wǎng)頁、如何搭建分布式爬蟲、如何應(yīng)對(duì)常見的反爬蟲、如何設(shè)計(jì)數(shù)據(jù)模型、如何設(shè)計(jì)架構(gòu)模型、如何在實(shí)踐中綜合運(yùn)用前四篇涉及的技術(shù)。本書既適合非計(jì)算機(jī)專業(yè)的編程“小白”,也適合剛畢業(yè)或即將畢業(yè)走向工作崗位的廣大畢業(yè)生,以及已經(jīng)有編程經(jīng)驗(yàn),但想轉(zhuǎn)行做大數(shù)據(jù)分析的專業(yè)人士。同時(shí),還可以作為廣大職業(yè)院校、電腦培訓(xùn)班的教學(xué)參考用書。
PYTHON數(shù)據(jù)分析與大數(shù)據(jù)處理從入門到精通 內(nèi)容簡介
《Python數(shù)據(jù)分析與大數(shù)據(jù)處理從入門到精通》主要講解數(shù)據(jù)分析與大數(shù)據(jù)處理所需的技術(shù)、基礎(chǔ)設(shè)施、核心概念、實(shí)施流程。從編程語言準(zhǔn)備、數(shù)據(jù)采集與清洗、數(shù)據(jù)分析與可視化,到大型數(shù)據(jù)的分布式存儲(chǔ)與分布式計(jì)算,貫穿了整個(gè)大數(shù)據(jù)項(xiàng)目開發(fā)流程。本書輕理論、重實(shí)踐,目的是讓讀者快速上手。1篇首先介紹了Python的基本語法、面向?qū)ο箝_發(fā)、模塊化設(shè)計(jì)等,掌握Python的編程方式。然后介紹了多線程、多進(jìn)程及其相互間的通信,讓讀者對(duì)分布式程序有個(gè)基本的認(rèn)識(shí)。第2篇介紹了網(wǎng)絡(luò)數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)存儲(chǔ)等技術(shù)。第3篇介紹了Python常用的數(shù)據(jù)分析工具,擴(kuò)展了更多的數(shù)據(jù)清洗、插值方法,為很終的數(shù)據(jù)可視化奠定基礎(chǔ)。第4篇是大數(shù)據(jù)分析的重點(diǎn)。首先介紹了Hadoop的框架原理、調(diào)度原理,MapReduce原理與編程模型、環(huán)境搭建,接著介紹了Spark框架原理、環(huán)境搭建方式,以及如何與Hive等第三方工具進(jìn)行交互,還介紹了近期新的結(jié)構(gòu)化流式處理技術(shù)。第5篇通過三個(gè)項(xiàng)目實(shí)例,綜合介紹了如何分析網(wǎng)頁、如何搭建分布式爬蟲、如何應(yīng)對(duì)常見的反爬蟲、如何設(shè)計(jì)數(shù)據(jù)模型、如何設(shè)計(jì)架構(gòu)模型、如何在實(shí)踐中綜合運(yùn)用前四篇涉及的技術(shù)。本書既適合非計(jì)算機(jī)專業(yè)的編程“小白”,也適合剛畢業(yè)或即將畢業(yè)走向工作崗位的廣大畢業(yè)生,以及已經(jīng)有編程經(jīng)驗(yàn),但想轉(zhuǎn)行做大數(shù)據(jù)分析的專業(yè)人士。同時(shí),還可以作為廣大職業(yè)院校、電腦培訓(xùn)班的教學(xué)參考用書。
PYTHON數(shù)據(jù)分析與大數(shù)據(jù)處理從入門到精通 目錄
第1章 Python入門 3
1.1 Python概述 4
1.2 搭建Python開發(fā)環(huán)境 6
1.3 Python開發(fā)工具介紹 11
1.4 Python軟件包的管理 13
1.5 實(shí)訓(xùn):編寫“Hello World” 15
本章小結(jié) 16
第2章 Python基礎(chǔ) 17
2.1 變量 18
2.2 標(biāo)識(shí)符 24
2.3 代碼組織 26
2.4 輸入與輸出 28
2.5 運(yùn)算符與優(yōu)先級(jí) 30
2.6 新手問答 30
2.7 實(shí)訓(xùn):設(shè)計(jì)一個(gè)簡易計(jì)算器 31
本章小結(jié) 31
第3章 數(shù)據(jù)類型與流程控制 32
3.1 數(shù)字類型 33
3.2 字符串類型 37
3.3 集合類型 40
3.4 流程控制語句 45
3.5 新手問答 47
3.6 實(shí)訓(xùn):設(shè)計(jì)算法,輸出乘法表 49
本章小結(jié) 50
第4章 函數(shù)、模塊、包 51
4.1 自定義函數(shù) 52
4.2 函數(shù)參數(shù) 55
4.3 函數(shù)式編程 58
4.4 模塊與包 63
4.5 新手問答 65
4.6 實(shí)訓(xùn):設(shè)計(jì)算法,對(duì)列表進(jìn)行排序 67
本章小結(jié) 68
第5章 面向?qū)ο蟮某绦蛟O(shè)計(jì) 69
5.1 面向?qū)ο?70
5.2 自定義類 71
5.3 屬性 73
5.4 方法 79
5.5 類的繼承 83
5.6 可調(diào)用對(duì)象 86
5.7 不可變對(duì)象 87
5.8 新手問答 88
5.9 實(shí)訓(xùn):設(shè)計(jì)算法,構(gòu)造一棵二叉樹 90
本章小結(jié) 92
第6章 高級(jí)主題 93
6.1 生成器 94
6.2 迭代器 96
6.3 異步處理 97
6.4 錯(cuò)誤、調(diào)試 103
6.5 新手問答 108
6.6 實(shí)訓(xùn):使用多進(jìn)程技術(shù)統(tǒng)計(jì)數(shù)據(jù)并匯總 109
本章小結(jié) 110
第2篇 數(shù)據(jù)采集與數(shù)據(jù)清洗
第7章 網(wǎng)絡(luò)數(shù)據(jù)采集 113
7.1 HTTP請(qǐng)求概述 114
7.2 XPath網(wǎng)頁解析 114
7.3 Scrapy數(shù)據(jù)采集入門 119
7.4 Scrapy應(yīng)對(duì)反爬蟲程序 126
7.5 CrawlSpider類 131
7.6 分布式爬蟲 132
7.7 新手問答 136
7.8 實(shí)訓(xùn):構(gòu)建百度云音樂爬蟲 136
本章小結(jié) 139
第8章 數(shù)據(jù)清洗 140
8.1 數(shù)據(jù)清洗的意義 141
8.2 數(shù)據(jù)清洗的內(nèi)容 141
8.3 數(shù)據(jù)格式與存儲(chǔ)類型 142
8.4 數(shù)據(jù)清洗的步驟 145
8.5 數(shù)據(jù)清洗的工具 147
8.6 新手問答 151
8.7 實(shí)訓(xùn):清洗百度云音樂數(shù)據(jù)并儲(chǔ)存到CSV 151
本章小結(jié) 152
第3篇 數(shù)據(jù)分析與可視化
第9章 NumPy數(shù)值計(jì)算 155
9.1 NumPy基礎(chǔ) 156
9.2 形狀操作 164
9.3 副本、淺拷貝和深拷貝 166
9.4 高級(jí)索引 168
9.5 排序統(tǒng)計(jì) 171
9.6 新手問答 173
9.7 實(shí)訓(xùn):銷售額統(tǒng)計(jì) 174
本章小結(jié) 175
第10章 Matplotlib可視化 176
10.1 圖形的基本要素 177
10.2 繪圖基礎(chǔ) 177
10.3 設(shè)置樣式 186
10.4 圖形樣例 189
10.5 新手問答 198
10.6 實(shí)訓(xùn):營業(yè)數(shù)據(jù)可視化 199
本章小結(jié) 201
第11章 Pandas統(tǒng)計(jì)分析 202
11.1 Pandas數(shù)據(jù)結(jié)構(gòu) 203
11.2 基礎(chǔ)功能 210
11.3 統(tǒng)計(jì)分析 217
11.4 時(shí)間數(shù)據(jù) 229
11.5 數(shù)據(jù)整理 231
11.6 高級(jí)功能 234
11.7 讀寫MySQL數(shù)據(jù)庫 236
11.8 新手問答 237
11.9 實(shí)訓(xùn):成績分析 237
本章小結(jié) 239
第12章 Seaborn可視化 240
12.1 Seaborn概述 241
12.2 可視化數(shù)據(jù)關(guān)系 242
12.3 根據(jù)數(shù)據(jù)分類繪圖 246
12.4 單變量與雙變量 251
12.5 線性關(guān)系 256
12.6 新手問答 258
12.7 實(shí)訓(xùn):成績分析可視化 258
本章小結(jié) 260
第4篇 大數(shù)據(jù)存儲(chǔ)與快速分析篇
第13章 Hadoop數(shù)據(jù)存儲(chǔ)與基本操作 263
13.1 Hadoop概述 264
13.2 Hadoop數(shù)據(jù)存儲(chǔ)與任務(wù)調(diào)度原理 268
13.3 Hadoop基礎(chǔ)環(huán)境搭建 273
13.4 Hadoop部署模式 294
13.5 Hadoop常用操作命令 298
13.6 新手問答 300
13.7 實(shí)訓(xùn):動(dòng)手搭建Hadoop集群環(huán)境 301
本章小結(jié) 309
第14章 Spark入門 310
14.1 Spark概述 311
14.2 Spark核心原理 312
14.3 Spark基礎(chǔ)環(huán)境搭建 315
14.4 Spark運(yùn)行模式 317
14.5 新手問答 321
14.6 實(shí)訓(xùn):動(dòng)手搭建Spark集群 322
本章小結(jié) 323
第15章 Spark RDD編程 324
15.1 RDD設(shè)計(jì)原理 325
15.2 RDD編程 328
15.3 鍵值對(duì)RDD 335
15.4 文件讀寫 340
15.5 編程進(jìn)階 342
15.6 新手問答 347
15.7 實(shí)訓(xùn):統(tǒng)計(jì)海鮮銷售情況 348
本章小結(jié) 350
第16章 Spark SQL編程 351
16.1 Spark SQL概述 352
16.2 創(chuàng)建DataFrame對(duì)象 360
16.3 DataFrame常用API 364
16.4 保存DataFrame 370
16.5 新手問答 372
16.6 實(shí)訓(xùn):統(tǒng)計(jì)手機(jī)銷售情況 373
本章小結(jié) 375
第17章 Spark流式計(jì)算編程 376
17.1 流計(jì)算簡介 377
17.2 Discretized Stream 379
17.3 Structured Streaming 385
17.4 新手問答 397
17.5 實(shí)訓(xùn):實(shí)時(shí)統(tǒng)計(jì)貸款金額 397
本章小結(jié) 398
第5篇 項(xiàng)目實(shí)戰(zhàn)篇
第18章 分析電商網(wǎng)站銷售數(shù)據(jù) 401
18.1 目標(biāo)分析 402
18.2 數(shù)據(jù)采集 405
18.3 數(shù)據(jù)分析 411
本章小結(jié) 416
第19章 分析旅游網(wǎng)站數(shù)據(jù) 417
19.1 目標(biāo)分析 418
19.2 數(shù)據(jù)采集 420
19.3 數(shù)據(jù)分析 425
本章小結(jié) 429
第20章 分析在售二手房數(shù)據(jù) 430
20.1 目標(biāo)分析 431
20.2 數(shù)據(jù)采集 434
20.3 數(shù)據(jù)分析 440
本章小結(jié) 446
附錄:Python常見面試題精選 447
主要參考文獻(xiàn) 450
PYTHON數(shù)據(jù)分析與大數(shù)據(jù)處理從入門到精通 作者簡介
朱春旭,高級(jí)軟件工程師,長期對(duì)企業(yè)、軟件開發(fā)公司、政府機(jī)構(gòu)培訓(xùn)大數(shù)據(jù)開發(fā)與應(yīng)用課程,對(duì)Python大數(shù)據(jù)處理與分析相關(guān)應(yīng)用有深入研究,并編寫有《極客內(nèi)參-大數(shù)據(jù)開發(fā)實(shí)戰(zhàn)》教程45篇,總共30000 字。
- >
唐代進(jìn)士錄
- >
煙與鏡
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
人文閱讀與收藏·良友文學(xué)叢書:一天的工作
- >
有舍有得是人生
- >
月亮與六便士
- >
苦雨齋序跋文-周作人自編集
- >
隨園食單