-
>
決戰(zhàn)行測(cè)5000題(言語(yǔ)理解與表達(dá))
-
>
軟件性能測(cè)試.分析與調(diào)優(yōu)實(shí)踐之路
-
>
第一行代碼Android
-
>
深度學(xué)習(xí)
-
>
Unreal Engine 4藍(lán)圖完全學(xué)習(xí)教程
-
>
深入理解計(jì)算機(jī)系統(tǒng)-原書(shū)第3版
-
>
Word/Excel PPT 2013辦公應(yīng)用從入門到精通-(附贈(zèng)1DVD.含語(yǔ)音視頻教學(xué)+辦公模板+PDF電子書(shū))
Python數(shù)據(jù)分析入門-從數(shù)據(jù)獲取到可視化 版權(quán)信息
- ISBN:9787121336539
- 條形碼:9787121336539 ; 978-7-121-33653-9
- 裝幀:一般膠版紙
- 冊(cè)數(shù):暫無(wú)
- 重量:暫無(wú)
- 所屬分類:>>
Python數(shù)據(jù)分析入門-從數(shù)據(jù)獲取到可視化 本書(shū)特色
本書(shū)作為數(shù)據(jù)分析的入門圖書(shū),以Python語(yǔ)言為基礎(chǔ),介紹了數(shù)據(jù)分析的整個(gè)流程。本書(shū)內(nèi)容涵蓋數(shù)據(jù)的獲。淳W(wǎng)絡(luò)爬蟲(chóng)程序的設(shè)計(jì))、前期數(shù)據(jù)的清洗和處理、運(yùn)用機(jī)器學(xué)習(xí)算法進(jìn)行建模分析,以及使用可視化的方法展示數(shù)據(jù)及結(jié)果。首先,書(shū)中不會(huì)涉及過(guò)于高級(jí)的語(yǔ)法,不過(guò)還是希望讀者有一定的語(yǔ)法基礎(chǔ),這樣可以更好地理解本書(shū)的內(nèi)容。其次,本書(shū)重點(diǎn)在于應(yīng)用Python來(lái)完成一些數(shù)據(jù)分析和數(shù)據(jù)處理的工作,即如何使用Python來(lái)完成工作而非專注于Python語(yǔ)言語(yǔ)法等原理的講解。本書(shū)的目的是讓初學(xué)者不論對(duì)數(shù)據(jù)分析流程本身還是Python語(yǔ)言,都能有一個(gè)十分直觀的感受,為以后的深入學(xué)習(xí)打下基礎(chǔ)。*后,讀者不必須按順序通讀本書(shū),因?yàn)楦鱾(gè)章節(jié)層次比較分明,可以根據(jù)興趣或者需要來(lái)自行安排。例如第5章介紹了一些實(shí)戰(zhàn)的小項(xiàng)目,有趣且難度不大,大家可以在學(xué)習(xí)前面內(nèi)容之余來(lái)閱讀這部分內(nèi)容。
Python數(shù)據(jù)分析入門-從數(shù)據(jù)獲取到可視化 內(nèi)容簡(jiǎn)介
這是一本務(wù)實(shí)之作,充分體現(xiàn)數(shù)據(jù)分析流程的各項(xiàng)環(huán)節(jié),包含數(shù)據(jù)的采集、清洗和探索性分析,并通過(guò)大家耳熟能說(shuō)的Python工具加以實(shí)操。
Python數(shù)據(jù)分析入門-從數(shù)據(jù)獲取到可視化 目錄
1.1 開(kāi)發(fā)環(huán)境搭建 2
1.1.1 在Ubuntu系統(tǒng)下搭建Python集成開(kāi)發(fā)環(huán)境 2
1.1.2 在Windows系統(tǒng)下搭建Python集成開(kāi)發(fā)環(huán)境 13
1.1.3 三種安裝第三方庫(kù)的方法 16
1.2 Python基礎(chǔ)語(yǔ)法介紹 19
1.2.1 if__name__=='__main__' 20
1.2.2 列表解析式 22
1.2.3 裝飾器 23
1.2.4 遞歸函數(shù) 26
1.2.5 面向?qū)ο?27
1.3 The Zen of Python 28
參考文獻(xiàn) 30
2 數(shù)據(jù)的獲取 31
2.1 爬蟲(chóng)簡(jiǎn)介 31
2.2 數(shù)據(jù)抓取實(shí)踐 33
2.2.1 請(qǐng)求網(wǎng)頁(yè)數(shù)據(jù) 33
2.2.2 網(wǎng)頁(yè)解析 38
2.2.3 數(shù)據(jù)的存儲(chǔ) 46
2.3 爬蟲(chóng)進(jìn)階 50
2.3.1 異常處理 50
2.3.2 robots.txt 58
2.3.3 動(dòng)態(tài)UA 60
2.3.4 代理IP 61
2.3.5 編碼檢測(cè) 61
2.3.6 正則表達(dá)式入門 63
2.3.7 模擬登錄 69
2.3.8 驗(yàn)證碼問(wèn)題 74
2.3.9 動(dòng)態(tài)加載內(nèi)容的獲取 84
2.3.10 多線程與多進(jìn)程 93
2.4 爬蟲(chóng)總結(jié) 101
參考文獻(xiàn) 102
3 數(shù)據(jù)的存取與清洗 103
3.1 數(shù)據(jù)存取 103
3.1.1 基本文件操作 103
3.1.2 CSV文件的存取 111
3.1.3 JSON文件的存取 116
3.1.4 XLSX文件的存取 121
3.1.5 MySQL數(shù)據(jù)庫(kù)文件的存取 137
3.2 NumPy 145
3.2.1 NumPy簡(jiǎn)介 145
3.2.2 NumPy基本操作 146
3.3 pandas 158
3.3.1 pandas簡(jiǎn)介 158
3.3.2 Series與DataFrame的使用 159
3.3.3 布爾值數(shù)組與函數(shù)應(yīng)用 169
3.4 數(shù)據(jù)的清洗 174
3.4.1 編碼問(wèn)題 174
3.4.2 缺失值的檢測(cè)與處理 175
3.4.3 去除異常值 181
3.4.4 去除重復(fù)值與冗余信息 183
3.4.5 注意事項(xiàng) 185
參考文獻(xiàn) 187
4 數(shù)據(jù)的分析及可視化 188
4.1 探索性數(shù)據(jù)分析 189
4.1.1 基本流程 189
4.1.2 數(shù)據(jù)降維 197
4.2 機(jī)器學(xué)習(xí)入門 199
4.2.1 機(jī)器學(xué)習(xí)簡(jiǎn)介 200
4.2.2 決策樹(shù)——機(jī)器學(xué)習(xí)算法的應(yīng)用 202
4.3 手動(dòng)實(shí)現(xiàn)KNN算法 205
4.3.1 特例——*鄰近分類器 205
4.3.2 KNN算法的完整實(shí)現(xiàn) 213
4.4 數(shù)據(jù)可視化 215
4.4.1 高質(zhì)量作圖工具——matplotlib 215
4.4.2 快速作圖工具——pandas與matplotlib 223
4.4.3 簡(jiǎn)捷作圖工具——seaborn與matplotlib 226
4.4.4 詞云圖 230
參考文獻(xiàn) 232
5 Python與生活 234
5.1 定制一個(gè)新聞提醒服務(wù) 234
5.1.1 新聞數(shù)據(jù)的抓取 235
5.1.2 實(shí)現(xiàn)郵件發(fā)送功能 237
5.1.3 定時(shí)執(zhí)行及本地日志記錄 239
5.2 Python與數(shù)學(xué) 241
5.2.1 估計(jì)π值 242
5.2.2 三門問(wèn)題 245
5.2.3 解決LP與QP問(wèn)題(選讀) 247
5.3 QQ群聊天記錄數(shù)據(jù)分析 251
參考文獻(xiàn) 256
Python數(shù)據(jù)分析入門-從數(shù)據(jù)獲取到可視化 作者簡(jiǎn)介
沈祥壯 自學(xué)Python兩年,以數(shù)據(jù)分析為主線,系統(tǒng)學(xué)習(xí)了數(shù)據(jù)的采集,處理、分析和可視化。在研究統(tǒng)計(jì)機(jī)器學(xué)習(xí)理論的同時(shí),使用Python語(yǔ)言實(shí)現(xiàn)了部分統(tǒng)計(jì)學(xué)習(xí)算法。研究方向包括數(shù)據(jù)采集,數(shù)據(jù)挖掘,統(tǒng)計(jì)機(jī)器學(xué)習(xí)及圖像處理。
- >
推拿
- >
中國(guó)人在烏蘇里邊疆區(qū):歷史與人類學(xué)概述
- >
新文學(xué)天穹兩巨星--魯迅與胡適/紅燭學(xué)術(shù)叢書(shū)(紅燭學(xué)術(shù)叢書(shū))
- >
巴金-再思錄
- >
人文閱讀與收藏·良友文學(xué)叢書(shū):一天的工作
- >
有舍有得是人生
- >
月亮與六便士
- >
我從未如此眷戀人間