書馨卡幫你省薪 2024個(gè)人購書報(bào)告 2024中圖網(wǎng)年度報(bào)告
歡迎光臨中圖網(wǎng) 請 | 注冊
> >
零基礎(chǔ)學(xué)Python爬蟲.數(shù)據(jù)分析與可視化從入門到精通

零基礎(chǔ)學(xué)Python爬蟲.數(shù)據(jù)分析與可視化從入門到精通

出版社:機(jī)械工業(yè)出版社出版時(shí)間:2020-12-01
開本: 16開 頁數(shù): 376
中 圖 價(jià):¥60.2(6.7折) 定價(jià)  ¥89.8 登錄后可看到會(huì)員價(jià)
加入購物車 收藏
運(yùn)費(fèi)6元,滿39元免運(yùn)費(fèi)
?新疆、西藏除外
本類五星書更多>

零基礎(chǔ)學(xué)Python爬蟲.數(shù)據(jù)分析與可視化從入門到精通 版權(quán)信息

零基礎(chǔ)學(xué)Python爬蟲.數(shù)據(jù)分析與可視化從入門到精通 本書特色

揭秘python爬蟲在行業(yè)實(shí)戰(zhàn)中的應(yīng)用,
講解大數(shù)據(jù)分析與可視化的典型技術(shù)
數(shù)據(jù)自動(dòng)爬取 海量數(shù)據(jù)分析 中文文本分詞 大數(shù)據(jù)可視化

零基礎(chǔ)學(xué)Python爬蟲.數(shù)據(jù)分析與可視化從入門到精通 內(nèi)容簡介

Python 語言功能強(qiáng)大而靈活,具有很強(qiáng)的擴(kuò)展性,同時(shí)它的語法又相對簡潔易懂,沒有編程基礎(chǔ)的普通辦公人員經(jīng)過適當(dāng)?shù)膶W(xué)習(xí)也能輕松上手。本書以Python 語言為工具,從編程新手的角度和日常辦公的需求出發(fā),深入淺出地講解如何通過Python 編程高效地完成數(shù)據(jù)的獲取、處理、分析與可視化。全書共13 章。 章和第2 章主要講解Python 編程環(huán)境的搭建和Python 語言的基礎(chǔ)語法知識(shí)。第3 ~ 6章以數(shù)據(jù)處理與分析為主題,講解NumPy 模塊和pandas 模塊的基本用法和實(shí)際應(yīng)用。第7 ~ 9 章以數(shù)據(jù)獲取為主題,由淺入深地講解如何通過編寫爬蟲程序從網(wǎng)頁上采集數(shù)據(jù),并保存到數(shù)據(jù)庫中。0 章主要講解自然語言處理技術(shù)在文本分詞中的應(yīng)用。1 章和2 章以數(shù)據(jù)可視化為主題,講解如何使用Matplotlib 模塊和pyecharts 模塊繪制圖表。3 章通過量化金融案例對前面所學(xué)的知識(shí)進(jìn)行了綜合應(yīng)用。
本書適合想要提高數(shù)據(jù)處理和分析效率的職場人士和辦公人員閱讀,也可供Python 編程愛好者參考。

零基礎(chǔ)學(xué)Python爬蟲.數(shù)據(jù)分析與可視化從入門到精通 目錄

前言 如何獲取學(xué)習(xí)資源 第1章 Python快速上手 1.1Python編程環(huán)境的搭建 13 1.2Python的模塊 19 1.2.1初識(shí)模塊 19 1.2.2模塊的安裝 19 第2章 Python的基礎(chǔ)語法知識(shí) 2.1變量 23 2.2數(shù)據(jù)類型:數(shù)字與字符串 24 2.2.1數(shù)字 24 2.2.2字符串 25 2.2.3數(shù)據(jù)類型的查詢 27 2.2.4數(shù)據(jù)類型的轉(zhuǎn)換 28 2.3數(shù)據(jù)類型:列表、字典、元組與集合 29 2.3.1列表 29 2.3.2字典 33 2.3.3元組和集合 34 2.4運(yùn)算符 35 2.4.1算術(shù)運(yùn)算符和字符串運(yùn)算符 35 2.4.2比較運(yùn)算符 36 2.4.3賦值運(yùn)算符 37 2.4.4邏輯運(yùn)算符 38 2.5編碼基本規(guī)范 38 2.5.1縮進(jìn) 39 2.5.2注釋 39 2.6控制語句 41 2.6.1if語句 41 2.6.2for語句 42 2.6.3while語句 43 2.6.4控制語句的嵌套 44 2.7函數(shù) 45 2.7.1內(nèi)置函數(shù) 45 2.7.2自定義函數(shù) 51 2.8模塊的導(dǎo)入 53 2.8.1import語句導(dǎo)入法 53 2.8.2from語句導(dǎo)入法 54 第3章 數(shù)組的存儲(chǔ)和處理-NumPy模塊 3.1創(chuàng)建數(shù)組 56 3.1.1使用array()函數(shù)創(chuàng)建數(shù)組 56 3.1.2創(chuàng)建等差數(shù)組 57 3.1.3創(chuàng)建隨機(jī)數(shù)組 59 3.2查看數(shù)組的屬性 61 3.3選取數(shù)組元素 63 3.3.1一維數(shù)組的元素選取 63 3.3.2二維數(shù)組的元素選取 66 3.4數(shù)組的重塑與轉(zhuǎn)置 68 3.4.1一維數(shù)組的重塑 69 3.4.2多維數(shù)組的重塑 70 3.4.3數(shù)組的轉(zhuǎn)置 71 3.5數(shù)組的處理 72 3.5.1添加數(shù)組元素 72 3.5.2刪除數(shù)組元素 75 3.5.3處理數(shù)組的缺失值 76 3.5.4處理數(shù)組的重復(fù)值 77 3.5.5拼接數(shù)組 77 3.5.6拆分?jǐn)?shù)組 79 3.6數(shù)組的運(yùn)算 81 3.6.1數(shù)組之間的四則運(yùn)算 81 3.6.2數(shù)組元素的統(tǒng)計(jì)運(yùn)算 82 第4章 數(shù)據(jù)的簡單處理-pandas模塊入門 4.1數(shù)據(jù)結(jié)構(gòu) 85 4.1.1Series對象 85 4.1.2DataFrame對象 87 4.2讀取數(shù)據(jù) 88 4.2.1讀取Excel工作簿數(shù)據(jù) 89 4.2.2讀取csv文件數(shù)據(jù) 93 4.3查看數(shù)據(jù) 94 4.3.1查看數(shù)據(jù)的前幾行 94 4.3.2查看數(shù)據(jù)的行數(shù)和列數(shù) 95 4.3.3查看數(shù)據(jù)的類型 96 4.4選擇數(shù)據(jù) 97 4.4.1選擇行數(shù)據(jù) 97 4.4.2選擇列數(shù)據(jù) 100 4.4.3同時(shí)選擇行列數(shù)據(jù) 103 4.5修改行標(biāo)簽和列標(biāo)簽 104 第5章 數(shù)據(jù)的高級(jí)處理-pandas模塊進(jìn)階 5.1數(shù)據(jù)的查找和替換 106 5.1.1查找數(shù)據(jù) 106 5.1.2替換數(shù)據(jù) 108 5.2數(shù)據(jù)的處理 110 5.2.1插入數(shù)據(jù) 110 5.2.2刪除數(shù)據(jù) 111 5.2.3處理缺失值 115 5.2.4處理重復(fù)值 118 5.2.5排序數(shù)據(jù) 121 5.2.6篩選數(shù)據(jù) 123 5.3數(shù)據(jù)表的處理 125 5.3.1轉(zhuǎn)置數(shù)據(jù)表的行列 125 5.3.2將數(shù)據(jù)表轉(zhuǎn)換為樹形結(jié)構(gòu) 125 5.3.3數(shù)據(jù)表的拼接 126 5.4數(shù)據(jù)的運(yùn)算 130 5.4.1數(shù)據(jù)的統(tǒng)計(jì)運(yùn)算 131 5.4.2獲取數(shù)值分布情況 133 5.4.3計(jì)算相關(guān)系數(shù) 134 5.4.4分組匯總數(shù)據(jù) 135 5.4.5創(chuàng)建數(shù)據(jù)透視表 137 5.5案例:獲取并分析股票歷史數(shù)據(jù) 138 第6章 使用Python進(jìn)行數(shù)據(jù)分析 6.1相關(guān)性分析 143 6.1.1獲取股價(jià)數(shù)據(jù) 143 6.1.2合并股價(jià)數(shù)據(jù) 146 6.1.3股價(jià)數(shù)據(jù)相關(guān)性分析 148 6.2假設(shè)檢驗(yàn) 150 6.3方差分析 152 6.3.1方差分析的基本步驟 152 6.3.2單因素方差分析的代碼實(shí)現(xiàn) 159 6.3.3雙因素方差分析的代碼實(shí)現(xiàn) 162 6.3.4利用第三方模塊快速完成方差分析 164 6.4描述性統(tǒng)計(jì)分析 167 6.4.1描述性統(tǒng)計(jì)指標(biāo)的計(jì)算 167 6.4.2數(shù)據(jù)的分布狀態(tài)分析 169 6.4.3數(shù)據(jù)的頻數(shù)和頻率分析 171 6.5線性回歸分析 174 6.5.1線性回歸分析的數(shù)學(xué)原理 174 6.5.2線性回歸分析的思路 175 6.5.3廣告費(fèi)與銷量的一元線性回歸分析 178 6.5.4不同渠道的廣告費(fèi)與銷量的多元線性回歸分析 182 第7章 Python爬蟲基礎(chǔ) 7.1認(rèn)識(shí)網(wǎng)頁結(jié)構(gòu) 188 7.1.1查看網(wǎng)頁的源代碼 188 7.1.2網(wǎng)頁結(jié)構(gòu)的組成 189 7.1.3百度新聞頁面結(jié)構(gòu)剖析 194 7.2requests模塊 196 7.2.1requests模塊獲取數(shù)據(jù)的方式 196 7.2.2get()函數(shù)的參數(shù)介紹 200 7.3案例:爬取豆瓣電影動(dòng)畫排行榜 202 7.4正則表達(dá)式 205 7.4.1正則表達(dá)式基礎(chǔ) 205 7.4.2用正則表達(dá)式提取數(shù)據(jù) 209 7.5BeautifulSoup模塊 211 7.5.1實(shí)例化BeautifulSoup對象 212 7.5.2用BeautifulSoup對象定位標(biāo)簽 212 7.5.3從標(biāo)簽中提取文本內(nèi)容和屬性值 217 7.6XPath表達(dá)式 219 7.6.1實(shí)例化etree對象 219 7.6.2用XPath表達(dá)式定位標(biāo)簽并提取數(shù)據(jù) 220 7.6.3快速獲取標(biāo)簽節(jié)點(diǎn)的XPath表達(dá)式 221 7.7數(shù)據(jù)清洗 222 7.8案例:爬取當(dāng)當(dāng)網(wǎng)的圖書銷售排行榜 225 第8章 Python爬蟲進(jìn)階 8.1Selenium模塊基礎(chǔ) 229 8.1.1Selenium模塊的安裝與基本用法 229 8.1.2Selenium模塊的標(biāo)簽定位 232 8.1.3Selenium模塊的標(biāo)簽操作 235 8.2Selenium模塊進(jìn)階 237 8.2.1模擬鼠標(biāo)操作 237 8.2.2