無(wú)R語(yǔ)言數(shù)據(jù)分析與可視化從入門(mén)到精通
-
>
決戰(zhàn)行測(cè)5000題(言語(yǔ)理解與表達(dá))
-
>
軟件性能測(cè)試.分析與調(diào)優(yōu)實(shí)踐之路
-
>
第一行代碼Android
-
>
深度學(xué)習(xí)
-
>
Unreal Engine 4藍(lán)圖完全學(xué)習(xí)教程
-
>
深入理解計(jì)算機(jī)系統(tǒng)-原書(shū)第3版
-
>
Word/Excel PPT 2013辦公應(yīng)用從入門(mén)到精通-(附贈(zèng)1DVD.含語(yǔ)音視頻教學(xué)+辦公模板+PDF電子書(shū))
無(wú)R語(yǔ)言數(shù)據(jù)分析與可視化從入門(mén)到精通 版權(quán)信息
- ISBN:9787301314807
- 條形碼:9787301314807 ; 978-7-301-31480-7
- 裝幀:一般膠版紙
- 冊(cè)數(shù):暫無(wú)
- 重量:暫無(wú)
- 所屬分類:>>
無(wú)R語(yǔ)言數(shù)據(jù)分析與可視化從入門(mén)到精通 本書(shū)特色
1. 理論為輔、實(shí)踐為主。本書(shū)涉及一些必要的理論知識(shí),特別是在數(shù)據(jù)分析部分,但總體以實(shí)踐為主,因此幾乎每節(jié)都有大量的代碼,方便讀者實(shí)踐。 2. 知識(shí)全面、系統(tǒng)。本書(shū)在介紹了R語(yǔ)言的基礎(chǔ)知識(shí)后,從數(shù)據(jù)獲取和導(dǎo)出、數(shù)據(jù)清理和操作、數(shù)據(jù)分析和可視化方面分別進(jìn)行了探討,內(nèi)容由淺入深、循序漸進(jìn)。 3. 案例廣泛。本書(shū)中的案例涉及心理學(xué)、社會(huì)學(xué)、醫(yī)學(xué)、商業(yè)和經(jīng)濟(jì)等領(lǐng)域,但并不需要讀者具備這些領(lǐng)域的專業(yè)知識(shí)。 4. “新手問(wèn)答”和“小試牛刀”知識(shí)模塊!靶率謫(wèn)答”主要對(duì)讀者學(xué)習(xí)過(guò)程中易出現(xiàn)的疑問(wèn)或容易犯的錯(cuò)誤進(jìn)行針對(duì)性的解答;“小試牛刀”結(jié)合每章知識(shí)及相關(guān)技能,列舉綜合上機(jī)案例,讓讀者在學(xué)完一章內(nèi)容后能及時(shí)回顧和練習(xí),旨在讓讀者鞏固知識(shí)、學(xué)以致用。
無(wú)R語(yǔ)言數(shù)據(jù)分析與可視化從入門(mén)到精通 內(nèi)容簡(jiǎn)介
R語(yǔ)言是一個(gè)自由、免費(fèi)、源代碼開(kāi)放的編程語(yǔ)言和環(huán)境,它提供了強(qiáng)大的數(shù)據(jù)分析功能和豐富的數(shù)據(jù)可視化手段。隨著數(shù)據(jù)科學(xué)的快速發(fā)展,R語(yǔ)言已經(jīng)成為數(shù)據(jù)分析領(lǐng)域炙手可熱的通用語(yǔ)言。全書(shū)分為3篇共12章,具體內(nèi)容如下。 篇:入門(mén)篇(章~第3章)。本篇將帶領(lǐng)讀者逐步走進(jìn)R語(yǔ)言的世界,幫助讀者對(duì)R語(yǔ)言形成初步的認(rèn)識(shí),并學(xué)會(huì)如何獲取和安裝R語(yǔ)言,以及如何在需要時(shí)獲取幫助。然后介紹R語(yǔ)言的一些基礎(chǔ)知識(shí),這些知識(shí)是靈活應(yīng)用R語(yǔ)言的必要前提。很后重點(diǎn)介紹R語(yǔ)言函數(shù)的使用方法,同時(shí)也會(huì)涉及一些其他相關(guān)內(nèi)容,如流程控制和R語(yǔ)言環(huán)境等。 第2篇:進(jìn)階篇(第4章~1章)。本篇介紹R語(yǔ)言數(shù)據(jù)管理、數(shù)據(jù)分析和數(shù)據(jù)可視化的三大威力,包括通過(guò)數(shù)據(jù)獲取、導(dǎo)出、整合和清理等操作將零散的數(shù)據(jù)整合為可以分析處理的數(shù)據(jù)集的多種方法;并介紹一些常用基礎(chǔ)統(tǒng)計(jì)和不錯(cuò)統(tǒng)計(jì)的實(shí)現(xiàn)方法,以及R語(yǔ)言的圖形生成、圖形修飾、外部繪圖插件和圖形展示等功能。 第3篇:實(shí)戰(zhàn)篇(2章)。本篇通過(guò)一個(gè)實(shí)戰(zhàn)案例,綜合講解R語(yǔ)言在數(shù)據(jù)處理與可視化分析方面的實(shí)戰(zhàn)技能。
無(wú)R語(yǔ)言數(shù)據(jù)分析與可視化從入門(mén)到精通 目錄
第1篇 入門(mén)篇第1章 R語(yǔ)言快速入門(mén) /3
1.1 R語(yǔ)言及其歷史 /4
1.1.1 R語(yǔ)言的源起 /4
1.1.2 R語(yǔ)言的版本更新 /4
1.2 R語(yǔ)言的優(yōu)勢(shì)和劣勢(shì) /5
1.2.1 R語(yǔ)言的優(yōu)勢(shì) /5
1.2.2 R語(yǔ)言的劣勢(shì) /6
1.3 R語(yǔ)言的軟件獲取及安裝 /6
1.3.1 獲取R語(yǔ)言軟件 /6
1.3.2 在Windows平臺(tái)上安裝 /7
1.3.3 在Linux平臺(tái)上安裝 /10
1.3.4 在Mac OS平臺(tái)上安裝 /11
1.4 R語(yǔ)言的輔助工具 /13
1.4.1 R GUI /13
1.4.2 RStudio /16
1.4.3 獲取幫助 /19
1.5 新手問(wèn)答 /21
1.6 小試牛刀:練習(xí)設(shè)置RStudio全局選項(xiàng) /21
本章小結(jié) /23
第2章 R語(yǔ)言的編程基礎(chǔ)(上) /24
2.1 對(duì)象與變量 /25
2.1.1 對(duì)象 /25
2.1.2 變量 /26
2.1.3 變量的列舉和刪除 /28
2.2 數(shù)據(jù)類型 /30
2.2.1 常用數(shù)據(jù)類型 /31
2.2.2 特殊值 /31
2.3 數(shù)據(jù)結(jié)構(gòu) /32
2.3.1 向量 /32
2.3.2 矩陣和數(shù)組 /38
2.3.3 因子 /43
2.3.4 列表 /46
2.3.5 數(shù)據(jù)框 /50
2.3.6 原子向量和遞歸向量 /53
2.4 數(shù)學(xué)運(yùn)算 /58
2.4.1 基礎(chǔ)運(yùn)算 /58
2.4.2 向量運(yùn)算 /61
2.4.3 矩陣運(yùn)算 /64
2.5 新手問(wèn)答 /65
2.6 小試牛刀:提取數(shù)據(jù)框子集,并對(duì)部分列做統(tǒng)計(jì)計(jì)算 /66
本章小結(jié) /67
第3章 R語(yǔ)言的編程基礎(chǔ)(下) /68
3.1 流程控制 /69
3.1.1 repeat循環(huán) /69
3.1.2 while循環(huán) /70
3.1.3 for循環(huán) /70
3.1.4 if…else語(yǔ)句 /72
3.1.5 switch語(yǔ)句 /73
3.2 編寫(xiě)R函數(shù) /74
3.2.1 函數(shù)格式 /74
3.2.2 函數(shù)參數(shù) /75
3.2.3 返回值 /77
3.2.4 函數(shù)調(diào)用 /77
3.3 R語(yǔ)言常用函數(shù) /78
3.3.1 文件操作函數(shù) /78
3.3.2 基礎(chǔ)計(jì)算函數(shù) /81
3.3.3 概率分布函數(shù) /86
3.3.4 字符處理函數(shù) /90
3.4 R包 /94
3.4.1 R包的管理 /94
3.4.2 R包的加載 /97
3.4.3 自定義R包 /98
3.5 環(huán)境空間 /103
3.5.1 環(huán)境空間的種類 /103
3.5.2 環(huán)境空間的使用方法 /104
3.5.3 環(huán)境空間的特征 /106
3.6 新手問(wèn)答 /108
3.7 小試牛刀:編寫(xiě)函數(shù)并實(shí)現(xiàn)調(diào)用 /109
本章小結(jié) /110
第2篇 進(jìn)階篇第
4章 R語(yǔ)言的數(shù)據(jù)獲取與導(dǎo)出 /113
4.1 數(shù)據(jù)獲取 /114
4.1.1 導(dǎo)入R語(yǔ)言系統(tǒng)格式數(shù)據(jù) /114
4.1.2 導(dǎo)入帶有分隔符的文本數(shù)據(jù) /114
4.1.3 導(dǎo)入Excel數(shù)據(jù) /115
4.1.4 讀取數(shù)據(jù)庫(kù)數(shù)據(jù) /119
4.1.5 讀取其他統(tǒng)計(jì)工具的數(shù)據(jù) /128
4.1.6 從互聯(lián)網(wǎng)抓取數(shù)據(jù) /136
4.2 數(shù)據(jù)導(dǎo)出 /151
4.2.1 寫(xiě)入R語(yǔ)言系統(tǒng)格式的數(shù)據(jù) /151
4.2.2 寫(xiě)入文本文件 /152
4.2.3 寫(xiě)入Excel文件 /152
4.2.4 寫(xiě)入數(shù)據(jù)庫(kù) /153
4.3 新手問(wèn)答 /155
4.4 小試牛刀:比較R語(yǔ)言讀/寫(xiě)文件的效率 /156
本章小結(jié) /158
第5章 R語(yǔ)言的數(shù)據(jù)管理威力之?dāng)?shù)據(jù)操作 /159
5.1 R語(yǔ)言內(nèi)置數(shù)據(jù)操作函數(shù) /160
5.1.1 查看和編輯數(shù)據(jù) /160
5.1.2 篩選 /163
5.1.3 合并 /165
5.1.4 分組和匯總 /168
5.1.5 排序 /170
5.1.6 轉(zhuǎn)換 /173
5.2 數(shù)據(jù)重塑 /175
5.3 apply函數(shù)族 /178
5.3.1 apply()函數(shù) /178
5.3.2 lapply()函數(shù) /181
5.3.3 sapply()函數(shù) /183
5.3.4 vapply()函數(shù) /183
5.3.5 mapply()函數(shù) /184
5.4 plyr擴(kuò)展包 /184
5.5 用sqldf()函數(shù)實(shí)現(xiàn)數(shù)據(jù)框的SQL風(fēng)格查詢 /189
5.6 dplyr擴(kuò)展包 /191
5.7 新手問(wèn)答 /199
5.8 牛刀小試:對(duì)矩陣各列使用不同的
函數(shù) /200
本章小結(jié) /202
第6章 語(yǔ)言的數(shù)據(jù)分析威力之基本統(tǒng)計(jì) /203
6.1 描述性統(tǒng)計(jì) /204
6.1.1 描述性統(tǒng)計(jì)量 /204
6.1.2 列聯(lián)表 /206
6.1.3 同時(shí)呈現(xiàn)多個(gè)統(tǒng)計(jì)量 /210
6.2 計(jì)數(shù)數(shù)據(jù)的檢驗(yàn) /215
6.2.1 卡方檢驗(yàn)的基本原理 /215
6.2.2 在R語(yǔ)言中實(shí)現(xiàn)卡方檢驗(yàn) /216
6.3 相關(guān)分析 /220
6.3.1 相關(guān)的類型 /220
6.3.2 各種相關(guān)系數(shù)計(jì)算在R語(yǔ)言中的實(shí)現(xiàn) /221
6.4 t檢驗(yàn) /224
6.4.1 獨(dú)立樣本t檢驗(yàn) /225
6.4.2 非獨(dú)立樣本t檢驗(yàn) /227
6.4.3 對(duì)t檢驗(yàn)的前提假設(shè)進(jìn)行檢驗(yàn) /228
6.5 方差分析 /230
6.5.1 方差分析的基本術(shù)語(yǔ) /230
6.5.2 aov()函數(shù) /231
6.5.3 單因素非重復(fù)測(cè)量方差分析 /232
6.5.4 單因素協(xié)方差分析 /235
6.5.5 單因素重復(fù)測(cè)量方差分析 /238
6.5.6 兩因素方差分析 /240
6.5.7 對(duì)方差分析前提假設(shè)的檢驗(yàn) /242
6.6 非參數(shù)檢驗(yàn) /242
6.6.1 兩總體比較 /243
6.6.2 多于兩總體比較 /244
6.7 回歸分析 /244
6.7.1 lm()函數(shù) /245
6.7.2 模型擬合 /245
6.7.3 模型診斷 /249
6.7.4 模型改進(jìn) /251
6.8 新手問(wèn)答 /257
6.9 小試牛刀:獨(dú)立樣本均值差異檢驗(yàn) /257
本章小結(jié) /259
第7章 R語(yǔ)言的數(shù)據(jù)分析威力之高級(jí)方法 /262
7.1 判別分析 /263
7.1.1 判別分析的原理 /263
7.1.2 判別分析在R語(yǔ)言中的實(shí)現(xiàn) /264
7.2 聚類分析 /273
7.2.1 聚類分析的原理 /274
7.2.2 聚類分析在R語(yǔ)言中的實(shí)現(xiàn) /279
7.3 主成分分析 /289
7.3.1 主成分分析的原理 /289
7.3.2 主成分分析在R語(yǔ)言中的實(shí)現(xiàn) /290
7.4 因子分析 /292
7.4.1 因子分析的原理 /293
7.4.2 因子分析在R語(yǔ)言中的實(shí)現(xiàn) /295
7.5 新手問(wèn)答 /302
7.6 小試牛刀:嘗試實(shí)現(xiàn)層次聚類 /302
本章小結(jié) /303
第8章 R語(yǔ)言的可視化威力之圖形生成 /304
8.1 R語(yǔ)言繪圖系統(tǒng) /305
8.2 單變量繪圖和雙變量繪圖 /305
8.2.1 散點(diǎn)圖 /305
8.2.2 折線圖 /309
8.2.3 條形圖 /312
8.2.4 餅圖 /314
8.2.5 箱線圖 /315
8.2.6 直方圖和核密度圖 /317
8.3 多變量繪圖 /319
8.3.1 氣泡圖 /319
8.3.2 熱圖 /321
8.3.3 馬賽克圖 /322
8.3.4 相關(guān)矩陣圖 /325
8.3.5 三維散點(diǎn)圖 /327
8.4 新手問(wèn)答 /328
8.5 小試牛刀:將兩個(gè)數(shù)據(jù)源繪制在同一個(gè)坐標(biāo)系中 /329
本章小結(jié) /330
第9章 R語(yǔ)言的可視化威力之圖形優(yōu)化 /331
9.1 添加圖形元素 /332
9.1.1 坐標(biāo)軸 /332
9.1.2 圖例 /337
9.1.3 文本注解 /341
9.1.4 標(biāo)題 /343
9.1.5 參考線 /344
9.1.6 線段和帶箭頭的線段 /346
9.1.7 矩形陰影 /347
9.2 控制圖形外觀 /348
9.2.1 整體外觀 /348
9.2.2 局部外觀 /351
9.2.3 文本 /352
9.2.4 線條 /353
9.2.5 矩形 /354
9.2.6 點(diǎn)的形狀 /355
9.3 圖形配色與布局 /356
9.3.1 顏色與調(diào)色板 /356
9.3.2 面板和分面 /362
9.3.3 圖形組合 /365
9.4 新手問(wèn)答 /368
9.5 小試牛刀:使用網(wǎng)格系統(tǒng)組合圖形 /369
本章小結(jié) /370
第10章 R語(yǔ)言的可視化威力之外部插件 /371
10.1 ggvis插件包 /372
10.1.1 ggivs與ggplot2的對(duì)比 /372
10.1.2 繪圖語(yǔ)法 /374
10.1.3 圖層 /377
10.1.4 圖形修飾 /384
10.2 plotly插件包 /391
10.2.1 plotly插件包對(duì)ggplot2包繪圖對(duì)象的擴(kuò)展 /392
10.2.2 繪圖語(yǔ)法 /393
10.2.3 繪圖示例 /403
10.2.4 圖形修飾 /416
10.3 新手問(wèn)答 /422
10.4 小試牛刀:使用plotly插件包繪制組合圖 /423
本章小結(jié) /425
第11章 R語(yǔ)言的可視化威力之圖形展示 /426
11.1 傳統(tǒng)圖形輸出 /427
11.1.1 輸出為位圖文件 /427
11.1.2 輸出為PDF文件 /428
11.1.3 輸出為矢量圖 /429
11.2 網(wǎng)頁(yè)輸出 /429
11.2.1 使用R Markdown輸出為網(wǎng)頁(yè) /430
11.2.2 使用shiny輸出為網(wǎng)頁(yè) /437
11.3 新手問(wèn)答 /443
11.4 小試牛刀:將繪圖輸出為HTML文檔 /444
本章小結(jié) /446
第3篇 實(shí)戰(zhàn)篇
第12章 R語(yǔ)言對(duì)產(chǎn)品性價(jià)比的數(shù)據(jù)分析與可視化 /449
12.1 數(shù)據(jù)采集 /450
12.1.1 分析頁(yè)面結(jié)構(gòu) /450
12.1.2 編寫(xiě)爬蟲(chóng)程序 /454
12.1.3 抓取數(shù)據(jù)并保存 /463
12.2 數(shù)據(jù)清理 /463
12.2.1 變量(字符)拆分與抽取 /464
12.2.2 檢測(cè)數(shù)據(jù)缺失與重復(fù)值 /466
12.2.3 變量類型轉(zhuǎn)化與重命名 /468
12.3 數(shù)據(jù)分析與數(shù)據(jù)可視化 /470
12.3.1 探索性數(shù)據(jù)分析 /470
12.3.2 圖書(shū)價(jià)格和評(píng)論指標(biāo)的聚類分析 /484
12.3.3 圖書(shū)性價(jià)比分析 /487
本章小結(jié) /496
參考文獻(xiàn) /497
無(wú)R語(yǔ)言數(shù)據(jù)分析與可視化從入門(mén)到精通 節(jié)選
R 語(yǔ)言是S 語(yǔ)言的一個(gè)分支,而S 語(yǔ)言則是由John Chambers、Rick Becker 和Allan Wilks 等人在貝爾實(shí)驗(yàn)室(前身為AT & T,現(xiàn)為朗訊科技)開(kāi)發(fā)的一種用來(lái)進(jìn)行數(shù)據(jù)探索、統(tǒng)計(jì)分析和作圖的解釋型語(yǔ)言。S 語(yǔ)言*初的實(shí)現(xiàn)版本主要是S-PLUS。S-PLUS 是一個(gè)商業(yè)軟件,它基于S 語(yǔ)言,并被MathSoft 公司的統(tǒng)計(jì)科學(xué)部進(jìn)一步完善。1995 年,奧克蘭大學(xué)統(tǒng)計(jì)系的Ross Ihaka 和RobertGentleman 基于S 語(yǔ)言的源代碼并結(jié)合Scheme 語(yǔ)言的語(yǔ)法,編寫(xiě)了一個(gè)能執(zhí)行S 語(yǔ)言的軟件。他們以兩人名字的首字母將該軟件命名為“R”,并公開(kāi)了該軟件的全部源代碼,其命令統(tǒng)稱為R 語(yǔ)言。因此R 語(yǔ)言其實(shí)也是S 語(yǔ)言的一種實(shí)現(xiàn)。 1997 年,由11 人組成的R 語(yǔ)言開(kāi)發(fā)核心團(tuán)隊(duì)正式成立,負(fù)責(zé)R 語(yǔ)言的開(kāi)發(fā)和維護(hù)。如今R語(yǔ)言核心開(kāi)發(fā)團(tuán)隊(duì)已經(jīng)達(dá)到25 人,成員來(lái)自世界知名大學(xué)和企業(yè)。由于R 語(yǔ)言具備出眾的擴(kuò)展性,其使用者越來(lái)越多,同時(shí)也吸引了大量的開(kāi)發(fā)者編寫(xiě)自定義函數(shù)包供更多人使用。自2004 年開(kāi)始,R 語(yǔ)言基金會(huì)幾乎每年都支持R 語(yǔ)言社區(qū)成員組織的會(huì)議,世界各地的R 語(yǔ)言開(kāi)發(fā)者和用戶齊聚一堂,討論R 語(yǔ)言的應(yīng)用與科研方面的成果。此外,自2008 年開(kāi)始,國(guó)內(nèi)也定期舉行中國(guó)R 語(yǔ)言會(huì)議,以推動(dòng)R 語(yǔ)言在我國(guó)的普及。 截至2018 年12 月,R 語(yǔ)言在TIOBE 指數(shù)中排名第16 位,反映了R 語(yǔ)言的流行程度。
無(wú)R語(yǔ)言數(shù)據(jù)分析與可視化從入門(mén)到精通 作者簡(jiǎn)介
程乾,長(zhǎng)期從事教育測(cè)量和教育大數(shù)據(jù)分析,擅長(zhǎng)教育測(cè)量技術(shù)、數(shù)據(jù)可視化、數(shù)據(jù)挖掘算法和數(shù)據(jù)庫(kù)管理,并致力于R的推廣和普及。 劉永,R語(yǔ)言極客,數(shù)據(jù)分析專家,曾任職于科大訊飛(深圳),新光在線(深圳),擅長(zhǎng)數(shù)據(jù)管理、數(shù)據(jù)可視化、潛在分類分析、結(jié)構(gòu)方程建模和統(tǒng)計(jì)計(jì)算,對(duì)R語(yǔ)言有深入研究。 高博,高級(jí)工程師,主要研究方向?yàn)樵朴?jì)算與大數(shù)據(jù)、數(shù)據(jù)可視化等,熟悉R語(yǔ)言、.Net、PHP、Python、DevOps、MySQL、SQLServer等技術(shù)和工具。參與編寫(xiě)了《代碼的力量——Discuz!源碼分析與插件開(kāi)發(fā)實(shí)例進(jìn)階》《PHP+MySQL+AJAX Web開(kāi)發(fā)給力起飛》《Java Web應(yīng)用開(kāi)發(fā)給力起飛》等圖書(shū)。主持省部級(jí)縱向課題3項(xiàng),參與縱向、橫向課題16項(xiàng),獲得軟件著作權(quán)12項(xiàng)。
- >
山海經(jīng)
- >
伯納黛特,你要去哪(2021新版)
- >
隨園食單
- >
姑媽的寶刀
- >
龍榆生:詞曲概論/大家小書(shū)
- >
煙與鏡
- >
我與地壇
- >
月亮虎