歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊(cè)
> >>
無(wú)R語(yǔ)言數(shù)據(jù)分析與可視化從入門(mén)到精通

無(wú)R語(yǔ)言數(shù)據(jù)分析與可視化從入門(mén)到精通

出版社:北京大學(xué)出版社出版時(shí)間:2020-10-01
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 508
讀者評(píng)分:5分1條評(píng)論
中 圖 價(jià):¥84.5(7.1折) 定價(jià)  ¥119.0 登錄后可看到會(huì)員價(jià)
加入購(gòu)物車 收藏
運(yùn)費(fèi)6元,滿39元免運(yùn)費(fèi)
?新疆、西藏除外
本類五星書(shū)更多>
買過(guò)本商品的人還買了

無(wú)R語(yǔ)言數(shù)據(jù)分析與可視化從入門(mén)到精通 版權(quán)信息

無(wú)R語(yǔ)言數(shù)據(jù)分析與可視化從入門(mén)到精通 本書(shū)特色

1. 理論為輔、實(shí)踐為主。本書(shū)涉及一些必要的理論知識(shí),特別是在數(shù)據(jù)分析部分,但總體以實(shí)踐為主,因此幾乎每節(jié)都有大量的代碼,方便讀者實(shí)踐。 2. 知識(shí)全面、系統(tǒng)。本書(shū)在介紹了R語(yǔ)言的基礎(chǔ)知識(shí)后,從數(shù)據(jù)獲取和導(dǎo)出、數(shù)據(jù)清理和操作、數(shù)據(jù)分析和可視化方面分別進(jìn)行了探討,內(nèi)容由淺入深、循序漸進(jìn)。 3. 案例廣泛。本書(shū)中的案例涉及心理學(xué)、社會(huì)學(xué)、醫(yī)學(xué)、商業(yè)和經(jīng)濟(jì)等領(lǐng)域,但并不需要讀者具備這些領(lǐng)域的專業(yè)知識(shí)。 4. “新手問(wèn)答”和“小試牛刀”知識(shí)模塊!靶率謫(wèn)答”主要對(duì)讀者學(xué)習(xí)過(guò)程中易出現(xiàn)的疑問(wèn)或容易犯的錯(cuò)誤進(jìn)行針對(duì)性的解答;“小試牛刀”結(jié)合每章知識(shí)及相關(guān)技能,列舉綜合上機(jī)案例,讓讀者在學(xué)完一章內(nèi)容后能及時(shí)回顧和練習(xí),旨在讓讀者鞏固知識(shí)、學(xué)以致用。

無(wú)R語(yǔ)言數(shù)據(jù)分析與可視化從入門(mén)到精通 內(nèi)容簡(jiǎn)介

    R語(yǔ)言是一個(gè)自由、免費(fèi)、源代碼開(kāi)放的編程語(yǔ)言和環(huán)境,它提供了強(qiáng)大的數(shù)據(jù)分析功能和豐富的數(shù)據(jù)可視化手段。隨著數(shù)據(jù)科學(xué)的快速發(fā)展,R語(yǔ)言已經(jīng)成為數(shù)據(jù)分析領(lǐng)域炙手可熱的通用語(yǔ)言。全書(shū)分為3篇共12章,具體內(nèi)容如下。     篇:入門(mén)篇(章~第3章)。本篇將帶領(lǐng)讀者逐步走進(jìn)R語(yǔ)言的世界,幫助讀者對(duì)R語(yǔ)言形成初步的認(rèn)識(shí),并學(xué)會(huì)如何獲取和安裝R語(yǔ)言,以及如何在需要時(shí)獲取幫助。然后介紹R語(yǔ)言的一些基礎(chǔ)知識(shí),這些知識(shí)是靈活應(yīng)用R語(yǔ)言的必要前提。很后重點(diǎn)介紹R語(yǔ)言函數(shù)的使用方法,同時(shí)也會(huì)涉及一些其他相關(guān)內(nèi)容,如流程控制和R語(yǔ)言環(huán)境等。     第2篇:進(jìn)階篇(第4章~1章)。本篇介紹R語(yǔ)言數(shù)據(jù)管理、數(shù)據(jù)分析和數(shù)據(jù)可視化的三大威力,包括通過(guò)數(shù)據(jù)獲取、導(dǎo)出、整合和清理等操作將零散的數(shù)據(jù)整合為可以分析處理的數(shù)據(jù)集的多種方法;并介紹一些常用基礎(chǔ)統(tǒng)計(jì)和不錯(cuò)統(tǒng)計(jì)的實(shí)現(xiàn)方法,以及R語(yǔ)言的圖形生成、圖形修飾、外部繪圖插件和圖形展示等功能。     第3篇:實(shí)戰(zhàn)篇(2章)。本篇通過(guò)一個(gè)實(shí)戰(zhàn)案例,綜合講解R語(yǔ)言在數(shù)據(jù)處理與可視化分析方面的實(shí)戰(zhàn)技能。

無(wú)R語(yǔ)言數(shù)據(jù)分析與可視化從入門(mén)到精通 目錄

第1篇 入門(mén)篇第1章 R語(yǔ)言快速入門(mén) /3

1.1 R語(yǔ)言及其歷史 /4

1.1.1 R語(yǔ)言的源起 /4

1.1.2 R語(yǔ)言的版本更新 /4

1.2 R語(yǔ)言的優(yōu)勢(shì)和劣勢(shì) /5

1.2.1 R語(yǔ)言的優(yōu)勢(shì) /5

1.2.2 R語(yǔ)言的劣勢(shì) /6

1.3 R語(yǔ)言的軟件獲取及安裝 /6

1.3.1 獲取R語(yǔ)言軟件 /6

1.3.2 在Windows平臺(tái)上安裝 /7

1.3.3 在Linux平臺(tái)上安裝 /10

1.3.4 在Mac OS平臺(tái)上安裝 /11

1.4 R語(yǔ)言的輔助工具 /13

1.4.1 R GUI /13

1.4.2 RStudio /16

1.4.3 獲取幫助 /19

1.5 新手問(wèn)答 /21

1.6 小試牛刀:練習(xí)設(shè)置RStudio全局選項(xiàng) /21

本章小結(jié)  /23

第2章 R語(yǔ)言的編程基礎(chǔ)(上) /24

2.1 對(duì)象與變量 /25

2.1.1 對(duì)象 /25

2.1.2 變量 /26

2.1.3 變量的列舉和刪除 /28

2.2 數(shù)據(jù)類型 /30

2.2.1 常用數(shù)據(jù)類型 /31

2.2.2 特殊值 /31

2.3 數(shù)據(jù)結(jié)構(gòu) /32

2.3.1 向量 /32

2.3.2 矩陣和數(shù)組 /38

2.3.3 因子 /43

2.3.4 列表 /46

2.3.5 數(shù)據(jù)框 /50

2.3.6 原子向量和遞歸向量 /53

2.4 數(shù)學(xué)運(yùn)算 /58

2.4.1 基礎(chǔ)運(yùn)算 /58

2.4.2 向量運(yùn)算 /61

2.4.3 矩陣運(yùn)算 /64

2.5 新手問(wèn)答 /65

2.6 小試牛刀:提取數(shù)據(jù)框子集,并對(duì)部分列做統(tǒng)計(jì)計(jì)算 /66

本章小結(jié)  /67

第3章 R語(yǔ)言的編程基礎(chǔ)(下) /68

3.1 流程控制 /69

3.1.1 repeat循環(huán) /69

3.1.2 while循環(huán) /70

3.1.3 for循環(huán) /70

3.1.4 if…else語(yǔ)句 /72

3.1.5 switch語(yǔ)句 /73

3.2 編寫(xiě)R函數(shù) /74

3.2.1 函數(shù)格式 /74

3.2.2 函數(shù)參數(shù) /75

3.2.3 返回值 /77

3.2.4 函數(shù)調(diào)用 /77

3.3 R語(yǔ)言常用函數(shù) /78

3.3.1 文件操作函數(shù) /78

3.3.2 基礎(chǔ)計(jì)算函數(shù) /81

3.3.3 概率分布函數(shù) /86

3.3.4 字符處理函數(shù) /90

3.4 R包 /94

3.4.1 R包的管理 /94

3.4.2 R包的加載 /97

3.4.3 自定義R包 /98

3.5 環(huán)境空間 /103

3.5.1 環(huán)境空間的種類 /103

3.5.2 環(huán)境空間的使用方法 /104

3.5.3 環(huán)境空間的特征 /106

3.6 新手問(wèn)答 /108

3.7 小試牛刀:編寫(xiě)函數(shù)并實(shí)現(xiàn)調(diào)用  /109

本章小結(jié)  /110

第2篇 進(jìn)階篇第

4章 R語(yǔ)言的數(shù)據(jù)獲取與導(dǎo)出 /113

4.1 數(shù)據(jù)獲取 /114

4.1.1 導(dǎo)入R語(yǔ)言系統(tǒng)格式數(shù)據(jù) /114

4.1.2 導(dǎo)入帶有分隔符的文本數(shù)據(jù) /114

4.1.3 導(dǎo)入Excel數(shù)據(jù) /115

4.1.4 讀取數(shù)據(jù)庫(kù)數(shù)據(jù) /119

4.1.5 讀取其他統(tǒng)計(jì)工具的數(shù)據(jù) /128

4.1.6 從互聯(lián)網(wǎng)抓取數(shù)據(jù) /136

4.2 數(shù)據(jù)導(dǎo)出 /151

4.2.1 寫(xiě)入R語(yǔ)言系統(tǒng)格式的數(shù)據(jù) /151

4.2.2 寫(xiě)入文本文件 /152

4.2.3 寫(xiě)入Excel文件 /152

4.2.4 寫(xiě)入數(shù)據(jù)庫(kù) /153

4.3 新手問(wèn)答 /155

4.4 小試牛刀:比較R語(yǔ)言讀/寫(xiě)文件的效率 /156

本章小結(jié)  /158

第5章 R語(yǔ)言的數(shù)據(jù)管理威力之?dāng)?shù)據(jù)操作 /159

5.1 R語(yǔ)言內(nèi)置數(shù)據(jù)操作函數(shù) /160

5.1.1 查看和編輯數(shù)據(jù) /160

5.1.2 篩選 /163

5.1.3 合并 /165

5.1.4 分組和匯總 /168

5.1.5 排序 /170

5.1.6 轉(zhuǎn)換 /173

5.2 數(shù)據(jù)重塑 /175

5.3 apply函數(shù)族 /178

5.3.1 apply()函數(shù) /178

5.3.2 lapply()函數(shù) /181

5.3.3 sapply()函數(shù) /183

5.3.4 vapply()函數(shù) /183

5.3.5 mapply()函數(shù) /184

5.4 plyr擴(kuò)展包 /184

5.5 用sqldf()函數(shù)實(shí)現(xiàn)數(shù)據(jù)框的SQL風(fēng)格查詢 /189

5.6 dplyr擴(kuò)展包 /191

5.7 新手問(wèn)答  /199

5.8 牛刀小試:對(duì)矩陣各列使用不同的

函數(shù) /200

本章小結(jié)  /202

第6章 語(yǔ)言的數(shù)據(jù)分析威力之基本統(tǒng)計(jì) /203

6.1 描述性統(tǒng)計(jì) /204

6.1.1 描述性統(tǒng)計(jì)量 /204

6.1.2 列聯(lián)表 /206

6.1.3 同時(shí)呈現(xiàn)多個(gè)統(tǒng)計(jì)量 /210

6.2 計(jì)數(shù)數(shù)據(jù)的檢驗(yàn) /215

6.2.1 卡方檢驗(yàn)的基本原理 /215

6.2.2 在R語(yǔ)言中實(shí)現(xiàn)卡方檢驗(yàn) /216

6.3 相關(guān)分析 /220

6.3.1 相關(guān)的類型 /220

6.3.2 各種相關(guān)系數(shù)計(jì)算在R語(yǔ)言中的實(shí)現(xiàn) /221

6.4 t檢驗(yàn) /224

6.4.1 獨(dú)立樣本t檢驗(yàn) /225

6.4.2 非獨(dú)立樣本t檢驗(yàn) /227

6.4.3 對(duì)t檢驗(yàn)的前提假設(shè)進(jìn)行檢驗(yàn) /228

6.5 方差分析 /230

6.5.1 方差分析的基本術(shù)語(yǔ) /230

6.5.2 aov()函數(shù) /231

6.5.3 單因素非重復(fù)測(cè)量方差分析 /232

6.5.4 單因素協(xié)方差分析 /235

6.5.5 單因素重復(fù)測(cè)量方差分析 /238

6.5.6 兩因素方差分析 /240

6.5.7 對(duì)方差分析前提假設(shè)的檢驗(yàn) /242

6.6 非參數(shù)檢驗(yàn) /242

6.6.1 兩總體比較 /243

6.6.2 多于兩總體比較 /244

6.7 回歸分析 /244

6.7.1 lm()函數(shù) /245

6.7.2 模型擬合 /245

6.7.3 模型診斷 /249

6.7.4 模型改進(jìn) /251

6.8 新手問(wèn)答 /257

6.9 小試牛刀:獨(dú)立樣本均值差異檢驗(yàn) /257

本章小結(jié)  /259

第7章 R語(yǔ)言的數(shù)據(jù)分析威力之高級(jí)方法 /262

7.1 判別分析 /263

7.1.1 判別分析的原理 /263

7.1.2 判別分析在R語(yǔ)言中的實(shí)現(xiàn) /264

7.2 聚類分析 /273

7.2.1 聚類分析的原理 /274

7.2.2 聚類分析在R語(yǔ)言中的實(shí)現(xiàn) /279

7.3 主成分分析 /289

7.3.1 主成分分析的原理 /289

7.3.2 主成分分析在R語(yǔ)言中的實(shí)現(xiàn) /290

7.4 因子分析 /292

7.4.1 因子分析的原理 /293

7.4.2 因子分析在R語(yǔ)言中的實(shí)現(xiàn) /295

7.5 新手問(wèn)答 /302

7.6 小試牛刀:嘗試實(shí)現(xiàn)層次聚類 /302

本章小結(jié)  /303

第8章 R語(yǔ)言的可視化威力之圖形生成 /304

8.1 R語(yǔ)言繪圖系統(tǒng) /305

8.2 單變量繪圖和雙變量繪圖 /305

8.2.1 散點(diǎn)圖 /305

8.2.2 折線圖 /309

8.2.3 條形圖 /312

8.2.4 餅圖 /314

8.2.5 箱線圖 /315

8.2.6 直方圖和核密度圖 /317

8.3 多變量繪圖 /319

8.3.1 氣泡圖 /319

8.3.2 熱圖 /321

8.3.3 馬賽克圖 /322

8.3.4 相關(guān)矩陣圖 /325

8.3.5 三維散點(diǎn)圖 /327

8.4 新手問(wèn)答 /328

8.5 小試牛刀:將兩個(gè)數(shù)據(jù)源繪制在同一個(gè)坐標(biāo)系中 /329

本章小結(jié)  /330

第9章 R語(yǔ)言的可視化威力之圖形優(yōu)化 /331

9.1 添加圖形元素 /332

9.1.1 坐標(biāo)軸 /332

9.1.2 圖例 /337

9.1.3 文本注解 /341

9.1.4 標(biāo)題 /343

9.1.5 參考線 /344

9.1.6 線段和帶箭頭的線段 /346

9.1.7 矩形陰影 /347

9.2 控制圖形外觀 /348

9.2.1 整體外觀 /348

9.2.2 局部外觀 /351

9.2.3 文本 /352

9.2.4 線條 /353

9.2.5 矩形 /354

9.2.6 點(diǎn)的形狀 /355

9.3 圖形配色與布局 /356

9.3.1 顏色與調(diào)色板 /356

9.3.2 面板和分面 /362

9.3.3 圖形組合 /365

9.4 新手問(wèn)答 /368

9.5 小試牛刀:使用網(wǎng)格系統(tǒng)組合圖形 /369

本章小結(jié)  /370

第10章 R語(yǔ)言的可視化威力之外部插件 /371

10.1 ggvis插件包 /372

10.1.1 ggivs與ggplot2的對(duì)比 /372

10.1.2 繪圖語(yǔ)法 /374

10.1.3 圖層 /377

10.1.4 圖形修飾 /384

10.2 plotly插件包 /391

10.2.1 plotly插件包對(duì)ggplot2包繪圖對(duì)象的擴(kuò)展 /392

10.2.2 繪圖語(yǔ)法 /393

10.2.3 繪圖示例 /403

10.2.4 圖形修飾 /416

10.3 新手問(wèn)答 /422

10.4 小試牛刀:使用plotly插件包繪制組合圖 /423

本章小結(jié)  /425

第11章 R語(yǔ)言的可視化威力之圖形展示 /426

11.1 傳統(tǒng)圖形輸出 /427

11.1.1 輸出為位圖文件 /427

11.1.2 輸出為PDF文件 /428

11.1.3 輸出為矢量圖 /429

11.2 網(wǎng)頁(yè)輸出 /429

11.2.1 使用R Markdown輸出為網(wǎng)頁(yè) /430

11.2.2 使用shiny輸出為網(wǎng)頁(yè) /437

11.3 新手問(wèn)答 /443

11.4 小試牛刀:將繪圖輸出為HTML文檔 /444

本章小結(jié)  /446

第3篇 實(shí)戰(zhàn)篇

第12章 R語(yǔ)言對(duì)產(chǎn)品性價(jià)比的數(shù)據(jù)分析與可視化 /449

12.1 數(shù)據(jù)采集 /450

12.1.1 分析頁(yè)面結(jié)構(gòu) /450

12.1.2 編寫(xiě)爬蟲(chóng)程序 /454

12.1.3 抓取數(shù)據(jù)并保存 /463

12.2 數(shù)據(jù)清理 /463

12.2.1 變量(字符)拆分與抽取 /464

12.2.2 檢測(cè)數(shù)據(jù)缺失與重復(fù)值 /466

12.2.3 變量類型轉(zhuǎn)化與重命名 /468

12.3 數(shù)據(jù)分析與數(shù)據(jù)可視化 /470

12.3.1 探索性數(shù)據(jù)分析 /470

12.3.2 圖書(shū)價(jià)格和評(píng)論指標(biāo)的聚類分析 /484

12.3.3 圖書(shū)性價(jià)比分析 /487

本章小結(jié)  /496

參考文獻(xiàn) /497


展開(kāi)全部

無(wú)R語(yǔ)言數(shù)據(jù)分析與可視化從入門(mén)到精通 節(jié)選

R 語(yǔ)言是S 語(yǔ)言的一個(gè)分支,而S 語(yǔ)言則是由John Chambers、Rick Becker 和Allan Wilks 等人在貝爾實(shí)驗(yàn)室(前身為AT & T,現(xiàn)為朗訊科技)開(kāi)發(fā)的一種用來(lái)進(jìn)行數(shù)據(jù)探索、統(tǒng)計(jì)分析和作圖的解釋型語(yǔ)言。S 語(yǔ)言*初的實(shí)現(xiàn)版本主要是S-PLUS。S-PLUS 是一個(gè)商業(yè)軟件,它基于S 語(yǔ)言,并被MathSoft 公司的統(tǒng)計(jì)科學(xué)部進(jìn)一步完善。1995 年,奧克蘭大學(xué)統(tǒng)計(jì)系的Ross Ihaka 和RobertGentleman 基于S 語(yǔ)言的源代碼并結(jié)合Scheme 語(yǔ)言的語(yǔ)法,編寫(xiě)了一個(gè)能執(zhí)行S 語(yǔ)言的軟件。他們以兩人名字的首字母將該軟件命名為“R”,并公開(kāi)了該軟件的全部源代碼,其命令統(tǒng)稱為R 語(yǔ)言。因此R 語(yǔ)言其實(shí)也是S 語(yǔ)言的一種實(shí)現(xiàn)。 1997 年,由11 人組成的R 語(yǔ)言開(kāi)發(fā)核心團(tuán)隊(duì)正式成立,負(fù)責(zé)R 語(yǔ)言的開(kāi)發(fā)和維護(hù)。如今R語(yǔ)言核心開(kāi)發(fā)團(tuán)隊(duì)已經(jīng)達(dá)到25 人,成員來(lái)自世界知名大學(xué)和企業(yè)。由于R 語(yǔ)言具備出眾的擴(kuò)展性,其使用者越來(lái)越多,同時(shí)也吸引了大量的開(kāi)發(fā)者編寫(xiě)自定義函數(shù)包供更多人使用。自2004 年開(kāi)始,R 語(yǔ)言基金會(huì)幾乎每年都支持R 語(yǔ)言社區(qū)成員組織的會(huì)議,世界各地的R 語(yǔ)言開(kāi)發(fā)者和用戶齊聚一堂,討論R 語(yǔ)言的應(yīng)用與科研方面的成果。此外,自2008 年開(kāi)始,國(guó)內(nèi)也定期舉行中國(guó)R 語(yǔ)言會(huì)議,以推動(dòng)R 語(yǔ)言在我國(guó)的普及。 截至2018 年12 月,R 語(yǔ)言在TIOBE 指數(shù)中排名第16 位,反映了R 語(yǔ)言的流行程度。

無(wú)R語(yǔ)言數(shù)據(jù)分析與可視化從入門(mén)到精通 作者簡(jiǎn)介

程乾,長(zhǎng)期從事教育測(cè)量和教育大數(shù)據(jù)分析,擅長(zhǎng)教育測(cè)量技術(shù)、數(shù)據(jù)可視化、數(shù)據(jù)挖掘算法和數(shù)據(jù)庫(kù)管理,并致力于R的推廣和普及。 劉永,R語(yǔ)言極客,數(shù)據(jù)分析專家,曾任職于科大訊飛(深圳),新光在線(深圳),擅長(zhǎng)數(shù)據(jù)管理、數(shù)據(jù)可視化、潛在分類分析、結(jié)構(gòu)方程建模和統(tǒng)計(jì)計(jì)算,對(duì)R語(yǔ)言有深入研究。 高博,高級(jí)工程師,主要研究方向?yàn)樵朴?jì)算與大數(shù)據(jù)、數(shù)據(jù)可視化等,熟悉R語(yǔ)言、.Net、PHP、Python、DevOps、MySQL、SQLServer等技術(shù)和工具。參與編寫(xiě)了《代碼的力量——Discuz!源碼分析與插件開(kāi)發(fā)實(shí)例進(jìn)階》《PHP+MySQL+AJAX Web開(kāi)發(fā)給力起飛》《Java Web應(yīng)用開(kāi)發(fā)給力起飛》等圖書(shū)。主持省部級(jí)縱向課題3項(xiàng),參與縱向、橫向課題16項(xiàng),獲得軟件著作權(quán)12項(xiàng)。

  • 主題:r語(yǔ)言數(shù)據(jù)分析

    r語(yǔ)言數(shù)據(jù)分析好

    2021/10/8 14:18:41
    讀者:nie***(購(gòu)買過(guò)本書(shū))
書(shū)友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服