玩轉(zhuǎn)大數(shù)據(jù):SAS+R+Stata+Python
-
>
決戰(zhàn)行測(cè)5000題(言語(yǔ)理解與表達(dá))
-
>
軟件性能測(cè)試.分析與調(diào)優(yōu)實(shí)踐之路
-
>
第一行代碼Android
-
>
深度學(xué)習(xí)
-
>
Unreal Engine 4藍(lán)圖完全學(xué)習(xí)教程
-
>
深入理解計(jì)算機(jī)系統(tǒng)-原書(shū)第3版
-
>
Word/Excel PPT 2013辦公應(yīng)用從入門(mén)到精通-(附贈(zèng)1DVD.含語(yǔ)音視頻教學(xué)+辦公模板+PDF電子書(shū))
玩轉(zhuǎn)大數(shù)據(jù):SAS+R+Stata+Python 版權(quán)信息
- ISBN:9787302570677
- 條形碼:9787302570677 ; 978-7-302-57067-7
- 裝幀:70g膠版紙
- 冊(cè)數(shù):暫無(wú)
- 重量:暫無(wú)
- 所屬分類(lèi):>>
玩轉(zhuǎn)大數(shù)據(jù):SAS+R+Stata+Python 本書(shū)特色
本書(shū)采用雙色印刷,部分重點(diǎn)圖片可掃碼觀看彩圖。本書(shū)采用次加大開(kāi)本印刷,使代碼的閱讀更加方便。 本書(shū)與常規(guī)介紹SAS、R語(yǔ)言、Stata和Python等統(tǒng)計(jì)軟件的書(shū)籍*大的區(qū)別在于避免只講統(tǒng)計(jì)分析而忽略如何高效、準(zhǔn)確地提取主要結(jié)果,如何生成可直接用于匯報(bào)、交流或達(dá)到SCI發(fā)表要求的表格。 本書(shū)立足于目前大數(shù)據(jù)研究的現(xiàn)狀分三步進(jìn)行講解。首先強(qiáng)調(diào)必須掌握的數(shù)學(xué)和統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí);其次,根據(jù)真實(shí)世界的電子病歷及健康注冊(cè)系統(tǒng)的數(shù)據(jù)特征,模擬出與其復(fù)雜程度和處理難度相當(dāng)?shù)哪M數(shù)據(jù)庫(kù);再次,針對(duì)同一研究問(wèn)題,在SAS、R語(yǔ)言、Stata和Python中進(jìn)行同步處理,詳細(xì)講解如何在這4個(gè)統(tǒng)計(jì)軟件中實(shí)現(xiàn)從數(shù)據(jù)導(dǎo)入、數(shù)據(jù)清洗、統(tǒng)計(jì)分析、整理輸出結(jié)果(表格或圖)到結(jié)果解釋的全部過(guò)程,從而可完成軟件的對(duì)比學(xué)習(xí),達(dá)到事半功倍的效果。以上3點(diǎn)也是本書(shū)的特色所在。 筆者將著眼于真實(shí)世界的醫(yī)學(xué)研究,主要介紹在四個(gè)軟件中*常用的、*高效的命令及編程方法,使數(shù)據(jù)工作者能夠在短時(shí)間內(nèi)掌握每個(gè)軟件的精髓,并且能夠?qū)W以致用,切實(shí)應(yīng)用到自己的研究項(xiàng)目中解決相關(guān)問(wèn)題。但本書(shū)不會(huì)過(guò)多的涉及諸如模型的比較和選擇等問(wèn)題,因該類(lèi)問(wèn)題常是由研究課題或項(xiàng)目來(lái)決定的,不存在放之四海而皆準(zhǔn)的準(zhǔn)則。對(duì)該類(lèi)問(wèn)題感興趣的讀者,請(qǐng)查閱相關(guān)書(shū)籍或文章。 本書(shū)主要是面向在校大學(xué)生、研究生以及欲掌握SAS、R語(yǔ)言、Stata和Python的數(shù)據(jù)工作者,熟悉4個(gè)軟件的任意一個(gè)且欲短時(shí)間內(nèi)掌握其他軟件者,尤其適合醫(yī)科學(xué)生、臨床醫(yī)生或藥企人員等醫(yī)療相關(guān)人員學(xué)習(xí)使用。 本書(shū)采用雙色印刷,部分重點(diǎn)圖片可掃碼觀看彩圖,本書(shū)采用次加大開(kāi)本印刷,使代碼的閱讀更加方便。書(shū)中案例的數(shù)據(jù)和代碼可下載使用。本書(shū)通過(guò)對(duì)醫(yī)療領(lǐng)域的大數(shù)據(jù)分析案例講解SAS、R、STATA、PYTHON的聯(lián)合使用。案例生動(dòng)。
玩轉(zhuǎn)大數(shù)據(jù):SAS+R+Stata+Python 內(nèi)容簡(jiǎn)介
面對(duì)日漸復(fù)雜的大數(shù)據(jù),科技工作者很難用單一的統(tǒng)計(jì)軟件高效、完美地完成從數(shù)據(jù)挖掘、數(shù)據(jù)清洗、統(tǒng)計(jì)分析到結(jié)果呈現(xiàn)的全部工作,因此需要熟悉和掌握多種統(tǒng)計(jì)工具,各取所長(zhǎng)、整合使用。本書(shū)立足于大數(shù)據(jù)研究的現(xiàn)狀,基于實(shí)際醫(yī)療案例,介紹數(shù)學(xué)基礎(chǔ)知識(shí)和統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí),SAS、R語(yǔ)言、Stata和Python這4款大數(shù)據(jù)常用分析工具的基礎(chǔ)編程知識(shí)及實(shí)踐操作。 本書(shū)主要面向在校本科生、研究生,以及要掌握SAS、R語(yǔ)言、Stata和Python的數(shù)據(jù)工作者,熟悉四個(gè)軟件的任意一個(gè)且想要在短時(shí)間內(nèi)掌握其他軟件的讀者,也適合醫(yī)科學(xué)生、臨床醫(yī)生或藥企人員等醫(yī)療相關(guān)人員學(xué)習(xí)使用。
玩轉(zhuǎn)大數(shù)據(jù):SAS+R+Stata+Python 目錄
目錄
第1章數(shù)學(xué)基礎(chǔ)1
1.1常用的數(shù)學(xué)符號(hào)1
1.2常見(jiàn)概念2
1.2.1集合2
1.2.2極限3
1.3微積分5
1.3.1導(dǎo)數(shù)與微分5
1.3.2基本初等函數(shù)的導(dǎo)函數(shù)和微分公式6
1.3.3導(dǎo)數(shù)與微分的運(yùn)算法則7
1.3.4定積分與不定積分8
1.3.5基本的不定積分公式9
1.3.6定積分與不定積分的性質(zhì)10
1.4線性代數(shù)11
1.4.1標(biāo)量與向量11
1.4.2矩陣與線性方程組11
1.4.3行列式的定義與運(yùn)算12
1.4.4矩陣的運(yùn)算法則14
1.4.5特殊的矩陣16
1.4.6矩陣的秩17
1.4.7矩陣的轉(zhuǎn)置與矩陣的逆18
1.4.8特征向量與特征值18
第2章統(tǒng)計(jì)學(xué)基礎(chǔ)20
2.1概率論的基本概念20
2.2隨機(jī)變量與分布21
2.2.1隨機(jī)變量21
2.2.2累積分布函數(shù)222.2.3概率函數(shù)22
2.3隨機(jī)變量的數(shù)學(xué)特征23
2.3.1數(shù)學(xué)期望23
2.3.2期望值的規(guī)律24
2.3.3條件期望25
2.3.4協(xié)方差與相關(guān)系數(shù)25
2.3.5樣本均值和方差26
2.4常見(jiàn)的隨機(jī)變量分布27
2.4.1離散變量分布27
2.4.2連續(xù)變量分布28
2.5統(tǒng)計(jì)學(xué)基本概念32
2.5.1總體與樣本32
2.5.2參數(shù)和統(tǒng)計(jì)量32
2.5.3中心極限定理32
2.6統(tǒng)計(jì)描述32
2.6.1定量資料的統(tǒng)計(jì)描述32
2.6.2分類(lèi)資料的統(tǒng)計(jì)描述34
2.7統(tǒng)計(jì)推斷34
2.7.1參數(shù)估計(jì)34
2.7.2假設(shè)檢驗(yàn)38
2.8多因素回歸模型40
2.8.1多因素線性回歸模型40
2.8.2多因素Logistic回歸模型41
2.8.3多因素Cox回歸模型43
第3章軟件基礎(chǔ)總論45
3.1軟件初識(shí)45
3.1.1SAS45
3.1.2R語(yǔ)言45
3.1.3Stata45
3.1.4Python46
3.24個(gè)軟件的比較46
第4章SAS基礎(chǔ)52
4.1SAS介紹與資源52
4.1.1SAS語(yǔ)言及程序結(jié)構(gòu)52
4.1.2SAS工作界面53
4.1.3獲得幫助54
4.2數(shù)據(jù)的導(dǎo)入與導(dǎo)出55
4.2.1導(dǎo)入數(shù)據(jù)55
4.2.2導(dǎo)出數(shù)據(jù)67
4.3SAS中常用的函數(shù)70
4.3.1字符型函數(shù)70
4.3.2數(shù)值型函數(shù)80
4.3.3日期型函數(shù)84
4.3.4特殊函數(shù)86
4.3.5其他函數(shù)89
4.4SAS變量91
4.4.1變量屬性92
4.4.2自動(dòng)變量92
4.4.3變量列表的縮寫(xiě)規(guī)則92
4.4.4創(chuàng)建變量94
4.4.5改變變量屬性96
4.4.6改變變量類(lèi)型96
4.5SAS數(shù)據(jù)處理97
4.5.1選取變量97
4.5.2創(chuàng)建變量99
4.5.3對(duì)觀測(cè)求和100
4.5.4選取并操作部分觀測(cè)102
4.5.5循環(huán)和數(shù)組104
4.5.6數(shù)據(jù)集的橫向合并和縱向合并107
4.5.7增加數(shù)據(jù)集處理靈活性的SAS選項(xiàng)111
4.6SAS中常見(jiàn)的proc步113
4.6.1proc contents113
4.6.2proc datasets114
4.6.3proc freq116
4.6.4proc means118
4.6.5proc sort120
4.6.6proc transpose121
4.6.7proc univariate123
4.6.8proc corr125
4.6.9proc reg126
4.6.10proc logistic128
4.6.11proc lifetest129
4.6.12proc phreg130
4.7PROC SQL131
4.7.1檢索數(shù)據(jù)131
4.7.2合并數(shù)據(jù)集135
4.7.3使用PROC SQL管理表137
4.8SAS宏介紹143
4.8.1宏變量143
4.8.2宏函數(shù)147
4.8.3宏程序151
4.8.4宏參數(shù)152
4.8.5宏語(yǔ)言與data步153
4.8.6宏語(yǔ)言與PROC SQL157
4.8.7條件語(yǔ)句和循環(huán)語(yǔ)句在宏語(yǔ)言中的使用161
第5章R語(yǔ)言基礎(chǔ)163
5.1R語(yǔ)言介紹163
5.1.1R語(yǔ)言的特點(diǎn)與資源163
5.1.2RStudio使用簡(jiǎn)介163
5.2R語(yǔ)言的基本規(guī)則164
5.2.1對(duì)象165
5.2.2函數(shù)使用基礎(chǔ)165
5.2.3擴(kuò)展包166
5.2.4幫助167
5.3數(shù)據(jù)類(lèi)型167
5.3.1vector167
5.3.2factor169
5.3.3date171
5.3.4matrix172
5.3.5list175
5.3.6data.frame179
5.3.7formula181
5.4常用函數(shù)介紹182
5.4.1數(shù)據(jù)的讀入和導(dǎo)出182
5.4.2條件判斷183
5.4.3循環(huán)186
5.4.4文本處理188
5.4.5基本作圖190
5.4.6自定義函數(shù)192
5.5常用數(shù)據(jù)處理與統(tǒng)計(jì)分析函數(shù)195
5.5.1單變量分析195
5.5.2雙變量、多變量分析198
5.5.3線性回歸模型200
5.5.4Logistic回歸模型202
5.5.5生存分析模型203
5.6dplyr包簡(jiǎn)介206
5.6.1安裝dplyr包206
5.6.2dplyr包中*常用的5個(gè)函數(shù)206
5.6.3用%>%運(yùn)算符連接多個(gè)函數(shù)211
5.6.4dplyr包中其他實(shí)用的函數(shù)212
5.7ggplot2包簡(jiǎn)介214
5.7.1安裝ggplot2包214
5.7.2使用ggplot2畫(huà)圖的基本思路214
5.7.3使用geom_histogram函數(shù)繪制直方圖215
5.7.4使用geom_bar函數(shù)繪制柱狀圖217
5.7.5使用geom_boxplot函數(shù)繪制箱形圖217
5.7.6使用geom_point函數(shù)繪制散點(diǎn)圖220
5.7.7使用geom_smooth函數(shù)在散點(diǎn)圖上添加線性回歸結(jié)果223
5.7.8對(duì)圖中細(xì)節(jié)進(jìn)行微調(diào)224
5.7.9將多個(gè)圖合并為一個(gè)圖225
5.7.10保存圖228
第6章Stata基礎(chǔ)229
6.1Stata簡(jiǎn)介229
6.1.1界面介紹229
6.1.2在菜單欄中選擇命令230
6.1.3輸入命令代碼230
6.2獲得幫助230
6.2.1檢索關(guān)鍵詞230
6.2.2查看幫助231
6.2.3幫助建議231
6.3語(yǔ)法結(jié)構(gòu)231
6.3.1變量集232
6.3.2by前綴233
6.3.3命令234
6.3.4=表達(dá)式234
6.3.5if表達(dá)式236
6.3.6in范圍236
6.3.7權(quán)重237
6.3.8命令選項(xiàng)237
6.3.9數(shù)值集合238
6.3.10文件名238
6.4數(shù)據(jù)轉(zhuǎn)換與分析239
6.4.1導(dǎo)入數(shù)據(jù)239
6.4.2瀏覽數(shù)據(jù)與基本描述240
6.4.3數(shù)值變量243
6.4.4文本變量247
6.4.5日期變量252
6.4.6缺失值253
6.4.7注釋變量254
6.4.8調(diào)整數(shù)據(jù)結(jié)構(gòu)256
6.4.9基本描述258
6.4.10統(tǒng)計(jì)檢驗(yàn)260
6.4.11相關(guān)分析262
6.4.12回歸分析263
6.4.13導(dǎo)出數(shù)據(jù)267
6.5輸出結(jié)果調(diào)用268
6.5.1一般統(tǒng)計(jì)命令結(jié)果調(diào)用268
6.5.2估計(jì)命令結(jié)果調(diào)用269
6.6重復(fù)命令271
6.6.1by前綴271
6.6.2foreach循環(huán)274
6.6.3forvalues循環(huán)275
6.7編程工具275
6.7.1do文件275
6.7.2標(biāo)量變量276
6.7.3宏變量277
6.7.4矩陣279
6.7.5程序283
第7章Python基礎(chǔ)284
7.1Python的安裝284
7.1.1使用Python安裝包安裝Python 3284
7.1.2通過(guò)Anaconda安裝Python 3285
7.2常用交互式語(yǔ)言開(kāi)發(fā)環(huán)境287
7.2.1編輯器288
7.2.2控制臺(tái)289
7.2.3變量管理器290
7.3常用數(shù)據(jù)類(lèi)型、數(shù)據(jù)結(jié)構(gòu)與基本語(yǔ)句291
7.3.1Python中的變量命名規(guī)則291
7.3.2常見(jiàn)的數(shù)據(jù)類(lèi)型及運(yùn)算291
7.3.3常見(jiàn)的數(shù)據(jù)結(jié)構(gòu)及運(yùn)算291
7.3.4**個(gè)程序295
7.3.5函數(shù)295
7.3.6常用邏輯語(yǔ)句298
7.4數(shù)據(jù)的導(dǎo)入與導(dǎo)出302
7.4.1數(shù)據(jù)的讀取302
7.4.2數(shù)據(jù)存儲(chǔ)304
7.5基礎(chǔ)運(yùn)算常用包——NumPy 304
7.5.1基本性質(zhì)304
7.5.2矢量化運(yùn)算306
7.5.3NumPy中的函數(shù)306
7.5.4ndarray的軸、索引與切片309
7.5.5實(shí)戰(zhàn)舉例: 用NumPy進(jìn)行圖像處理313
7.6數(shù)據(jù)處理常用包——Pandas316
7.6.1主要數(shù)據(jù)類(lèi)型316
7.6.2對(duì)DataFrame的描述318
7.6.3缺失值的檢測(cè)與處理319
7.6.4DataFrame的索引321
7.6.5常見(jiàn)操作325
7.6.6字符處理專(zhuān)題328
7.6.7apply專(zhuān)題331
7.6.8groupby專(zhuān)題333
7.7統(tǒng)計(jì)分析常用包338
7.7.1單樣本t檢驗(yàn)339
7.7.2獨(dú)立樣本t檢驗(yàn)340
7.7.3兩個(gè)連續(xù)型變量的相關(guān)性341
7.7.4兩個(gè)分類(lèi)變量的頻數(shù)統(tǒng)計(jì)341
7.7.5線性回歸模型342
7.7.6Logistic回歸模型345
7.7.7生存分析347
7.8繪圖常用包352
7.8.1Pandas352
7.8.2Matplotlib356
7.8.3Seaborn360
第8章軟件實(shí)踐總論366
8.1本書(shū)使用的數(shù)據(jù)集366
8.1.1病人基本信息數(shù)據(jù)集366
8.1.2診斷信息數(shù)據(jù)集367
8.1.3實(shí)驗(yàn)室檢測(cè)結(jié)果數(shù)據(jù)集(一)368
8.1.4實(shí)驗(yàn)室檢測(cè)結(jié)果數(shù)據(jù)集(二)368
8.1.5用藥信息數(shù)據(jù)集368
8.1.6急性心肌梗死數(shù)據(jù)集369
8.2軟件實(shí)踐步驟369
8.2.1數(shù)據(jù)清洗369
8.2.2數(shù)據(jù)準(zhǔn)備370
8.2.3數(shù)據(jù)分析370
8.2.4結(jié)果整理370
8.2.5代碼的重復(fù)使用370
8.3實(shí)例: 擬研究的課題371
第9章SAS實(shí)踐部分372
9.1數(shù)據(jù)的清洗與管理372
9.1.1病人基本信息數(shù)據(jù)集372
9.1.2診斷信息數(shù)據(jù)集376
9.1.3實(shí)驗(yàn)室檢測(cè)結(jié)果數(shù)據(jù)集(一)381
9.1.4實(shí)驗(yàn)室檢測(cè)結(jié)果數(shù)據(jù)集(二)387
9.1.5用藥信息數(shù)據(jù)集390
9.2數(shù)據(jù)分析與結(jié)果整理393
9.2.1定量數(shù)據(jù)的統(tǒng)計(jì)描述394
9.2.2分類(lèi)數(shù)據(jù)的統(tǒng)計(jì)描述398
9.2.3相關(guān)分析402
9.2.4線性回歸分析406
9.2.5Logistic回歸分析412
9.2.6Cox回歸分析418
第10章R語(yǔ)言實(shí)踐部分425
10.1數(shù)據(jù)的清洗與管理425
10.1.1病人基本信息數(shù)據(jù)集425
10.1.2診斷信息數(shù)據(jù)集431
10.1.3實(shí)驗(yàn)室檢測(cè)結(jié)果數(shù)據(jù)集(一)435
10.1.4實(shí)驗(yàn)室檢測(cè)結(jié)果數(shù)據(jù)集(二)439
10.1.5用藥信息數(shù)據(jù)集442
10.2數(shù)據(jù)分析與結(jié)果整理445
10.2.1定量數(shù)據(jù)的統(tǒng)計(jì)描述446
10.2.2分類(lèi)數(shù)據(jù)的統(tǒng)計(jì)描述449
10.2.3相關(guān)分析452
10.2.4線性回歸分析453
10.2.5Logistic回歸分析457
10.2.6Cox回歸分析463
第11章Stata實(shí)踐部分470
11.1數(shù)據(jù)的清洗與管理470
11.1.1病人基本信息數(shù)據(jù)集470
11.1.2診斷信息數(shù)據(jù)集483
11.1.3實(shí)驗(yàn)室檢測(cè)結(jié)果數(shù)據(jù)集(一)490
11.1.4實(shí)驗(yàn)室檢測(cè)結(jié)果數(shù)據(jù)集(二)495
11.1.5用藥信息數(shù)據(jù)集500
11.2數(shù)據(jù)分析與結(jié)果整理504
11.2.1定量數(shù)據(jù)的統(tǒng)計(jì)描述504
11.2.2分類(lèi)數(shù)據(jù)的統(tǒng)計(jì)描述511
11.2.3相關(guān)分析516
11.2.4一般線性回歸分析519
11.2.5Logistic回歸分析526
11.2.6Cox回歸分析535
11.3Stata在Meta分析中的應(yīng)用545
11.3.1Meta分析簡(jiǎn)介545
11.3.2二分類(lèi)變量的Meta分析548
11.3.3連續(xù)性變量的Meta分析552
11.3.4發(fā)表偏倚分析553
第12章Python實(shí)踐部分557
12.1數(shù)據(jù)的清洗與管理557
12.1.1病人基本信息數(shù)據(jù)集557
12.1.2診斷信息數(shù)據(jù)集566
12.1.3實(shí)驗(yàn)室檢測(cè)結(jié)果數(shù)據(jù)集(一)571
12.1.4實(shí)驗(yàn)室檢測(cè)結(jié)果數(shù)據(jù)集(二)578
12.1.5用藥信息數(shù)據(jù)集582
12.2數(shù)據(jù)準(zhǔn)備和數(shù)據(jù)分析584
12.2.1定量數(shù)據(jù)的統(tǒng)計(jì)描述584
12.2.2分類(lèi)數(shù)據(jù)的統(tǒng)計(jì)描述587
12.2.3相關(guān)分析589
12.2.4線性回歸分析591
12.2.5Logistic回歸分析595
12.2.6Cox回歸分析602參考文獻(xiàn)609附錄A常用假設(shè)檢驗(yàn)方法610附錄B正則表達(dá)式619附錄C系統(tǒng)綜述與Meta分析技術(shù)路線圖622
玩轉(zhuǎn)大數(shù)據(jù):SAS+R+Stata+Python 作者簡(jiǎn)介
孫江偉 復(fù)旦大學(xué)流行病與衛(wèi)生統(tǒng)計(jì)學(xué)專(zhuān)業(yè)碩士,曾在強(qiáng)生公司(Johnson &Johnson)任生物統(tǒng)計(jì)師,對(duì)國(guó)內(nèi)醫(yī)藥臨床領(lǐng)域及國(guó)外醫(yī)療注冊(cè)系統(tǒng)等大數(shù)據(jù)的數(shù)據(jù)管理、數(shù)據(jù)清洗、研究設(shè)計(jì)及統(tǒng)計(jì)分析,有豐富的理論及實(shí)踐經(jīng)驗(yàn),現(xiàn)于瑞典卡羅林斯卡醫(yī)學(xué)院進(jìn)行衛(wèi)生統(tǒng)計(jì)學(xué)方面的研究深造。在American Journal of Epidemiology、European Journal of Neurology等雜志發(fā)表相關(guān)領(lǐng)域SCI論文10篇。
- >
大紅狗在馬戲團(tuán)-大紅狗克里弗-助人
- >
煙與鏡
- >
羅曼·羅蘭讀書(shū)隨筆-精裝
- >
隨園食單
- >
李白與唐代文化
- >
姑媽的寶刀
- >
推拿
- >
人文閱讀與收藏·良友文學(xué)叢書(shū):一天的工作