書(shū)馨卡幫你省薪 2024個(gè)人購(gòu)書(shū)報(bào)告 2024中圖網(wǎng)年度報(bào)告
歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊(cè)
> >>
基于Rattle的可視化數(shù)據(jù)挖掘技術(shù)

基于Rattle的可視化數(shù)據(jù)挖掘技術(shù)

出版社:清華大學(xué)出版社出版時(shí)間:2017-08-01
開(kāi)本: 32開(kāi) 頁(yè)數(shù): 174
中 圖 價(jià):¥31.2(8.0折) 定價(jià)  ¥39.0 登錄后可看到會(huì)員價(jià)
加入購(gòu)物車(chē) 收藏
運(yùn)費(fèi)6元,滿(mǎn)39元免運(yùn)費(fèi)
?新疆、西藏除外
本類(lèi)五星書(shū)更多>

基于Rattle的可視化數(shù)據(jù)挖掘技術(shù) 版權(quán)信息

基于Rattle的可視化數(shù)據(jù)挖掘技術(shù) 本書(shū)特色

數(shù)據(jù)挖掘技術(shù)近年來(lái)發(fā)展異常迅猛,已成為大數(shù)據(jù)時(shí)代*熱門(mén)的技術(shù)和研究熱點(diǎn),不僅產(chǎn)生了大量不同類(lèi)型、功能強(qiáng)大的數(shù)據(jù)挖掘算法,而且推動(dòng)了眾多數(shù)據(jù)挖掘工具軟件的發(fā)展。在這些軟件中,R語(yǔ)言是數(shù)據(jù)挖掘領(lǐng)域*重要的軟件之一。Rattle是一種用于數(shù)據(jù)挖掘的R語(yǔ)言的圖形交互界面,或稱(chēng)為可視化數(shù)據(jù)挖掘工具。Rattle給出了從數(shù)據(jù)整理到模型評(píng)價(jià)的完整解決方案。 本書(shū)主要介紹如何用Rattle包進(jìn)行數(shù)據(jù)挖掘,全書(shū)共9章,通過(guò)大量精選實(shí)例,循序漸進(jìn)、全面系統(tǒng)地講述數(shù)據(jù)挖掘過(guò)程。 本書(shū)不僅是從事數(shù)據(jù)挖掘和大數(shù)據(jù)分析工程技術(shù)人員開(kāi)發(fā)相關(guān)系統(tǒng)的技術(shù)資料,也可作為學(xué)習(xí)數(shù)據(jù)挖掘和大數(shù)據(jù)分析等課程的參考用書(shū)。

基于Rattle的可視化數(shù)據(jù)挖掘技術(shù) 內(nèi)容簡(jiǎn)介

1. 介紹數(shù)據(jù)挖掘新技術(shù)——Rattle可視化數(shù)據(jù)挖掘。2. 關(guān)注的是數(shù)據(jù)挖掘全過(guò)程的實(shí)踐,包括數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備、模型建立、模型評(píng)估、模型優(yōu)化和應(yīng)用部署。3. 通過(guò)大量精選實(shí)例,循序漸進(jìn),全面系統(tǒng)地講述數(shù)據(jù)挖掘過(guò)程。

基于Rattle的可視化數(shù)據(jù)挖掘技術(shù) 目錄

目 錄 第1章緒論1 1.1數(shù)據(jù)挖掘的認(rèn)識(shí)1 1.1.1為什么要進(jìn)行數(shù)據(jù)挖掘1 1.1.2數(shù)據(jù)挖掘過(guò)程1 1.1.3數(shù)據(jù)挖掘九大定律3 1.2R與Rattle3 1.2.1R語(yǔ)言3 1.2.2R語(yǔ)言的基本語(yǔ)法4 1.2.3R語(yǔ)言的優(yōu)勢(shì)10 1.2.4Rattle包10 1.3本章小結(jié)12 第2章入門(mén)指南13 2.1概述13 2.2認(rèn)識(shí)Rstudio13 2.2.1Rstudio的界面13 2.2.2R腳本編輯區(qū)14 2.2.3R命令控制臺(tái)15 2.2.4工作空間16 2.2.5結(jié)果展示區(qū)18 2.3認(rèn)識(shí)Rattle20 2.3.1Rattle的安裝與啟動(dòng)20 2.3.2選項(xiàng)卡21 2.3.3工具欄24基于Rattle的可視化數(shù)據(jù)挖掘技術(shù)目錄2.3.4菜單欄24 2.3.5屬性面板26 2.4本章小結(jié)26 第3章數(shù)據(jù)準(zhǔn)備28 3.1概述28 3.2數(shù)據(jù)28 3.2.1術(shù)語(yǔ)28 3.2.2變量29 3.2.3數(shù)據(jù)集30 3.3可用數(shù)據(jù)30 3.4數(shù)據(jù)質(zhì)量31 3.4.1數(shù)據(jù)質(zhì)量概述31 3.4.2數(shù)據(jù)質(zhì)量評(píng)估維度31 3.4.3影響數(shù)據(jù)質(zhì)量的因素31 3.5數(shù)據(jù)匹配32 3.6數(shù)據(jù)倉(cāng)庫(kù)33 3.7數(shù)據(jù)訪問(wèn)34 3.8載入數(shù)據(jù)35 3.8.1載入CSV數(shù)據(jù)35 3.8.2載入數(shù)據(jù)庫(kù)36 3.8.3載入SPSS類(lèi)型數(shù)據(jù)38 3.8.4載入自帶數(shù)據(jù)集38 3.8.5載入網(wǎng)頁(yè)數(shù)據(jù)38 3.8.6載入其他格式的數(shù)據(jù)39 3.9本章小結(jié)39 第4章數(shù)據(jù)理解41 4.1概述41 4.2匯總數(shù)據(jù)41 4.2.1查看數(shù)據(jù)的簡(jiǎn)單信息41 4.2.2查看數(shù)據(jù)的細(xì)節(jié)信息43 4.2.3查看數(shù)據(jù)的分布信息43 4.2.4查看數(shù)據(jù)的缺失值44 4.3數(shù)據(jù)分布圖46 4.3.1數(shù)值型變量分布圖46 4.3.2分類(lèi)變量分布圖50 4.3.3散點(diǎn)圖矩陣52 4.4相關(guān)分析53 4.4.1相關(guān)矩陣和相關(guān)圖53 4.4.2缺失值的相關(guān)分析55 4.4.3相關(guān)樹(shù)56 4.5主成分分析60 4.6交互式探索數(shù)據(jù)62 4.6.1安裝GGobi63 4.6.2安裝rggobi63 4.6.3實(shí)驗(yàn)指導(dǎo)64 4.7本章小結(jié)64 第5章數(shù)據(jù)檢驗(yàn)66 5.1概述66 5.2KS正態(tài)性檢驗(yàn)67 5.3Wilcoxon檢驗(yàn)68 5.4t檢驗(yàn)70 5.5F檢驗(yàn)72 5.6本章小結(jié)73 第6章數(shù)據(jù)變換75 6.1概述75 6.2取值范圍調(diào)整77 6.3缺失值填充79 6.4變量類(lèi)型轉(zhuǎn)換81 6.4.1數(shù)值變量離散化81 6.4.2分類(lèi)變量指標(biāo)化81 6.4.3分類(lèi)變量合并83 6.4.4分類(lèi)變量和數(shù)值變量互相轉(zhuǎn)換83 6.4.5變量和數(shù)據(jù)的刪除83 6.5離群點(diǎn)數(shù)據(jù)的處理84 6.6本章小結(jié)86 第7章數(shù)據(jù)建模87 7.1概述87 7.2聚類(lèi)模型96 7.2.1背景96 7.2.2Kmeans聚類(lèi)96 7.2.3Ewkm聚類(lèi)100 7.2.4層次聚類(lèi)101 7.2.5雙向聚類(lèi)105 7.3關(guān)聯(lián)規(guī)則挖掘106 7.3.1背景106 7.3.2基本術(shù)語(yǔ)107 7.3.3關(guān)聯(lián)規(guī)則分類(lèi)108 7.3.4Apriori算法108 7.3.5實(shí)驗(yàn)指導(dǎo)109 7.4傳統(tǒng)決策樹(shù)模型114 7.4.1背景114 7.4.2ID3算法115 7.4.3C4.5算法116 7.4.4實(shí)驗(yàn)指導(dǎo)117 7.5隨機(jī)森林決策樹(shù)模型120 7.5.1背景120 7.5.2隨機(jī)森林算法121 7.5.3實(shí)驗(yàn)指導(dǎo)122 7.6自適應(yīng)選擇決策樹(shù)模型126 7.6.1背景126 7.6.2Boosting算法127 7.6.3Adaboost算法127 7.6.4實(shí)驗(yàn)指導(dǎo)128 7.7SVM131 7.7.1背景131 7.7.2SVM算法131 7.7.3實(shí)驗(yàn)指導(dǎo)133 7.8線性回歸模型134 7.8.1背景134 7.8.2一元線性回歸方法135 7.8.3實(shí)驗(yàn)指導(dǎo)137 7.9神經(jīng)網(wǎng)絡(luò)模型138 7.9.1背景138 7.9.2人工神經(jīng)網(wǎng)絡(luò)模型139 7.9.3實(shí)驗(yàn)指導(dǎo)142 7.10本章小結(jié)143 第8章模型評(píng)估147 8.1概述147 8.2數(shù)據(jù)集148 8.3混淆矩陣149 8.3.1二分類(lèi)混淆矩陣149 8.3.2模型評(píng)價(jià)指標(biāo)150 8.3.3多分類(lèi)混淆矩陣151 8.4風(fēng)險(xiǎn)圖151 8.4.1風(fēng)險(xiǎn)圖的作用151 8.4.2實(shí)驗(yàn)指導(dǎo)152 8.5ROC曲線154 8.5.1ROC曲線的定義154 8.5.2ROC曲線的作用154 8.5.3實(shí)驗(yàn)指導(dǎo)155 8.6其他模型評(píng)估圖156 8.7本章小結(jié)157 第9章模型部署159 9.1概述159 9.2模型的應(yīng)用159 9.3轉(zhuǎn)換為PMML161 9.4電商數(shù)據(jù)挖掘案例162 9.4.1背景162 9.4.2數(shù)據(jù)理解162 9.4.3數(shù)據(jù)準(zhǔn)備163 9.4.4清洗數(shù)據(jù)166 9.4.5探索數(shù)據(jù)167 9.4.6數(shù)據(jù)建模172 9.5本章小結(jié)174 參考文獻(xiàn)175
展開(kāi)全部
暫無(wú)評(píng)論……
書(shū)友推薦
返回頂部
中圖網(wǎng)
在線客服