書馨卡幫你省薪 2024個(gè)人購(gòu)書報(bào)告 2024中圖網(wǎng)年度報(bào)告
歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊(cè)
> >
并行數(shù)據(jù)挖掘及性能優(yōu)化——關(guān)聯(lián)規(guī)則與數(shù)據(jù)相關(guān)性分析

并行數(shù)據(jù)挖掘及性能優(yōu)化——關(guān)聯(lián)規(guī)則與數(shù)據(jù)相關(guān)性分析

作者:荀亞玲著
出版社:電子工業(yè)出版社出版時(shí)間:2020-01-01
開本: 24cm 頁(yè)數(shù): 210頁(yè)
中 圖 價(jià):¥51.9(5.9折) 定價(jià)  ¥88.0 登錄后可看到會(huì)員價(jià)
加入購(gòu)物車 收藏
運(yùn)費(fèi)6元,滿39元免運(yùn)費(fèi)
?新疆、西藏除外
本類五星書更多>

并行數(shù)據(jù)挖掘及性能優(yōu)化——關(guān)聯(lián)規(guī)則與數(shù)據(jù)相關(guān)性分析 版權(quán)信息

并行數(shù)據(jù)挖掘及性能優(yōu)化——關(guān)聯(lián)規(guī)則與數(shù)據(jù)相關(guān)性分析 本書特色

大數(shù)據(jù)的戰(zhàn)略意義不在于擁有龐大的數(shù)據(jù)資源,而在于提高對(duì)數(shù)據(jù)的"加工能力”,通過(guò)"加工”實(shí)現(xiàn)數(shù)據(jù)的"增值”,數(shù)據(jù)挖掘是實(shí)現(xiàn)大數(shù)據(jù)知識(shí)發(fā)現(xiàn)的有效手段和途徑。關(guān)聯(lián)規(guī)則作為數(shù)據(jù)挖掘領(lǐng)域中的一個(gè)主要研究?jī)?nèi)容,可以在不知道或無(wú)法確定數(shù)據(jù)的關(guān)聯(lián)函數(shù)或模型時(shí),有效發(fā)現(xiàn)大量數(shù)據(jù)項(xiàng)集之間有趣的關(guān)聯(lián)信息。現(xiàn)有的關(guān)聯(lián)規(guī)則挖掘算法因其時(shí)空復(fù)雜性和I/O代價(jià)高,無(wú)法適應(yīng)大數(shù)據(jù)分析處理任務(wù)。本書圍繞大數(shù)據(jù)時(shí)代數(shù)據(jù)處理的核心理論與技術(shù)問(wèn)題,將數(shù)據(jù)挖掘技術(shù),并行算法設(shè)計(jì)及考慮計(jì)算模型的優(yōu)化技術(shù)有機(jī)結(jié)合,充分利用集群系統(tǒng)的強(qiáng)大數(shù)據(jù)處理能力,研究了面向大數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘方法和數(shù)據(jù)放置、負(fù)載均衡等性能優(yōu)化技術(shù)。

并行數(shù)據(jù)挖掘及性能優(yōu)化——關(guān)聯(lián)規(guī)則與數(shù)據(jù)相關(guān)性分析 內(nèi)容簡(jiǎn)介

本書圍繞大數(shù)據(jù)時(shí)代數(shù)據(jù)處理的核心理論與技術(shù)問(wèn)題, 將數(shù)據(jù)挖掘技術(shù), 并行算法設(shè)計(jì)及考慮計(jì)算模型的優(yōu)化技術(shù)有機(jī)結(jié)合, 充分利用集群系統(tǒng)的強(qiáng)大數(shù)據(jù)處理能力, 研究了面向大數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘方法和數(shù)據(jù)放置、負(fù)載均衡等性能優(yōu)化技術(shù)。

并行數(shù)據(jù)挖掘及性能優(yōu)化——關(guān)聯(lián)規(guī)則與數(shù)據(jù)相關(guān)性分析 目錄

目錄
**篇 基礎(chǔ)理論篇
第1章 緒論 3
1.1 數(shù)據(jù)挖掘 4
1.1.1 數(shù)據(jù)挖掘的產(chǎn)生和定義 4
1.1.2 數(shù)據(jù)挖掘的任務(wù)與分類 6
1.1.3 研究前沿和發(fā)展趨勢(shì) 8
1.2 關(guān)聯(lián)規(guī)則 9
1.2.1 關(guān)聯(lián)規(guī)則及其分類 9
1.2.2 關(guān)聯(lián)規(guī)則挖掘算法 12
1.3 集群系統(tǒng)與并行計(jì)算模型 17
1.3.1 集群系統(tǒng) 17
1.3.2 并行計(jì)算模型 18
1.3.3 大數(shù)據(jù)處理架構(gòu)Hadoop與Spark 21
1.4 大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘及應(yīng)用 27
1.4.1 大數(shù)據(jù) 27
1.4.2 大數(shù)據(jù)挖掘及應(yīng)用 29
第2章 MapReduce集群環(huán)境下的數(shù)據(jù)放置策略 33
2.1 引言 34
2.2 數(shù)據(jù)放置策略的關(guān)鍵問(wèn)題與度量標(biāo)準(zhǔn) 35
2.3 數(shù)據(jù)放置策略的優(yōu)化 37
2.3.1 MapReduce集群系統(tǒng)能耗與數(shù)據(jù)放置策略 38
2.3.2 負(fù)載均衡的數(shù)據(jù)放置策略 41
2.3.3 改善I/O性能與通信負(fù)載的數(shù)據(jù)放置策略 46
2.3.4 考慮其他因素的數(shù)據(jù)放置策略 49
2.4 數(shù)據(jù)放置策略的分析與歸納 50
2.5 本章小結(jié) 53
第二篇 關(guān)聯(lián)規(guī)則并行挖掘及性能優(yōu)化篇
第3章 壓縮后綴鏈表與并行頻繁項(xiàng)集挖掘算法 61
3.1 問(wèn)題提出 62
3.2 基礎(chǔ)理論 63
3.3 基于MapReduce的頻繁項(xiàng)集挖掘算法 65
3.3.1 **個(gè)MapReduce作業(yè) 67
3.3.2 第二個(gè)MapReduce作業(yè) 67
3.4 實(shí)驗(yàn)評(píng)價(jià) 68
3.4.1 *小支持度 69
3.4.2 可擴(kuò)展性 70
3.4.3 加速比 70
3.5 本章小結(jié) 71
第4章 FIUT算法與頻繁項(xiàng)集并行挖掘 73
4.1 引言 74
4.2 FIUT算法描述 76
4.3 FiDoop算法概述 77
4.4 基于MapReduce的FiDoop算法 81
4.4.1 **個(gè)MapReduce作業(yè) 83
4.4.2 第二個(gè)MapReduce作業(yè) 83
4.4.3 第三個(gè)MapReduce作業(yè) 84
4.5 實(shí)現(xiàn)細(xì)節(jié) 87
4.5.1 負(fù)載均衡 87
4.5.2 高維優(yōu)化 88
4.6 FiDoop-HD算法 90
4.7 實(shí)驗(yàn)評(píng)價(jià) 92
4.7.1 *小支持度 93
4.7.2 負(fù)載均衡 95
4.7.3 加速比 96
4.7.4 可擴(kuò)展性 97
4.8 本章小結(jié) 98
第5章 MapReduce編程模型下的約束頻繁項(xiàng)集并行挖掘算法 101
5.1 問(wèn)題提出 102
5.2 約束頻繁項(xiàng)集挖掘算法的并行化 103
5.3 基于MapReduce的約束頻繁項(xiàng)集并行挖掘 105
5.4 基于MapReduce的約束頻繁項(xiàng)集并行挖掘算法(PACFP) 108
5.4.1 并行化計(jì)數(shù)過(guò)程 108
5.4.2 并行化CFP-Growth算法 109
5.4.3 結(jié)果聚合 111
5.5 負(fù)載均衡 111
5.6 實(shí)驗(yàn)結(jié)果及分析 112
5.6.1 *小支持度 113
5.6.2 可伸縮性 115
5.6.3 可擴(kuò)展性 116
5.6.4 約束條件判斷的代價(jià)分析 117
5.6.5 負(fù)載均衡 118
5.7 本章小結(jié) 120
第6章 支持并行頻繁項(xiàng)集挖掘的數(shù)據(jù)劃分策略 121
6.1 引言 122
6.1.1 FiDoop-DP算法的研發(fā)動(dòng)機(jī) 123
6.1.2 FiDoop-DP算法要解決的數(shù)據(jù)劃分問(wèn)題 124
6.1.3 FiDoop-DP算法的基本思想 125
6.2 并行FP-Growth算法 126
6.3 相關(guān)工作 128
6.3.1 MapReduce下的數(shù)據(jù)劃分 128
6.3.2 應(yīng)用系統(tǒng)相關(guān)的數(shù)據(jù)劃分 129
6.4 問(wèn)題陳述和設(shè)計(jì)目標(biāo) 131
6.4.1 基本方法與問(wèn)題陳述 131
6.4.2 設(shè)計(jì)目標(biāo) 132
6.5 數(shù)據(jù)劃分策略 133
6.5.1 距離度量 134
6.5.2 K-Means算法種子點(diǎn)的選擇 135
6.5.3 劃分策略 135
6.6 實(shí)現(xiàn)細(xì)節(jié) 138
6.7 實(shí)驗(yàn)評(píng)價(jià) 143
6.7.1 種子點(diǎn)個(gè)數(shù)對(duì)算法的影響 143
6.7.2 *小支持度對(duì)算法的影響 145
6.7.3 數(shù)據(jù)特征對(duì)算法的影響 147
6.7.4 加速比 149
6.7.5 可擴(kuò)展性 150
6.8 本章小結(jié) 151
第7章 頻繁項(xiàng)集并行化過(guò)程中的重定向任務(wù)調(diào)度 153
7.1 問(wèn)題提出 154
7.2 重定向任務(wù)調(diào)度算法 156
7.2.1 數(shù)據(jù)本地化的重要性 156
7.2.2 計(jì)算響應(yīng)時(shí)間 157
7.2.3 重定向任務(wù)調(diào)度算法的設(shè)計(jì) 158
7.3 實(shí)驗(yàn)結(jié)果及分析 160
7.3.1 有效性 160
7.3.2 可擴(kuò)展性 161
7.3.3 穩(wěn)定性 162
7.4 本章小結(jié) 163
第8章 基于Spark內(nèi)存計(jì)算的并行頻繁項(xiàng)集挖掘及優(yōu)化 165
8.1 引言 166
8.2 FP-Growth 算法的并行化分析 167
8.3 Spark環(huán)境下的均衡FP-Growth算法 169
8.3.1 負(fù)載均衡的分組策略 169
8.3.2 負(fù)載均衡的FP-Growth算法并行化 172
8.4 實(shí)驗(yàn)評(píng)價(jià) 174
8.4.1 算法執(zhí)行效率 175
8.4.2 加速比 176
8.4.3 可擴(kuò)展性 177
8.5 本章小結(jié) 178
第三篇 應(yīng) 用 篇
第9章 冷軋輥加工質(zhì)量管理過(guò)程相關(guān)性分析 181
9.1 引言 182
9.2 系統(tǒng)需求與總體設(shè)計(jì) 184
9.2.1 軋輥生產(chǎn)工藝流程 184
9.2.2 冷軋輥生產(chǎn)質(zhì)量管理特點(diǎn) 186
9.2.3 系統(tǒng)的軟件體系結(jié)構(gòu)及功能 188
9.3 數(shù)據(jù)預(yù)處理及關(guān)鍵技術(shù) 190
9.3.1 數(shù)據(jù)轉(zhuǎn)換 190
9.3.2 數(shù)據(jù)清理 190
9.3.3 數(shù)據(jù)離散化 193
9.4 提取關(guān)聯(lián)規(guī)則 195
9.5 系統(tǒng)實(shí)現(xiàn)及運(yùn)行結(jié)果 196
9.6 本章小結(jié) 203
附錄A 冷軋輥加工數(shù)據(jù) 205
附錄B 冷軋輥加工數(shù)據(jù)預(yù)處理格式 207
參考文獻(xiàn) 209











**篇 基礎(chǔ)理論篇
第1章 緒論 3
1.1 數(shù)據(jù)挖掘 4
1.1.1 數(shù)據(jù)挖掘的產(chǎn)生和定義 4
1.1.2 數(shù)據(jù)挖掘的任務(wù)與分類 6
1.1.3 研究前沿和發(fā)展趨勢(shì) 8
1.2 關(guān)聯(lián)規(guī)則 9
1.2.1 關(guān)聯(lián)規(guī)則及其分類 9
1.2.2 關(guān)聯(lián)規(guī)則挖掘算法 12
1.3 集群系統(tǒng)與并行計(jì)算模型 17
1.3.1 集群系統(tǒng) 17
1.3.2 并行計(jì)算模型 18
1.3.3 大數(shù)據(jù)處理架構(gòu)Hadoop與Spark 21
1.4 大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘及應(yīng)用 27
1.4.1 大數(shù)據(jù) 27
1.4.2 大數(shù)據(jù)挖掘及應(yīng)用 29
第2章 MapReduce集群環(huán)境下的數(shù)據(jù)放置策略 33
2.1 引言 34
2.2 數(shù)據(jù)放置策略的關(guān)鍵問(wèn)題與度量標(biāo)準(zhǔn) 35
2.3 數(shù)據(jù)放置策略的優(yōu)化 37
2.3.1 MapReduce集群系統(tǒng)能耗與數(shù)據(jù)放置策略 38
2.3.2 負(fù)載均衡的數(shù)據(jù)放置策略 41
2.3.3 改善I/O性能與通信負(fù)載的數(shù)據(jù)放置策略 46
2.3.4 考慮其他因素的數(shù)據(jù)放置策略 49
2.4 數(shù)據(jù)放置策略的分析與歸納 50
2.5 本章小結(jié) 53
第二篇 關(guān)聯(lián)規(guī)則并行挖掘及性能優(yōu)化篇
第3章 壓縮后綴鏈表與并行頻繁項(xiàng)集挖掘算法 61
3.1 問(wèn)題提出 62
3.2 基礎(chǔ)理論 63
3.3 基于MapReduce的頻繁項(xiàng)集挖掘算法 65
3.3.1 **個(gè)MapReduce作業(yè) 67
3.3.2 第二個(gè)MapReduce作業(yè) 67
3.4 實(shí)驗(yàn)評(píng)價(jià) 68
3.4.1 *小支持度 69
3.4.2 可擴(kuò)展性 70
3.4.3 加速比 70
3.5 本章小結(jié) 71
第4章 FIUT算法與頻繁項(xiàng)集并行挖掘 73
4.1 引言 74
4.2 FIUT算法描述 76
4.3 FiDoop算法概述 77
4.4 基于MapReduce的FiDoop算法 81
4.4.1 **個(gè)MapReduce作業(yè) 83
4.4.2 第二個(gè)MapReduce作業(yè) 83
4.4.3 第三個(gè)MapReduce作業(yè) 84
4.5 實(shí)現(xiàn)細(xì)節(jié) 87
4.5.1 負(fù)載均衡 87
4.5.2 高維優(yōu)化 88
4.6 FiDoop-HD算法 90
4.7 實(shí)驗(yàn)評(píng)價(jià) 92
4.7.1 *小支持度 93
4.7.2 負(fù)載均衡 95
4.7.3 加速比 96
4.7.4 可擴(kuò)展性 97
4.8 本章小結(jié) 98
第5章 MapReduce編程模型下的約束頻繁項(xiàng)集并行挖掘算法 101
5.1 問(wèn)題提出 102
5.2 約束頻繁項(xiàng)集挖掘算法的并行化 103
5.3 基于MapReduce的約束頻繁項(xiàng)集并行挖掘 105
5.4 基于MapReduce的約束頻繁項(xiàng)集并行挖掘算法(PACFP) 108
5.4.1 并行化計(jì)數(shù)過(guò)程 108
5.4.2 并行化CFP-Growth算法 109
5.4.3 結(jié)果聚合 111
5.5 負(fù)載均衡 111
5.6 實(shí)驗(yàn)結(jié)果及分析 112
5.6.1 *小支持度 113
5.6.2 可伸縮性 115
5.6.3 可擴(kuò)展性 116
5.6.4 約束條件判斷的代價(jià)分析 117
5.6.5 負(fù)載均衡 118
5.7 本章小結(jié) 120
第6章 支持并行頻繁項(xiàng)集挖掘的數(shù)據(jù)劃分策略 121
6.1 引言 122
6.1.1 FiDoop-DP算法的研發(fā)動(dòng)機(jī) 123
6.1.2 FiDoop-DP算法要解決的數(shù)據(jù)劃分問(wèn)題 124
6.1.3 FiDoop-DP算法的基本思想 125
6.2 并行FP-Growth算法 126
6.3 相關(guān)工作 128
6.3.1 MapReduce下的數(shù)據(jù)劃分 128
6.3.2 應(yīng)用系統(tǒng)相關(guān)的數(shù)據(jù)劃分 129
6.4 問(wèn)題陳述和設(shè)計(jì)目標(biāo) 131
6.4.1 基本方法與問(wèn)題陳述 131
6.4.2 設(shè)計(jì)目標(biāo) 132
6.5 數(shù)據(jù)劃分策略 133
6.5.1 距離度量 134
6.5.2 K-Means算法種子點(diǎn)的選擇 135
6.5.3 劃分策略 135
6.6 實(shí)現(xiàn)細(xì)節(jié) 138
6.7 實(shí)驗(yàn)評(píng)價(jià) 143
6.7.1 種子點(diǎn)個(gè)數(shù)對(duì)算法的影響 143
6.7.2 *小支持度對(duì)算法的影響 145
6.7.3 數(shù)據(jù)特征對(duì)算法的影響 147
6.7.4 加速比 149
6.7.5 可擴(kuò)展性 150
6.8 本章小結(jié) 151
第7章 頻繁項(xiàng)集并行化過(guò)程中的重定向任務(wù)調(diào)度 153
7.1 問(wèn)題提出 154
7.2 重定向任務(wù)調(diào)度算法 156
7.2.1 數(shù)據(jù)本地化的重要性 156
7.2.2 計(jì)算響應(yīng)時(shí)間 157
7.2.3 重定向任務(wù)調(diào)度算法的設(shè)計(jì) 158
7.3 實(shí)驗(yàn)結(jié)果及分析 160
7.3.1 有效性 160
7.3.2 可擴(kuò)展性 161
7.3.3 穩(wěn)定性 162
7.4 本章小結(jié) 163
第8章 基于Spark內(nèi)存計(jì)算的并行頻繁項(xiàng)集挖掘及優(yōu)化 165
8.1 引言 166
8.2 FP-Growth 算法的并行化分析 167
8.3 Spark環(huán)境下的均衡FP-Growth算法 169
8.3.1 負(fù)載均衡的分組策略 169
8.3.2 負(fù)載均衡的FP-Growth算法并行化 172
8.4 實(shí)驗(yàn)評(píng)價(jià) 174
8.4.1 算法執(zhí)行效率 175
8.4.2 加速比 176
8.4.3 可擴(kuò)展性 177
8.5 本章小結(jié) 178
第三篇 應(yīng) 用 篇
第9章 冷軋輥加工質(zhì)量管理過(guò)程相關(guān)性分析 181
9.1 引言 182
9.2 系統(tǒng)需求與總體設(shè)計(jì) 184
9.2.1 軋輥生產(chǎn)工藝流程 184
9.2.2 冷軋輥生產(chǎn)質(zhì)量管理特點(diǎn) 186
9.2.3 系統(tǒng)的軟件體系結(jié)構(gòu)及功能 188
9.3 數(shù)據(jù)預(yù)處理及關(guān)鍵技術(shù) 190
9.3.1 數(shù)據(jù)轉(zhuǎn)換 190
9.3.2 數(shù)據(jù)清理 190
9.3.3 數(shù)據(jù)離散化 193
9.4 提取關(guān)聯(lián)規(guī)則 195
9.5 系統(tǒng)實(shí)現(xiàn)及運(yùn)行結(jié)果 196
9.6 本章小結(jié) 203
附錄A 冷軋輥加工數(shù)據(jù) 205
附錄B 冷軋輥加工數(shù)據(jù)預(yù)處理格式 207
參考文獻(xiàn) 209
展開全部

并行數(shù)據(jù)挖掘及性能優(yōu)化——關(guān)聯(lián)規(guī)則與數(shù)據(jù)相關(guān)性分析 作者簡(jiǎn)介

荀亞玲,女,1980年生,山西臨汾霍州人,博士,現(xiàn)任太原科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院副教授。在科研方面一直從事數(shù)據(jù)挖掘和并行與分布式計(jì)算等方面的研究工作。在關(guān)聯(lián)規(guī)則挖掘、天體光譜數(shù)據(jù)挖掘技術(shù)、并行與分布式計(jì)算等領(lǐng)域進(jìn)行了理論和應(yīng)用研究,已取得了一些階段性的研究成果。先后參與了多項(xiàng)國(guó)家自然科學(xué)基金、國(guó)家"863”高技術(shù)發(fā)展計(jì)劃基金項(xiàng)目子課題。主持國(guó)家青年基金項(xiàng)目1項(xiàng)("MapReduce集群環(huán)境下的恒星光譜關(guān)聯(lián)規(guī)則挖掘及性能優(yōu)化”項(xiàng)目(編號(hào):61602335))。在《IEEE Transactions on Systems, Man, and Cybernetics: Systems》、《軟件學(xué)報(bào)》等國(guó)內(nèi)外期刊上, 已公開發(fā)表了第一作者學(xué)術(shù)論文若干,其中: SCI收錄1篇, EI收錄2篇;在《Soft Computing》、《Knowledge-Based Systems》、《軟件學(xué)報(bào)》等期刊上,合作發(fā)表了論文十余篇;此外,以第一作者撰寫的《FiDoop-DP: Data Partitioning in Frequent Itemset Mining on Hadoop Clusters》論文,已被CCF推薦的A類國(guó)際**SCI期刊《IEEE Transactions on Parallel and Distributed Systems 》,于2016年5月錄用。2016年5月,《一種基于云存儲(chǔ)的校園安防系統(tǒng)》獲授權(quán)國(guó)家專利,專利號(hào):ZL 2015 2 1058772.7。

商品評(píng)論(0條)
暫無(wú)評(píng)論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服