大數(shù)據(jù)挖掘技術(shù)與應(yīng)用
-
>
營(yíng)銷管理
-
>
茶葉里的全球貿(mào)易史(精裝)
-
>
近代華商股票市場(chǎng)制度與實(shí)踐(1872—1937)
-
>
麥肯錫圖表工作法
-
>
底層邏輯:看清這個(gè)世界的底牌
-
>
李誕脫口秀工作手冊(cè)
-
>
成事:馮唐品讀曾國(guó)藩嘉言鈔
大數(shù)據(jù)挖掘技術(shù)與應(yīng)用 版權(quán)信息
- ISBN:9787502467807
- 條形碼:9787502467807 ; 978-7-5024-6780-7
- 裝幀:一般膠版紙
- 冊(cè)數(shù):暫無(wú)
- 重量:暫無(wú)
- 所屬分類:>
大數(shù)據(jù)挖掘技術(shù)與應(yīng)用 本書(shū)特色
本書(shū)針對(duì)數(shù)據(jù)的海量性、復(fù)雜性、高維性、模糊性和不完整性,對(duì)數(shù)據(jù)挖掘技術(shù)中的聚類分析和關(guān)聯(lián)規(guī)則分析進(jìn)行了系統(tǒng)的研究。設(shè)計(jì)與實(shí)現(xiàn)了基于密度和自適應(yīng)密度可達(dá)聚類算法、基于簇特征的動(dòng)態(tài)增量聚類算法、并行聚類算法、基于密度加權(quán)的模糊聚類算法、高唯復(fù)雜數(shù)據(jù)聚類算法、基于數(shù)據(jù)場(chǎng)的聚類算法、基于距離的量化關(guān)聯(lián)規(guī)則和基于數(shù)據(jù)場(chǎng)的量化關(guān)聯(lián)規(guī)則算法,給出了在礦產(chǎn)資源評(píng)價(jià)、遙感圖像分類、礦業(yè)經(jīng)濟(jì)分析中的應(yīng)用例證。全書(shū)共分11章,主要內(nèi)容包括:緒論,基于密度和密度可達(dá)聚類分析,基于簇特征的動(dòng)態(tài)增量聚類分析,并行聚類分析,基于密度加權(quán)的模糊聚類分析,高唯復(fù)雜數(shù)據(jù)聚類分析,基于數(shù)據(jù)場(chǎng)的聚類分析,基于距離的量化關(guān)聯(lián)規(guī)則,基于數(shù)據(jù)場(chǎng)的量化關(guān)聯(lián)規(guī)則,數(shù)據(jù)挖掘結(jié)果可視化和數(shù)據(jù)挖掘算法應(yīng)用。
大數(shù)據(jù)挖掘技術(shù)與應(yīng)用 內(nèi)容簡(jiǎn)介
《大數(shù)據(jù)挖掘技術(shù)與應(yīng)用》針對(duì)大數(shù)據(jù)的海量性、高維性、異構(gòu)性、動(dòng)態(tài)性、多樣性、多源性、多尺度性、時(shí)空性和模糊性等特征,對(duì)數(shù)據(jù)挖掘技術(shù)中的聚類分析和關(guān)聯(lián)規(guī)則分析進(jìn)行了系統(tǒng)的研究;研究與開(kāi)發(fā)了基于密度和自適應(yīng)密度可達(dá)聚類算法、動(dòng)態(tài)增量聚類算法、并行聚類算法、高維多類型數(shù)據(jù)聚類算法、基于密度加權(quán)的模糊聚類算法、基于數(shù)據(jù)場(chǎng)的聚類和量化關(guān)聯(lián)規(guī)則算法、基于距離的量化關(guān)聯(lián)規(guī)則分析、基于云計(jì)算的大數(shù)據(jù)聚類算法,以及挖掘結(jié)果的可視化表達(dá);給出了地球化學(xué)數(shù)據(jù)挖掘、基于數(shù)據(jù)挖掘的中國(guó)資源與區(qū)域經(jīng)濟(jì)發(fā)展關(guān)系的分析應(yīng)用實(shí)例! 洞髷(shù)據(jù)挖掘技術(shù)與應(yīng)用》可供從事數(shù)據(jù)挖掘技術(shù)研究、應(yīng)用和軟件開(kāi)發(fā)人員以及學(xué)習(xí)數(shù)據(jù)挖掘技術(shù)的本科生和研究生參考。
大數(shù)據(jù)挖掘技術(shù)與應(yīng)用 目錄
1.1 大數(shù)據(jù) 1
1.1.1 大數(shù)據(jù)概念1
1.1.2 大數(shù)據(jù)特征4
1.2 云計(jì)算與大數(shù)據(jù)挖掘 5
1.2.1 云計(jì)算5
1.2.2 大數(shù)據(jù)挖掘6
1.3 傳統(tǒng)數(shù)據(jù)挖掘 6
1.3.1 數(shù)據(jù)源與挖掘任務(wù)7
1.3.2 數(shù)據(jù)挖掘方法7
1.3.3 數(shù)據(jù)挖掘面臨問(wèn)題9
參考文獻(xiàn) 10
2 基于屬性加權(quán)和密度聚類分析11
2.1 聚類分析技術(shù) 11
2.1.1 數(shù)據(jù)基礎(chǔ)11
2.1.2 聚類分析方法16
2.1.3 簇的類型16
2.2 聚類算法 17
2.2.1 聚類算法分類17
2.2.2 聚類算法特性19
2.2.3 選用聚類算法參考因素20
2.2.4 聚類算法面臨的挑戰(zhàn)21
2.3 聚類算法改進(jìn) 23
2.3.1 聚類算法分析23
2.3.2 數(shù)據(jù)對(duì)象屬性加權(quán)25
2.3.3 基于屬性加權(quán)k-means算法27
2.3.4 實(shí)例驗(yàn)證算法28
2.4 基于密度與對(duì)象方向聚類算法 29
2.4.1 算法的提出29
2.4.2 denclue算法30
2.4.3 算法設(shè)計(jì)31
2.5 cabwad算法實(shí)現(xiàn) 36
2.5.1 數(shù)據(jù)結(jié)構(gòu)建立36
2.5.2 數(shù)據(jù)結(jié)構(gòu)上聚類38
2.5.3 時(shí)間和空間復(fù)雜度40
2.6 實(shí)驗(yàn)分析 40
2.6.1 準(zhǔn)確度分析41
2.6.2 可擴(kuò)展性分析43
參考文獻(xiàn) 44
3 基于密度與密度可達(dá)聚類分析46
3.1 cabwad算法分析 46
3.1.1 算法過(guò)程分析46
3.1.2 兩個(gè)輸入?yún)?shù)的分析47
3.2 算法設(shè)計(jì)與分析 50
3.2.1 相關(guān)定義50
3.2.2 cadd算法設(shè)計(jì)53
3.2.3 算法執(zhí)行過(guò)程分析53
3.3 實(shí)驗(yàn)分析 55
3.3.1 不同分布形態(tài)的簇(纏繞簇)55
3.3.2 不同密度的簇56
3.3.3 分布在不同密度噪聲中的變密度簇57
3.3.4 復(fù)雜形態(tài)簇58
3.3.5 算法復(fù)雜度分析59
參考文獻(xiàn) 60
4 動(dòng)態(tài)增量聚類分析62
4.1 算法提出 62
4.1.1 增量聚類算法62
4.1.2 cadd算法分析64
4.1.3 抽樣技術(shù)66
4.2 基于密度可達(dá)的動(dòng)態(tài)增量聚類算法 67
4.2.1 算法設(shè)計(jì)67
4.2.2 算法實(shí)現(xiàn)69
4.2.3 算法復(fù)雜度分析69
4.3 基于子簇特征的增量聚類算法 70
4.3.1 相關(guān)定義70
4.3.2 算法設(shè)計(jì)72
4.3.3 算法實(shí)現(xiàn)72
4.4 實(shí)驗(yàn)分析 73
4.4.1 仿真動(dòng)態(tài)增量聚類73
4.4.2 算法對(duì)比分析77
參考文獻(xiàn) 78
5 并行聚類分析80
5.1 并行計(jì)算技術(shù) 80
5.1.1 并行計(jì)算定義81
5.1.2 并行計(jì)算分類81
5.1.3 并行計(jì)算模型和體系結(jié)構(gòu)82
5.1.4 并行數(shù)據(jù)挖掘85
5.1.5 并行聚類分析86
5.2 并行聚類算法設(shè)計(jì)與實(shí)現(xiàn) 88
5.2.1 算法總體流程88
5.2.2 數(shù)據(jù)并行聚類算法89
5.2.3 數(shù)據(jù)并行和任務(wù)并行聚類算法90
5.3 實(shí)驗(yàn)分析 92
5.3.1 算法有效性分析92
5.3.2 算法加速比分析92
5.3.3 算法時(shí)間復(fù)雜度分析93
5.3.4 pcadd與cadd算法執(zhí)行時(shí)間對(duì)比93
參考文獻(xiàn) 94
6 高維多類型屬性數(shù)據(jù)對(duì)象聚類分析95
6.1 高維多類型屬性數(shù)據(jù)對(duì)象 95
6.1.1 高維數(shù)據(jù)處理95
6.1.2 多類型屬性處理96
6.1.3 高維數(shù)據(jù)對(duì)象聚類96
6.1.4 多類型屬性數(shù)據(jù)對(duì)象聚類98
6.2 維度對(duì)聚類算法精度影響 99
6.2.1 高維數(shù)據(jù)聚類99
6.2.2 數(shù)據(jù)集與相關(guān)定義99
6.2.3 實(shí)驗(yàn)結(jié)果及分析100
6.3 多類型屬性數(shù)據(jù)聚類分析 103
6.3.1 處理多類型數(shù)據(jù)方法103
6.3.2 聚類效果度量標(biāo)準(zhǔn)103
6.3.3 實(shí)驗(yàn)結(jié)果及分析104
6.4 基于屬性加權(quán)的高維數(shù)據(jù)聚類 108
6.4.1 屬性加權(quán)cadd算法108
6.4.2 實(shí)驗(yàn)結(jié)果及分析109
參考文獻(xiàn) 113
7 基于密度加權(quán)模糊聚類分析115
7.1 模糊聚類分析 115
7.1.1 模糊聚類產(chǎn)生115
7.1.2 模糊聚類分類116
7.1.3 模糊聚類算法優(yōu)化117
7.2 模糊聚類算法 118
7.2.1 模糊簇118
7.2.2 hc-means聚類算法118
7.2.3 fc-means聚類算法119
7.2.4 hcm和fcm的關(guān)系120
7.2.5 fcm算法存在問(wèn)題分析121
7.3 基于密度函數(shù)加權(quán)的fcm 122
7.3.1 聚類算法提出122
7.3.2 聚類算法設(shè)計(jì)123
7.3.3 實(shí)驗(yàn)結(jié)果及分析124
參考文獻(xiàn) 132
8 基于距離量化關(guān)聯(lián)規(guī)則挖掘135
8.1 關(guān)聯(lián)規(guī)則挖掘 135
8.1.1 關(guān)聯(lián)規(guī)則相關(guān)概念135
8.1.2 關(guān)聯(lián)規(guī)則度量137
8.1.3 關(guān)聯(lián)規(guī)則分類138
8.1.4 關(guān)聯(lián)規(guī)則挖掘模型與步驟139
8.2 量化關(guān)聯(lián)規(guī)則 140
8.2.1 量化關(guān)聯(lián)規(guī)則提出140
8.2.2 量化關(guān)聯(lián)規(guī)則定義143
8.2.3 算法描述145
8.2.4 算法分析146
8.3 基于距離算法設(shè)計(jì)與實(shí)現(xiàn) 148
8.3.1 算法設(shè)計(jì)148
8.3.2 數(shù)據(jù)預(yù)處理149
8.3.3 基于距離量化規(guī)則150
8.3.4 簇間關(guān)聯(lián)度的度量150
8.3.5 關(guān)聯(lián)度參數(shù) d 0 限定151
8.3.6 規(guī)則的生成153
8.4 算法實(shí)驗(yàn)分析 153
8.4.1 系統(tǒng)交互界面153
8.4.2 地球化學(xué)數(shù)據(jù)分析154
8.4.3 臨床醫(yī)學(xué)調(diào)查數(shù)據(jù)156
參考文獻(xiàn) 156
9 基于數(shù)據(jù)場(chǎng)的數(shù)據(jù)挖掘技術(shù)158
9.1 數(shù)據(jù)場(chǎng) 158
9.1.1 數(shù)據(jù)場(chǎng)的概念158
9.1.2 數(shù)據(jù)場(chǎng)主要特征159
9.1.3 數(shù)據(jù)場(chǎng)表達(dá)159
9.2 數(shù)據(jù)場(chǎng)聚類算法 161
9.2.1 數(shù)據(jù)場(chǎng)聚類算法設(shè)計(jì)161
9.2.2 測(cè)試數(shù)據(jù)集產(chǎn)生162
9.2.3 位場(chǎng)聚類實(shí)驗(yàn)162
9.2.4 輻射場(chǎng)聚類實(shí)驗(yàn)163
9.2.5 參數(shù)對(duì)數(shù)據(jù)場(chǎng)聚類效果影響164
9.3 聚類效果實(shí)驗(yàn)分析 166
9.3.1 模擬數(shù)據(jù)分析166
9.3.2 uci數(shù)據(jù)集實(shí)驗(yàn)168
9.4 基于數(shù)據(jù)場(chǎng)量化關(guān)聯(lián)規(guī)則挖掘 172
9.4.1 常用量化關(guān)聯(lián)規(guī)則挖掘方法172
9.4.2 算法相關(guān)定義173
9.4.3 算法設(shè)計(jì)與實(shí)現(xiàn)175
9.5 關(guān)聯(lián)規(guī)則挖掘?qū)嶒?yàn)與分析 176
9.5.1 身體脂肪bodyfat數(shù)據(jù)集176
9.5.2 臨床醫(yī)學(xué)數(shù)據(jù)實(shí)驗(yàn)測(cè)試178
參考文獻(xiàn) 179
10 基于mapreduce聚類分析181
10.1 hadoop開(kāi)源云計(jì)算平臺(tái) 181
10.1.1 mapreduce181
10.1.2 hdfs文件系統(tǒng)183
10.1.3 基于mapreduce聚類算法184
10.2 基于mapreduce k-means算法改進(jìn) 186
10.2.1 距離三角不等式聚類算法186
10.2.2 距離三角不等式算法設(shè)計(jì)187
10.2.3 聚類算法實(shí)驗(yàn)結(jié)果分析189
10.3 基于mapreduce cadd聚類算法 191
10.3.1 算法設(shè)計(jì)191
10.3.2 mapreduce聚類模型192
10.3.3 聚類算法實(shí)驗(yàn)結(jié)果分析193
參考文獻(xiàn) 195
11 數(shù)據(jù)挖掘結(jié)果可視化表達(dá)196
11.1 可視化數(shù)據(jù)挖掘 196
11.1.1 數(shù)據(jù)可視化197
11.1.2 數(shù)據(jù)挖掘過(guò)程可視化198
11.1.3 數(shù)據(jù)挖掘結(jié)果可視化198
11.1.4 交互式可視化數(shù)據(jù)挖掘199
11.2 數(shù)據(jù)可視化方法及分類 200
11.2.1 基于幾何的技術(shù)200
11.2.2 面向像素的技術(shù)202
11.2.3 基于圖標(biāo)的技術(shù)202
11.2.4 基于層次的技術(shù)203
11.3 可視化數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn) 204
11.3.1 可視化挖掘系統(tǒng)204
11.3.2 聚類結(jié)果可視化205
11.3.3 關(guān)聯(lián)規(guī)則結(jié)果可視化208
參考文獻(xiàn) 212
12 地球化學(xué)數(shù)據(jù)挖掘(。214
12.1 地球化學(xué)數(shù)據(jù)處理方法 214
12.1.1 傳統(tǒng)處理方法214
12.1.2 數(shù)據(jù)挖掘方法215
12.2 地球化學(xué)數(shù)據(jù)聚類分析 217
12.2.1 地球化學(xué)數(shù)據(jù)來(lái)源217
12.2.2 區(qū)域地質(zhì)概況217
12.2.3 聚類分析研究221
12.2.4 靶區(qū)地球化學(xué)特征222
12.3 區(qū)域礦產(chǎn)資源預(yù)測(cè) 225
12.3.1 地球化學(xué)異常靶區(qū)225
12.3.2 元素組合特征分析226
12.3.3 區(qū)域礦產(chǎn)資源預(yù)測(cè)232
參考文獻(xiàn) 234
13 地球化學(xué)數(shù)據(jù)挖掘(ⅱ)236
13.1 區(qū)域地質(zhì)形貌 236
13.1.1 自然地理環(huán)境236
13.1.2 區(qū)域地質(zhì)概況236
13.2 地球化學(xué)元素聚類分析 239
13.2.1 數(shù)據(jù)整理和建立數(shù)據(jù)庫(kù)239
13.2.2 地球化學(xué)數(shù)據(jù)聚類分析239
13.2.3 聚類結(jié)果mapgis成圖241
13.3 地球化學(xué)元素組合特征分析 243
13.3.1 靶區(qū)1~4元素組合特征243
13.3.2 靶區(qū)5元素組合特征243
13.3.3 礦產(chǎn)資源預(yù)測(cè)244
13.4 地球化學(xué)元素模糊c-means聚類 247
13.4.1 某金礦區(qū)模糊c-means聚類分析247
13.4.2 某錫礦區(qū)模糊c-means聚類分析248
13.4.3 某采樣地區(qū)模糊c-means聚類分析249
參考文獻(xiàn) 250
14 資源與經(jīng)濟(jì)發(fā)展關(guān)系分析252
14.1 資源與經(jīng)濟(jì) 252
14.1.1 礦產(chǎn)資源開(kāi)發(fā)252
14.1.2 傳統(tǒng)研究方法253
14.2 數(shù)據(jù)源與數(shù)據(jù)預(yù)處理 256
14.2.1 數(shù)據(jù)的選取256
14.2.2 數(shù)據(jù)標(biāo)準(zhǔn)化257
14.3 聚類分析 258
14.3.1 資源儲(chǔ)量屬性258
14.3.2 環(huán)境指標(biāo)屬性260
14.3.3 經(jīng)濟(jì)指標(biāo)屬性262
14.3.4 技術(shù)指標(biāo)屬性275
14.3.5 結(jié)論與建議278
參考文獻(xiàn) 280
大數(shù)據(jù)挖掘技術(shù)與應(yīng)用 作者簡(jiǎn)介
孟海東(1958-),男,博士,教授,博士生導(dǎo)師。主要從事數(shù)據(jù)挖掘、數(shù)字礦山和計(jì)算機(jī)應(yīng)用領(lǐng)域的教學(xué)和科研工作。內(nèi)蒙古科技大學(xué)礦業(yè)工程學(xué)院教授委員會(huì)委員、學(xué)術(shù)副院長(zhǎng),礦業(yè)系統(tǒng)工程創(chuàng)新團(tuán)隊(duì)學(xué)術(shù)帶頭人、礦業(yè)系統(tǒng)工程研究室主任。主持或承擔(dān)國(guó)家級(jí)和省部級(jí)項(xiàng)目10余項(xiàng)。發(fā)表論文60余篇,其中SCI、EI收錄20余篇。
- >
新文學(xué)天穹兩巨星--魯迅與胡適/紅燭學(xué)術(shù)叢書(shū)(紅燭學(xué)術(shù)叢書(shū))
- >
龍榆生:詞曲概論/大家小書(shū)
- >
巴金-再思錄
- >
朝聞道
- >
小考拉的故事-套裝共3冊(cè)
- >
史學(xué)評(píng)論
- >
我從未如此眷戀人間
- >
經(jīng)典常談