數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)基礎(chǔ)及應(yīng)用 版權(quán)信息
- ISBN:9787115645760
- 條形碼:9787115645760 ; 978-7-115-64576-0
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)基礎(chǔ)及應(yīng)用 本書特色
1.本書是《大數(shù)據(jù)》編委會針對校企合作的精心力作。
2.本書凝結(jié)了曙光瑞翼多年的教學(xué)經(jīng)驗,能夠滿足校企融合教學(xué)的需求。
3.本書旨在介紹數(shù)據(jù)挖掘的基礎(chǔ)知識,以及人工智能算法,為即將學(xué)習(xí)大數(shù)據(jù)技術(shù)的讀者奠定基礎(chǔ)。
4.本書采用任務(wù)驅(qū)動的編寫方式,讀者可以直接進(jìn)行實驗效果體驗,并進(jìn)行自由調(diào)整。
5.本書采用大量的實踐案例,結(jié)合行業(yè)典型應(yīng)用,編寫行業(yè)實踐。
6.本書提供豐富的教學(xué)資源,包括電子課件、實驗設(shè)計等。
數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)基礎(chǔ)及應(yīng)用 內(nèi)容簡介
這是一本全面介紹數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的大數(shù)據(jù)專業(yè)類圖書,閱讀本書可以提升讀者對大數(shù)據(jù)分析與挖掘的認(rèn)知及動手能力。本書共10章,由淺入深地講解數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的基本概念與流程、相關(guān)算法與實現(xiàn)工具。全書理論與實踐相結(jié)合,既有新技術(shù)的深度,也有行業(yè)應(yīng)用的廣度,使讀者可以全面了解數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)相關(guān)技術(shù)。
本書可以作為高等學(xué)校計算機(jī)、數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)等相關(guān)專業(yè)“機(jī)器學(xué)習(xí)”或者“數(shù)據(jù)挖掘”課程的教材,也可作為從事機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘、數(shù)據(jù)分析相關(guān)工作的技術(shù)人員的參考書。
數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)基礎(chǔ)及應(yīng)用 目錄
第 1 章 13
數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)概述 13
1.1 數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的發(fā)展史 13
1.1.1 數(shù)據(jù)時代 13
1.1.2 數(shù)據(jù)挖掘的技術(shù)發(fā)展 14
1.1.3 機(jī)器學(xué)習(xí)的技術(shù)發(fā)展 17
1.1.4 人工智能、數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的關(guān)系 20
1.2 數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的相關(guān)概念 21
1.2.1 數(shù)據(jù)挖掘的定義 21
1.2.2 機(jī)器學(xué)習(xí)的定義 21
1.2.3 數(shù)據(jù)庫與數(shù)據(jù)倉庫 22
1.3 數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的算法分類 24
1.3.1 類/概念描述:特征和區(qū)分 25
1.3.2 回歸(regression) 26
1.3.3 分類(classification) 27
1.3.4 預(yù)測(forecasting) 28
1.3.5 關(guān)聯(lián)分析(association) 28
1.3.6 聚類分析(cluster) 29
1.3.7 異常檢測(anomalydetection) 30
1.3.8 遷移學(xué)習(xí) 31
1.3.9 強化學(xué)習(xí) 31
1.3.10 小結(jié) 32
1.4 數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的一般流程 33
1.4.1 確定分析目標(biāo) 33
1.4.2 收集數(shù)據(jù) 33
1.4.3 整理預(yù)處理 33
1.4.4 數(shù)據(jù)建模 34
1.4.5 模型訓(xùn)練 35
1.4.6 模型評估 35
1.4.7 模型應(yīng)用 35
1.5 數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的應(yīng)用領(lǐng)域 35
1.5.1 電子商務(wù) 36
1.5.2 金融領(lǐng)域 36
1.5.3 醫(yī)療領(lǐng)域 37
1.5.2 通信領(lǐng)域 37
1.5.3 自然語言處理 37
1.5.4 工業(yè)領(lǐng)域 40
1.5.5 藝術(shù)創(chuàng)作 41
1.5.6 數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)應(yīng)用的問題 41
第 2章 43
數(shù)據(jù)科學(xué)分析入門 43
2.1 數(shù)據(jù)科學(xué)分析庫 43
2.2 數(shù)據(jù)科學(xué)分析庫的基本使用 59
2.2.1 numpy基本使用 59
2.2.2 pandas基本使用 63
2.2.3 matplotlib基本使用 70
2.2.4 Scikit-Learn基本使用 80
2.2.5綜合案例 84
第3章 100
回歸算法與應(yīng)用 100
3.1 回歸預(yù)測問題 100
3.1.1 介紹 100
3.1.2 常見回歸數(shù)據(jù)集 101
3.2 線性回歸 104
3.2.1 原理與應(yīng)用場景 104
3.2.2 一元線性回歸的python實現(xiàn) 105
3.2.3 Python實現(xiàn)多元線性回歸算法 107
3.2.4 多元線性回歸算法優(yōu)缺點 108
3.3 Logistic回歸 108
3.3.1 原理與應(yīng)用場景 109
3.3.2 Logistic回歸的python實現(xiàn) 109
第4章 112
4.1 數(shù)據(jù)挖掘分類 112
4.1.1 數(shù)據(jù)挖掘分類 112
4.1.2 常見的分類數(shù)據(jù)集 113
4.2 KNN算法 118
4.2.1 K*近鄰算法概述 118
4.2.2 K*近鄰算法實現(xiàn)電影分類 120
4.2.3 使用Python實現(xiàn)KNN算法 128
4.3 向量空間模型 129
4.3.1 原理與應(yīng)用場景 129
4.3.2 空間向量模型應(yīng)用 130
4.4 支持向量機(jī) 133
4.4.1 支持向量機(jī) 133
4.4.2 支持向量機(jī)實現(xiàn)分類 135
4.4.3 支持向量機(jī)實現(xiàn)回歸 136
4.4.4 支持向量機(jī)異常檢測 136
4.4.5 線性可分與線性不可分 139
4.4.6 SVM鳶尾花分類 143
4.4.7 軟間隔 145
4.4.8 GridSearchCV確定超參數(shù) 148
4.4.9 過擬合問題 150
4.5 決策樹 154
4.5.1 決策樹 154
4.5.2 ID3算法 156
4.5.3 決策樹實現(xiàn)分類 159
4.5.4 決策樹實現(xiàn)回歸 166
4.6 集成學(xué)習(xí) 170
4.6.1 集成學(xué)習(xí) 170
4.6.2 隨機(jī)森林 177
4.7 模型的評判和保存 181
第5章 186
聚類算法與應(yīng)用 186
5.1 無監(jiān)督學(xué)習(xí)問題 186
5.1.1 無監(jiān)督學(xué)習(xí) 186
5.1.2 聚類分析的基本概念與原理 187
5.1.3 常見聚類數(shù)據(jù)集 187
5.2 劃分聚類 189
5.2.1 劃分聚類 189
5.2.2 K-Means算法 190
5.2.4 K-Means算法在鳶尾花應(yīng)用 195
5.2.4 使用聚類進(jìn)行圖像壓縮 197
5.2.5 Numpy實現(xiàn)K_Means聚類 199
5.3 層次聚類 200
5.3.1 層次聚類算法 200
5.3.2 使用層次聚類算法聚類 202
5.3.3 基于運營商基站信息挖掘商圈 204
5.4 聚類效果評測 207
第6章 209
關(guān)聯(lián)規(guī)則與協(xié)同過濾 209
6.1 推薦算法簡介 209
6.1.1 推薦算法的概念 209
6.2 關(guān)聯(lián)規(guī)則 210
6.2.1 什么是關(guān)聯(lián)規(guī)則? 210
6.2.2 關(guān)聯(lián)規(guī)則的挖掘過程 211
6.2.3 Apriori算法 212
6.3 協(xié)同過濾 224
6.3.1 協(xié)同過濾算法的概念 224
6.3.2 基于用戶的協(xié)同過濾 224
6.3.3 基于物品協(xié)同過濾 227
6.3.4 實驗實現(xiàn)協(xié)同過濾算法 229
6.3.5 推薦算法庫Surprise介紹與案例 234
第7章 239
特征工程、降維與超參數(shù)調(diào)優(yōu) 239
7.1 特征工程 239
7.1.1 數(shù)據(jù)總體分析 240
7.1.2 數(shù)據(jù)預(yù)處理 241
7.1.3 數(shù)據(jù)預(yù)處理案例分析—美國高中生的社交數(shù)據(jù)案例分析 253
7.2 降維與超參數(shù)調(diào)優(yōu) 257
7.2.1 降維方法 257
7.2.2 實驗實現(xiàn)降維 257
7.2.3 超參數(shù)調(diào)優(yōu) 259
7.2.4 交叉驗證案例分析 261
第8章 263
圖像數(shù)據(jù)處理分析 263
8.1 圖像數(shù)據(jù)結(jié)構(gòu)介紹 264
8.1.1圖像數(shù)據(jù) 264
8.1.2 圖像結(jié)構(gòu)介紹 265
8.2 圖像數(shù)據(jù)分析方法 266
8.3 圖像數(shù)據(jù)分析案例 271
8.3.1 PIL:Python圖像處理類庫應(yīng)用示例 271
8.3.2 Numpy圖像數(shù)據(jù)分析示例 277
8.3.3 Scipy圖像數(shù)據(jù)分析示例 279
8.3.4 scikit-image 283
8.3.5 OpenCV 288
8.3.6 綜合練習(xí)——貓狗圖片識別案例 300
8.4 計算機(jī)視覺的應(yīng)用 302
8.4.1 圖像分類(Image Classification) 302
8.4.2 目標(biāo)檢測(Object Detection) 303
8.4.3 圖像分割(Object Segmentation) 305
8.4.4 風(fēng)格遷移(Style Transfer) 307
8.4.5 圖像重構(gòu)(Image Reconstruction) 308
8.4.6 超分辨率(Super-Resolution) 309
8.4.7 圖像生成(Image Synthesis) 309
8.4.8 人臉圖像的應(yīng)用 310
8.4.9 其他 310
第 9 章 321
文本數(shù)據(jù)處理分析 321
9.1 文本數(shù)據(jù)處理的相關(guān)概念 321
9.1.1 常用的文本數(shù)據(jù)處理技術(shù) 321
9.1.2 中英文的文本數(shù)據(jù)處理方法對比 322
9.2 文本數(shù)據(jù)處理關(guān)鍵技術(shù)應(yīng)用 325
9.2.1 文本分詞技術(shù) 325
9.2.2 文本向量化技術(shù) 328
9.2.3 關(guān)鍵詞提取 331
9.3 文本數(shù)據(jù)處理分析案例 332
9.3.1 Python的第三方模塊NLTK 332
9.3.2 Python的第三方模塊jieba 346
9.4 自然語言處理的應(yīng)用 353
9.4.1 NLP的應(yīng)用場景及數(shù)據(jù)集 353
9.4.2 LLM的發(fā)展與研究方向 356
第 10章 358
深度學(xué)習(xí)入門 358
10.1 深度學(xué)習(xí)概述 358
10.2 神經(jīng)網(wǎng)絡(luò)介紹 359
10.2.1 單個神經(jīng)元 & 邏輯回歸(LR) 359
10.2.2 人工神經(jīng)網(wǎng)絡(luò)概念 360
10.2.3 多層神經(jīng)網(wǎng)絡(luò)簡介 360
10.2.4 BP神經(jīng)網(wǎng)絡(luò)簡介 361
10.3 卷積神經(jīng)網(wǎng)絡(luò) 361
10.3.1 卷積神經(jīng)網(wǎng)絡(luò)簡介 361
10.3.2 卷積神經(jīng)網(wǎng)絡(luò)的整體結(jié)構(gòu) 362
10.3.3 常見卷積神經(jīng)網(wǎng)絡(luò) 365
10.4 循環(huán)神經(jīng)網(wǎng)絡(luò) 376
10.4.1 RNN基本原理 376
10.4.2 長短期記憶網(wǎng)絡(luò) 379
10.4.3 門限循環(huán)單元 385
10.5 深度學(xué)習(xí)流行框架 386
10.6 建立一個卷積神經(jīng)網(wǎng)絡(luò)對圖片分類 388
展開全部
數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)基礎(chǔ)及應(yīng)用 作者簡介
許桂秋,北京中科特瑞科技有限公司運營總監(jiān),已出版《大數(shù)據(jù)導(dǎo)論》《Python編程基礎(chǔ)與應(yīng)用》《NoSQL數(shù)據(jù)庫原理與應(yīng)用》《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》等教材。