目錄前言第1章 大數(shù)據(jù)概論 11.1 什么是大數(shù)據(jù) 11.1.1 大數(shù)據(jù)時代背景 11.1.2 大數(shù)據(jù)的定義 21.1.3 大數(shù)據(jù)的特征 51.1.4 DIKW模型 61.2 大數(shù)據(jù)的產(chǎn)生與來源 81.2.1 信息-物理-社會融合系統(tǒng) 81.2.2 大數(shù)據(jù)的產(chǎn)生方式 91.2.3 典型大數(shù)據(jù)來源 91.3 大數(shù)據(jù)時代的科研范式 131.3.1 數(shù)據(jù)科學(xué) 131.3.2 數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn) 141.3.3 計(jì)算社會科學(xué) 151.4 大數(shù)據(jù)人才與組織 161.4.1 大數(shù)據(jù)人才 161.4.2 大數(shù)據(jù)組織 171.5 大數(shù)據(jù)安全與隱私保護(hù) 181.5.1 大數(shù)據(jù)安全 181.5.2 隱私保護(hù) 20參考文獻(xiàn) 21第2章 商務(wù)分析基礎(chǔ) 222.1 商務(wù)分析概述 222.1.1 什么是商務(wù)分析 222.1.2 從商務(wù)智能到商務(wù)分析 232.1.3 大數(shù)據(jù)時代的商務(wù)分析 252.2 商務(wù)數(shù)據(jù)分析框架 262.2.1 描述性分析 262.2.2 預(yù)測性分析 262.2.3 規(guī)范性分析 272.3 常用的商務(wù)數(shù)據(jù)分析方法 282.3.1 關(guān)聯(lián)分析 282.3.2 聚類分析 282.3.3 分類分析 282.3.4 回歸分析 292.4 商務(wù)數(shù)據(jù)分析流程 292.4.1 數(shù)據(jù)分析過程模型 292.4.2 六階段任務(wù) 30參考文獻(xiàn) 32第3章 大數(shù)據(jù)管理 333.1 結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù) 333.1.1 結(jié)構(gòu)化數(shù)據(jù) 343.1.2 非結(jié)構(gòu)化數(shù)據(jù) 343.2 元數(shù)據(jù)管理 353.2.1 什么是元數(shù)據(jù) 353.2.2 元數(shù)據(jù)如何管理 373.3 大數(shù)據(jù)存儲管理 383.3.1 傳統(tǒng)關(guān)系型數(shù)據(jù)庫 383.3.2 數(shù)據(jù)倉庫與數(shù)據(jù)集市 393.3.3 NoSQL數(shù)據(jù)庫 413.3.4 Hadoop與MapReduce 423.3.5 云計(jì)算與云數(shù)據(jù)管理 443.4 數(shù)據(jù)質(zhì)量管理 463.4.1 數(shù)據(jù)質(zhì)量維度 463.4.2 影響數(shù)據(jù)質(zhì)量的因素 483.4.3 數(shù)據(jù)生命周期 493.4.4 數(shù)據(jù)質(zhì)量管理方法 50參考文獻(xiàn) 52第4章 數(shù)據(jù)預(yù)處理 534.1 數(shù)據(jù)清洗 534.1.1 缺失數(shù)據(jù)處理 534.1.2 噪聲數(shù)據(jù)處理 544.2 數(shù)據(jù)集成 554.2.1 模式集成問題 554.2.2 屬性語義差異和結(jié)構(gòu)差異問題 554.2.3 冗余問題 564.2.4 數(shù)據(jù)重復(fù)問題 564.2.5 數(shù)據(jù)沖突問題 574.3 數(shù)據(jù)轉(zhuǎn)換 574.4 數(shù)據(jù)降維 574.4.1 維數(shù)災(zāi)難 584.4.2 降維方法 59參考文獻(xiàn) 61第5章 數(shù)據(jù)探索分析 625.1 數(shù)據(jù)描述統(tǒng)計(jì)分析 625.1.1 分散趨勢分析 625.1.2 集中趨勢分析 635.1.3 變異分析 635.1.4 相關(guān)分析 635.2 數(shù)據(jù)可視化 645.2.1 數(shù)據(jù)可視化的價值 645.2.2 趨勢型數(shù)據(jù)可視化 655.2.3 對比型數(shù)據(jù)可視化 685.2.4 比例型數(shù)據(jù)可視化 755.2.5 分布型數(shù)據(jù)可視化 785.2.6 關(guān)系型數(shù)據(jù)可視化 815.2.7 地理型數(shù)據(jù)可視化 84參考文獻(xiàn) 84第6章 描述性數(shù)據(jù)分析 856.1 關(guān)聯(lián)分析 856.1.1 頻繁項(xiàng)集 856.1.2 關(guān)聯(lián)規(guī)則 856.1.3 關(guān)聯(lián)規(guī)則發(fā)現(xiàn)流程 866.1.4 Apriori算法 876.1.5 FP-growth算法 926.1.6 關(guān)聯(lián)規(guī)則評價 966.2 序列模式分析 986.2.1 基本概念 986.2.2 序列模式挖掘 996.2.3 AprioriAll算法 1006.2.4 GSP算法 1026.2.5 FreeSpan算法 1026.2.6 PrefixSpan算法 1026.2.7 算法比較 1046.3 聚類分析 1056.3.1 聚類分析方法分類 1056.3.2 劃分聚類方法 1076.3.3 層次聚類方法 1106.3.4 密度聚類方法 1176.3.5 聚類性能評估 1206.4 離群點(diǎn)檢測 1236.4.1 離群點(diǎn)及檢測方法概述 1236.4.2 基于統(tǒng)計(jì)的離群點(diǎn)檢測 1256.4.3 基于距離的離群點(diǎn)檢測 1266.4.4 基于密度的離群點(diǎn)檢測 1276.4.5 基于聚類的離群點(diǎn)檢測 128參考文獻(xiàn) 130第7章 預(yù)測性數(shù)據(jù)分析 1317.1 線性回歸分析 1317.1.1 一元線性回歸分析 1317.1.2 多元線性回歸分析 1337.2 時間序列分析 1357.2.1 時間序列的組成成分 1367.2.2 平穩(wěn)序列的預(yù)測 1377.2.3 趨勢型序列的預(yù)測 1397.2.4 季節(jié)型序列的預(yù)測 1407.2.5 時間序列預(yù)測方法的選擇 1417.2.6 復(fù)合型序列的分解預(yù)測 1427.3 判別分析 1427.3.1 判別分析的基本思想 1437.3.2 兩個總體的判別分析 1447.3.3 多個總體的判別分析 1457.3.4 應(yīng)用實(shí)例 1457.4 分類算法 1477.4.1 分類的數(shù)學(xué)定義 1487.4.2 決策樹 1497.4.3 貝葉斯分類 1537.4.4 k-近鄰分類 1557.4.5 人工神經(jīng)網(wǎng)絡(luò) 1567.4.6 支持向量機(jī) 1597.5 推薦算法 1617.5.1 個性化推薦的基本概念 1617.5.2 協(xié)同過濾推薦 1617.5.3 基于內(nèi)容的推薦 1657.5.4 基于知識的推薦 1657.5.5 基于信任的推薦 1677.5.6 混合推薦 1687.5.7 應(yīng)用實(shí)例 170參考文獻(xiàn) 171第8章 規(guī)范性數(shù)據(jù)分析 1738.1 決策分析 1738.1.1 決策的定義與決策過程 1738.1.2 決策問題的類型 1748.1.3 決策問題的描述 1778.1.4 決策模型與求解方法 1778.2 數(shù)據(jù)驅(qū)動的決策 1798.2.1 數(shù)據(jù)文化 1808.2.2 數(shù)據(jù)驅(qū)動型決策的步驟 1818.2.3 大數(shù)據(jù)驅(qū)動的管理決策范式與框架 1828.3 決策支持系統(tǒng) 1858.3.1 決策支持系統(tǒng)的組件 1868.3.2 新一代決策支持系統(tǒng) 1878.4 商務(wù)智能系統(tǒng) 1888.4.1 商務(wù)智能系統(tǒng)的主要功能 1888.4.2 商務(wù)智能系統(tǒng)的體系架構(gòu) 1898.5 知識管理系統(tǒng) 1908.5.1 知識系統(tǒng)的工作過程 1918.5.2 知識系統(tǒng)的功能與結(jié)構(gòu) 1918.6 個性化推薦系統(tǒng) 1958.6.1 推薦系統(tǒng)的工作原理與構(gòu)成 1958.6.2 推薦系統(tǒng)的架構(gòu) 1968.7 收益管理系統(tǒng) 1988.7.1 收益管理理論 1988.7.2 收益管理系統(tǒng)的體系架構(gòu) 2008.7.3 收益管理優(yōu)化算例 201參考文獻(xiàn) 202第9章 非結(jié)構(gòu)化數(shù)據(jù)分析 2039.1 Web數(shù)據(jù)分析 2039.1.1 Web數(shù)據(jù)分析任務(wù) 2039.1.2 Web挖掘的基本流程 2059.1.3 Web信息爬取 2069.1.4 Web結(jié)構(gòu)挖掘 2129.1.5 Web觀點(diǎn)挖掘 2159.1.6 Web使用挖掘 2209.2 文本數(shù)據(jù)分析 2229.2.1 預(yù)處理技術(shù) 2229.2.2 文本表示 2289.2.3 文本聚類 2359.2.4 文本分類 2389.3 圖數(shù)據(jù)分析 2399.3.1 圖的基礎(chǔ)知識 2399.3.2 二分圖匹配 2439.3.3 頻繁子圖挖掘 2459.3.4 圖聚類 249參考文獻(xiàn) 254