書(shū)馨卡幫你省薪 2024個(gè)人購(gòu)書(shū)報(bào)告 2024中圖網(wǎng)年度報(bào)告
歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊(cè)

Hadoop大數(shù)據(jù)分析

出版社:中國(guó)鐵道出版社出版時(shí)間:2019-07-01
開(kāi)本: 26cm 頁(yè)數(shù): 176頁(yè)
本類榜單:教材銷量榜
中 圖 價(jià):¥16.3(4.3折) 定價(jià)  ¥38.0 登錄后可看到會(huì)員價(jià)
加入購(gòu)物車 收藏
運(yùn)費(fèi)6元,滿39元免運(yùn)費(fèi)
?新疆、西藏除外
溫馨提示:5折以下圖書(shū)主要為出版社尾貨,大部分為全新(有塑封/無(wú)塑封),個(gè)別圖書(shū)品相8-9成新、切口
有劃線標(biāo)記、光盤(pán)等附件不全詳細(xì)品相說(shuō)明>>
本類五星書(shū)更多>

Hadoop大數(shù)據(jù)分析 版權(quán)信息

Hadoop大數(shù)據(jù)分析 本書(shū)特色

本書(shū)從Hadoop的原理和使用出發(fā),在重點(diǎn)介紹Hadoop生態(tài)系統(tǒng)的重要組件HDFS、MapReduce、YARN、Hive和Spark的同時(shí),注重大數(shù)據(jù)分析能力的全面提高。本書(shū)共分13章,主要內(nèi)容包括Hadoop簡(jiǎn)介、HDFS文件系統(tǒng)、YARN資源管理、MapReduce計(jì)算框架、Hive簡(jiǎn)介、Hive數(shù)據(jù)定義、Hive數(shù)據(jù)操作、Hive數(shù)據(jù)查詢、Spark簡(jiǎn)介、Spark大數(shù)據(jù)處理、Spark機(jī)器學(xué)習(xí)流程、Spark有監(jiān)督學(xué)習(xí)模型和Spark無(wú)監(jiān)督學(xué)習(xí)模型。本書(shū)內(nèi)容豐富、體系新穎、結(jié)構(gòu)合理、文字精練,適合作為普通高等院校信息類專業(yè)Hadoop大數(shù)據(jù)分析課程的教材,也可以作為數(shù)據(jù)科學(xué)行業(yè)相關(guān)從業(yè)人員的自學(xué)教材。

Hadoop大數(shù)據(jù)分析 內(nèi)容簡(jiǎn)介

本書(shū)共分13章, 主要內(nèi)容包括Hadoop簡(jiǎn)介、HDFS文件系統(tǒng)、YARN資源管理、MapReduce計(jì)算框架、Hive簡(jiǎn)介, Hive數(shù)據(jù)定義、Hive數(shù)據(jù)操作、Hive數(shù)據(jù)查詢、Spark簡(jiǎn)介、Spark大數(shù)據(jù)處理、Spark機(jī)器學(xué)習(xí)流程, Spark有監(jiān)督學(xué)習(xí)和Spark無(wú)監(jiān)督學(xué)習(xí)模型。

Hadoop大數(shù)據(jù)分析 目錄

第1部分 Hadoop核心基礎(chǔ) 第1章 Hadoop簡(jiǎn)介 2 1.1 Hadoop產(chǎn)生背景 2 1.2 Hadoop簡(jiǎn)要?dú)v史 3 1.3 Hadoop生態(tài)系統(tǒng)組件 3 1.4 Hadoop版本和商用支持 5 1.5 Hadoop的基礎(chǔ)環(huán)境配置 6 1.6 Hadoop的安裝 7 1.7 Hadoop的配置 11 1.8 Hadoop的運(yùn)行 14 小結(jié) 19 習(xí)題 19 第2章 HDFS文件系統(tǒng) 20 2.1 HDFS簡(jiǎn)介 20 2.2 HDFS架構(gòu) 20 2.3 HDFS文件塊 21 2.4 HDFS常用操作 22 小結(jié) 24 習(xí)題 24 第3章 YARN資源管理 25 3.1 YARN架構(gòu) 25 3.2 YARN調(diào)度策略 26 3.3 YARN常用操作 28 小結(jié) 30 習(xí)題 31 第4章 MapReduce計(jì)算框架 32 4.1 MapReduce原理 32 4.2 MapReduce作業(yè)數(shù)據(jù)流 33 4.3 Hadoop流處理 35 4.4 MapReduce程序?qū)崿F(xiàn)詞頻 統(tǒng)計(jì) 35 4.5 MapReduce程序的Reducer 數(shù)量 40 4.6 MapReduce程序的Combiner 41 4.7 MapReduce程序?qū)崿F(xiàn)數(shù)據(jù) 連接 43 小結(jié) 49 習(xí)題 49 第2部分 Hive數(shù)據(jù)倉(cāng)庫(kù) 第5章 Hive簡(jiǎn)介 52 5.1 Hive概述 52 5.2 Hive的安裝 53 5.3 Hive的運(yùn)行 56 小結(jié) 59 習(xí)題 59 第6章 Hive數(shù)據(jù)定義 60 6.1 數(shù)據(jù)庫(kù)操作 60 6.2 數(shù)據(jù)表基本操作 62 6.3 存儲(chǔ)格式和行格式 65 6.4 數(shù)據(jù)類型 67 6.5 外部表 70 6.6 分區(qū)表 72 小結(jié) 74 習(xí)題 74 第7章 Hive數(shù)據(jù)操作 75 7.1 數(shù)據(jù)導(dǎo)入 75 7.2 數(shù)據(jù)插入 78 7.3 數(shù)據(jù)導(dǎo)出 82 小結(jié) 84 習(xí)題 84 第8章 Hive數(shù)據(jù)查詢 85 8.1 基本查詢 85 8.2 數(shù)據(jù)聚合 87 8.3 數(shù)據(jù)連接 90 小結(jié) 92 習(xí)題 93 第3部分 Spark數(shù)據(jù)分析 第9章 Spark簡(jiǎn)介 96 9.1 Spark概述 96 9.2 Spark原理 97 9.3 Spark的安裝 98 9.4 Spark運(yùn)行方式 99 9.5 Spark運(yùn)行位置 101 9.6 Spark運(yùn)行參數(shù) 104 小結(jié) 104 習(xí)題 104 第10章 Spark大數(shù)據(jù)處理 105 10.1 數(shù)據(jù)框的創(chuàng)建 105 10.2 數(shù)據(jù)框的選擇 107 10.3 數(shù)據(jù)框的運(yùn)算和聚合 110 10.4 數(shù)據(jù)框的增加、刪除 和修改 114 10.5 數(shù)據(jù)框的連接 116 10.6 數(shù)據(jù)框的變形 119 小結(jié) 120 習(xí)題 120 第11章 Spark機(jī)器學(xué)習(xí)流程 121 11.1 數(shù)據(jù)探索 122 11.2 數(shù)據(jù)劃分 123 11.3 數(shù)據(jù)填充 124 11.4 類別變量處理 125 11.5 特征選擇 128 11.6 建模與調(diào)優(yōu) 131 11.7 測(cè)試與評(píng)估 133 小結(jié) 135 習(xí)題 135 第12章 Spark有監(jiān)督學(xué)習(xí)模型 136 12.1 線性回歸模型 140 12.2 邏輯回歸模型 142 12.3 決策樹(shù)模型 145 12.4 隨機(jī)森林模型 152 12.5 神經(jīng)網(wǎng)絡(luò) 158 12.6 協(xié)同過(guò)濾 163 小結(jié) 166 習(xí)題 166 第13章 Spark無(wú)監(jiān)督學(xué)習(xí)模型 167 13.1 k均值聚類模型 168 13.2 主成分分析模型 172 13.3 關(guān)聯(lián)分析模型 173 小結(jié) 176 習(xí)題 176
展開(kāi)全部

Hadoop大數(shù)據(jù)分析 作者簡(jiǎn)介

高永彬:博士、講師,就職于上海工程技術(shù)大學(xué),博士畢業(yè)于韓國(guó)全北國(guó)立大學(xué),在模式識(shí)別、機(jī)器學(xué)習(xí)領(lǐng)域積累了大量的研究與實(shí)戰(zhàn)經(jīng)驗(yàn)。特別地,在基于深度學(xué)習(xí)技術(shù)的人臉識(shí)別以及車型檢測(cè)技術(shù)進(jìn)行了深入地研究,發(fā)表了近30篇期刊/會(huì)議論文,取得了豐厚的研究成果,發(fā)表在包括Information Sciences, Pattern Recognition Letters等高水平期刊中,其中SCI收錄5篇,EI收錄4篇。錢亮宏,男,畢業(yè)于上海交通大學(xué)電子信息與電氣工程學(xué)院,1989年8月出生,擁有10年R語(yǔ)言使用經(jīng)驗(yàn),一直奮戰(zhàn)在數(shù)據(jù)分析與挖掘領(lǐng)域的第一線,作為金融和互聯(lián)網(wǎng)行業(yè)資深數(shù)據(jù)挖掘?qū)<。方志軍,男,教授,現(xiàn)任上海工程技術(shù)大學(xué)電子電氣工程學(xué)院院長(zhǎng),1971年9月出生,主要從事人工智能、機(jī)器視覺(jué)、大數(shù)據(jù)分析等方面的研究,主講課程包括數(shù)字圖像處理、機(jī)器視覺(jué)、計(jì)算機(jī)導(dǎo)論、大數(shù)據(jù)導(dǎo)論和程序設(shè)計(jì)等。

暫無(wú)評(píng)論……
書(shū)友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服