書(shū)馨卡幫你省薪 2024個(gè)人購(gòu)書(shū)報(bào)告 2024中圖網(wǎng)年度報(bào)告
歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊(cè)
> >>
大數(shù)據(jù)技術(shù)入門到商業(yè)實(shí)戰(zhàn) Hadoop+Spark+Flink全解析

大數(shù)據(jù)技術(shù)入門到商業(yè)實(shí)戰(zhàn) Hadoop+Spark+Flink全解析

作者:李偉杰
出版社:機(jī)械工業(yè)出版社出版時(shí)間:2021-08-01
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 248
中 圖 價(jià):¥42.6(4.3折) 定價(jià)  ¥99.0 登錄后可看到會(huì)員價(jià)
加入購(gòu)物車 收藏
運(yùn)費(fèi)6元,滿39元免運(yùn)費(fèi)
?新疆、西藏除外
溫馨提示:5折以下圖書(shū)主要為出版社尾貨,大部分為全新(有塑封/無(wú)塑封),個(gè)別圖書(shū)品相8-9成新、切口
有劃線標(biāo)記、光盤等附件不全詳細(xì)品相說(shuō)明>>
本類五星書(shū)更多>

大數(shù)據(jù)技術(shù)入門到商業(yè)實(shí)戰(zhàn) Hadoop+Spark+Flink全解析 版權(quán)信息

大數(shù)據(jù)技術(shù)入門到商業(yè)實(shí)戰(zhàn) Hadoop+Spark+Flink全解析 本書(shū)特色

以精煉的語(yǔ)言和經(jīng)典實(shí)例,用圖文并茂的形式,向讀者生動(dòng)展示大數(shù)據(jù)技術(shù)商業(yè)實(shí)戰(zhàn)開(kāi)發(fā)

大數(shù)據(jù)技術(shù)入門到商業(yè)實(shí)戰(zhàn) Hadoop+Spark+Flink全解析 內(nèi)容簡(jiǎn)介

本書(shū)全面詳細(xì)地介紹了大數(shù)據(jù)生態(tài)系統(tǒng)中的主流技術(shù)。全書(shū)共10章,主要包括大數(shù)據(jù)生態(tài)系統(tǒng)概述、大數(shù)據(jù)采集技術(shù)、大數(shù)據(jù)存儲(chǔ)技術(shù)、大數(shù)據(jù)分析處理技術(shù)等內(nèi)容,書(shū)中涵蓋了Hadoop、Hive、Hbase、Kafka、Spark、Flink等技術(shù)的原理和實(shí)踐,其中重點(diǎn)介紹了Hadoop技術(shù)、Spark技術(shù)及Flink技術(shù)。本書(shū)詳細(xì)介紹了主流大數(shù)據(jù)技術(shù)框架的基本原理、環(huán)境搭建、操作使用和在典型行業(yè)中的具體應(yīng)用,使讀者不僅能夠在宏觀上全面認(rèn)知大數(shù)據(jù)生態(tài)系統(tǒng),而且還能在微觀上深入理解大數(shù)據(jù)技術(shù)細(xì)節(jié)。本書(shū)不僅適合大數(shù)據(jù)技術(shù)初學(xué)者閱讀,還可以幫助金融、電信、電商、能源、政府部門的大數(shù)據(jù)應(yīng)用決策和技術(shù)人員,以及IT經(jīng)理、CTO、CIO等快速學(xué)習(xí)大數(shù)據(jù)技術(shù),并能作為大數(shù)據(jù)相關(guān)崗位培訓(xùn)的教程。

大數(shù)據(jù)技術(shù)入門到商業(yè)實(shí)戰(zhàn) Hadoop+Spark+Flink全解析 目錄

前言

第1章 初識(shí)大數(shù)據(jù)
1.1 什么是大數(shù)據(jù)
1.2 大數(shù)據(jù)行業(yè)應(yīng)用
1.3 什么是Hadoop
1.4 Hadoop產(chǎn)生背景
1.5 Hadoop的架構(gòu)模塊介紹
1.6 Hadoop在大數(shù)據(jù)、云計(jì)算中的位置和關(guān)系
1.7 國(guó)內(nèi)外Hadoop應(yīng)用案例介紹
1.8 Hadoop生態(tài)圈以及各組成部分簡(jiǎn)介
1.9 本章小結(jié)

第2章 Hadoop之分布式文件系統(tǒng)HDFS
2.1 構(gòu)建Hadoop集群
2.1.1 集群簡(jiǎn)介
2.1.2 Hadoop集群部署
2.2 Hadoop集群?jiǎn)?dòng)和停止
2.2.1 Hadoop集群?jiǎn)?dòng)
2.2.2 Hadoop集群停止
2.3 HDFS的Shell命令行客戶端操作
2.4 HDFS的工作機(jī)制
2.4.1 HDFS概述
2.4.2 HDFS的重要特性
2.4.3 HDFS寫(xiě)數(shù)據(jù)流程
2.4.4 HDFS讀數(shù)據(jù)流程
2.5 NameNode和SecondaryNameNode功能剖析
2.5.1 NameNode與SecondaryNameNode解析
2.5.2 元數(shù)據(jù)的checkpoint的條件
2.5.3 fsimage與edits詳解
2.5.4 fsimage和edits文件信息查看
2.6 DataNode的工作機(jī)制及存儲(chǔ)
2.6.1 DataNode工作機(jī)制
2.6.2 數(shù)據(jù)完整性保證
2.6.3 DataNode掉線判斷時(shí)限參數(shù)
2.7 HDFS的安全模式
2.8 本章小結(jié)

第3章 Hadoop之分布式計(jì)算MapReduce
3.1 MapReduce概述
3.1.1 MapReduce介紹
3.1.2 為什么要使用MapReduce
3.2 MapReduce框架結(jié)構(gòu)及核心運(yùn)行機(jī)制
3.3 MapReduce編程規(guī)范和示例編寫(xiě)
3.3.1 編程規(guī)范
3.3.2 MapReduce編程入門之單詞計(jì)數(shù)
3.4 MapTask數(shù)量及切片機(jī)制
3.4.1 MapTask個(gè)數(shù)
3.4.2 如何控制MapTask的個(gè)數(shù)
3.4.3 Map并行度的經(jīng)驗(yàn)之談
3.5 ReduceTask并行度的決定
3.6 MapReduce中的combiner
3.7 MapReduce中的Shuffle
3.7.1 Map端
3.7.2 Reduce端
3.7.3 Shuffle小結(jié)
3.8 MapReduce與Yam
3.8.1 Yarn概述
3.8.2 Yarn的重要概念
3.9 MapReduce在Yarn上運(yùn)行流程
……

第4章 分布式協(xié)調(diào)服務(wù)Zookeeper
第5章 分布式數(shù)據(jù)庫(kù)Hbase
第6章 數(shù)據(jù)倉(cāng)庫(kù)Hive
第7章 日志采集框架Flume
第8章 分布式消息系統(tǒng)Kafka
第9章 Spark內(nèi)存計(jì)算框架
第10章 Flink實(shí)時(shí)流處理
展開(kāi)全部
暫無(wú)評(píng)論……
書(shū)友推薦
編輯推薦
返回頂部
中圖網(wǎng)
在線客服