大數(shù)據(jù)原理及實(shí)踐 版權(quán)信息
- ISBN:9787564239091
- 條形碼:9787564239091 ; 978-7-5642-3909-1
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
大數(shù)據(jù)原理及實(shí)踐 內(nèi)容簡介
近幾年來,隨著計算機(jī)和信息技術(shù)的迅猛發(fā)展和普及應(yīng)用,行業(yè)應(yīng)用系統(tǒng)的規(guī)模迅速擴(kuò)大,行業(yè)應(yīng)用所產(chǎn)生的數(shù)據(jù)呈爆炸性增長。人們把這種大規(guī)模數(shù)據(jù)稱為“海量數(shù)據(jù)”。 本書針對社會需求,為信息管理與信息系統(tǒng)專業(yè)本科生提供大數(shù)據(jù)存儲及處理方面的知識。通過系統(tǒng)的講解大規(guī)模數(shù)據(jù)的存儲及處理等基礎(chǔ)知識,使學(xué)生了解分布式數(shù)據(jù)處理系統(tǒng)的基本思想、原理及架構(gòu);通過實(shí)際案例分析及實(shí)踐,使學(xué)生掌握大數(shù)據(jù)存儲及處理的技術(shù)方法,*終使學(xué)生具備參與大規(guī)模分布式數(shù)據(jù)處理系統(tǒng)的搭建、數(shù)據(jù)分析及處理以及數(shù)據(jù)可視化等方面的能力。 本書大致目錄:**章,**章,Hadoop生態(tài)系統(tǒng)介紹;第二章,Hadoop基本原理及環(huán)境搭建;第三章,HDFS基本操作及MapReduce編程;第四章,數(shù)據(jù)倉庫HIVE的基本原理及應(yīng)用;第五章,SPARK基本原理及應(yīng)用;第六章,綜合案例。
大數(shù)據(jù)原理及實(shí)踐 目錄
第1章 Hadoop生態(tài)系統(tǒng)簡介/001
1.1 大數(shù)據(jù)發(fā)展/001
1.2 Hadoop平臺介紹/006
1.3 相關(guān)的公司/009
1.4 Hadoop生態(tài)系統(tǒng)/011
第2章 Hadoop核心組件及其基本原理/014
2.1 HDFS基本原理/014
2.2 MapReduce分布式計算框架/022
2.3 Yarn介紹/029
第3章 Hadoop環(huán)境搭建/033
3.1 Linux基礎(chǔ)/033
3.2 Linux的文件系統(tǒng)結(jié)構(gòu)/036
3.3 文件類型/038
3.4 Linux基本操作命令/039
3.5 Linux下常用的工具軟件/047
3.6 Hadoop環(huán)境搭建/051
第4章 Hive基本原理及安裝部署/063
4.1 Hive基本原理/063
4.2 Hive的數(shù)據(jù)存儲/064
4.3 Hive的安裝部署/066
第5章 Hive的基本操作/070
5.1 Hive的DDL(data define language)操作/070
5.2 Hive的DML(data managed language)操作/076
5.3 Hive shell 參數(shù)/093
第6章 Spark基礎(chǔ)知識/095
6.1 Spark原理/095
6.2 Spark架構(gòu)及生態(tài)/098
6.3 Spark運(yùn)行流程及特點(diǎn)/100
6.4 Spark運(yùn)行模式/108
第7章 Spark RDD編程/114
7.1 RDD設(shè)計與運(yùn)行原理/114
7.2 RDD基本操作/122
7.3 Spark SQL簡介/132
第8章 基于MLLIB機(jī)器學(xué)習(xí)/140
8.1 概述/140
8.2 Spark分類和預(yù)測/142
8.3 決策樹算法/145
8.4 樸素貝葉斯算法/152
8.5 回歸分析與預(yù)測技術(shù)/157
8.6 聚類分析/167
大數(shù)據(jù)原理及實(shí)踐
8.7 k-means聚類算法簡介/172
8.8 DBSCAN聚類算法簡介/179
8.9 關(guān)聯(lián)規(guī)則分析簡介/185
8.10 Apriori算法和FP Tree算法簡介/188
參考文獻(xiàn)/200
- >
煙與鏡
- >
回憶愛瑪儂
- >
推拿
- >
李白與唐代文化
- >
巴金-再思錄
- >
人文閱讀與收藏·良友文學(xué)叢書:一天的工作
- >
伯納黛特,你要去哪(2021新版)
- >
有舍有得是人生