-
>
中醫(yī)基礎(chǔ)理論
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫(yī)內(nèi)科學(xué)·全國中醫(yī)藥行業(yè)高等教育“十四五”規(guī)劃教材
-
>
中醫(yī)診斷學(xué)--新世紀第五版
-
>
中藥學(xué)·全國中醫(yī)藥行業(yè)高等教育“十四五”規(guī)劃教材
大數(shù)據(jù)分析基礎(chǔ) 版權(quán)信息
- ISBN:9787302674139
- 條形碼:9787302674139 ; 978-7-302-67413-9
- 裝幀:平裝
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
大數(shù)據(jù)分析基礎(chǔ) 本書特色
“普通高等院校網(wǎng)絡(luò)與新媒體專業(yè)系列教材”凝聚了眾多網(wǎng)絡(luò)與新媒體領(lǐng)域?qū)<覍W(xué)者的智慧與心血,注重理論與實踐相結(jié)合、教育與應(yīng)用并重、系統(tǒng)知識與課后習(xí)題相呼應(yīng),是兼具前瞻性、系統(tǒng)性、知識性和實操性的教學(xué)范本。同時,我們充分借鑒了國內(nèi)外網(wǎng)絡(luò)與新媒體專業(yè)教學(xué)實踐的先進經(jīng)驗,確保內(nèi)容的時效性。作為一套面向未來的系列教材,本系列教材不僅注重向?qū)W生傳授專業(yè)知識,更注重培養(yǎng)學(xué)生的創(chuàng)新思維和專業(yè)實踐能力。我們深切希望,通過對本系列教材的學(xué)習(xí),學(xué)生能夠深入理解網(wǎng)絡(luò)與新媒體的本質(zhì)與發(fā)展規(guī)律,熟練掌握相關(guān)技術(shù)與工具,具備扎實的專業(yè)素養(yǎng)和專業(yè)技能,在未來的媒體崗位工作中能熟練運用專業(yè)技能,提升創(chuàng)新能力,為社會做出貢獻。
大數(shù)據(jù)分析基礎(chǔ) 內(nèi)容簡介
"《大數(shù)據(jù)分析基礎(chǔ)》是傳媒專業(yè)的研究方法類課程教材,具體介紹了大數(shù)據(jù)分析的基本原理、主要方法、技術(shù)操作、研究應(yīng)用以及常見工具,系統(tǒng)講解了從數(shù)據(jù)收集到分析、挖掘的全套研究流程。本教材聚焦于傳播學(xué)科與大數(shù)據(jù)科學(xué)的交叉領(lǐng)域,旨在拓寬相關(guān)專業(yè)學(xué)生的學(xué)術(shù)視野,提供更加豐富和精確的研究工具。 本教材共分 10 章,分別介紹了在計算傳播學(xué)研究中常用的大數(shù)據(jù)方法。第 1 章主要介紹了大數(shù)據(jù)的獲取方法,第 2 章至第 10 章分別介紹了文本分析、情感分析、聚類分析、主題模型、機器學(xué)習(xí)、自動文本分析、社會網(wǎng)絡(luò)分析、語義網(wǎng)絡(luò)分析、虛擬仿真等具體的大數(shù)據(jù)分析方法。 本教材將研究方法與研究案例相結(jié)合,內(nèi)容豐富,難易適中,注重系統(tǒng)性、科學(xué)性、實用性、時代性和引導(dǎo)性,既可作為傳媒專業(yè)及交叉學(xué)科教師、研究生、本科生、大中專院校學(xué)生的教學(xué)、實踐與研究資料,又可作為傳媒從業(yè)者、市場營銷人員和社會科學(xué)研究者等讀者的參考讀物。 《大數(shù)據(jù)分析基礎(chǔ)》提供課件,請掃描封底二維碼獲取。"
大數(shù)據(jù)分析基礎(chǔ) 目錄
1.1 大數(shù)據(jù)獲取方式 001
1.1.1 網(wǎng)絡(luò)公開數(shù)據(jù)獲取 001
1.1.2 網(wǎng)絡(luò)爬蟲獲取 007
1.2 使用GooSeeker獲取網(wǎng)絡(luò)數(shù)據(jù) 015
1.2.1 GooSeeker簡介 015
1.2.2 GooSeeker的優(yōu)勢與應(yīng)用 015
1.2.3 GooSeeker的操作步驟 016
1.3 使用Python獲取網(wǎng)絡(luò)數(shù)據(jù) 018
1.3.1 Python和PyCharm介紹 019
1.3.2 Python的優(yōu)勢和適用領(lǐng)域 019
1.3.3 Python和PyCharm的下載安裝 020
1.3.4 Python和PyCharm的使用步驟 022
1.3.5 使用Python爬取網(wǎng)絡(luò)數(shù)據(jù)的步驟 025
本章小結(jié) 027
核心概念 028
思考題 028
第2章 文本分析 029
2.1 文本分析概述 029
2.1.1 文本分析的概念 029
2.1.2 文本分析的對象 030
2.1.3 文本分析的流程 031
2.1.4 文本分析的應(yīng)用 032
2.2 文本規(guī)范化 033
2.2.1 詞語切割 033
2.2.2 停用詞去除 044
2.2.3 詞干提取 046
2.2.4 詞形還原 047
2.2.5 詞性標(biāo)注 048
2.2.6 詞頻統(tǒng)計與詞云圖制作 052
2.3 文本關(guān)鍵詞提取 054
2.3.1 關(guān)鍵詞提取方法的分類 054
2.3.2 關(guān)鍵詞提取算法 055
2.4 文本向量化 058
2.4.1 離散表示 059
2.4.2 分布式表示 059
2.4.3 Word2vec實現(xiàn)文本向量化或
進行詞向量的訓(xùn)練 063
2.4.4 文本向量化的應(yīng)用 065
2.5 文本分析技術(shù)操作 065
2.5.1 詞性標(biāo)注與詞頻統(tǒng)計 065
2.5.2 關(guān)鍵詞提取與詞云圖制作 067
2.6 案例分析 068
2.6.1 文本分析在媒體報道中的應(yīng)用 068
2.6.2 文本分析在社交媒體平臺中的應(yīng)用 069
本章小結(jié) 075
核心概念 076
思考題 077
第3章 情感分析 078
3.1 情感分析概述 078
3.1.1 情感分析的概念 078
3.1.2 情感分析的分類 078
3.1.3 情感分析的研究框架 079
3.2 英文文本情感分析 080
3.2.1 情感信息抽取 080
3.2.2 情感信息分類 087
3.3 中文文本情感分析 091
3.3.1 基于詞典匹配的情感分類方法 091
3.3.2 有監(jiān)督機器學(xué)習(xí)的情感分類方法 096
3.3.3 中文文本情感分析的Python實現(xiàn)案例 098
3.4 研究案例 107
3.4.1 情感分析在風(fēng)險傳播研究中的應(yīng)用 107
3.4.2 情感分析在健康傳播研究中的應(yīng)用 108
3.4.3 情感分析在傳播學(xué)研究中的方法探索 112
本章小結(jié) 113
核心概念 113
思考題 115
第4章 聚類分析 116
4.1 聚類分析概述 117
4.1.1 認識聚類和簇 117
4.1.2 聚類分析的概念 119
4.1.3 聚類分析的分類 120
4.1.4 聚類分析的原理及基本過程 121
4.2 聚類分析方法 122
4.2.1 K-means聚類 122
4.2.2 DBSCAN 132
4.2.3 凝聚層次聚類 134
4.3 實戰(zhàn)演練 137
4.4 案例介紹 141
4.4.1 聚類分析在新聞報道研究中的運用 141
4.4.2 聚類分析在社交媒體研究中的運用 143
本章小結(jié) 146
核心概念 147
思考題 147
第5章 主題模型 148
5.1 主題模型概述 149
5.1.1 主題模型的概念 149
5.1.2 主題模型的主要內(nèi)容 150
5.1.3 主題模型涉及的數(shù)學(xué)概念 154
5.2 主要模型類型 156
5.2.1 LSA模型和pLSA模型 156
5.2.2 LDA模型 158
5.3 技術(shù)操作 160
5.3.1 系統(tǒng)配置和文本預(yù)處理 160
5.3.2 LDA模型分析 164
5.3.3 結(jié)果探討 167
5.4 案例研究 170
5.4.1 LDA模型在傳播學(xué)中的方法探索 171
5.4.2 LDA模型的傳播學(xué)分析實踐 172
5.4.3 主題模型在科學(xué)傳播研究中的應(yīng)用 174
5.4.4 主題模型在政治傳播研究中的應(yīng)用 176
5.4.5 主題模型的主要應(yīng)用方向及面臨的挑戰(zhàn) 178
本章小結(jié) 179
核心概念 179
思考題 180
第6章 機器學(xué)習(xí) 182
6.1 機器學(xué)習(xí)概述 182
6.1.1 機器學(xué)習(xí)的定義及關(guān)鍵術(shù)語 182
6.1.2 機器學(xué)習(xí)的分類及步驟 184
6.2 線性回歸算法 187
6.2.1 原理簡述及基本概念介紹 187
6.2.2 線性回歸算法的Python
實現(xiàn) 189
6.3 支持向量機 191
6.3.1 原理簡述及基本概念介紹 191
6.3.2 支持向量機的Python實現(xiàn) 193
6.4 使用WEKA進行機器學(xué)習(xí) 195
6.5 應(yīng)用機器學(xué)習(xí)發(fā)掘數(shù)據(jù)潛力 203
6.5.1 從衛(wèi)星圖像中提取社會經(jīng)濟數(shù)據(jù)并預(yù)測貧困 204
6.5.2 通過視頻觀測政治候選人的情緒表現(xiàn)如何影響選民印象 205
本章小結(jié) 207
核心概念 207
思考題 208
第7章 自動文本分析 209
7.1 自動文本分析概述 209
7.1.1 自動文本分析的發(fā)展歷程 209
7.1.2 自動文本分析的原則 210
7.1.3 自動文本分析的步驟 211
7.2 有監(jiān)督機器學(xué)習(xí) 216
7.2.1 有監(jiān)督機器學(xué)習(xí)概述 216
7.2.2 有監(jiān)督機器學(xué)習(xí)的步驟 217
7.3 有監(jiān)督機器學(xué)習(xí)下文本分類的不同算法 219
7.3.1 統(tǒng)計學(xué)習(xí)算法:樸素貝葉斯 219
7.3.2 基于實例分類:K近鄰法 223
7.3.3 基于邏輯的算法:決策樹 224
7.4 不同算法的機器學(xué)習(xí)應(yīng)用 226
7.4.1 前期操作 226
7.4.2 數(shù)據(jù)預(yù)處理 228
7.4.3 引入算法 229
7.5 案例研究 231
7.5.1 自動文本分析在政治傳播研究中的應(yīng)用 231
7.5.2 自動文本分析在文化研究中的應(yīng)用 233
7.5.3 自動文本分析在健康傳播研究中的應(yīng)用 235
本章小結(jié) 237
核心概念 237
思考題 238
第8章 社會網(wǎng)絡(luò)分析 239
8.1 社會網(wǎng)絡(luò)分析概述 239
8.1.1 社會網(wǎng)絡(luò)的概念 239
8.1.2 社會網(wǎng)絡(luò)分析基礎(chǔ)知識 240
8.1.3 社會網(wǎng)絡(luò)的形式化表達 242
8.1.4 社會網(wǎng)絡(luò)的常見分類 243
8.2 整體網(wǎng)絡(luò)測量 246
8.2.1 密度 246
8.2.2 核心邊緣結(jié)構(gòu) 248
8.3 中心性分析 249
8.3.1 點度中心性 249
8.3.2 中間(中介)中心性 253
8.3.3 接近中心性(整體中心性) 255
8.3.4 特征向量中心性 256
8.4 凝聚子群分析 257
8.5 使用UCINET進行社會網(wǎng)絡(luò)計算 257
8.5.1 UCINET的運行環(huán)境 257
8.5.2 UCINET數(shù)據(jù)導(dǎo)入導(dǎo)出與數(shù)據(jù)處理 259
8.6 網(wǎng)絡(luò)可視化分析 266
8.6.1 NetDraw 266
8.6.2 Gephi 266
8.6.3 導(dǎo)出數(shù)據(jù) 271
8.7 案例研究 271
8.7.1 社會網(wǎng)絡(luò)分析在網(wǎng)絡(luò)結(jié)構(gòu)研究中的應(yīng)用 271
8.7.2 社會網(wǎng)絡(luò)分析在社會資本研究中的應(yīng)用 273
8.7.3 社會網(wǎng)絡(luò)分析在同質(zhì)性研究中的應(yīng)用 274
本章小結(jié) 276
核心概念 276
思考題 277
第9章 語義網(wǎng)絡(luò)分析 278
9.1 語義網(wǎng)絡(luò)分析概述 278
9.1.1 語義網(wǎng)絡(luò)分析的基本概念 278
9.1.2 語義網(wǎng)絡(luò)分析的流程結(jié)構(gòu) 278
9.2 語義網(wǎng)絡(luò)分析的結(jié)構(gòu)特征 279
9.3 語義網(wǎng)絡(luò)分析的常用工具 280
9.3.1 ROST CM6 280
9.3.2 Python 282
9.3.3 結(jié)果探討 287
9.4 研究案例 288
9.4.1 語義網(wǎng)絡(luò)分析在學(xué)科發(fā)展領(lǐng)域的應(yīng)用 288
9.4.2 語義網(wǎng)絡(luò)分析在媒體報道分析層面的應(yīng)用 291
9.4.3 語義網(wǎng)絡(luò)分析在數(shù)字平臺用戶層面的應(yīng)用 294
本章小結(jié) 296
核心概念 297
思考題 297
第10章 虛擬仿真 298
10.1 虛擬仿真概述 298
10.1.1 虛擬仿真的基本概念 298
10.1.2 ABM的發(fā)展和應(yīng)用 299
10.1.3 ABM建模 300
10.1.4 ABM的核心概念 301
10.1.5 ABM方法的優(yōu)點 302
10.2 NetLogo 303
10.2.1 基本編程概念 303
10.2.2 認識NetLogo 304
10.3 實戰(zhàn)演練 310
10.3.1 模擬程序的流程 310
10.3.2 SIR模型 312
10.4 案例分析 320
10.4.1 ABM仿真模擬的兩個研究方向 320
10.4.2 ABM仿真模擬在信息傳播和社交媒體中的應(yīng)用 322
10.4.3 ABM仿真模擬在健康傳播中的應(yīng)用 324
本章小結(jié) 325
核心概念 326
思考題 326
大數(shù)據(jù)分析基礎(chǔ) 作者簡介
羅茜,蘇州大學(xué)傳媒學(xué)院副教授;研究方向為計算傳播、智能傳播、網(wǎng)絡(luò)輿論等;在SSCI、CSSCI期刊發(fā)表論文十余篇;主持國家社科基金青年項目“基于人工智能的網(wǎng)絡(luò)意識形態(tài)自動分類和人機綜合治理研究”。
- >
龍榆生:詞曲概論/大家小書
- >
名家?guī)阕x魯迅:故事新編
- >
經(jīng)典常談
- >
自卑與超越
- >
【精裝繪本】畫給孩子的中國神話
- >
上帝之肋:男人的真實旅程
- >
月亮與六便士
- >
人文閱讀與收藏·良友文學(xué)叢書:一天的工作