書馨卡幫你省薪 2024個人購書報告 2024中圖網(wǎng)年度報告
歡迎光臨中圖網(wǎng) 請 | 注冊
> >
非參數(shù)統(tǒng)計——基于Python(基于Python的數(shù)據(jù)分析叢書)

非參數(shù)統(tǒng)計——基于Python(基于Python的數(shù)據(jù)分析叢書)

作者:王星
出版社:中國人民大學(xué)出版社出版時間:2022-06-01
開本: 其他 頁數(shù): 312
中 圖 價:¥29.4(6.0折) 定價  ¥49.0 登錄后可看到會員價
加入購物車 收藏
運費6元,滿39元免運費
?新疆、西藏除外
本類五星書更多>

非參數(shù)統(tǒng)計——基于Python(基于Python的數(shù)據(jù)分析叢書) 版權(quán)信息

非參數(shù)統(tǒng)計——基于Python(基于Python的數(shù)據(jù)分析叢書) 內(nèi)容簡介

非參數(shù)統(tǒng)計是統(tǒng)計學(xué)和數(shù)據(jù)科學(xué)的重要分支領(lǐng)域。本書作為該領(lǐng)域的基礎(chǔ)教材,其特點體現(xiàn)在以下幾方面:
1.針對性強(qiáng)。本書針對數(shù)據(jù)分析專業(yè)的特點和需要,闡述非參數(shù)統(tǒng)計的基本概念、理論、方法和編程,重點從非受控觀察數(shù)據(jù)對參數(shù)推斷知識的需要角度出發(fā),將統(tǒng)計推斷知識、理論和方法與反事實復(fù)雜場景因果關(guān)系的解讀與判斷問題相結(jié)合,應(yīng)用于穩(wěn)健估計、局部模式、嚴(yán)格證據(jù)的信息提取任務(wù)中。
2.通用性強(qiáng)。適用于Python技術(shù)數(shù)據(jù)管理人才培養(yǎng)。增加Python技術(shù)的應(yīng)用內(nèi)容,編寫了Python綜合程序,降低了統(tǒng)計理論學(xué)習(xí)難度,增強(qiáng)了技術(shù)的可嵌入性;自主研發(fā)的準(zhǔn)確分析求解程序,大大補(bǔ)充了Python中小數(shù)據(jù)推斷程序的不足,計算的便利性大幅提升,適用于Python自動化測試、運維、數(shù)據(jù)分析等多種高端數(shù)據(jù)管理崗位的嵌入式學(xué)習(xí)需求。
3.內(nèi)容新穎。順應(yīng)人工智能時代發(fā)展和數(shù)據(jù)分析大環(huán)境的變化,對特征工程有效降噪及控制錯誤發(fā)現(xiàn)率等方面的內(nèi)容作了闡述與分析,針對深度學(xué)習(xí)對圖像應(yīng)用的需求增加,增加了深度學(xué)習(xí)的內(nèi)容。

非參數(shù)統(tǒng)計——基于Python(基于Python的數(shù)據(jù)分析叢書) 目錄

第 1章 基本概念 1.1非參數(shù)統(tǒng)計的概念與產(chǎn)生 1.1.1 非參數(shù)統(tǒng)計的研究對象 1.1.2 非參數(shù)統(tǒng)計簡史 1.2假設(shè)檢驗回顧 1.3經(jīng)驗分布和分布探索 1.3.1 經(jīng)驗分布 1.3.2 生存函數(shù) 1.4檢驗的相對效率 1.5分位數(shù)和非參數(shù)估計 1.5.1 順序統(tǒng)計量 1.5.2 分位數(shù)的定義 1.5.3 分位數(shù)的估計 1.5.4 分位數(shù)的圖形表示 1.6秩檢驗統(tǒng)計量 1.6.1 無重復(fù)數(shù)據(jù)的秩及性質(zhì) 1.6.2 帶結(jié)數(shù)據(jù)的秩及性質(zhì) 1.7 U統(tǒng)計量 1.7.1 單一樣本的U統(tǒng)計量和主要特征 1.7.2 兩樣本 U檢驗統(tǒng)計量和分布 習(xí)題 第 2章單變量位置推斷問題 2.1符號檢驗和分位數(shù)推斷2.1.1基本概念 2.1.2大樣本的檢驗方法 2.1.3符號檢驗在配對樣本比較中的應(yīng)用 2.1.4分位數(shù)檢驗――符號檢驗的推廣 2.2 Cox-Stuart趨勢存在性檢驗 2.2.1*優(yōu)權(quán)重Cox-Stuart統(tǒng)計量基本原理 2.2.2無權(quán)重Cox-Stuart統(tǒng)計量 2.3隨機(jī)游程檢驗 2.3.1兩類隨機(jī)游程檢驗 2.3.2三類及多類游程檢驗 2.4 Wilcoxon符號秩檢驗 2.4.1基本概念 2.4.2 Wilcoxon符號秩檢驗和抽樣分布 2.5估計量的穩(wěn)健性評價 2.5.1敏感曲線 2.5.2影響函數(shù) 2.5.3失效點 2.6單組數(shù)據(jù)的位置參數(shù)置信區(qū)間估計2.6.1順序統(tǒng)計量位置參數(shù)置信區(qū)間估計 2.6.2基于方差估計法的位置參數(shù)置信區(qū)間估計 2.7正態(tài)記分檢驗 2.8分布的一致性檢驗 2.8.1 χ2擬合優(yōu)度檢驗 2.8.2 Kolmogorov-Smirnov正態(tài)性檢驗 2.8.3 Liliefor正態(tài)分布檢驗 2.9單一總體漸近相對效率比較 習(xí)題 第3章 兩獨立樣本數(shù)據(jù)的位置和尺度推斷 · 3.1 Brown-Mood中位數(shù)檢驗 3.1.1假設(shè)檢驗問題 3.1.2大樣本檢驗 3.2 Wilcoxon-Mann-Whitney秩和檢驗 3.2.1無結(jié)點Wilcoxon-Mann-Whitney秩和檢驗 · 3.2.2帶結(jié)點時的計算公式 3.2.3 MX . MY的點估計和區(qū)間估計 3.3 Mann-Whitney U統(tǒng)計量與ROC曲線 3.4置換檢驗3.5 Mood方差檢驗3.6 Moses方差檢驗 習(xí)題 第4章 多組數(shù)據(jù)位置推斷 4.1試驗設(shè)計和方差分析的基本概念回顧 4.2多重檢驗問題 4.2.1 FDR控制基本原理 4.2.2 FDR的相關(guān)討論 4.3高階鑒定法(HC) 4.4 Kruskal-Wallis單因素方差分析 4.4.1 Kruskal-Wallis檢驗的基本原理 4.4.2有結(jié)點的檢驗 4.5 Jonckheere-Terpstra檢驗 4.5.1無結(jié)點Jonckheere-Terpstra檢驗 4.5.2帶結(jié)點的Jonkheere-Terpstra檢驗 4.6 Friedman秩方差分析法 4.6.1 Friedman檢驗的基本原理 4.6.2 Hollander-Wolfe兩處理間比較 4.7隨機(jī)區(qū)組數(shù)據(jù)的調(diào)整秩和檢驗 4.8 Cochran檢驗4.9 Durbin不完全區(qū)組分析法習(xí)題 第5章 分類數(shù)據(jù)的關(guān)聯(lián)分析 5.1 r×s列聯(lián)表和χ2獨立性檢驗 5.2 χ2齊性檢驗 5.3 Fisher精確性檢驗 5.4 McNemar檢驗 5.5 Mantel-Haenszel檢驗 5.6關(guān)聯(lián)規(guī)則5.6.1關(guān)聯(lián)規(guī)則基本概念 5.6.2 Apriori算法 5.7 Ridit檢驗法 5.7.1 Ridit得分的計算和假設(shè)檢驗 5.7.2 根據(jù)置信區(qū)間分組 5.8對數(shù)線性模型 5.8.1泊松回歸 5.8.2對數(shù)線性模型的基本概念 5.8.3模型的設(shè)計矩陣 5.8.4模型的估計和檢驗 5.8.5高維對數(shù)線性模型和獨立性習(xí)題 第 6章 秩相關(guān)和穩(wěn)健回歸 · 6.1 Spearman秩相關(guān)檢驗6.2 Kendallτ相關(guān)檢驗 6.3多變量Kendall協(xié)和系數(shù)檢驗 6.4 Kappa一致性檢驗 6.5 HBR基于秩的穩(wěn)健回歸 6.5.1基于秩的R估計 6.5.2假設(shè)檢驗 6.5.3多重決定系數(shù) CMD 6.5.4回歸診斷 6.6中位數(shù)回歸系數(shù)估計法 6.6.1 Brown-Mood方法 6.6.2 Theil方法 6.6.3關(guān)于α和 β的檢驗 6.7線性分位回歸模型習(xí)題第7章 非參數(shù)密度估計 7.1直方圖密度估計 7.1.1基本概念 7.1.2理論性質(zhì)和*優(yōu)帶寬 7.1.3多維直方圖 · 7.2核密度估計7.2.1核函數(shù)的基本概念 7.2.2理論性質(zhì)和帶寬 7.2.3置信帶和中心極限定理 7.2.4多維核密度估計 7.2.5貝葉斯決策和非參數(shù)密度估計 7.3 k近鄰估計 習(xí)題 第8章 非參數(shù)回歸 8.1核回歸光滑模型 8.2局部多項式回歸 8.2.1局部線性回歸 8.2.2局部多項式回歸的基本原理 8.3 LOWESS穩(wěn)健回歸 8.4 k近鄰回歸 8.4.1 k近鄰估計 8.4.2 k近鄰核估計 8.5正交序列回歸 8.6罰*小二乘法 8.7樣條回歸8.7.1模型 8.7.2 樣條回歸模型的節(jié)點 8.7.3 常用的樣條基函數(shù) 8.7.4 樣條模型自由度 習(xí)題 第9章 數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí) 9.1分類一般問題 9.2線性判別IR-LDA基本原理 9.3 Logistic回歸 9.3.1 Logistic回歸模型 9.3.2 Logistic回歸模型的極大似然估計 9.3.3 Logistic回歸和線性判別函數(shù)LDA的比較 9.4 k近鄰 9.4.1 參數(shù)選擇與維數(shù)災(zāi)難9.4.2 k近鄰與線性模型之間的比較 9.5決策樹9.5.1決策樹的基本概念 9.5.2 CART 9.5.3決策樹的剪枝 9.5.4回歸樹 9.5.5決策樹的特點 9.6 Boosting 9.6.1 Boosting提升方法 9.6.2 AdaBoost.M1算法 9.7支持向量機(jī)9.7.1*大分類間隔 9.7.2支持向量機(jī)問題的求解 9.7.3支持向量機(jī)的核方法 9.8隨機(jī)森林9.8.1隨機(jī)森林算法的定義 · 9.8.2隨機(jī)森林算法的性質(zhì) 9.8.3如何確定隨機(jī)森林算法中樹的節(jié)點分裂變量 9.8.4隨機(jī)森林的回歸算法 9.8.5有關(guān)隨機(jī)森林算法的一些評價9.9 MARS 9.9.1 MARS與 CART的聯(lián)系 9.9.2 MARS的一些性質(zhì) 9.10深度學(xué)習(xí) 9.10.1神經(jīng)網(wǎng)絡(luò) 9.10.2卷積神經(jīng)網(wǎng)絡(luò) 習(xí)題附錄 Python基礎(chǔ)參考文獻(xiàn)
展開全部

非參數(shù)統(tǒng)計——基于Python(基于Python的數(shù)據(jù)分析叢書) 節(jié)選

如果讀者僅僅將非參數(shù)統(tǒng)計看成是關(guān)于數(shù)據(jù)分析的 ,那就錯了 ,非參數(shù)統(tǒng)計更多的是展開對數(shù)據(jù)更深層的分析 ,這就需要在由精致的計算和細(xì)致的操作所構(gòu)成的更大的數(shù)據(jù)科學(xué)社群平臺上,增強(qiáng)統(tǒng)計思維和分析認(rèn)知的基本功。在數(shù)據(jù)分析實踐中 ,如果將模型根據(jù)研發(fā)的成熟度分為起步期、發(fā)展期和成熟期三個階段,我們可以將模型里的信息分為參數(shù)信息和非參數(shù)信息。處在起步期的模型里參數(shù)信息的成分比較多 ,一般包括由樣本所估計出的位置參數(shù) (如均值 )、波動性參數(shù) (如方差和相關(guān)度 )等信息 ,較為成熟的模型和算力中 ,非參數(shù)信息則更多一些 ,發(fā)展期的模型是由參數(shù)信息不斷向非參數(shù)信息過度的過程。非參數(shù)信息能體現(xiàn)模型設(shè)計的功底 ,包含相容性、秩序、分位數(shù)、信噪比、對稱性、穩(wěn)健性、失效性、是否一致性等豐富的分析維度。如果想通過手中的數(shù)據(jù)對模型進(jìn)行 “二度創(chuàng)作 ”使其成為獨樹一幟的信息提取模式 ,需要培養(yǎng)對數(shù)據(jù)的敏銳性、數(shù)據(jù)收集的知識、數(shù)據(jù)的分析與處理技能、利用數(shù)據(jù)進(jìn)行決策、對數(shù)據(jù)的批判性思維和數(shù)據(jù)倫理等專業(yè)分析能力 ,參數(shù)統(tǒng)計和非參數(shù)統(tǒng)計的共同作用尤為重要 ,缺一不可。 Python語言在高并發(fā)場景中的運用能力、簡潔可解釋性的語言特點、豐富且快速生長的跨平臺標(biāo)準(zhǔn)庫和第三方庫 ,都更有利于傳遞關(guān)于科學(xué)的認(rèn)知與思考 ,加速與計算機(jī)進(jìn)行關(guān)于人類創(chuàng)造和累積的文化精神財富的對話與交流。這就是我在本書中選擇 Python的基本理由。在 Python里踐行,以 Python取效。全書內(nèi)容分為兩個部分 :非參數(shù)統(tǒng)計推斷和非參數(shù)統(tǒng)計模型。非參數(shù)統(tǒng)計推斷的內(nèi)容由單一變量、兩變量及多組數(shù)據(jù)非參數(shù)統(tǒng)計估計、多重檢驗、分類數(shù)據(jù)的關(guān)聯(lián)分析方法、定量數(shù)據(jù)的相關(guān)和穩(wěn)健回歸等分析方法構(gòu)成 ;非參數(shù)統(tǒng)計模型部分包括非參數(shù)密度估計、穩(wěn)健回歸和非參數(shù)回歸等內(nèi)容。本書具有如下特點: (1)全面對接Python語言編程 ,習(xí)題和思考題中增加了具有復(fù)雜樣態(tài)的一手?jǐn)?shù)據(jù)和分析習(xí)題,用于提高學(xué)生對統(tǒng)計建模的分析能力,增強(qiáng)學(xué)生對復(fù)雜數(shù)據(jù)的辨析能力。 (2)有教學(xué)資源和官方網(wǎng)站支持。教學(xué)資源中有參考課件、程序代碼、參考習(xí)題、擴(kuò)展閱讀、中國大學(xué) MOOC (慕課 )國家精品課程在線學(xué)習(xí)平臺等 ,教材的每一章還陪有微課精品短視頻 ,點擊二維碼可以獲取下載使用這些資源。該教材曾獲得過中國人民大學(xué)**批探究性教學(xué)課程立項支持 ,受 2018, 2019年度中央高校建設(shè)世界一流大學(xué) (學(xué)科 )和特色發(fā)展引導(dǎo)專項資金 (教材類 )和中國人民大學(xué) “十三五 ”規(guī)劃教材支持。教師在教學(xué)過程中可圍繞相關(guān)知識從網(wǎng)站上獲取延展性學(xué)習(xí)材料 ,比如知識點中的歷史人物、重要事件理論的推證過程、相關(guān)文獻(xiàn)、應(yīng)用技術(shù)等。這些輔助學(xué)習(xí)資源也會不斷更新 ,以適用于研討型和協(xié)作型學(xué)習(xí)和教學(xué)。本書可作為高等院校統(tǒng)計學(xué)、經(jīng)濟(jì)學(xué)、管理學(xué)、生物學(xué)、信息科學(xué)、大數(shù)據(jù)分析等專業(yè)領(lǐng)域本科三、四年級以上學(xué)生以及相關(guān)研究人員學(xué)習(xí)非參數(shù)統(tǒng)計方法的教材 ,也可作為從事統(tǒng)計研究或數(shù)據(jù)分析工作人員的案頭參考書 .本書的讀者需具備初等統(tǒng)計學(xué)基礎(chǔ)、概率論和數(shù)理統(tǒng)計的相關(guān)知識。本書的內(nèi)容建議安排在一學(xué)期 54課時內(nèi)完成 ,且安排 1/3左右課時用于學(xué)生上機(jī)實驗。有條件的教師可以選擇教材部分案例組織案例教學(xué)和課堂討論。 2017年和 2018年連續(xù)兩年 ,我們在中國人民大學(xué)統(tǒng)計學(xué)專業(yè)大三課堂上嘗試了案例教學(xué) ,獲得了學(xué)生們的高度認(rèn)可。事實證明 ,通過案例探究和團(tuán)組討論 ,學(xué)生們會形成一股深入研究、嚴(yán)謹(jǐn)辨析、開拓創(chuàng)新的統(tǒng)計學(xué)課堂新風(fēng)。本書備有豐富的習(xí)題 ,理論推導(dǎo)、方法應(yīng)用和上機(jī)實驗題目 ,可靈活支持各種教學(xué)需要。

非參數(shù)統(tǒng)計——基于Python(基于Python的數(shù)據(jù)分析叢書) 作者簡介

王星 中國人民大學(xué)統(tǒng)計學(xué)院教授,北京師范大學(xué)數(shù)學(xué)本科與碩士,中國人民大學(xué)統(tǒng)計學(xué)博士。國家社科基金重點項目負(fù)責(zé)人,《中國大百科全書》第三版統(tǒng)計學(xué)卷編委。在《統(tǒng)計研究》《中國人民大學(xué)學(xué)報》《數(shù)理統(tǒng)計與管理》和JAMA等刊物發(fā)表多篇論文。主要研究方向包括稀疏網(wǎng)絡(luò)挖掘模型、高維復(fù)雜數(shù)據(jù)統(tǒng)計學(xué)習(xí)、深度學(xué)習(xí)等。主要著作和譯作包括《非參數(shù)統(tǒng)計》《大數(shù)據(jù)分析:方法與應(yīng)用》《人文社會科學(xué)文獻(xiàn)網(wǎng)絡(luò)知識模型與應(yīng)用》《統(tǒng)計學(xué)習(xí)導(dǎo)論一基于R應(yīng)用》等。講授課程包括非參數(shù)統(tǒng)計、大數(shù)據(jù)分析、機(jī)器學(xué)習(xí)方法等。曾獲北京市高等教育教學(xué)成果獎二等獎、第十屆全國統(tǒng)計科學(xué)研究優(yōu)秀成果獎二等獎、全國應(yīng)用統(tǒng)計案例大賽一等獎指導(dǎo)教師等學(xué)術(shù)獎勵;開設(shè)非參數(shù)統(tǒng)計MOOC課程。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服