實(shí)用推薦系統(tǒng)
-
>
決戰(zhàn)行測5000題(言語理解與表達(dá))
-
>
軟件性能測試.分析與調(diào)優(yōu)實(shí)踐之路
-
>
第一行代碼Android
-
>
深度學(xué)習(xí)
-
>
Unreal Engine 4藍(lán)圖完全學(xué)習(xí)教程
-
>
深入理解計(jì)算機(jī)系統(tǒng)-原書第3版
-
>
Word/Excel PPT 2013辦公應(yīng)用從入門到精通-(附贈(zèng)1DVD.含語音視頻教學(xué)+辦公模板+PDF電子書)
實(shí)用推薦系統(tǒng) 版權(quán)信息
- ISBN:9787121420788
- 條形碼:9787121420788 ; 978-7-121-42078-8
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>>
實(shí)用推薦系統(tǒng) 本書特色
介紹推薦系統(tǒng)原理和關(guān)鍵算法,配備大量代碼,適合入門 對于書中所涉及的數(shù)學(xué)和統(tǒng)計(jì)學(xué)知識,均提供示例圖和代碼,直觀易懂 涵蓋從數(shù)據(jù)收集到生成推薦的全過程,提供詳細(xì)的Python代碼及注釋,代碼可在GitHub上下載 剖析流行的算法在Amazon和Netflix上的應(yīng)用" "“這本書涵蓋了技術(shù)背景知識,并以清晰簡短的Python代碼演示了實(shí)現(xiàn)! ——Andrew Collier,Exegetic公司 “你有沒有想過Amazon和Netflix是如何了解你對產(chǎn)品和電影的喜好,并提供相關(guān)推薦的?這本書會(huì)告訴你它們是如何做到的!” ——Amit Lamba, Tech Overture公司 “這本書講了關(guān)于推薦系統(tǒng)的一切,從入門到不錯(cuò)概念。” ——Jaromir D.B. Nemec,DBN公司 “這是一本實(shí)用的深入了解推薦系統(tǒng)的圖書!” ——Peter Hampton,阿爾斯特大學(xué)
實(shí)用推薦系統(tǒng) 內(nèi)容簡介
要構(gòu)建一個(gè)實(shí)用的“智能”推薦系統(tǒng),不僅需要有好的算法,還需要了解接收推薦的用戶。本書分為兩部分,部分側(cè)重于基礎(chǔ)架構(gòu),主要介紹推薦系統(tǒng)的工作原理,展示如何創(chuàng)建推薦系統(tǒng),以及給應(yīng)用程序增加推薦系統(tǒng)時(shí),應(yīng)該如何收集和應(yīng)用數(shù)據(jù) ;第二部分側(cè)重于算法,介紹推薦系統(tǒng)算法,以及如何使用系統(tǒng)收集的數(shù)據(jù)來計(jì)算向用戶推薦什么內(nèi)容。作者還教授了如何使用很流行的推薦算法,并剖析它們在 Amazon 和 Netflix 等網(wǎng)站上的實(shí)際應(yīng)用。
實(shí)用推薦系統(tǒng) 目錄
第1部分 推薦系統(tǒng)的準(zhǔn)備工作
第1章 什么是推薦
1.1 現(xiàn)實(shí)生活中的推薦
1.1.1 推薦系統(tǒng)在互聯(lián)網(wǎng)上大顯身手
1.1.2 長尾
1.1.4 推薦系統(tǒng)的定義
1.2 推薦系統(tǒng)的分類
1.2.1 域
1.2.2 目的
1.2.3 上下文
1.2.4 個(gè)性化級別
1.2.5 專家意見
1.2.6 隱私與可信度
1.2.7 接口
1.2.8 算法
1.3 機(jī)器學(xué)習(xí)與Netflix Prize
1.4 MovieGEEKs網(wǎng)站
1.4.1 設(shè)計(jì)與規(guī)范
1.4.2 架構(gòu)
1.5 構(gòu)建一個(gè)推薦系統(tǒng)
小結(jié)
第2章 用戶行為以及如何收集用戶行為數(shù)據(jù)
2.1 在瀏覽網(wǎng)站時(shí)Netflix如何收集證據(jù)
2.1.1 Netflix 收集的證據(jù)
2.2 尋找有用的用戶行為
2.2.1 捕獲訪客印象
2.2.2 可以從瀏覽者身上學(xué)到什么
2.2.3 購買行為
2.2.4 消費(fèi)商品
2.2.5 訪客評分
2.2.6 以(舊的)Netflix 方式了解你的用戶
2.3 識別用戶
2.4 從其他途徑獲取訪客數(shù)據(jù)
2.5 收集器
2.5.1 構(gòu)建項(xiàng)目文件
2.5.2 數(shù)據(jù)模型
2.5.3 告密者(snitch):客戶端證據(jù)收集器
2.5.4 將收集器集成到 MovieGEEKs 中
2.6 系統(tǒng)中的用戶是誰以及如何對其進(jìn)行建模
小結(jié)
第3章 監(jiān)控系統(tǒng)
3.1 為什么添加儀表盤是個(gè)好主意
3.1.1 回答“我們做得怎么樣?”
3.2 執(zhí)行分析
3.2.1 網(wǎng)站分析
3.2.2 基本統(tǒng)計(jì)數(shù)據(jù)
3.2.3 轉(zhuǎn)化
3.2.4 分析轉(zhuǎn)化路徑
3.2.5 轉(zhuǎn)化路徑
3.3 角色
3.4 MovieGEEKs儀表盤
3.4.1 自動(dòng)生成日志數(shù)據(jù)
3.4.2 分析儀表盤的規(guī)范和設(shè)計(jì)
3.4.3 分析儀表盤示意圖
3.4.4 架構(gòu)
小結(jié)
第4章 評分及其計(jì)算方法
4.1 用戶-商品喜好
4.1.1 什么是評分
4.1.2 用戶 - 商品矩陣
4.2 顯式評分和隱式評分
4.2.1 如何選擇可靠的推薦來源
4.3 重溫顯式評分
4.4 什么是隱式評分
4.4.1 與人相關(guān)的推薦
4.4.2 關(guān)于計(jì)算評分的思考
4.5 計(jì)算隱式評分
4.5.1 看看行為數(shù)據(jù)
4.5.2 一個(gè)有關(guān)機(jī)器學(xué)習(xí)的問題
4.6 如何計(jì)算隱式評分
4.6.1 添加時(shí)間因素
4.7 低頻商品更有價(jià)值
小結(jié)
第5章 非個(gè)性化推薦
5.1 什么是非個(gè)性化推薦
5.1.1 什么是廣告
5.1.2 推薦有什么作用
5.2 當(dāng)沒有數(shù)據(jù)的時(shí)候如何做推薦
5.2.1 商品的十大排行榜
5.3 榜單的實(shí)現(xiàn)以及推薦系統(tǒng)組件的準(zhǔn)備工作
5.3.1 推薦系統(tǒng)組件
5.3.2 GitHub 上的 MovieGEEKs 網(wǎng)站代碼
5.3.3 推薦系統(tǒng)
5.3.4 為 MovieGEEKs 網(wǎng)站添加一個(gè)榜單
5.3.5 使內(nèi)容看起來更具吸引力
5.4 種子推薦
5.4.1 頻繁購買的商品與你正在查看的商品很相似
5.4.2 關(guān)聯(lián)規(guī)則
5.4.3 實(shí)現(xiàn)關(guān)聯(lián)規(guī)則
5.4.4 在數(shù)據(jù)庫中存儲(chǔ)關(guān)聯(lián)規(guī)則
5.4.5 計(jì)算關(guān)聯(lián)規(guī)則
5.4.6 運(yùn)用不同的事件來創(chuàng)建關(guān)聯(lián)規(guī)則
小結(jié)
第6章 冷用戶(冷商品)
6.1 什么是冷啟動(dòng)
6.1.1 冷商品
6.1.2 冷用戶
6.1.3 灰羊
6.1.4 現(xiàn)實(shí)生活中的例子
6.1.5 面對冷啟動(dòng)你能做什么
6.2 追蹤訪客
6.2.1 執(zhí)著于匿名用戶
6.3 用算法來解決冷啟動(dòng)問題
6.3.1 使用關(guān)聯(lián)規(guī)則為冷用戶創(chuàng)建推薦信息
6.3.2 使用領(lǐng)域知識和業(yè)務(wù)規(guī)則
6.3.3 使用分組
6.3.4 使用類別來避免灰羊問題以及如何介紹冷商品
6.4 那些不詢問就很難被發(fā)現(xiàn)的人
6.4.1 當(dāng)訪客數(shù)據(jù)不夠新時(shí)
6.5 使用關(guān)聯(lián)規(guī)則快速進(jìn)行推薦
6.5.1 收集數(shù)據(jù)項(xiàng)
6.5.2 檢索關(guān)聯(lián)規(guī)則并根據(jù)置信度對其排序
6.5.3 顯示推薦內(nèi)容
6.5.4 評估
小結(jié)
第2部分 推薦算法
第7章 找出用戶之間和商品之間的相似之處
7.1 什么是相似度
7.1.1 什么是相似度函數(shù)
7.2 基本的相似度函數(shù)
7.2.1 Jaccard 距離
7.2.2 使用 Lp-norm 測量距離
7.2.3 Cosine 相似度
7.2.4 通過 Pearson 相關(guān)系數(shù)查找相似度
7.2.5 運(yùn)行 Pearson 相似度
7.2.6 Pearson 相關(guān)性系數(shù)與 Cosine 相似度類似
7.3 k-means聚類
7.3.1 k-means 聚類算法
7.3.2 使用 Python 實(shí)現(xiàn) k-means 聚類算法
7.4 實(shí)現(xiàn)相似度
7.4.1 在 MovieGEEKs 網(wǎng)站上實(shí)現(xiàn)相似度
7.4.2 在 MovieGEEKs 網(wǎng)站上實(shí)現(xiàn)聚類
小結(jié)
第8章 鄰域協(xié)同過濾
8.1 協(xié)同過濾:一節(jié)歷史課
8.1.1 當(dāng)信息被協(xié)同過濾時(shí)
8.1.2 互幫互助
8.1.3 評分矩陣
8.1.4 協(xié)同過濾管道
8.1.5 應(yīng)該使用用戶 - 用戶還是物品 - 物品的協(xié)同過濾
8.1.6 數(shù)據(jù)要求
8.2 推薦的計(jì)算
8.3 相似度的計(jì)算
8.4 Amazon預(yù)測物品相似度的算法
8.5 選擇鄰域的方法
8.6 找到正確的鄰域
8.7 計(jì)算預(yù)測評分的方法
8.8 使用基于物品的過濾進(jìn)行預(yù)測
8.8.1 計(jì)算物品的預(yù)測評分
8.9 冷啟動(dòng)問題
8.10 機(jī)器學(xué)習(xí)術(shù)語簡介
8.11 MovieGeeks網(wǎng)站上的協(xié)同過濾
8.11.1 基于物品的過濾
8.12 關(guān)聯(lián)規(guī)則推薦和協(xié)同推薦之間有什么區(qū)別
8.13 用于協(xié)同過濾的工具
8.14 協(xié)同過濾的優(yōu)缺點(diǎn)
小結(jié)
第9章 評估推薦系統(tǒng)
9.1 推薦系統(tǒng)的評估周期
9.2 為什么評估很重要
9.3 如何解釋用戶行為
9.4 測量什么
9.4.1 了解我的喜好,盡量減少預(yù)測錯(cuò)誤
9.4.2 多樣性
9.4.3 覆蓋率
9.4.4 驚喜度
9.5 在實(shí)現(xiàn)推薦之前
9.5.1 驗(yàn)證算法
9.5.2 回歸測試
9.6 評估的類型
9.7 離線評估
9.7.1 當(dāng)算法不產(chǎn)生任何推薦時(shí)該怎么辦
9.8 離線實(shí)驗(yàn)
9.8.1 準(zhǔn)備實(shí)驗(yàn)數(shù)據(jù)
9.9 在MovieGEEKs中實(shí)現(xiàn)這個(gè)實(shí)驗(yàn)
9.9.1 待辦任務(wù)清單
9.10 評估測試集
9.10.1 從基線預(yù)測器開始
9.10.2 找到正確的參數(shù)
9.11 在線評估
9.11.1 對照實(shí)驗(yàn)
9.11.2 A/B 測試
9.12 利用exploit/explore持續(xù)測試
9.12.1 反饋循環(huán)
小結(jié)
第10章 基于內(nèi)容的過濾
10.1 舉例說明
10.2 什么是基于內(nèi)容的過濾
10.3 內(nèi)容分析器
10.3.1 從物品配置文件提取特征
10.3.2 數(shù)量較少的分類數(shù)據(jù)
10.3.3 將年份轉(zhuǎn)換為可比較的特征
10.4 從描述中提取元數(shù)據(jù)
10.4.1 準(zhǔn)備描述
10.5 使用TF-IDF查找重要單詞
10.6 使用LDA進(jìn)行主題建模
10.6.1 有什么方法可以調(diào)整 LDA
10.7 查找相似內(nèi)容
10.8 如何創(chuàng)建用戶配置文件
10.8.1 使用 LDA 創(chuàng)建用戶配置文件
10.8.2 使用 TF-IDF 創(chuàng)建用戶配置文件
10.9 MovieGEEKs中基于內(nèi)容的推薦
10.9.1 加載數(shù)據(jù)
10.9.2 訓(xùn)練模型
10.9.3 創(chuàng)建物品配置文件
10.9.4 創(chuàng)建用戶配置文件
10.9.5 展示推薦
10.10 評估基于內(nèi)容的推薦系統(tǒng)
10.11 基于內(nèi)容過濾的優(yōu)缺點(diǎn)
小結(jié)
第11章 用矩陣分解法尋找隱藏特征
11.1 有時(shí)減少數(shù)據(jù)量是好事
11.2 你想要解決的問題的例子
11.3 談一點(diǎn)線性代數(shù)
11.3.1 矩陣
11.3.2 什么是因子分解
11.4 使用SVD構(gòu)造因子分解
11.4.1 通過分組加入添加新用戶
11.4.2 如何使用 SVD 進(jìn)行推薦
11.4.3 基線預(yù)測
11.4.4 時(shí)間動(dòng)態(tài)
11.5 使用Funk SVD構(gòu)造因子分解
11.5.1 均方根誤差
11.5.2 梯度下降
11.5.3 隨機(jī)梯度下降
11.5.4 *后是因子分解
11.5.5 增加偏差
11.5.6 如何開始,何時(shí)結(jié)束
11.6 用Funk SVD進(jìn)行推薦
11.7 MovieGEEKs中的Funk SVD實(shí)現(xiàn)
11.7.1 如何處理異常值
11.7.2 保持模型的更新
11.7.3 更快的實(shí)施方法
11.8 顯式數(shù)據(jù)與隱式數(shù)據(jù)
11.9 評估
11.10 用于Funk SVD的參數(shù)
小結(jié)
第12章 運(yùn)用*佳算法來實(shí)現(xiàn)混合推薦
12.1 混合推薦系統(tǒng)的困惑世界
12.2 單體
12.2.1 將基于內(nèi)容的特征與行為數(shù)據(jù)混合,以改進(jìn)協(xié)同過濾
推薦系統(tǒng)
12.3 摻雜式混合推薦
12.4 集成推薦
12.4.1 可切換的集成推薦
12.4.2 加權(quán)式集成推薦
12.4.3 線性回歸
12.5 特征加權(quán)線性疊加(FWLS)
12.5.1 元特征 :權(quán)重作為函數(shù)
12.5.2 算法
12.6 實(shí)現(xiàn)
小結(jié)
第13章 排序和排序?qū)W習(xí)
13.1 Foursquare的排序?qū)W習(xí)例子
13.2 重新排序
13.3 什么是排序?qū)W習(xí)
13.3.1 三種類型的 LTR 算法
13.4 貝葉斯個(gè)性化排序
13.4.1 BPR 排序
13.4.2 數(shù)學(xué)魔術(shù)(高級巫術(shù))
13.4.3 BPR 算法
13.4.4 具有矩陣分解的 BPR
13.5 BPR的實(shí)現(xiàn)
13.5.1 執(zhí)行推薦
13.6 評估
13.7 用于BPR的參數(shù)
小結(jié)
第14章 推薦系統(tǒng)的未來
14.1 本書內(nèi)容總結(jié)
14.2 接下來要學(xué)習(xí)的主題
14.2.1 延伸閱讀
14.2.2 算法
14.2.3 所處環(huán)境
14.2.4 人機(jī)交互
14.2.5 選擇一個(gè)好的架構(gòu)
14.3 推薦系統(tǒng)的未來是什么
14.4 *后的想法
14.4 *后的想法
實(shí)用推薦系統(tǒng) 作者簡介
Kim Falk 是一位數(shù)據(jù)科學(xué)家,他在構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的應(yīng)用程序方面有著豐富的經(jīng)驗(yàn)。他對推薦系統(tǒng)和機(jī)器學(xué)習(xí)很感興趣。他所訓(xùn)練的推薦系統(tǒng),為用戶推薦合適的電影,為人們推送廣告,甚至幫助律師找到判例法的內(nèi)容。自 2010 年以來,他一直從事大數(shù)據(jù)解決方案和機(jī)器學(xué)習(xí)方面的工作。Kim 經(jīng)常參與有關(guān)推薦系統(tǒng)的演講和寫作。當(dāng) Kim 不工作的時(shí)候,他就是一個(gè)居家男人,一位父親,會(huì)帶著他的德國短毛指示犬越野跑。 李源,曾在華為技術(shù)有限公司從事開發(fā)、系統(tǒng)架構(gòu)、項(xiàng)目管理等多個(gè)崗位的工作,后在途牛旅游網(wǎng)擔(dān)任研發(fā)中心總經(jīng)理一職,目前在中國旅游集團(tuán)旅行服務(wù)事業(yè)群擔(dān)任研發(fā)總經(jīng)理,有豐富的研發(fā)、架構(gòu)設(shè)計(jì)及管理經(jīng)驗(yàn),負(fù)責(zé)過多個(gè)大型項(xiàng)目的規(guī)劃和落地,曾翻譯《Java性能調(diào)優(yōu)指南》、《Serverless架構(gòu)》等書籍。 朱罡罡,2012年西安電子科技大學(xué)本科畢業(yè),曾擔(dān)任知名上市OTA企業(yè)系統(tǒng)架構(gòu)師、研發(fā)總監(jiān)等職位,目前就職于TOP50央企信息技術(shù)部,擔(dān)任研發(fā)經(jīng)理崗位,擁有發(fā)明專利1個(gè)。技術(shù)研究領(lǐng)域涵蓋互聯(lián)網(wǎng)系統(tǒng)技術(shù)架構(gòu)設(shè)計(jì)、大數(shù)據(jù)、推薦系統(tǒng)算法等,對在線旅游系統(tǒng)的基于用戶推薦和基于內(nèi)容推薦有過一定的研究。 溫睿,互聯(lián)網(wǎng)行業(yè)從業(yè)9年,資深系統(tǒng)架構(gòu)師,從事過大型高并發(fā)Web網(wǎng)站開發(fā)、手機(jī)APP開發(fā)、IM服務(wù)開發(fā)、微服務(wù)系統(tǒng)架構(gòu)等工作,熟練掌握各種常用前后端開發(fā)語言、腳本語言和框架。
- >
新文學(xué)天穹兩巨星--魯迅與胡適/紅燭學(xué)術(shù)叢書(紅燭學(xué)術(shù)叢書)
- >
詩經(jīng)-先民的歌唱
- >
唐代進(jìn)士錄
- >
月亮與六便士
- >
名家?guī)阕x魯迅:故事新編
- >
李白與唐代文化
- >
經(jīng)典常談
- >
苦雨齋序跋文-周作人自編集