-
>
(精)方力鈞作品圖錄
-
>
《藏書報(bào)》2021合訂本
-
>
中外性文物大觀
-
>
馬克思主義經(jīng)典著作解讀叢書·探索人類解放的新路徑《1844年經(jīng)濟(jì)學(xué)哲學(xué)手稿》解讀
-
>
襄陽府志(九品)
-
>
奇思妙想創(chuàng)意玩具書(精裝4冊)
-
>
大慈恩寺
智能聊天機(jī)器人——核心技術(shù)與算法 版權(quán)信息
- ISBN:9787302570783
- 條形碼:9787302570783 ; 978-7-302-57078-3
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:
智能聊天機(jī)器人——核心技術(shù)與算法 本書特色
本書消除了智能聊天領(lǐng)域的門檻,目的是培養(yǎng)復(fù)合型技術(shù)人才。本書通過多個案例,逐步介紹聊天機(jī)器人開發(fā)各個階段可能遇到的技術(shù)難題、業(yè)務(wù)需求以及相對應(yīng)的技術(shù)解決方案和實(shí)踐解析,讓讀者身臨其境,探尋智能聊天機(jī)器人的奧秘。本書覆蓋面全,涵蓋了所有*關(guān)鍵的技術(shù)?蓪(shí)踐性強(qiáng),通過大量實(shí)踐才能積累寶貴的經(jīng)驗(yàn),*大限度地根據(jù)理論知識彌補(bǔ)技術(shù)方案的空白。這有利于技術(shù)人員針對不同的業(yè)務(wù)需求,制定更為合理的技術(shù)方案。
智能聊天機(jī)器人——核心技術(shù)與算法 內(nèi)容簡介
隨著人工智能技術(shù)的發(fā)展,人類對智能化服務(wù)更加渴望,聊天機(jī)器人成為研發(fā)熱門之一。本 書從聊天機(jī)器人所涉及的多個方面出發(fā),先理論后實(shí)踐,讓讀者不僅能了解其中的原理,還能自 己動手編程。全書共9 章, 章以該領(lǐng)域的背景知識作為開篇,重點(diǎn)介紹了聊天系統(tǒng)中的主要 模塊;第2 章闡述了語音識別和隱馬爾可夫模型;第3 章側(cè)重于通用的自然語言處理技術(shù);第4 章講解如何使用信息檢索技術(shù),來實(shí)現(xiàn)問答型的聊天系統(tǒng);第5 章介紹一些主流的機(jī)器學(xué)習(xí)算 法,以及如何使用這些算法來提升基于信息檢索的問答系統(tǒng);第6 章介紹推薦系統(tǒng)相關(guān)的知識以 及常見的推薦算法,并將其應(yīng)用到問答系統(tǒng)中;第7 章介紹如何使用深度學(xué)習(xí)來優(yōu)化問答系統(tǒng); 第8 章講述了聊天系統(tǒng)的前沿領(lǐng)域—知識圖譜;第9 章討論任務(wù)型和閑聊型聊天系統(tǒng)中更有挑 戰(zhàn)性的幾個課題。 本書可為高等院校計(jì)算機(jī)科學(xué)、信息科學(xué)、電子工程和人工智能等領(lǐng)域的科研人員提供參考, 也可作為相關(guān)專業(yè)本科生和研究生教學(xué)的參考書,對于從事深度學(xué)習(xí)及其應(yīng)用的開發(fā)人員同樣具 有參考價值。
智能聊天機(jī)器人——核心技術(shù)與算法 目錄
第1章 聊天機(jī)器人概述
1.1 聊天機(jī)器人的發(fā)展歷史
1.2 聊天機(jī)器人的類型和應(yīng)用
1.3 聊天機(jī)器人的模塊和框架
第2章 自動語音識別
2.1 自動語音識別的發(fā)展概述
2.2 隱馬爾可夫模型
2.2.1 概率論基礎(chǔ)知識
2.2.2 隱馬爾可夫模型是怎么來的
2.2.3 求解隱馬爾可夫模型
2.3 Python實(shí)戰(zhàn)
第3章 自然語言處理
3.1 自然語言處理的發(fā)展概述
3.2 常見的自然語言處理技術(shù)
3.2.1 停用詞
3.2.2 同義詞和近義詞
3.2.3 多元語法
3.2.4 詞袋模型和TF-IDF機(jī)制
3.2.5 語義相關(guān)的詞
3.2.6 詞性標(biāo)注
3.2.7 實(shí)體識別
3.2.8 語法分析和語義分析
3.3 針對中英文的特殊處理
3.3.1 取詞干和詞形還原
3.3.2 中文分詞
第4章 基于信息檢索的問答系統(tǒng)
4.1 問答系統(tǒng)的發(fā)展概述
4.2 信息檢索
4.2.1 如何高效地找到信息
4.2.2 相關(guān)性模型
4.2.3 其他擴(kuò)展
4.2.4 基于信息檢索的問答系統(tǒng)架構(gòu)
4.3 基于Elasticsearch搜索引擎的問答系統(tǒng)
4.3.1 軟件和數(shù)據(jù)的準(zhǔn)備
4.3.2 Elasticsearch的基本概念和使用
4.3.3 在Elasticsearch中處理自然語言
4.3.4 自定義Elasticsearch的排序
4.3.5 Elasticsearch中搜索結(jié)果的統(tǒng)計(jì)
4.3.6 Elasticsearch集群
4.3.7 集成的問答系統(tǒng)
……
第5章 用機(jī)器學(xué)習(xí)提升基于信息檢索的問答系統(tǒng)
第6章 基于社區(qū)和推薦的問答系統(tǒng)
第7章 使用深度學(xué)習(xí)加強(qiáng)問答系統(tǒng)
第8章 使用知識圖譜構(gòu)建問答系統(tǒng)
第9章 打造任務(wù)型和閑聊型聊天系統(tǒng)
智能聊天機(jī)器人——核心技術(shù)與算法 節(jié)選
第2章 自動語音識別 2.1 自動語音識別的發(fā)展概述 有時候,我們需要通過語音和聊天機(jī)器人進(jìn)行溝通,這種方式更加符合我們的行為習(xí)慣?墒,讓機(jī)器理解我們的語音不是件容易的事情。自從19世紀(jì)電話機(jī)問世以來,人們就可以通過機(jī)器進(jìn)行人類聲音的處理。可是,無論是電話機(jī)對講機(jī),還是錄音機(jī),都只能存儲和播放人類說話的聲音,而無法理解這些話語。從20世紀(jì)至今,科學(xué)家們一直在探索如何利用計(jì)算機(jī)領(lǐng)域的知識,讓機(jī)器“聽懂”我們的語言,這也是本章的主題—自動語音識別(以下簡稱語音識別)。 *早的語音識別系統(tǒng)可以追溯到20世紀(jì)的50年代,專家們根據(jù)具體的業(yè)務(wù)需求,設(shè)計(jì)了簡單的語音交互系統(tǒng)?蛻糁恍枰唵蔚卣f出“是”“否”或者一些基于數(shù)字和單詞的簡單選項(xiàng),就能和系統(tǒng)進(jìn)行交互。時至今日,在一些銀行等企事業(yè)單位的電話熱線中,我們還能常常碰到并使用這種系統(tǒng)。這種系統(tǒng)已經(jīng)具備了語音識別的基本形式,只需要區(qū)分固定集合內(nèi)、數(shù)量有限的若干語音模式。 20世紀(jì)70年代初期,語音識別技術(shù)進(jìn)入快速發(fā)展時期,其中比較有代表性的方法包括模式識別、動態(tài)規(guī)劃和線性預(yù)測編碼。由于口語的發(fā)音數(shù)量是有限的,所以通過這些技術(shù),機(jī)器能夠比較準(zhǔn)確地識別單個詞的語音。美國國防部高級研究計(jì)劃署(Defense Advanced Research Projects Agency,DARPA)也曾經(jīng)投資語音識別項(xiàng)目,在其資助下,卡內(nèi)基-梅隆大學(xué)創(chuàng)造出了一臺能夠識別1000多個單詞的機(jī)器,識別成功率也是不錯的。到了20世紀(jì)70年代后期,一些大公司包括IBM、Bell等開始研發(fā)基于海量詞匯的連續(xù)語音識別系統(tǒng),而此時基于專家系統(tǒng)的方法逐步被淘汰,而基于統(tǒng)計(jì)建模的方法逐步興起。 我們可以認(rèn)為20世紀(jì)80、90年代是語音識別技術(shù)的一個突破期。一些成熟的算法,如基于隱馬爾可夫模型和N元語法(N-gram)語言模型。特別是HMM,它從基于簡單的模板匹配方法轉(zhuǎn)向基于概率統(tǒng)計(jì)建模的方法,時下主流的方法也有一部分采用了HMM框架。在各種HMM中,*為主流的方法是GMM-HMM,它一方面通過高斯混合模型(Gaussian Mixture Model,GMM)對語音狀態(tài)的觀察概率進(jìn)行建模;另一方面通過HMM對語音狀態(tài)的時序進(jìn)行建模。進(jìn)入20世紀(jì)90年代之后,基于HMM的一系列語音識別技術(shù)趨于成熟,商業(yè)軟件和應(yīng)用也層出不窮,包括DragonDecitate的Dragon系統(tǒng),微軟的Whisper系統(tǒng),IBM的Via-vioce系統(tǒng)和英國劍橋大學(xué)的HTK系統(tǒng)等。 可是,這些方法和系統(tǒng)在進(jìn)入21世紀(jì)之后,面臨不少新的挑戰(zhàn)。人們使用語音識別的場景越來越多,不再局限于專業(yè)性的文稿輸入。比如,汽車、手機(jī)、會議室里的語音助手,它們需要處理的是隨意性的對話,甚至是多人之間的交談。隨著深度學(xué)習(xí)的興起,語音識別技術(shù)找到了新的發(fā)展方向。其實(shí),早在20世紀(jì)80年代,已經(jīng)有學(xué)者開始將神經(jīng)網(wǎng)絡(luò)運(yùn)用到語音識別中,只是未能取得滿意的效果。而在目前深度學(xué)習(xí)的研究領(lǐng)域中,人們已經(jīng)可以構(gòu)建并訓(xùn)練深層的神經(jīng)網(wǎng)絡(luò)(DNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)。某些實(shí)驗(yàn)數(shù)據(jù)表明,在理想情況下,基于RNN模型的語音識別準(zhǔn)確度達(dá)到了90%~95%,這一指標(biāo)已經(jīng)非常接近人類大腦識別的精度了。 正是由于語音識別技術(shù)的長足進(jìn)步,時下各種語音識別的硬件、軟件和應(yīng)用層出不窮。這項(xiàng)技術(shù)讓人類可以通過一種更自然的方式和機(jī)器進(jìn)行交互,所以被廣泛運(yùn)用在各種聊天機(jī)器人中。其中比較主流的形式是語音助手,包括亞馬遜在2014年推出的Echo,谷歌在2016年推出的Google Home等。而國內(nèi)的公司也正在迎頭趕上,推出了智能音響、智能鼠標(biāo)、智能遙控器等各種周邊設(shè)備,作為語音識別的硬件載體。 在經(jīng)歷了幾十年的發(fā)展后,語音識別技術(shù)日趨成熟,其主流的處理框架也相對穩(wěn)定。圖2-1列出了其中很常見的一種語音識別框架。 圖2-1 常用的語音識別框架 對于聊天機(jī)器人來說,*重要的是需要理解人們對它表達(dá)的意思,對應(yīng)圖2-1來說,就是單詞(字)識別和句子識別的過程。在這里,我們通過*經(jīng)典的隱馬爾可夫模型,重點(diǎn)說說語音識別中從單詞、字到句子的識別過程。 2.2 隱馬爾可夫模型
智能聊天機(jī)器人——核心技術(shù)與算法 作者簡介
黃申,博士,2015年美國杰出人才,微軟學(xué)者,IBMExtremeBlue天才計(jì)劃成員。2006年博士畢業(yè)于上海交通大學(xué)計(jì)算機(jī)科學(xué)與工程專業(yè),師從俞勇教授,擁有20余篇國際論文和30多項(xiàng)國際專利。他有超過20年機(jī)器學(xué)習(xí)和大數(shù)據(jù)領(lǐng)域的從業(yè)經(jīng)驗(yàn),現(xiàn)任Glassdoor機(jī)器學(xué)習(xí)資深研發(fā)經(jīng)理,曾任職于LinkedIn全球數(shù)據(jù)科學(xué)部、微軟亞洲研究院、IBM研究院、eBay中國研發(fā)中心、1號店和***飛牛網(wǎng)。出版過《大數(shù)據(jù)架構(gòu)和算法實(shí)現(xiàn)之路:電商系統(tǒng)的技術(shù)實(shí)戰(zhàn)》《大數(shù)據(jù)架構(gòu)商業(yè)之路:從業(yè)務(wù)需求到技術(shù)方案》《程序員的數(shù)學(xué)》等技術(shù)書籍和專欄,累計(jì)讀者數(shù)萬人。
- >
大紅狗在馬戲團(tuán)-大紅狗克里弗-助人
- >
姑媽的寶刀
- >
詩經(jīng)-先民的歌唱
- >
名家?guī)阕x魯迅:故事新編
- >
中國人在烏蘇里邊疆區(qū):歷史與人類學(xué)概述
- >
小考拉的故事-套裝共3冊
- >
苦雨齋序跋文-周作人自編集
- >
我與地壇