歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊(cè)
> >
解析深度學(xué)習(xí)-語(yǔ)音識(shí)別實(shí)踐

解析深度學(xué)習(xí)-語(yǔ)音識(shí)別實(shí)踐

出版社:電子工業(yè)出版社出版時(shí)間:2016-07-01
開本: 32開 頁(yè)數(shù): 336
讀者評(píng)分:4.5分2條評(píng)論
中 圖 價(jià):¥32.4(4.1折) 定價(jià)  ¥79.0 登錄后可看到會(huì)員價(jià)
加入購(gòu)物車 收藏
運(yùn)費(fèi)6元,滿39元免運(yùn)費(fèi)
?新疆、西藏除外
溫馨提示:5折以下圖書主要為出版社尾貨,大部分為全新(有塑封/無(wú)塑封),個(gè)別圖書品相8-9成新、切口
有劃線標(biāo)記、光盤等附件不全詳細(xì)品相說(shuō)明>>
本類五星書更多>
買過本商品的人還買了

解析深度學(xué)習(xí)-語(yǔ)音識(shí)別實(shí)踐 版權(quán)信息

解析深度學(xué)習(xí)-語(yǔ)音識(shí)別實(shí)踐 本書特色

本書是首部介紹語(yǔ)音識(shí)別中深度學(xué)習(xí)技術(shù)細(xì)節(jié)的專著。全書首先概要介紹了傳統(tǒng)語(yǔ)音識(shí)別理論和經(jīng)典的深度神經(jīng)網(wǎng)絡(luò)核心算法。接著全面而深入地介紹了深度學(xué)習(xí)在語(yǔ)音識(shí)別中的應(yīng)用,包括“深度神經(jīng)網(wǎng)絡(luò)-隱馬爾可夫混合模型”的訓(xùn)練和優(yōu)化,特征表示學(xué)習(xí)、模型融合、自適應(yīng),以及以循環(huán)神經(jīng)網(wǎng)絡(luò)為代表的若干先進(jìn)深度學(xué)習(xí)技術(shù)。本書適合有一定機(jī)器學(xué)習(xí)或語(yǔ)音識(shí)別基礎(chǔ)的學(xué)生、研究者或從業(yè)者閱讀,所有的算法及技術(shù)細(xì)節(jié)都提供了詳盡的參考文獻(xiàn),給出了深度學(xué)習(xí)在語(yǔ)音識(shí)別中應(yīng)用的全景。

解析深度學(xué)習(xí)-語(yǔ)音識(shí)別實(shí)踐 內(nèi)容簡(jiǎn)介

alphago與李世石的圍棋大戰(zhàn)激發(fā)了人們對(duì)人工智能是非的諸多爭(zhēng)論。人工智能背后的工作原理深度學(xué)習(xí)跳入大眾的視野。alphago的大獲全勝一定程度展示了深度學(xué)習(xí)在應(yīng)用領(lǐng)域的成功,而語(yǔ)音識(shí)別正是深度學(xué)習(xí)取得顯著成功的應(yīng)用領(lǐng)域之一。本書是首次以深度學(xué)習(xí)為主線介紹語(yǔ)音識(shí)別應(yīng)用的書籍,對(duì)讀者了解語(yǔ)音識(shí)別技術(shù)及其發(fā)展歷程有重要的參考價(jià)值。本書作者俞棟、鄧力均是該領(lǐng)域的著名專家,他們是深度學(xué)習(xí)在應(yīng)用領(lǐng)域取得突破性進(jìn)展的推動(dòng)者與實(shí)踐者,他們?cè)跁蟹窒淼难芯砍晒欢ǔ潭壬洗砹吮绢I(lǐng)域*的研究進(jìn)展;譯者俞凱、錢彥旻也是本領(lǐng)域的資深專家,并有眾多實(shí)踐成果。對(duì)于從事此領(lǐng)域研究的讀者來(lái)說(shuō),本書無(wú)疑有重要的參考價(jià)值。 

解析深度學(xué)習(xí)-語(yǔ)音識(shí)別實(shí)踐 目錄

譯者序 iv序 vii前言 ix術(shù)語(yǔ)縮寫 xxii符號(hào) xxvii第 1 章 簡(jiǎn)介 11.1 自動(dòng)語(yǔ)音識(shí)別:更好的溝通之橋 . . . . . . . . . . . . . . . . . . . . . . . 11.1.1 人類之間的交流 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.1.2 人機(jī)交流 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2 語(yǔ)音識(shí)別系統(tǒng)的基本結(jié)構(gòu) . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.3 全書結(jié)構(gòu) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.3.1 **部分:傳統(tǒng)聲學(xué)模型 . . . . . . . . . . . . . . . . . . . . . . 61.3.2 第二部分:深度神經(jīng)網(wǎng)絡(luò) . . . . . . . . . . . . . . . . . . . . . . 61.3.3 第三部分:語(yǔ)音識(shí)別中的 dnn-hmm 混合系統(tǒng) . . . . . . . . . . 71.3.4 第四部分:深度神經(jīng)網(wǎng)絡(luò)中的表征學(xué)習(xí) . . . . . . . . . . . . . . 71.3.5 第五部分:高級(jí)的深度模型 . . . . . . . . . . . . . . . . . . . . . 7**部分 傳統(tǒng)聲學(xué)模型 9第 2 章 混合高斯模型 112.1 隨機(jī)變量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.2 高斯分布和混合高斯隨機(jī)變量 . . . . . . . . . . . . . . . . . . . . . . . . 122.3 參數(shù)估計(jì) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.4 采用混合高斯分布對(duì)語(yǔ)音特征建模 . . . . . . . . . . . . . . . . . . . . . 16第 3 章 隱馬爾可夫模型及其變體 193.1 介紹 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193.2 馬爾可夫鏈 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213.3 序列與模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223.3.1 隱馬爾可夫模型的性質(zhì) . . . . . . . . . . . . . . . . . . . . . . . . 233.3.2 隱馬爾可夫模型的仿真 . . . . . . . . . . . . . . . . . . . . . . . . 243.3.3 隱馬爾可夫模型似然度的計(jì)算 . . . . . . . . . . . . . . . . . . . . 243.3.4 計(jì)算似然度的高效算法 . . . . . . . . . . . . . . . . . . . . . . . . 263.3.5 前向與后向遞歸式的證明 . . . . . . . . . . . . . . . . . . . . . . 273.4 期望*大化算法及其在學(xué)習(xí) hmm 參數(shù)中的應(yīng)用 . . . . . . . . . . . . . 283.4.1 期望*大化算法介紹 . . . . . . . . . . . . . . . . . . . . . . . . . 283.4.2 使用 em 算法來(lái)學(xué)習(xí) hmm 參數(shù)——baum-welch 算法 . . . . . . 303.5 用于解碼 hmm 狀態(tài)序列的維特比算法 . . . . . . . . . . . . . . . . . . . 343.5.1 動(dòng)態(tài)規(guī)劃和維特比算法 . . . . . . . . . . . . . . . . . . . . . . . . 343.5.2 用于解碼 hmm 狀態(tài)的動(dòng)態(tài)規(guī)劃算法 . . . . . . . . . . . . . . . . 353.6 隱馬爾可夫模型和生成語(yǔ)音識(shí)別模型的變體 . . . . . . . . . . . . . . . . 373.6.1 用于語(yǔ)音識(shí)別的 gmm-hmm 模型 . . . . . . . . . . . . . . . . . 383.6.2 基于軌跡和隱藏動(dòng)態(tài)模型的語(yǔ)音建模和識(shí)別 . . . . . . . . . . . . 393.6.3 使用生成模型 hmm 及其變體解決語(yǔ)音識(shí)別問題 . . . . . . . . . 40第二部分 深度神經(jīng)網(wǎng)絡(luò) 43第 4 章 深度神經(jīng)網(wǎng)絡(luò) 454.1 深度神經(jīng)網(wǎng)絡(luò)框架 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454.2 使用誤差反向傳播來(lái)進(jìn)行參數(shù)訓(xùn)練 . . . . . . . . . . . . . . . . . . . . . 484.2.1 訓(xùn)練準(zhǔn)則 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484.2.2 訓(xùn)練算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494.3 實(shí)際應(yīng)用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 534.3.1 數(shù)據(jù)預(yù)處理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 544.3.2 模型初始化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 554.3.3 權(quán)重衰減 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 554.3.4 丟棄法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 564.3.5 批量塊大小的選擇 . . . . . . . . . . . . . . . . . . . . . . . . . . 584.3.6 取樣隨機(jī)化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 594.3.7 慣性系數(shù) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 604.3.8 學(xué)習(xí)率和停止準(zhǔn)則 . . . . . . . . . . . . . . . . . . . . . . . . . . 614.3.9 網(wǎng)絡(luò)結(jié)構(gòu) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 624.3.10 可復(fù)現(xiàn)性與可重啟性 . . . . . . . . . . . . . . . . . . . . . . . . . 62第 5 章 高級(jí)模型初始化技術(shù) 655.1 受限玻爾茲曼機(jī) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 655.1.1 受限玻爾茲曼機(jī)的屬性 . . . . . . . . . . . . . . . . . . . . . . . . 675.1.2 受限玻爾茲曼機(jī)參數(shù)學(xué)習(xí) . . . . . . . . . . . . . . . . . . . . . . 705.2 深度置信網(wǎng)絡(luò)預(yù)訓(xùn)練 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 735.3 降噪自動(dòng)編碼器預(yù)訓(xùn)練 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 765.4 鑒別性預(yù)訓(xùn)練 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 785.5 混合預(yù)訓(xùn)練 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 785.6 采用丟棄法的預(yù)訓(xùn)練 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79第三部分 語(yǔ)音識(shí)別中的深度神經(jīng)網(wǎng)絡(luò)–隱馬爾可夫混合模型 81第 6 章 深度神經(jīng)網(wǎng)絡(luò)–隱馬爾可夫模型混合系統(tǒng) 836
展開全部

解析深度學(xué)習(xí)-語(yǔ)音識(shí)別實(shí)踐 作者簡(jiǎn)介

俞棟1998 年加入微軟公司,現(xiàn)任微軟研究院首席研究員、浙江大學(xué)兼職教授和中科大客座教授。他是語(yǔ)音識(shí)別和深度學(xué)習(xí)方向的資深專家,出版了兩本專著,發(fā)表了150 多篇論文,是近60 項(xiàng)專利的發(fā)明人及有廣泛影響力的深度學(xué)習(xí)開源軟件CNTK 的發(fā)起人和主要作者之一。他在基于深度學(xué)習(xí)的語(yǔ)音識(shí)別技術(shù)上的工作帶來(lái)了語(yǔ)音識(shí)別研究方向的轉(zhuǎn)變,極大地推動(dòng)了語(yǔ)音識(shí)別領(lǐng)域的發(fā)展,并獲得2013 年IEEE 信號(hào)處理協(xié)會(huì)最佳論文獎(jiǎng)。俞棟博士現(xiàn)擔(dān)任IEEE 語(yǔ)音語(yǔ)言處理專業(yè)委員會(huì)委員,曾擔(dān)任IEEE/ACM音頻、語(yǔ)音及語(yǔ)言處理匯刊、IEEE 信號(hào)處理雜志等期刊的編委。鄧力世界著名人工智能、機(jī)器學(xué)習(xí)和語(yǔ)音語(yǔ)言信號(hào)處理專家,現(xiàn)任微軟首席人工智能科學(xué)家和深度學(xué)習(xí)技術(shù)中心研究經(jīng)理。他在美國(guó)威斯康星大學(xué)先后獲碩士和博士學(xué)位,然后在加拿大滑鐵盧大學(xué)任教獲得終身正教授。其間,他還任麻省理工學(xué)院研究職位。1999 年加入微軟研究院歷任數(shù)職,并在2014 年初創(chuàng)辦深度學(xué)習(xí)技術(shù)中心,主持微軟公司和研究院的人工智能和深度學(xué)習(xí)領(lǐng)域的技術(shù)創(chuàng)新。 鄧立博士的研究方向包括自動(dòng)語(yǔ)音與說(shuō)話者識(shí)別、口語(yǔ)識(shí)別與理解、語(yǔ)音–語(yǔ)音翻譯、機(jī)器翻譯、語(yǔ)言模式、統(tǒng)計(jì)方法與機(jī)器學(xué)習(xí)、聽覺和其他生物信息處理、深層結(jié)構(gòu)學(xué)習(xí)、類腦機(jī)器智能、圖像語(yǔ)言多模態(tài)深度學(xué)習(xí),商業(yè)大數(shù)據(jù)深度分析等。他在上述領(lǐng)域做出了重大貢獻(xiàn),是ASA(美國(guó)聲學(xué)學(xué)會(huì))會(huì)士、IEEE(美國(guó)電氣和電子工程師協(xié)會(huì))會(huì)士和理事、ISCA(國(guó)際語(yǔ)音通信協(xié)會(huì))會(huì)士,并憑借在深度學(xué)習(xí)與自動(dòng)語(yǔ)音識(shí)別方向做出的杰出貢獻(xiàn)榮獲2015年度IEEE 信號(hào)處理技術(shù)成就獎(jiǎng)。同時(shí),他也曾在頂級(jí)雜志和會(huì)議上發(fā)表過與上述領(lǐng)域相關(guān)的300 余篇學(xué)術(shù)論文,出版過5 部著作,發(fā)明及合作發(fā)明了超過70 多項(xiàng)專利。鄧立博士還擔(dān)任過IEEE 信號(hào)處理雜志和《音頻、語(yǔ)音與語(yǔ)言處理學(xué)報(bào)》(IEEE/ACMTransactions on Audio, Speech & anguage Processing)的主編。俞凱IEEE 高級(jí)會(huì)員,上海交通大學(xué)計(jì)算機(jī)科學(xué)與工程系特別研究員。清華大學(xué)本科、碩士,英國(guó)劍橋大學(xué)工程系博士。長(zhǎng)期從事智能語(yǔ)音及語(yǔ)言處理、人機(jī)交互、模式識(shí)別及機(jī)器學(xué)習(xí)的研究和產(chǎn)業(yè)化工作。他是中組部“千人計(jì)劃”(青年項(xiàng)目)獲得者,國(guó)家自然科學(xué)基金委優(yōu)秀青年科學(xué)基金獲得者,上海市“東方學(xué)者”特聘教授;作為共同創(chuàng)始人和首席科學(xué)家創(chuàng)立“蘇州思必馳信息科技有限公司”,F(xiàn)任中國(guó)聲學(xué)學(xué)會(huì)語(yǔ)音語(yǔ)言、聽覺及音樂分會(huì)執(zhí)委會(huì)委員,中國(guó)計(jì)算機(jī)學(xué)會(huì)人機(jī)交互專委會(huì)委員,中國(guó)語(yǔ)音產(chǎn)業(yè)聯(lián)盟技術(shù)工作組副組長(zhǎng)。他的研究興趣涉及語(yǔ)音識(shí)別、語(yǔ)音合成、口語(yǔ)理解、對(duì)話系統(tǒng)、認(rèn)知型人機(jī)交互等智能語(yǔ)音語(yǔ)言處理技術(shù)的多個(gè)核心技術(shù)領(lǐng)域,在本領(lǐng)域的一流國(guó)際期刊和會(huì)議上發(fā)表論文80 余篇,申請(qǐng)專利10 余項(xiàng),取得了一系列研究、工程和產(chǎn)業(yè)化成果。在InterSpeech 及IEEE Spoken Language Processing 等國(guó)際會(huì)議上獲得3 篇國(guó)際會(huì)議優(yōu)秀論文獎(jiǎng),獲得國(guó)際語(yǔ)音通信聯(lián)盟(ISCA)2013 年頒發(fā)的2008—2012 Computer Speech and Language 最優(yōu)論文獎(jiǎng)。受邀擔(dān)任InterSpeech 2009 語(yǔ)音識(shí)別領(lǐng)域主席、EUSIPCO 2011/EUSIPCO 2014 語(yǔ)音處理領(lǐng)域主席、InterSpeech 2014 口語(yǔ)對(duì)話系統(tǒng)領(lǐng)域主席等。他負(fù)責(zé)搭建或參與搭建的大規(guī)模連續(xù)語(yǔ)音識(shí)別系統(tǒng),曾獲得美國(guó)國(guó)家標(biāo)準(zhǔn)局(NIST)和美國(guó)國(guó)防部?jī)?nèi)部評(píng)測(cè)冠軍;作為核心技術(shù)人員,負(fù)責(zé)設(shè)計(jì)并實(shí)現(xiàn)的認(rèn)知型統(tǒng)計(jì)對(duì)話系統(tǒng)原型,在CMU 組織的2010 年對(duì)話系統(tǒng)國(guó)際挑戰(zhàn)賽上獲得了可控測(cè)試的冠軍。作為項(xiàng)目負(fù)責(zé)人或Co-PI,他主持了歐盟第7 框架PARLANCE、國(guó)家自然科學(xué)基金委、上海市教委、經(jīng)信委,以及美國(guó)通用公司、蘇州思必馳信息科技有限公司的一系列科研及產(chǎn)業(yè)化項(xiàng)目。2014 年,因在智能語(yǔ)音技術(shù)產(chǎn)業(yè)化方面的貢獻(xiàn),獲得中國(guó)人工智能學(xué)會(huì)頒發(fā)的“吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)”。錢彥旻上海交通大學(xué)計(jì)算機(jī)科學(xué)與工程系助理研究員,博士。分別在2007 年6 月和2013 年1 月于華中科技大學(xué)和清華大學(xué)獲得工學(xué)學(xué)士和工學(xué)博士學(xué)位。2013 年4 月起,任上海交通大學(xué)計(jì)算機(jī)科與工程系理研究員。同時(shí)從2015 年1 月至2015 年12 月,在英國(guó)劍橋大學(xué)工程系機(jī)器智能實(shí)驗(yàn)室語(yǔ)音組進(jìn)行訪問,作為項(xiàng)目研究員與語(yǔ)音識(shí)別領(lǐng)域的著名科學(xué)家Phil Woodland 教授和Mark Gales 教授開展合作研究,F(xiàn)為IEEE、ISCA 會(huì)員,同時(shí)也是國(guó)際開源項(xiàng)目Kaldi 語(yǔ)音識(shí)別工具包開發(fā)的項(xiàng)目組創(chuàng)始成員之一。此外,擔(dān)任IEEE Transactions on Audio, Speech, and Language Processing、SpeechCommunication、ICASSP、Interspeech、ASRU 等國(guó)際期刊和會(huì)議的審稿人。目前在國(guó)內(nèi)外學(xué)術(shù)刊物和會(huì)議上發(fā)表學(xué)術(shù)論文50 余篇,Google Scholar 總引用數(shù)近1000 次。其中包括在語(yǔ)音識(shí)別領(lǐng)域權(quán)威國(guó)際會(huì)議ICASSP、InterSpeech 和ASRU 上發(fā)表論文30 余篇,申請(qǐng)國(guó)家專利共3 項(xiàng),已授權(quán)1 項(xiàng)。2008 年獲科技奧運(yùn)先進(jìn)集體獎(jiǎng),2014 年獲中國(guó)人工智能學(xué)會(huì)頒發(fā)的“吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)進(jìn)步獎(jiǎng)”。曾作為負(fù)責(zé)人和主要參與者參加了包括英國(guó)EPSRC、國(guó)家自然科學(xué)基金、國(guó)家863 等多個(gè)項(xiàng)目。目前的研究領(lǐng)域包括:語(yǔ)音識(shí)別、說(shuō)話人和語(yǔ)種識(shí)別、自然語(yǔ)言理解、深度學(xué)習(xí)建模、多媒體信號(hào)處理等。

商品評(píng)論(2條)
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服