歡迎光臨中圖網(wǎng) 請 | 注冊

視覺問答理論與實(shí)踐

作者:吳琦
出版社:電子工業(yè)出版社出版時間:2024-06-06
開本: 16開 頁數(shù): 244
中 圖 價:¥83.8(7.1折) 定價  ¥118.0 登錄后可看到會員價
加入購物車 收藏
運(yùn)費(fèi)6元,滿39元免運(yùn)費(fèi)
?新疆、西藏除外
本類五星書更多>

視覺問答理論與實(shí)踐 版權(quán)信息

視覺問答理論與實(shí)踐 內(nèi)容簡介

視覺問答任務(wù)要求機(jī)器根據(jù)指定的視覺圖像內(nèi)容, 對單輪或多輪的自然語言問題進(jìn)行作答。其本質(zhì)上是一個多學(xué)科的研究問題,涉及計算機(jī)視覺、自然語言處理、知識表示與推理等。本書共5 部分,第1 部分介紹在計算機(jī)視覺和自然語言處理領(lǐng)域廣泛使用的基本方法和技術(shù),包括卷積神經(jīng)網(wǎng)絡(luò)、序列建模和注意力機(jī)制等。本書將視覺問答分為圖像和視頻方法。第2 部分將圖像視覺問答進(jìn)一步分為五類,即聯(lián)合嵌入、注意力機(jī)制、記憶網(wǎng)絡(luò)、組合推理和圖神經(jīng)網(wǎng)絡(luò)。此外,概述基于圖像的其他視覺問答任務(wù),例如基于知識的視覺問答、視覺問答的視覺和語言預(yù)訓(xùn)練。第3 部分討論基于視頻的視覺問答及其相關(guān)模型。第4 部分討論與視覺問答相關(guān)的高級任務(wù),包括具身視覺問答、醫(yī)學(xué)視覺問答、基于文本的視覺問答、視覺問題生成、視覺對話和指代表達(dá)理解,它們是視覺問答任務(wù)的擴(kuò)展。第5 部分對該領(lǐng)域進(jìn)行總結(jié)和展望,討論視覺問答領(lǐng)域的未來研究方向。

視覺問答理論與實(shí)踐 目錄

目錄 第1 章簡介..................................................................1 1.1 視覺問答的動機(jī)........................................................1 1.2 人工智能任務(wù)中的視覺問答...........................................4 1.3 視覺問答類別..........................................................5 1.3.1 數(shù)據(jù)分類驅(qū)動......................................................6 1.3.2 任務(wù)分類驅(qū)動......................................................7 1.3.3 其他..............................................................7 參考文獻(xiàn).....................................................................8 第1 部分基礎(chǔ)理論 第2 章深度學(xué)習(xí)基礎(chǔ)......................................................15 2.1 神經(jīng)網(wǎng)絡(luò)...............................................................15 2.2 卷積神經(jīng)網(wǎng)絡(luò)..........................................................17 2.3 循環(huán)神經(jīng)網(wǎng)絡(luò)及變體...................................................18 2.4 編碼器-解碼器結(jié)構(gòu)....................................................20 2.5 注意力機(jī)制.........................................................
展開全部

視覺問答理論與實(shí)踐 作者簡介

吳琦,澳大利亞阿德萊德大學(xué)高級講師(副教授),博士生導(dǎo)師,澳大利亞青年學(xué)者基金獲得者 (Australian Research Council DECRA Fellow),澳大利亞機(jī)器人視覺研究中心(ACRV)vision-language課題組組長,澳大利亞科學(xué)院羅素獎獲得者。吳琦博士于2015年在英國巴斯大學(xué)獲得博士學(xué)位,致力于計算機(jī)視覺領(lǐng)域研究,尤其關(guān)注于計算機(jī)視覺-自然語言相關(guān)領(lǐng)域的研究。吳琦博士在CVPR,ICCV,ECCV, NeurIPS, TPAMI等多個國際會議和期刊發(fā)表論文七十余篇,吳琦博士亦擔(dān)任TPAMI,IJCV,TIP,CVPR,NIPS,ACL等學(xué)術(shù)期刊會議審稿人以及ICCV2021 領(lǐng)域主席。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服