視覺問答理論與實(shí)踐 版權(quán)信息
- ISBN:9787121475313
- 條形碼:9787121475313 ; 978-7-121-47531-3
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
視覺問答理論與實(shí)踐 內(nèi)容簡介
視覺問答任務(wù)要求機(jī)器根據(jù)指定的視覺圖像內(nèi)容, 對單輪或多輪的自然語言問題進(jìn)行作答。其本質(zhì)上是一個多學(xué)科的研究問題,涉及計算機(jī)視覺、自然語言處理、知識表示與推理等。本書共5 部分,第1 部分介紹在計算機(jī)視覺和自然語言處理領(lǐng)域廣泛使用的基本方法和技術(shù),包括卷積神經(jīng)網(wǎng)絡(luò)、序列建模和注意力機(jī)制等。本書將視覺問答分為圖像和視頻方法。第2 部分將圖像視覺問答進(jìn)一步分為五類,即聯(lián)合嵌入、注意力機(jī)制、記憶網(wǎng)絡(luò)、組合推理和圖神經(jīng)網(wǎng)絡(luò)。此外,概述基于圖像的其他視覺問答任務(wù),例如基于知識的視覺問答、視覺問答的視覺和語言預(yù)訓(xùn)練。第3 部分討論基于視頻的視覺問答及其相關(guān)模型。第4 部分討論與視覺問答相關(guān)的高級任務(wù),包括具身視覺問答、醫(yī)學(xué)視覺問答、基于文本的視覺問答、視覺問題生成、視覺對話和指代表達(dá)理解,它們是視覺問答任務(wù)的擴(kuò)展。第5 部分對該領(lǐng)域進(jìn)行總結(jié)和展望,討論視覺問答領(lǐng)域的未來研究方向。
視覺問答理論與實(shí)踐 目錄
視覺問答理論與實(shí)踐 作者簡介
吳琦,澳大利亞阿德萊德大學(xué)高級講師(副教授),博士生導(dǎo)師,澳大利亞青年學(xué)者基金獲得者 (Australian Research Council DECRA Fellow),澳大利亞機(jī)器人視覺研究中心(ACRV)vision-language課題組組長,澳大利亞科學(xué)院羅素獎獲得者。吳琦博士于2015年在英國巴斯大學(xué)獲得博士學(xué)位,致力于計算機(jī)視覺領(lǐng)域研究,尤其關(guān)注于計算機(jī)視覺-自然語言相關(guān)領(lǐng)域的研究。吳琦博士在CVPR,ICCV,ECCV, NeurIPS, TPAMI等多個國際會議和期刊發(fā)表論文七十余篇,吳琦博士亦擔(dān)任TPAMI,IJCV,TIP,CVPR,NIPS,ACL等學(xué)術(shù)期刊會議審稿人以及ICCV2021 領(lǐng)域主席。
- >
人文閱讀與收藏·良友文學(xué)叢書:一天的工作
- >
唐代進(jìn)士錄
- >
中國歷史的瞬間
- >
名家?guī)阕x魯迅:故事新編
- >
大紅狗在馬戲團(tuán)-大紅狗克里弗-助人
- >
莉莉和章魚
- >
【精裝繪本】畫給孩子的中國神話
- >
朝聞道