講座編號(hào):jz-yjsb-2021-y036
講座題目:中國(guó)計(jì)算機(jī)學(xué)會(huì)計(jì)算機(jī)視覺(jué)專(zhuān)委會(huì)走進(jìn)高校系列報(bào)告會(huì)
主 講 人:查紅彬 教授 北京大學(xué)
趙 耀 教授 北京交通大學(xué)
紀(jì)榮嶸 教授 廈門(mén)大學(xué)
張 磊 教授 重慶大學(xué)
講座時(shí)間:2021年9月27日(星期一)下午14:00
講座地點(diǎn):北京工商大學(xué)阜成路校區(qū)西區(qū)綜合樓一層報(bào)告廳
參加對(duì)象:視覺(jué)領(lǐng)域?qū)I(yè)人士、研究生、媒體、其他有興趣者
主辦單位:計(jì)算機(jī)學(xué)院、研究生院
主講人簡(jiǎn)介:
查紅彬,北京大學(xué)信息科學(xué)技術(shù)學(xué)院智能科學(xué)系教授,機(jī)器感知與智能教育部重點(diǎn)實(shí)驗(yàn)室主任。主要從事計(jì)算機(jī)視覺(jué)與智能人機(jī)交互的研究,在三維視覺(jué)幾何計(jì)算、三維重建與環(huán)境幾何建模、三維物體識(shí)別等方面取得了一系列成果。出版學(xué)術(shù)期刊及國(guó)際會(huì)議論文300多篇,其中包括IEEE T- PAMI,IJCV,IEEE T-VCG,IEEE T-RA,IEEE T-SMC,ACM T-IST,JMLR,PR 等國(guó)際期刊以及ICCV,ECCV,CVPR,CHI,ICML,AAAI,ICRA等國(guó)際學(xué)術(shù)會(huì)議論文100多篇。
趙耀,長(zhǎng)江學(xué)者特聘教授、國(guó)家杰出青年科學(xué)基金獲得者、萬(wàn)人計(jì)劃科技創(chuàng)新領(lǐng)軍人才、科技部重點(diǎn)領(lǐng)域創(chuàng)新團(tuán)隊(duì)帶頭人?,F(xiàn)任北京交通大學(xué)信息科學(xué)研究所所長(zhǎng),“現(xiàn)代信息科學(xué)與網(wǎng)絡(luò)技術(shù)”北京市重點(diǎn)實(shí)驗(yàn)室主任。研究領(lǐng)域?yàn)閿?shù)字媒體信息處理與智能分析,包括圖像\視頻壓縮,數(shù)媒體內(nèi)容安全,媒體內(nèi)容分析與理解,人工智能等。主持了973計(jì)劃、863計(jì)劃等課題30余項(xiàng)。在包括IEEE Trans.等國(guó)內(nèi)外期刊、會(huì)議上發(fā)表論文200余篇。作為第一完成人獲北京市科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng)等省部級(jí)獎(jiǎng)勵(lì)4項(xiàng)。指導(dǎo)的博士生7人獲北京市和中國(guó)計(jì)算機(jī)學(xué)會(huì)優(yōu)秀博士論文獎(jiǎng)。受邀擔(dān)任了 IEEE Transactions on Cybernetics等多個(gè)國(guó)際雜志編委。他是國(guó)務(wù)院學(xué)科評(píng)議組成員,享受?chē)?guó)務(wù)院政府特殊津貼。
紀(jì)榮嶸,廈門(mén)大學(xué)南強(qiáng)特聘教授,國(guó)家杰出青年科學(xué)基金獲得者。主要研究方向?yàn)橛?jì)算機(jī)視覺(jué)。近年來(lái)發(fā)表TPAMI、IJCV、ACM匯刊、IEEE匯刊、CVPR、NeurIPS等會(huì)議長(zhǎng)?過(guò)百篇。論文谷歌學(xué)術(shù)引用萬(wàn)余次。曾獲2016年教育部技術(shù)發(fā)明一等獎(jiǎng)、2018年省科技進(jìn)步一等獎(jiǎng)、2019年福建省青年科技獎(jiǎng)。曾/現(xiàn)主持國(guó)防973項(xiàng)目,國(guó)家自然科學(xué)基金聯(lián)合重點(diǎn)基金等項(xiàng)目。任中國(guó)計(jì)算機(jī)學(xué)會(huì)A類(lèi)國(guó)際會(huì)議CVPR和ACM Multimedia領(lǐng)域主席、中國(guó)圖象圖形學(xué)學(xué)會(huì)學(xué)術(shù)工委副主任、教育部電子信息類(lèi)教指委人工智能專(zhuān)業(yè)建設(shè)咨詢(xún)委員會(huì)委員。
張磊,重慶大學(xué)教授,博士生導(dǎo)師,重慶市生物感知與智能信息處理重點(diǎn)實(shí)驗(yàn)室副主任,LiVE視覺(jué)智能與學(xué)習(xí)團(tuán)隊(duì)負(fù)責(zé)人,重慶市高層次人才計(jì)劃入選者、重慶市杰出青年基金獲得者、IEEE高級(jí)會(huì)員。主要聚焦于遷移學(xué)習(xí)、深度學(xué)習(xí)、開(kāi)放環(huán)境視覺(jué)感知、跨媒體分析等領(lǐng)域。共發(fā)表論文100余篇,其中IEEE Trans.匯刊以及CCF-A類(lèi)會(huì)議論文50余篇。多篇論文入選ESI高被引論文,出版英文專(zhuān)著1部,發(fā)明專(zhuān)利14項(xiàng)。擔(dān)任多個(gè)SCI期刊包括IEEE Trans. Instrumentation and Measurement以及Neural Networks等期刊Associate Editor,The Visual Computer以及Frontiers in Neurorobotics期刊客座編委,以及ACM MM、AAAI、CVPR、ICCV、ICLR等會(huì)議的AC、SPC和PC等。以第1完成人先后獲得吳文俊人工智能自然科學(xué)獎(jiǎng)、重慶市科學(xué)技術(shù)獎(jiǎng)、重慶市十佳科技青年獎(jiǎng)3項(xiàng)。
主講內(nèi)容:
視覺(jué)SLAM:在線(xiàn)學(xué)習(xí)的途徑:3D視覺(jué)的一個(gè)主要任務(wù)是利用傳感器視點(diǎn)的變化與成像幾何的約束來(lái)實(shí)現(xiàn)三維場(chǎng)景的幾何與結(jié)構(gòu)重建。因此,伴隨傳感器移動(dòng)的動(dòng)態(tài)視覺(jué)與3D視覺(jué)的關(guān)系愈加密切,SLAM(Simultaneous Localization and Mapping:即時(shí)定位與地圖構(gòu)建)技術(shù)再度成為3D視覺(jué)領(lǐng)域的研究熱點(diǎn)。為了提高動(dòng)態(tài)視覺(jué)系統(tǒng)在真實(shí)復(fù)雜場(chǎng)景中的應(yīng)用能力,我們應(yīng)充分強(qiáng)化視覺(jué)系統(tǒng)的環(huán)境自適應(yīng)性,而在線(xiàn)學(xué)習(xí)方法是實(shí)現(xiàn)這一目標(biāo)的有效途徑。該報(bào)告將圍繞基于在線(xiàn)學(xué)習(xí)的SLAM問(wèn)題,介紹我們近來(lái)的一些想法和嘗試,主要內(nèi)容包括:面向自監(jiān)督視覺(jué)里程計(jì)的序列對(duì)抗學(xué)習(xí)方法;具有在線(xiàn)自適應(yīng)能力的自監(jiān)督SLAM學(xué)習(xí)。
弱監(jiān)督與交互式圖像分割:圖像語(yǔ)義分割,是涉及計(jì)算機(jī)視覺(jué)、模式識(shí)別及人工智能的交叉研究方向,是實(shí)現(xiàn)自動(dòng)駕駛、智能監(jiān)控、虛擬現(xiàn)實(shí)、醫(yī)學(xué)圖像診斷、機(jī)器人等國(guó)家重點(diǎn)應(yīng)用的關(guān)鍵科學(xué)問(wèn)題。目前,深度學(xué)習(xí)已經(jīng)在圖像語(yǔ)義分割領(lǐng)域取得了巨大突破。然而,大量的像素級(jí)標(biāo)注通常需要消耗大量的時(shí)間、金錢(qián)和人力。因此,訓(xùn)練數(shù)據(jù)的不足或缺失已經(jīng)成為制約圖像語(yǔ)義分割進(jìn)一步發(fā)展的關(guān)鍵因素之一。為減少像素級(jí)標(biāo)注的巨大負(fù)擔(dān),近年來(lái)提出了許多弱監(jiān)督圖像語(yǔ)義分割技術(shù),即利用大量容易獲取的弱監(jiān)督信息(如:圖像標(biāo)簽)來(lái)完成更加復(fù)雜的圖像語(yǔ)義分割任務(wù)。交互式語(yǔ)義分割是通過(guò)人機(jī)的簡(jiǎn)單交互,引導(dǎo)計(jì)算機(jī)實(shí)現(xiàn)快速準(zhǔn)確的物體分割,是減輕像素級(jí)標(biāo)注成本的重要技術(shù)手段。本報(bào)告將重點(diǎn)介紹課題組在基于深度學(xué)習(xí)的圖像弱監(jiān)督語(yǔ)義分割以及交互式分割方面的部分研究成果。
復(fù)雜跨媒體數(shù)據(jù)協(xié)同分析與應(yīng)用:社交媒體包含了海量非合作、異構(gòu)化、跨模態(tài)的數(shù)據(jù),既蘊(yùn)藏了大量的人類(lèi)知識(shí)與高價(jià)值信息,也包含了各種自然與人為的噪聲,對(duì)其分析與處理需要融合類(lèi)腦計(jì)算、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理等多個(gè)維度的智能技術(shù)。本報(bào)告主要關(guān)注基于深度學(xué)習(xí)的多模態(tài)內(nèi)容協(xié)同分析與表示、跨模態(tài)信息融合及智能對(duì)抗攻防,介紹課題組在圖像描述與視覺(jué)問(wèn)答、語(yǔ)言指導(dǎo)的目標(biāo)檢測(cè)與分割、用戶(hù)隱私保護(hù)、社交網(wǎng)絡(luò)分析引導(dǎo)等方面的一些研究進(jìn)展。
開(kāi)放環(huán)境視覺(jué)感知:在實(shí)際應(yīng)用中,由于數(shù)據(jù)不確定性、環(huán)境不可控性以及算法特異性,機(jī)器學(xué)習(xí)算法的適應(yīng)性和安全性依然較差,傳統(tǒng)的人工智能模型與深度學(xué)習(xí)算法難以滿(mǎn)足開(kāi)放、動(dòng)態(tài)、復(fù)雜環(huán)境下的感知與應(yīng)用。本報(bào)告圍繞遷移自適應(yīng)學(xué)習(xí)方法論以及視覺(jué)感知算法偏見(jiàn)問(wèn)題,介紹我們近期在開(kāi)放環(huán)境下的視覺(jué)感知研究進(jìn)展,包括圖像分類(lèi)和目標(biāo)檢測(cè)等去偏方法。
