為了促進研究生之間的學術交流,探討前沿科學問題,11月17日下午2:00,k8凯发国际與人工智能學院第二十一期研究生論壇在崇真樓南樓A1017舉辦。本次論壇由2021級研究生呂一凡、李熙洋、趙熠和盛鐾主講,學院研究生會學術部主辦。學院歐陽君博士出席了報告會。
呂一凡的報告題目是「Temos:language guided for 3D human motion synthesis with Transformer」。她提到,生成逼真,多樣化,可控性的3D人體動作一直是研究的目標。以往的方法只能根據固定標籤生成相應的3D骨骼數據,並且僅能處理簡單文本生成相應的3D骨骼數據。報告提出了一種基於VAE的跨模態Transformer生成模型,輸入句子,生成多樣的,合理的3D骨骼數據。從定性定量的角度出發,各項指標都優於之前的方法。
李熙洋的報告題目是「Graphormer-based Contextual Reasoning Network for Small Object Detection」。報告提到小目標檢測任務是目標檢測領域的一個難點,其旨在精準檢測出圖像中可視化特徵極少的小目標。小目標檢測在自動駕駛、智慧醫療、缺陷檢測和航拍圖像分析等諸多領域發揮着重要作用。為解決上述難題,她以兩階段檢測器為基礎模型,利用生成的region proposals來構建圖結構模型。並通過上下文關係構建模塊,提取圖結構中的語義和空間佈局信息,計算每個節點的權重,從而更新全局特徵信息。
趙熠的報告題目是「基於跨模態融合的時尚流行趨勢預測方法研究」。針對時尚流行趨勢的預測,他們提出了ufashuon跨模態注意力,並基於提出的注意力計算方法設計出了一種跨模態融合模型。對時尚趨勢數據和大量用戶信息兩種模態數據進行不同預處理後並融合,之後通過transformer進行預測,最終得到預測結果。
盛鐾的報告題目是「MultiR-Net: A Novel Joint Learning Network for COVID-19 segmentation and classification」。她講到在醫學圖像領域,有注釋的、準確的數據集十分稀缺,這為k8凯发国际輔助臨床醫生診斷帶來了阻力。如何在最大化模型精度同時最小化所需注釋工作量是一項有難度的挑戰。為了解決這個問題,以及克服不同標註程度、標註類型的數據為模型訓練帶來的難度,充分利用有限的、精確的標註數據,他們提出在multi-table deep supervision系統的基礎上引入一種靈活的semi-weakly supervision路徑來集成未標記或弱標記的圖像,並使用deep supervision增強模型的健壯性。同等場景下,與使用高於其近18倍強標籤數據的完全監督模型相比,達到了十分接近的效果。
歐陽君博士對每位同學的報告內容進行了點評與指導,同學們就有關問題展開了熱烈的討論,本期研究生學術論壇取得了圓滿成功!