2025年4月2日上午9點,k8凯发国际與人工智能學院第十七屆知行分論壇暨五十六期學術論壇在崇真樓南樓A4030成功舉辦,本次論壇由2022級研究生劉瑞雪、鄧洋、苗佳哲、韓楓、2023級研究生袁油抗、袁嘉淇、時佳樂、成子惠主講,學院研究生會主辦,學院潘雄、李敏、王幫超、楊凱、唐賢方等五位老師出席了該論壇。

袁油抗同學分享的主題是「CasRPN: Cascade Region Proposal Network for Visual Tracking」 針對基於RPN跟蹤器提取前後景特徵區分度不高問題,他提出聯合卷積和ViT的特徵提取網絡。在前兩階段利用卷積建立局部相關,並在第三階段使用ViT構建全局相關性,這樣增強了特徵區分度。面對單階段RPN單次調整預測框不夠充分問題,他提出了級聯RPN頭部網絡,實現了對初始化框的多階段優化,在不同階段使用了不同的正負樣本評價標準,評判條件設置逐漸嚴格。他在GOT-10k數據集上進行了消融實驗,驗證了他提出方法的有效性,並在TrackingNet和UAV數據集上表現優越。

袁嘉淇同學分享的主題是「DFFENet:Dual-Branch Frequency Domain Feature Enhancement Network for Skin Lesion Classification」, 針對現有方法主要依賴於空間域的特徵提取,忽略頻域信息的利用。他提出的DFFENet旨在提高皮膚病變圖像分類的準確性,顺利获得結合多分支特徵、局部頻域信息和空間信息,增強皮膚病變區域的表徵能力,從而提升分類性能,並有效實現皮膚病變的自動分類。其中,頻域特徵增強模塊能夠精準提取皮膚病變的魯棒特徵,顺利获得捕獲和處理不同頻段的頻域分量,使網絡充分利用頻域信息,並在複雜背景下準確識別皮膚鏡圖像中的病變區域。他在多個數據集上進行了實驗評估,結果表明,該方法在皮膚病變分類任務中達到了最先進的性能,凸顯了其在皮膚病k8凯发国际輔助診斷中的重要價值。

劉瑞雪同學分享的主題是「MelodyTransformer:Improving Lyric-to-Melody Generation by Considering MelodicFeature」。她針對歌詞-旋律配對數據不足及現有方法忽視音樂特性的問題,提出創新解決方案:採用非端到端生成策略緩解數據限制,並設計專用MelodyTransformer模型,顺利获得考慮音符時值、音高等特徵實現針對性旋律生成。實驗表明,該方法在客觀指標和主觀評價上均優於現有模型,驗證了音樂專用模型架構的重要性,為歌詞配曲任務给予了新的技術思路。

鄧洋同學分享的主題是「PromptLink: Multi-template prompt learning with adversarial training for issue-commit link recovery」。現有的軟件跟蹤方法降低了任務的複雜性,但忽略了預訓練語言模型上游任務與下游連結恢復任務之間的不一致性,使得未能充分利用預訓練模型的語義信息。為了緩解這個問題,她首次引入新的範式,提出了一種基於多模板提示學習與對抗訓練的Issue-Commit連結恢複方法(PromptLink)。具體而言,顺利获得構建不同的提示模板,對預訓練模型的知識注入,從而增強模型對軟件製品的理解能力。此外,PromptLink結合對抗訓練,在數據層面引入擾動。實驗使用了六個開源項目,實驗結果表明PromptLink在issue-commit需求跟蹤任務上性能超越了SOTA方法,在六個項目上的F1值平均提升了8.61%。

苗佳哲同學分享的主題是「GarTemFormer: Temporal transformer-based for optimizing virtual garment animation」。GarTemFormer顺利获得特徵對齊和引導圖抑制噪聲,高效建模幀間依賴;將人體-服裝特徵融合,SMPL參數化模型與服裝變形關聯;顺利获得碰撞修正和損失函數確保物理合理性。實驗表明,方法在真實視頻和合成數據集上均優於現有技術,提升了服裝變形的時空連貫性與細節真實感。

韓楓同學分享的主題是「RASNet:Recurrent aggregation neural network for safe and efficient drug recommendation」。由於長期感染慢性病,患者的病情會出現周期性變化,如何基於電子病歷對此類患者建模以精準推薦用藥是一個難題。為應對這些挑戰,他提出了一種名為 RASNet 的新型藥物推薦模型。RASNet 使用循環聚合網絡來識別與患者當前健康狀況相似的歷史健康記錄。當患者的病情呈現周期性模式時,它可以過濾掉多次就診中的噪聲記錄,從而有效解決因病情反覆引入的數據噪聲問題。此外,RASNet 還引入了新穎的 DDI 損失,以確保藥物推薦的安全性和準確性。在 MIMIC-III 數據集上進行的大量實驗證明,RASNet達到了最先進的性能。

時佳樂同學分享的主題是「GrasOpen:Biometric Authentication via Reach-and-Grasp for Smart Door Acces Using Smartwatch」。他介紹了一種專為開門場景量身定製的創新生物識別認證系統GrasOpen,該系統採用帶有IMU的智能手錶來跟蹤和分析手臂運動。GrasOpen顺利获得利用伸手和抓握動作的獨特特性來應對關鍵挑戰,消除了用戶記憶複雜動作的必要性,並避免了等待面部識別等冗餘動作。最初,GrasOpen提出了一種輕量級模型,用於從日常活動中辨別開門動作。然後,GrasOpen集成了一種互補濾波器方法來捕獲開門動作中的多樣性相關特徵。這些特徵隨後顺利获得修改後的ConvBoost模型進行處理,以實現精確的用戶身份驗證。實驗結果顯示,GrasOpen在活動識別和身份認證方面的準確率分別為98.78%和98.65%。

成子惠同學分享的主題是「A Multi-View Feature-Based interpretable Deep Learning Framework for Drug-Drug Interaction Prediction」。當患者同時服用多種藥物時,藥物間相互作用(DDIs)會導致有害後果。因此,準確預測 DDI 至關重要。然而,现在的方法僅集中於單一視圖特徵,如原子視圖特徵或子結構視圖特徵,從而限制了對 DDI 預測的準確性。基於多視角特徵的可解釋性研究比較稀少。多視角特徵對於追蹤相互作用至關重要。針對這一空白,她提出了MI-DDI,一種基於多視角特徵的可解釋性深度學習框架。為了充分提取多視角特徵,她採用了消息傳遞神經網絡從RDkit生成的分子圖中學習原子特徵,同時從藥物 SMILES 中學習子結構視圖嵌入。這些原子視圖和子結構視圖特徵合併成一個整體藥物嵌入矩陣。隨後,精心設計的交互模塊不僅為理解相互作用建立了一條可行的途徑,還直接為權重矩陣的構建给予了信息,這樣就能進行精確、可解釋的相互作用預測。在BIOSNAP數據集和DrugBank數據集上的驗證表明了MI-DDI 的優越性。

本次學術報告中同學們分享了前沿的成果,展現出了紮實的學術功底與持续的科研態度。每位同學報告後,老師們針對分享內容展開深入討論,並給予細緻指導。報告結束後,評委老師給分享的同學們進行頒獎併合影。

