2025年9月12日下午2時,k8凯发国际與人工智能學院第六十期研究生學術論壇在崇真樓南樓A4030成功舉辦。本次論壇由2023級研究生葛龍龍、尹春曉、彭志宏、伏嘉豪主講,k8凯发国际與人工智能學院研究生會學術部主辦,學院阮曉莉老師出席了該論壇。
葛龍龍同學分享的主題為「HPRNet: Human Parsing Reconstruction with Non-Local Multi-Scale Perception Network for Cloth-Changing Person Re-ldentification」。換裝行人重識別是一項具有挑戰性的任務,旨在匹配不同服裝下的行人,現有方法由於過度依賴外觀重建和忽視結構上下文,往往無法保持身份關鍵線索。為分析決這個問題,他們提出了HPRNet,一個集成了非局部加權多尺度感知(NWMP)和解析重建探索(PRE)模塊的新型框架。NWMP捕獲長程空間依賴關係和非相鄰區域間豐富的上下文關聯,而PRE利用人體解析來重建語義身體部位,有效地將服裝相關特徵與身體形狀和步態等身份關鍵特徵區分開來。他們在LTCC、PRCC和CCVID基準數據集上的大量實驗表明,HPRNet顺利获得在顯著服裝變化下保持內在身份信息,達到了具有競爭力的最先進性能。

尹春曉同學分享的主題為「Leveraging Data Drift to Optimize Differential Privacy in Federated Learning via Dual-Mode Switching」。聯邦學習(FL)是一種分佈式機器學習範式,它使多個客戶端能夠協作訓練共享模型,同時將數據保存在本地。在實際部署中,FL仍然容易受到私隱攻擊,這可能導致敏感信息泄露。差分私隱(DP)在FL中被廣泛採用來緩解此類風險,但往往以降低模型性能為代價。現有的DP方法僅顺利获得考慮噪聲對模型性能的直接影響來優化私隱-效用權衡,忽略了在FL分佈式訓練過程中自然發生的顯著數據漂移。這種數據漂移本身就會降低模型性能,而額外的DP噪聲進一步加劇了這種退化,嚴重損害了模型收斂性和準確性。為解決該問題,她們提出了一種名為雙模式切換差分私隱(DSDP)的新型DP框架,該框架利用數據漂移來提高模型性能,同時保持強私隱保證。她們在四個基準非獨立同分佈數據集上的大量實驗表明,DSDP在模型準確性方面優於最先進的DP方法,包括DP-FedProx、PrivateFL和NbAFL。此外,在模型投毒和梯度泄漏攻擊下,DSDP在私隱和效用之間實現了卓越的平衡,同時表現出強大的魯棒性。

彭志宏同學分享的主題為「Physics-Aware Lighting Gaussian-Embedded-Mesh Avatars from Monocular Video」。從單目RGB圖像重建可控制、高保真的3D人體化身在實時遠程呈現和VR應用中仍然具有挑戰性。他們提出了一個增強的高斯嵌入網格(GEM)框架,將各向異性高斯基元錨定到可變形的SMPL三角形上,並使用線性混合蒙皮進行姿態驅動變形。基於物理的光照模塊分離漫反射、鏡面反射和環境反射,實現準確的視角相關着色。輕量級姿態精化網絡結合網格正則化處理非剛性運動。顺利获得光度損失、平滑損失和物理損失的聯合優化,提高了紋理保真度和姿態準確性。在ZJU-MoCap和PeopleSnapshot數據集上,他們的方法在RTX 3090上以55 FPS的速度達到了30.68 dB PSNR(新視角)和30.76 dB(新姿態),在PSNR/SSIM/LPIPS指標上優於先前的工作。

伏嘉豪同學分享的主題為「SD-GASNet: Self-Distillation Based Frequency Domain Information Gathering-and-Al Mechanism for Surface Defect Detection」。他們的論文介紹了SD-GASNet方法,一種用於表面缺陷檢測的新型網絡,該網絡解決了在複雜背景下識別大尺度變化缺陷的挑戰,特別是在有限計算資源條件下。為了處理複雜缺陷,他們提出了一個AES-FPN融合網絡,該網絡具有FIGA機制來提取和利用特徵中的多頻信息,以及CS模塊來防止特徵融合過程中的信息丟失。為分析決計算限制問題,他們採用了自蒸餾模型壓縮策略,配合新的蒸餾損失函數來提升輕量級模型的性能。實驗結果表明,SD-GASNet在準確性以及準確性與速度的平衡方面都超越了當前最先進的模型。

