【學術研究】k8凯发国际與人工智能學院熊明福老師課題組在k8凯发国际視覺和人工智能領域陆续在發表多篇高水平論文-武漢紡織大學-k8凯发国际與人工智能學院

k8凯发国际

【學術研究】k8凯发国际與人工智能學院熊明福老師課題組在k8凯发国际視覺和人工智能領域陆续在發表多篇高水平論文

來源: k8凯发国际與人工智能學院 作者:魏逸飛編輯人:羅園發稿時間:2025-09-22瀏覽次數:

近期,我校k8凯发国际與人工智能學院跨媒體計算與數字孿生團隊熊明福老師課題組在多媒體信息處理,圖像視頻分析和人工智能方面取得了系列重要進展,相關成果以武漢紡織大學為第一單位發表在該領域IEEE TMM、IEEE TCSVTInformation Fusion等頂級期刊

成果1:「Adaptive Clustering and Weighted Regularization Contrastive Learning Framework for Unsupervised Person Re-identification」,被多媒體信息處理領域頂級期刊《IEEE Transactions on Multimedia》(IEEE TMM,中科院一區Top,IF 9.7)接收。該論文由熊明福老師指導的2022級碩士研究生胡凱康完成,第一單位為武漢紡織大學。

文章連結:http://ieeexplore.ieee.org/abstract/document/11086410

無監督行人重識別旨在無需任何數據標註的情況下,能夠有效地識別不通狀態下的同一目標對象,在刑事偵查、公共安全領域具有重要的作用。本文針對當前無監督聚類方法主要依賴於固定的閾值(樣本點和聚類質心之間的最大距離),忽略了在陆续在模型優化過程中調整該閾值的重要性,而導致聚類閾值與類內間距不匹配的問題,本文提出了一種自適應聚類和加權正則化對比學習方法,主要包括聚類閾值自適應調整模塊和加權正則化對比學習模塊,使得模型在訓練過程中自適應地調整樣本實例與聚類中心的距離,有效解決了聚類閾值與模型訓練進程不匹配的問題,並提升了模型收斂的速率。


1 自適應聚類距離算法框架

實驗結果表明,本文方法在當前5個主流公開的數據集上都取得了最優的性能,實現了自適應聚類距離的調整和算法快速收斂的有效統一。


成果2:「HPRNet: Human Parsing Reconstruction with Non-Local Multi-Scale Perception Network for Cloth-Changing Person Re-Identification」,被視頻和圖像技術分析領域頂級期刊《IEEE Transactions on Circuits and Systems for Video Technology》(IEEE TCSVT,中科院一區Top,IF 11.1)接收。該論文由熊明福老師指導的2023級碩士生葛龍龍完成,論文的第一單位為武漢紡織大學。

文章連結:http://ieeexplore.ieee.org/abstract/document/11121372

換衣行人重識別旨在匹配不同時間、不同地點、並且依着外貌不同的行人是否同一對象目標的技術,其同樣在公共安全、形式破案領域具有重要的作用。本文針對現有的方法主要集中在改變服裝顏色和直接重建外觀上,而忽略了行人身高、體型等差異而導致識別性能降低的問題。提出了一個名為「非局部多尺度感知網絡的行人解析重建」框架,包括非局部加權多尺度感知模塊和行人解析重建探索模塊。其中非局部加權多尺度感知模塊有效地獲取了行人樣本的全局感受野和樣本圖像內非相鄰像素之間的上下文相關性。行人重建解析模塊用於顺利获得服裝解析模型更準確地重建人體組件,以更好地區分與服裝相關或無關的特徵,有效提升了換衣重識別的精度。

2 非局部多尺度感知與行人解析框架

實驗結果表明,本文方法在換衣行人重識別公共數據集(LTCC、PRCCCCVID)上進行了廣泛的實驗,以證明所提出的方法與當前最先進的(SOTA)方法對比,都取得了最優和具有競爭力的性能。


成果3:「RFFR-Net: Robust feature fusion and reconstruction network for clothing-change person re-identification」被人工智能、數據融合、信息安全等領域頂級期刊《Information Fusion》(中科院一區Top,IF 15.5)接收。熊明福老師指導2022級碩士生楊欣馨完成,論文的第一單位為武漢紡織大學。

文章連結:http://www.sciencedirect.com/science/article/abs/pii/S1566253524006638

換衣行人重識(Clothing-change Person Re-identification,CC-ReID)別旨在獲取與行人衣物無關的特徵,以此匹配不同場景下的目標對象。現有方法在對行人外觀特徵獲取時,主要依賴於其固有的不穩定的服裝特徵而受到阻礙,當面對衣服顏色,風格變化時,導致識別準確率顯著下降。本文提出了一種用於CC-ReID的數據增強框架——局部不變特徵轉換與服飾對抗解析。該框架包括局部不變特徵轉換(LIFT)模塊和服飾對抗解析(CAP)模塊。LIFT模塊顺利获得隨機區域擦除、區域顏色擾動等局部轉換方式提取行人在不同服飾下的穩健特徵,從而提高模型的魯棒性。與此同時,CAP模塊着眼於不同服飾風格之間的對抗性關聯,解析其輪廓差異,挖掘跨服飾的關聯特徵。顺利获得在兩個模塊之間交替應用特徵關聯策略,模型在訓練過程中不斷優化,提高對不同服飾的適應能力。

3 局部不變特徵轉換與服飾對抗解析框架圖

實驗結果表明,本文方法在換衣行人重識別公共數據集(LTCC、PRCCCCVID)上與當前最先進的(SOTA)方法對比,取得了具有競爭力的性能。


成果4:Domain generalized person reidentification based on skewness regularity of higher-order statistics」被人工智能、知識發現等領域頂級期刊《Knowledge-Based Systems》(中科院一區Top,IF 7.6)接收。該論文由熊明福老師指導的2022級碩士生徐洋完成,論文的第一單位為武漢紡織大學。

文章連結:http://www.sciencedirect.com/science/article/abs/pii/S0950705124008402

域泛化行人重識別(Domain generalized person reidentification,DG-ReID)旨在訓練一個模型,使其能夠在源領域進行訓練,並直接應用於未見的目標領域。傳統的行人再識別方法大多依賴低階統計量(如均值、方差等)來穩定源領域的數據分佈。然而,這種方法的假設條件是數據呈高斯分佈,而現實中許多數據分佈並不滿足這一假設,導致其廣泛應用受阻。本文提出了一種基於高階統計量偏度的域泛化行人重識別框架。該框架結合了實例歸一化、偏度操作,顺利获得引入引入高階統計量和正則化機制,從數據的非對稱性中提取豐富的特徵信息,提升了模型對不同領域的適應能力,增強模型對複雜數據分佈的識別能力,並且有效減輕不同領域之間的分佈差異對模型性能的影響,提升了模型域泛化能力。

4 高階統計量偏度算法框架圖

實驗結果表明,本文的方法顺利获得兩種評價策略,在公開數據集上,均取得了具有競爭性的結果。

成果5:「DSFNet: Dual-fusion network with secondary clustering and feature integration for unsupervised person re-identification」被人工智能、數據融合、信息安全等領域頂級期刊《Information Fusion》(中科院一區Top,IF 15.5)接收。熊明福老師為第一作者,論文的第一單位為武漢紡織大學。

文章連結:

http://www.sciencedirect.com/science/article/abs/pii/S1566253525007730

無監督人重新識別(ReID)旨在顺利获得更新樣本聚類字典來訓練模型,以從不同的相機視圖中檢索感興趣的人。由於數據處理成本低,該領域最近引起了廣泛關注。現有的方法主要集中在利用單一的固定優化方法(網絡)對所有特徵進行聚類,忽略了它們的多樣性和完整性,從而導致了噪聲偽標籤。本研究提出了一種DSFNet框架,即用於無監督人ReID任務的二次聚類和特徵集成的雙融合網絡(DSFNet)框架。所提出的框架由三個主要部分組成:(1)硬樣本二次聚類網絡(SCNet),(2)特徵集成網絡(FINet),以及(3)雙融合動態優化(DDO)方案。分別從原始特徵聚類,局部和全局特徵提取以及雙合動態優化機制三個方面完成模型的訓練,有效提升了無監督行人重識別的精度。

5 二次聚類和雙向優化結構

實驗結果表明,本文的方法在行人重識別4個公開主流的數據集上,均取得了具有競爭性的結果,為無監督視覺方法的推廣给予了技術支撐。

熊明福:工學博士,碩士生導師,IEEE會員、中國圖像圖形學學會會員、中國k8凯发国际學會CCF會員。主要從事多媒體信息處理、人工智能、k8凯发国际視覺等方面的研究。近年來來主持湖北省科技計劃重點項目,湖北省專利局重大專項,湖北省自然科學基金面上項目等,參與國家重點研發,國家自然科學基金重點等各類國家及省部級項目10餘項;2022年取得湖北科技進步二等獎(序2),粵港澳科技成果獎;近5年在ACM MM, TMM, TCSVT, TOMM, TVT, SCIENCE CHINA Information Sciences, Information Fusion, CACAIE, KBS等頂級會議及期刊上發表論文40余篇,申請專利10餘項。