2024年11月29日下午19點,k8凯发国际與人工智能學院第五十一期研究生學術論壇在崇真樓南樓A4030成功舉辦,本次論壇由2024級研究生郭馨婷,2022級研究生李爽,2022級研究生余紫薇,2023級研究生胡守婭主講,學院研究生會主辦,學院孫毅老師出席了該論壇。
郭馨婷同學分享的主題為「2024CNCC參會匯報」,介紹了由浙江大學CAD&CG國家重點實驗室主任周昆教授主持的「三維重建的盡頭是高斯」會議。會議重點介紹了「高保真虛擬數字人」技術,由中國科學技術大學的張舉勇教授進行分享,介紹了其課題組研發的基於單目RGB視頻的高保真三維人體重建算法——SelfRecon。該算法的創新之處在於,僅需一段十幾秒的目標對象自轉視頻作為輸入,便能夠精確恢復並重建對象的高保真數碼化身。
余紫薇同學分享的主題為「EDT: An EEG-based attention model for feature learning and depression recognition」。在基於深度學習的抑鬱症識別領域,腦電圖數據的頻域信息受到較少關注。她們提出了一種名為「EDT」的深度學習模型,該模型能夠從EEG數據的頻率、空間和時間域中提取特徵,並結合注意力機制和卷積神經網絡的優勢,開發了專門的頻域特徵提取模塊。實驗顯示,EDT模型在抑鬱症識別任務中準確率達到92.25 ± 4.83%,顯著超越其他模型。
李爽同學分享的主題為「Automatic code generation from GUI screenshots with vision-language models」。她們在pix2code的基礎上提出了一種端到端的GUI代碼生成框架img2code。通過在ViT輸出和GPT-2輸入之間引入交叉注意力機制來處理多模態信息融合的問題,成功地將視覺信息和代碼信息有效結合,提高了模型的性能和準確性,她們的方法在BLEU-4上提升了24%。
胡守婭同學分享的主題為「CNCC參會分享:大模型時代下的檢索增強生成(RAG)」。在CNCC2024中,郭嘉豐教授和竇志成教授分享了RAG(檢索增強生成)的最新研究進展。郭教授研究了RAG的核心問題:一是提升模型知識邊界感知能力解決何時使用RAG的問題。二是使用疊代式效用判斷框架解決優化檢索結果的問題。三是通過反事實風險控制框架解決如何提升生成結果的可靠性的問題。此外,她還分享了參會學習到的一些研究成果:包括開源RAG框架GoMate和FlashRAG工具包。