為了提高研究生的學術素養,營造濃厚的學術氛圍,6月3日下午2:00,k8凯发国际與人工智能學院第六期研究生論壇在崇真南樓A北1017舉辦。本次論壇由19級研究生楊路明、陳亞東、田蜜、張伏紅、陳志恆、張君宇主講。本次活動由k8凯发国际學院研究生會學術部組織。
楊路明的報告題目為「基於時序分析的機器閱讀理解」。他提出的模型建立在預訓練模型Bert-base基礎上,採用信息交互循環機制獲取分段間的時序信息,並使用強化學習來劃分文檔。實驗結果表明,較之Bert-base模型,性能有所提升,並且超過了其他對比模型。他表示,在今後的研究工作中,如何使模型在需要從多文檔、跨文檔提取答案的情形下達到較高的性能是值得努力的方向。
陳亞東的報告題目為「服裝分類」。報告中他介紹了圖像分類網絡——EfficientNet和它的主要特點。然後介紹了目前他在服裝分類方面的工作,包括使用Deepfashion和POG製作服裝分類數據集, 以及使用vggnet、googlenet、resnet等在數據集上做的分類實驗。他分享的實踐經驗讓在座的同學都受益匪淺。
田蜜的報告題目為「基於多模態特徵融合的服裝推薦」。她講到時尚服裝推薦的兩個目標——時尚項目的優秀兼容性和用戶當前偏好的一致性。她提出了一種多模態特徵融合的時尚推薦模型,它統一了時尚兼容的建模和個性化的服裝建議,用以滿足用戶當前的需求。該模型由語義提取、專家系統和特徵融合三個模塊組成,改進了個性化的服裝建議。
張伏紅的報告題目為「NLP中的Encoder-Decoder模型」。她對Encoder-Decoder模型在應用中的兩個弊端進行了詳細的分析,同時針對其所存在的缺陷給出了通過引入attention機制的解決方案。在此之後,舉例說明了模型在現實中的應用案例和其四種衍生模型,最後舉例說明了Encoder-Decoder在具體模型中的應用。
陳志恆的報告題目為「多模態維度情感識別研究」。報告中介紹了他的具體研究內容,包括針對維度情感描述模型的優勢以及多模態情感識別方法能夠實現更高的預測值,本文利用深度學習模型分別對語音等,然後對訓練出的特徵進行決策級融合,分析效價維、喚醒維和支配維三個情感維度對應的值V、A、D以及CCC均值,對多模態維度情感識別領域展開研究。
張君宇:服裝遷移任務由《Convolutional neural network architecture for geometric matching》講起,基於TPS轉換,通過卷積神經網絡預測幾何形變參數,實現物體的形變。《Toward characteristic-preserving image-Based virtual try-on network》採用兩階段的方法,實現服裝的遷移。《Attention U-Net: learning where to look for the pancreas》空間注意力機制的合理使用,能有效提高服裝遷移任務的掩碼生成,從而提高遷移效果。由三篇論文,講解服裝遷移的多階段過程和改進策略。研究的重點在於注意力機制的使用,以及自監督訓練的評價指標設計。