南華大學計算機學院在人工智能權(quán)威期刊Information Fusion上發(fā)表高水平研究論文

  新湖南客戶端   2025-03-19 15:38:22

近日,南華大學計算機學院劉永彬、萬亞平團隊在計算機人工智能領(lǐng)域權(quán)威期刊Information Fusion(影響因子14.8,中國科學院一區(qū))發(fā)表了題為“DyLas: A Dynamic Label Alignment Strategy for Large-Scale Multi-Label Text Classification”的研究論文。該論文創(chuàng)新性地利用因果推斷(Causal Inference)理論體系中的因果干預(yù)與反事實技術(shù),提出了一種動態(tài)標簽對齊策略(DyLas),使得大語言模型(Large Language Models)在無需額外訓(xùn)練的情況下,自動適配大規(guī)模多標簽分類任務(wù)(Large-scale Multi-label Text Classification)中的任意標簽集。

大規(guī)模多標簽文本分類(LMTC)是自然語言處理領(lǐng)域的一項重要任務(wù),廣泛應(yīng)用于電子商務(wù)產(chǎn)品標簽、新聞分類、醫(yī)療編碼和法律文檔分析等領(lǐng)域。然而,傳統(tǒng)的監(jiān)督學習方法在處理動態(tài)標簽集時面臨巨大挑戰(zhàn),尤其是標簽集的動態(tài)變化和長尾分布問題(圖1)。現(xiàn)有的方法通常需要重新訓(xùn)練模型以適配新的標簽集,這不僅耗費大量資源,還限制了模型的靈活性和應(yīng)用范圍。

圖1 傳統(tǒng)方法與基于大語言模型方法對比圖

研究團隊利用因果推斷中的因果干預(yù)和反事實技術(shù)有效減少大語言模型輸出中的幻覺問題,通過雙重對齊和錯誤檢查機制實現(xiàn)了大語言模型在動態(tài)標簽集上的高效適配(圖2),顯著提升了大語言模型在大規(guī)模多標簽分類任務(wù)、動態(tài)標簽集合場景下的性能。

圖2 DyLas架構(gòu)示意圖

南華大學計算機學院劉永彬副教授為通訊作者,碩士生任林為第一作者,南華大學計算機學院為第一署名單位。(任林)

責編:張芷瑜

一審:張芷瑜

二審:張馬良

三審:周韜

來源:新湖南客戶端

我要問