《Scientific Reports》:Graph-enhanced implicit aspect-level sentiment analysis based on multi-prompt fusion
編輯推薦:
針對隱式方面級情感分析中語義理解難、短文本特征少等挑戰,研究人員提出圖增強多提示融合生成模型。結合 T5 與圖神經網絡(GNN),設計索引生成任務及差異化損失函數。在 RestaurantACOS 和 LaptopACOS 數據集上 F1 值提升 1.99% 和 1.83%,為情感分析提供新方法。
在海量文本數據的情感挖掘中,傳統情感分析僅能判斷整體極性(如正、負、中性),難以深入解析細粒度情感要素。而方面級情感分析(ABSA)雖能提取特定對象的情感元素(如方面詞、觀點詞、類別、情感極性),但面對大量不含顯式情感詞的隱式表達時,模型常因語義推理困難、上下文理解不足而表現不佳。例如 “服務態度真差” 需推斷隱式方面 “服務”,“進門被香氣吸引” 需通過隱喻識別 “環境氣味” 的積極情感,這類場景對模型的語義捕捉和隱含信息挖掘能力提出了更高要求。
為突破隱式方面級情感分析的瓶頸,大連工業大學的研究人員開展了相關研究。他們提出一種基于多提示融合的圖增強生成模型,旨在通過整合多維度語義信息與圖結構依賴關系,提升模型對隱式情感的理解和生成能力。該研究成果發表在《Scientific Reports》上,為隱式情感分析領域提供了新的解決思路。
研究人員主要采用了以下關鍵技術方法:
- 生成模型架構:以 T5(Text-to-Text Transfer Transformer)為基礎,構建端到端的生成模型,將方面詞和觀點詞提取轉化為索引生成任務,通過預測文本中字符的起始和結束索引定位情感元素,減少生成空間復雜度。
- 圖神經網絡(GNN)融合:引入注意力圖卷積網絡(AttentionGCN),基于詞間依賴關系構建圖結構,捕捉文本中長距離依賴和復雜語義關系,與 T5 編碼器輸出進行門控融合,增強上下文理解。
- 多提示融合策略:設計多種提示順序(如 [A][C][O][S] 的不同排列組合),通過生成不同順序的情感元組并采用多數投票機制聚合結果,緩解單一提示的不完整性和預測誤差累積問題。
- 差異化損失函數:在交叉熵損失基礎上,針對情感類別差異設計權重,對正負情感誤分類施加更高懲罰,提升模型對隱式情感極性的判別能力。
實驗結果與結論
1. 模型性能驗證
在標準數據集 RestaurantACOS 和 LaptopACOS 上,該模型較現有先進模型(SOTA)分別提升 F1 值 1.99% 和 1.83%。消融實驗表明,多提示融合、GNN、索引生成和差異化損失函數均對性能提升有顯著貢獻,其中 GNN 模塊使模型在捕捉長距離語義依賴時更精準,多提示策略則通過多樣性輸入增強了預測穩定性。
2. 低資源場景表現
在僅使用 1%-20% 訓練數據的低資源場景下,模型初期因 GNN 參數較多導致性能略遜于部分基線模型,但當數據量超過 5% 后,其利用上下文和圖結構信息的優勢逐漸顯現,F1 值反超并持續提升,驗證了模型在數據有限時的泛化能力。
3. 錯誤類型分析
通過對 RestaurantACOS 數據集的錯誤樣本分析,發現主要誤差來源包括隱式方面識別錯誤(17.5%)、情感極性誤分類(12.0%)、方面 - 觀點錯位(20.0%)及復雜句子中多方面提取不完整(33.3%)。這提示模型在處理隱喻、否定和長距離依賴等復雜語義時仍有優化空間。
研究結論與意義
該研究提出的圖增強多提示融合模型,通過生成式框架與圖結構建模的結合,有效提升了隱式方面級情感分析的準確性和魯棒性。多提示策略與差異化損失函數的設計,分別從輸入多樣性和損失優化角度緩解了傳統方法的局限性,尤其在低資源場景下展現出更強的適應性。實驗結果表明,模型不僅適用于隱式情感分析,對顯式場景亦有提升,為電商評論分析、客戶反饋挖掘等實際應用提供了更高效的解決方案。
盡管模型在復雜語義處理上仍存在不足,但其模塊化架構為后續研究提供了擴展方向,例如引入外部知識圖譜、探索跨領域遷移學習等。該工作進一步推動了情感分析技術向細粒度、智能化方向發展,對自然語言處理領域的理論研究與實際應用均具有重要參考價值。