將貝葉斯先驗知識提煉到人工神經網絡中以模擬快速語言學習

《Nature Communications》:Modeling rapid language learning by distilling Bayesian priors into artificial neural networks

【字體: 時間:2025年05月21日 來源:Nature Communications 14.7

編輯推薦:

  人類可通過極少經驗學習語言,現有模型難兼顧快速泛化與自然數據處理。研究者融合貝葉斯模型與神經網絡,開發 “歸納偏置提煉” 技術,使模型既能從有限數據學習形式語言模式,又能處理自然語句語法,為解釋人類學習機制提供新框架。

  
語言學習的奧秘:從貝葉斯到神經網絡的跨界之旅

人類在語言學習中展現的 “少樣本高效學習” 能力堪稱認知科學的經典謎題。無論是幼兒通過有限語句掌握語法規則,還是成人快速理解新詞含義,其背后都涉及復雜的歸納推理過程。然而,傳統計算模型在模擬這一能力時面臨兩難困境:貝葉斯模型雖能通過強歸納偏置(inductive bias)實現快速泛化,卻難以處理自然語言的復雜性;神經網絡雖擅長解析大規模自然數據,卻因歸納偏置薄弱而在少樣本場景下表現不佳。如何調和這兩種模型的優勢,成為破解 “刺激貧乏論(poverty of the stimulus)” 等核心問題的關鍵。

為突破這一瓶頸,美國耶魯大學(Yale University)與普林斯頓大學(Princeton University)的研究團隊開展了一項開創性研究,相關成果發表于《Nature Communications》。研究者提出 “歸納偏置提煉(inductive bias distillation)” 框架,通過元學習(meta-learning)技術將貝葉斯模型的歸納偏置遷移至神經網絡,構建出兼具快速學習能力與自然數據處理靈活性的 “先驗訓練神經網絡(prior-trained neural network)”。

關鍵技術方法


  1. 貝葉斯模型定義目標偏置:基于形式語言(如正則表達式定義的字符串集合)構建概率模型,通過組合 “連接(concat)”“遞歸(plus)”“同步(synchrony)” 等原語,生成語言分布以刻畫目標歸納偏置。
  2. 元學習與數據采樣:利用模型無關元學習(MAML)算法,從貝葉斯模型采樣的語言任務中訓練長短期記憶網絡(LSTM),使神經網絡通過元學習獲取貝葉斯先驗知識。
  3. 雙場景驗證:在形式語言(人工規則語言)與自然語言(860 萬詞的 CHILDES 兒童語言語料庫)中分別測試模型的少樣本學習能力與復雜數據處理能力。

研究結果


1. 形式語言的少樣本學習


在 56 種形式語言測試中,先驗訓練神經網絡僅需 10-1000 個樣本即可達到與 Yang & Piantadosi 貝葉斯模型相近的 F 分數(衡量預測字符串與真實語言的匹配度),而標準神經網絡需約 10 倍樣本量。例如,在遞歸結構(如 (AB)+ 模式)學習中,先驗訓練網絡通過提煉貝葉斯模型的 “遞歸原語” 偏置,在深度遞歸語句(如多層嵌套介詞短語)中表現出更高準確性,證明歸納偏置遷移的有效性。

2. 自然語言的復雜模式解析


在 CHILDES 語料庫的 next-word 預測任務中,先驗訓練網絡的困惑度(perplexity,越低表示預測越準確)為 19.66,優于標準神經網絡(19.75)及傳統 5-gram 模型(24.4)。進一步分析顯示,其在 “遞歸”“啟動效應(priming)” 等語言學現象上表現更優:在包含遞歸結構的最小對(minimal pairs)測試中,先驗訓練網絡對深層遞歸語句的準確率比標準網絡高 5%-10%;在啟動效應實驗中,其對重復語句的預測困惑度降幅更大,表明模型更擅長捕捉語言中的結構依賴性。

3. 偏置可解釋性與泛化性


通過消融實驗(ablation study)發現,移除 “遞歸原語” 會導致模型在形式語言遞歸任務中性能顯著下降,而移除 “同步原語” 則影響自然語言中的長距離依賴處理。這表明提煉的歸納偏置具有明確的語義對應性,且在跨領域(形式語言→自然語言)泛化中表現出一定適應性,盡管在分布外場景(如非訓練模式的句法規則)中效果趨于模糊。

結論與意義


本研究通過 “歸納偏置提煉” 成功彌合貝葉斯模型與神經網絡的鴻溝,證明連續向量表示的神經網絡可編碼離散符號系統的歸納偏置。這一成果不僅為解釋人類語言學習的 “數據效率” 與 “結構敏感性” 提供了計算模型,也為開發兼具推理能力與學習效率的人工智能系統開辟了新路徑。未來,該框架有望拓展至認知科學其他領域(如概念學習、物理推理),并推動 “神經符號計算” 的融合發展。研究揭示,人類認知的奧秘或許就藏在歸納偏置與表征靈活性的動態平衡之中 —— 這正是連接主義與符號主義在計算層面的美妙和解。

相關新聞
生物通微信公眾號
微信
新浪微博
  • 急聘職位
  • 高薪職位

知名企業招聘

熱點排行

    今日動態 | 人才市場 | 新技術專欄 | 中國科學人 | 云展臺 | BioHot | 云講堂直播 | 會展中心 | 特價專欄 | 技術快訊 | 免費試用

    版權所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    聯系信箱:

    粵ICP備09063491號

    亚洲欧美自拍偷拍,亚洲人成77777,亚洲男女自偷自拍,亚洲成年在线