國家科學評論 (NSR) 刊發社論:大語言模型和類腦通用智能
近日,中國科學院自動化研究所徐波研究員和中國科學院腦科學與智能技術卓越創新中心蒲慕明院士在《國家科學評論》(NSR)上發表社論,就以促進更加綠色的類腦通用人工智能為目標,評述如何發展腦啟發的類腦神經網絡架構、類腦學習算法及基于脈沖編碼的類腦計算軟硬件等。
大語言模型(LLM)的出現以及它們在生成任務中的驚人表現預示著通用人工智能(AGI)新時代的開始。在很大程度上,它們已經通過了經典的圖靈測試。通過與機器人結合,大模型將進一步發展出更強大的具身智能?;诖笳Z言模型的各種科學、教育和商業應用正激發人們對未來人工智能的無限遐想。然而,大語言模型存在著大量的連接參數,它們在訓練和推理階段的計算調整和并行推理往往消耗了巨大的算力成本,這個問題將限制大語言模型作為社會基礎設施的廣泛應用。
發展受腦啟發的類腦通用智能研究是解決現有問題的一種有效途徑。人類大腦是進化過程賦予的一種高效生物神經網絡,包含多樣的細胞類型和連接模式,且在人類出生后的腦發育過程中通過與環境交互進一步完善并形成高效的連接模式。即使我們不能像圖靈曾經提出的那樣制造一個“兒童機器”(Child Machine),通用人工智能也仍然可以從兩個方面向成熟的大腦學習,即神經網絡架構和類腦學習算法。
過去的人工神經網絡在一定程度上受到了生物腦網絡的啟發,例如分層和模塊化的網絡結構,以及可調權重的突觸連接。然而,大腦網絡實現高效運轉不僅僅是更多神經元和突觸的堆疊,更重要的是不同神經元類型以及功能模塊之間的選擇性連接。大腦網絡從局部模式到全局拓撲已經啟發了當今人工智能中的卷積、循環及多類Transformer等強大神經算子。當前,全腦空間轉錄組(用于識別不同的神經元亞型)和介觀連接組(用于定義特定細胞類型的連接)的研究,為進一步設計更有效的大語言模型網絡架構提供了更多的生物依據。
突觸連接往往通過短時和長時的突觸可塑性機制進行神經活動的局部調節。全局神經調質可以在許多突觸上發揮作用,以改變局部突觸可塑性的能力和特性。類腦學習算法利用大腦發現的多尺度、多形式的突觸可塑性,如時序依賴突觸可塑性、自組織可塑性傳播、神經調制元可塑性等,來決定網絡突觸權重的動態變化。類腦學習算法也可以通過梯度下降方法與可塑性學習規則相結合,使得在沿用反向傳播核心原理同時,解決很多高效計算問題。開發用于大模型權重學習的新算法需要神經科學和人工智能之間的深度融合。
同步開發新的網絡架構和學習算法將發展出新形式的類腦計算(BIC),即在神經形態芯片上實現生物啟發的脈沖神經網絡算法(SNN)。在網絡和算法層面,SNN使用具有豐富動力學和脈沖模式的生物神經元作為基本計算單元,可以更容易地采用多尺度突觸可塑性進行優化。在硬件層面,神經形態芯片需要新一代的非馮·諾依曼計算架構,通過借鑒大腦的事件驅動稀疏計算、高度并行運算以及存內計算來降低硬件功耗成本。類腦計算的一個充滿吸引力的特質是,在執行推理時,只有一小部分脈沖神經元被激活以參與稀疏加法運算。這種稀疏計算非常適合降低大型人工智能模型的訓練和推理成本。
社論認為, 除了開發綠色和可持續的低功耗人工智能這個緊迫問題,人們也越來越擔心未來通用人工智能的發展可能會以有害的方式對人類社會產生重大影響??紤]到存在著政治、社會和文化差異,實現有效的人工智能全球治理不是一個容易實現的目標,但卻是人類生存必需邁出的一步。
社論鏈接:https://doi.org/10.1093/nsr/nwad267
《國家科學評論》刊發社論