Nvidia (NVDA-US) 正在顛覆AI訓練技術,其最新推出的歸一化 Transformer 架構 nGPT,不僅大幅加速語言模型訓練,還可能徹底改變AI行業的競爭格局。
根據Nvidia研究團隊的數據,nGPT 能將訓練步驟減少至4至20倍,具體取決於序列長度。在處理較長上下文時,這種增速更為顯著,對8k上下文的訓練速度提升甚至達到20倍。
nGPT 的創新核心在於對神經網路架構的重新設計,所有向量都進行歸一化處理,使得輸入標記在超球體表面移動,並通過每一層進行位移預測。
這一架構的突破性設計不僅提高了學習效率,還維持了模型的精確度,讓語言模型的發展邁向新里程碑。這項技術不僅僅是訓練速度的提升,其影響深遠。
對於未來的大型語言模型和AI應用的發展來說,nGPT 有望成為關鍵推手,縮短開發週期,並為企業節省大量運算資源成本。該技術可能為金融科技、智能客服以及其他對快速數據處理需求高的行業,提供更加高效的解決方案,讓AI的實用性和普及度進一步提升。
透過 nGPT 的突破,Nvidia 展現了引領 AI 技術前沿的實力,其對未來技術趨勢的影響值得關注。