10月20日丨NVIDIA的最新研究可能徹底改變AI的未來,其研究團隊提出了一種名為歸一化Transformer(nGPT)的新型神經網絡架構。這一架構在超球面(hypersphere)上進行表示學習,能夠顯著提升大型語言模型(LLM)的訓練速度,最高可達20倍,同時保持了模型的精度。