7 u V5 s& i* K: g这一看似矛盾的现象,其关键在于“回归”所指向的目标截然不同。控制系统的回归目标是静态且唯一的,它像一个强大的引力中心,将所有系统状态都拉向它。相比之下,大语言模型的回归目标则是动态且局部的。当模型生成一个新词后,这个词立刻成为新的上下文的一部分,从而彻底改变了下一次回归计算的起点和目标。模型并非要回到某个初始状态,而是在不断变化的语境中,持续地向下一个最符合逻辑和概率的“瞬时目标”前进。 $ W s; t5 F. b$ M+ \+ o7 }+ @ a- s6 J9 c# A' Z2 Y. O
这好比两种不同的旅程:自动控制系统是一次目标明确的返航,其所有航线都为了最终停泊在唯一的母港;而大语言模型则是一场永不回头的探索式航行,在每一个航点,它都会根据当前的水文气象(上下文)计算出最佳的下一段航线,从而驶向一个全新的、未知的海域。因此,大模型开放式的生成能力与其回归式的底层设计并非矛盾,而是因果相成的统一体。正是通过在微观层面每一次严谨的、以动态目标为导向的局部回归,才最终在宏观层面涌现出了那种强大的、能够探索无限语言空间的开放式创造力。1 R# r8 y% A( G( u8 }( Y