大语言模型

理查德·萨顿，图灵奖得主，强化学习领域的开创者，策略梯度算法与时序差分学习的核心贡献者，被业界称为"强化学习之父"。2025年9月末，这位大语言模型的重要奠基人之一在公开访谈中表达了对当前大语言模型发展路径的深刻质疑，直言类似ChatGPT的技术路线并非通往真正智能的最终答案。 ...