Sutton, el padre del aprendizaje reforzado: los grandes modelos de lenguaje no son el camino hacia la inteligencia artificial general

Richard Sutton, ganador del Premio Turing, pionero en el campo del aprendizaje por refuerzo y colaborador clave en el desarrollo de los algoritmos de gradiente estratégico y el aprendizaje por diferencias temporales, es conocido en el sector como el «padre del aprendizaje por refuerzo». A finales de septiembre de 2025, este importante artífice de los grandes modelos de lenguaje expresó en una entrevista pública sus profundas dudas sobre la trayectoria actual de desarrollo de dichos modelos, afirmando sin rodeos que la línea tecnológica seguida por ChatGPT y similares no es la respuesta definitiva para alcanzar la verdadera inteligencia. ...

20 de octubre de 2025 · 5 min · 977 palabras