Саттон, «отец» метода усиленного обучения: большие языковые модели — не путь к универсальному искусственному интеллекту
Ричард Саттон, лауреат премии Тьюринга, пионер в области обучения с подкреплением, один из основных разработчиков алгоритма стратегического градиента и метода временного дифференциального обучения, известен в отрасли как «отец обучения с подкреплением». В конце сентября 2025 года этот важный пионер в области крупных языковых моделей в публичном интервью выразил глубокие сомнения относительно текущего пути развития крупных языковых моделей, прямо заявив, что технологический подход, подобный ChatGPT, не является окончательным ответом на пути к подлинному интеллекту. ...