ИИ🔥
Самообучение моделей через синтетические задачи: перспективы и риски
Анализ идеи обучения нейросетей на синтетических задачах, сгенерированных другими моделями, и риски коллапса внутренних представлений.
В комментах возникло любопытное соображение. А что если мы возьмём чужую модель и будем при помощи неё генерировать верифицируемые задачи для написания кода. Оставим сейчас за скобками вопрос о том, как именно сделать сгенерированные задачи верифицируемые (это не очень просто), но, допустим, мы сделали такой пайплайн.
То есть:
1. Генерируем чужой моделью задачки, ответ на которые можно проверить автоматически
2. Обучаемся на этих задачках, используя RL
3. PROFIT!
Теоретически при таком подходе «ученик» может даже превзойти «учителя».
Как по мне — такой подход это «каша из топора», ЕВПОЧЯ. Ну то есть чужая модель вам тут в целом не нужна — вы можете воспользоваться предыдущей версией своей собственной модели.
Резонный контраргумент: допустим, наш способ генерации синтетики такой, что нам нужна очень «умная» модель. Если так, у этого будет одно не очень приятное последствие. Это будет значить, что вы не сможете при генерации заданий использовать достаточно большую температуру генерации, в итоге у вас получится датасет, который будет при его использовании способствовать коллапсу внутренних представлений «ученика» (ну и наследовать предубеждения вы тоже будете, скорее всего)
Кратко (AI)
Автор обсуждает концепцию обучения нейросетей на синтетических задачах, созданных другими моделями. Рассматриваются риски деградации модели, такие как коллапс внутренних представлений и наследование предубеждений при использовании высокотемпературной генерации.