Flappy Bird: делаем игру сложнее и добавляем автопилот на чистой математике
Автор клона Flappy Bird убивает два вечера на нейросеть, а решение оказывается в четырёх переменных и формуле из школьного учебника физики. Сначала он лезет в TensorFlow: обучение с подкреплением, Q-learning, попытки подружить библиотеку с браузером. Но
вся физика игры — это скорость, гравитация, труба и прыжок, которые школьная формула v = v₀ + gt считает за пару миллисекунд, поэтому её место занимает перебор вариантов, как в шахматном движке, который просчитывает последовательности прыжков и выбирает лучшую. После того как в игру добавляются движущиеся трубы, летящие шары и смена дня с ночью, на высоких уровнях бот иногда начинает зацикливаться.
Узнаем, почему предсказание ломается именно там, где до этого справлялась вся остальная математика.