Полагаю сколько бы она не играла сама с собой она никогда не выиграет против этих простых приемов пока ей их не покажут. Просто потому что сама она их не придумает а кнутом и пряником будет такая же нейросеть которая аналогично этих приемов не знает. Думаю это математически доказуемо.
Нет, это фундаментально неправильно.
Подобные сети проигрывают неожиданным подходам, так как у них зияющие дыры в информации, которой они обладают касательно подобного уровня игры.
Если профессионала кинуть против упоротых нубов, даже он может совершать ошибки против дуболобных тактик, к которым он просто не привык. Особенно это заметно в менее стратегических играх, например в файтингах.
Разница между человеком и нейронкой тут в том, что человек может быстро адаптироваться, а нейронка - нет. Вернее может, но это статистически нереалистично.
Шанс того, что нейронка наткнется на подобные "тактики" при игре с самой собой тоже не нулевые и тоже нереалистичные. Потому и учат "на чём-то".
Но это не значит, что нейронке нужно "показать", что делать с подобными тактиками. Ей нужно показать, что эти тактики есть и дальше отпустить практиковаться - решение на них найдет она сама.
А кнутом и пряником всегда может быть просто победа и поражение - это самая база. Всё остальное используется чисто для того, чтобы уменьшить количество мусорных забегов.
новое онож не придумано
Как раз наоборот, нейронки постоянно придумывают новое.
Про Дотовского бота про как раз и говорили, что он играл показательно не так, как играют люди. И что некоторые тактики от него вроде как были переняты игроками.
И да, это достигается "перебором", но так и люди это достигают "перебором". Начиная от перебора известных абстрагированных "действий" и завершая перебором нажатия на кнопки и кликанья мыши.
Всё то же самое справедливо и для нейронки. Уровень абстрактности просто решает необходимое количество симуляций для достижения сколько-нибудь значимого результата.