Genie представляет собой модель с 11 миллиардами параметров, которая обучена на более чем 200 000 часах видео людей, играющих в 2D-игры. Она умеет принимать изображения — будь то фотография, эскиз или изображение, созданное искусственным интеллектом, — и превращает их в игру, реагирующую на действия пользователя.
На данный момент Genie — это исследовательский проект, а не конечный продукт. Он был обучен на видео сверхнизкого разрешения 160 x 90 пикселей и частотой всего 10 кадров в секунду. Игры генерируются с таким же низким разрешением. Исследователи планируют улучшать и масштабировать Genie.«Я очень рад рассказать, чем занимается команда Open Endedness. Мы представляем Genie, базовую модель, обученную исключительно на основе видеороликов из Интернета, которая может генерировать бесконечное количество управляемых 2D-миров с помощью изображений», — сказал Тим Роктешель, руководитель проекта.