По словам Брукса, DeepMind планирует разрабатывать «массивные генеративные модели, способные имитировать мир». Новая команда будет сотрудничать с группами, работающими над моделями Gemini, Veo и Genie. Gemini — это флагманская серия моделей Google для анализа изображений и генерации текста. Veo — это модель для генерации видео, а Genie — модель для имитации игр и 3D-сред.
DeepMind has ambitious plans to make massive generative models that simulate the world. I’m hiring for a new team with this mission. Come build with us!https://t.co/pqvALtAvLs https://t.co/vtwgeXl9Dl
— Tim Brooks (@_tim_brooks) January 6, 2025
Согласно описанию вакансий, команда Брукса будет работать над инструментами «интерактивной генерации в реальном времени» на основе разработанных моделей. Они также будут изучать интеграцию своих моделей с существующими мультимодальными моделями, такими как Gemini. В одном из описаний вакансий указывается, что масштабирование обучения ИИ на видео и мультимодальных данных является «критически важным путем к общему ИИ.
Многие стартапы и крупные технологические компании, включая World Labs, Decart и Odyssey, также работают над созданием мировых моделей. Они считают, что такие модели можно будет использовать для создания интерактивных медиа, таких как видеоигры и фильмы, а также для реалистичных симуляций, например, учебных сред для роботов.
Отношение творческих работников к этой технологии неоднозначно. Исследование, проведенное Animation Guild, показало, что к 2026 году более 100 тысяч рабочих мест в кино, телевидении и анимации в США могут быть затронуты ИИ. Некоторые компании, такие как Odyssey, заявляют о готовности сотрудничать с профессиональными творческими работниками, а не заменять их. Также существует вопрос авторских прав из-за обучения ИИ на контенте правообладателей.