Компания Microsoft сделала значительный шаг вперед в области искусственного интеллекта, представив свою новейшую разработку — модель VASA-1. Эта инновационная технология способна генерировать реалистичные говорящие лица из одной единственной фотографии. Лица, созданные с помощью VASA-1, неотличимы от настоящих благодаря точно отработанной мимике, движениям глаз и головы, а также синхронизированному голосу.
Особенностью модели является возможность детальной настройки движений по осям X, Y, Z, что позволяет создать естественные и выразительные анимации. Microsoft указывает, что, хотя исследование уже доступно в виде статьи, практическое применение модели будет ограничено в ближайшее время из соображений безопасности.
В настоящее время многие компании уже используют подобные технологии для создания рекламных материалов, где реальные актеры дополняются синхронизированными движениями губ и клонированными голосами с помощью ИИ. Однако VASA-1 от Microsoft открывает новые горизонты в создании полностью виртуальных персонажей, что может радикально изменить подходы к производству цифрового контента.
Ссылка на статью: Исследование модели VASA-1 от Microsoft