Главная страница » OpenAI представляет технологию клонирования голоса, но не будет широко распространять ее

OpenAI представляет технологию клонирования голоса, но не будет широко распространять ее

Компания OpenAI разработала технологию клонирования голоса, которая способна воссоздать чей-то голос всего по 15-секундной аудиозаписи этого человека говорящим. Однако пока что OpenAI предоставит доступ к своему Voice Engine только избранным партнерам.

OpenAI не смогла удержаться: компания разработала технологию клонирования голоса настолько хорошую, что она обязательно впечатлит и одновременно напугает пользователей. Но пока что OpenAI предоставляет систему только избранным партнерам.

Технология, названная Voice Engine, может клонировать ваш голос, просто прослушав 15-секундный клип вашей речи. Кроме того, воспроизведенный голос может передавать эмоции и естественный ритм человеческой речи, делая AI-генерируемый диалог реалистичным.

OpenAI сообщает, что впервые разработала Voice Engine в конце 2022 года для обеспечения возможности преобразования текста в речь для ChatGPT. Но вместо того, чтобы выпустить Voice Engine для публики, компания по сути решила, что общество пока не готово к этому – по крайней мере, пока что.

“Мы принимаем осторожный и обоснованный подход к более широкому выпуску из-за потенциала злоупотребления синтетическим голосом”, – написала компания в блоге, который демонстрирует несколько примеров действия Voice Engine.

Как вы можете услышать, AI-генерированная речь часто неотличима от исходного аудио. В неправильных руках технология очевидно может быть использована для создания дипфейков с целью дезинформации общественности. Но несмотря на потенциал злоупотребления, OpenAI говорит, что Voice Engine может быть полезен для общества.

В блоге говорится, что, начиная с конца прошлого года, компания начала тестировать Voice Engine “с небольшой группой доверенных партнеров”. Результаты показывают, что клонирование голоса может быть использовано в качестве помощника для чтения для школьников. Он также может действовать как переводчик, используя голос человека для разговора на нескольких разных языках.

Еще один случай использования включает предоставление технологии клонирования голоса людям, потерявшим способность говорить, подобно тому, что делает Apple. В результате OpenAI решила выпустить Voice Engine в режиме предварительного просмотра для партнеров, которые соглашаются никогда не использовать технологию в целях несанкционированного подражания.

“Партнеры также должны ясно сообщать своей аудитории, что голоса, которые они слышат, генерируются AI”, – сказала компания. OpenAI также добавила систему водяных знаков, чтобы помочь обнаружить любой AI-генерированный аудио от Voice Engine.

Тем не менее, OpenAI не гарантирует, что когда-либо широко выпустит технологию клонирования голоса. Компания говорит, что многое будет зависеть от того, как общество отреагирует на рост генеративного AI, который уже размывает границы между фикцией и реальностью.

“Мы надеемся начать диалог о ответственном развертывании синтетических голосов и о том, как общество может адаптироваться к этим новым возможностям”, – добавила компания. “На основе этих разговоров и результатов этих масштабных тестов мы сможем принять более обоснованное решение о том, стоит ли и как развертывать эту технологию в масштабах”.

0

Автор публикации

не в сети 13 часов

aiinsider

0
Комментарии: 0Публикации: 792Регистрация: 18-09-2023
Поделиться