OpenAI представила Voice Engine — ИИ-инструмент, который способен клонировать голос человека по 15-секундном семплу

И как теперь бороться с телефонными мошенниками?

Компания OpenAI представила инновационный инструмент под названием Voice Engine, позволяющий клонировать голос человека по короткому аудиосемплу продолжительностью всего 15 секунд. Эта технология способна генерировать естественно звучащий результат, охватывая палитру эмоциональных оттенков и подражая речевым особенностям оригинала.

open_ai_voice_engine.jpg

Система Voice Engine, разработанная на базе предыдущей работы OpenAI в области преобразования текста в речь, внедрена в текущее API для чтения текста вслух. Проект получил широкую обратную связь и находится в стадии активного тестирования со стороны партнёрских организаций для исключения возможного злоупотребления и оценки потенциальных рисков.

Разработчики считают, что Voice Engine найдет своё применение в ряде направлений, например:

  • 1. Образовательные технологии: компания Age of Learning использует этот инструмент для озвучивания образовательного контента.
  • 2. Аудиовизуализация: HeyGen, платформа визуального повествования, внедряет Voice Engine для создания аватаров, что позволяет более точно озвучивать контент для корпоративных клиентов.
  • 3. Поддержка людей с нарушениями речи: приложение Livox предоставляет уникальные голоса для людей, испытывающих сложности с коммуникацией.
  • 4. Восстановление речевых функций: Институт нейронаук Нормана Принца (NPNI) внедрил Voice Engine в программу помощи пациентам с речевыми проблемами, вызванными заболеваниями.

Тем не менее, OpenAI учитывает опасения, связанные с потенциальной злоупотреблением технологии клонирования голоса, особенно учитывая повышенный риск использования подобных инноваций для мошенничества и дезинформации. По этой причине компания внедрила строгие правила использования Voice Engine, которые включают обязательное информирование аудитории о том, что голос сгенерирован искусственно, и предупреждают о запрете на использование чужого голоса без согласия.

Как дополнение к проекту Voice Engine, OpenAI заявила о партнёрстве с Microsoft для создания суперкомпьютера, предназначенного для задач, связанных с искусственным интеллектом. Этот проект, получивший название «Звёздные врата», представляет собой значительное инвестиционное вложение обеих компаний.

В отношении стоимости, предварительная информация от OpenAI сигнализирует о том, что Voice Engine может стать доступным решением по сравнению с аналогами, предложив актуальное соотношение цена-качество на рынке синтезированных голосов. Точная дата выхода Voice Engine пока не определена.

©  overclockers.ru