Microsoft создала инструмент для имитации любого голоса
Для этого понадобится трёхсекундный образец речи. Отмечается, что инструмент под названием VALL-E значительно превосходит существующие системы синтеза речи.
Компания Microsoft объявила о создании инструмента для имитации любого голоса. Модель разработанного искусственного интеллекта названа VALL-E.
Чтобы скопировать голос, VALL-E потребуется его запись продолжительностью всего в три секунды. Помимо сохранения вокального тембра и эмоций говорящего, нейросеть может имитировать и «акустическое окружение» – например, будто речь звучит как при телефонном звонке. Технология основана на алгоритме EnCodec и прошла обучение на 60 тыс. часов аудиозаписей речи более чем 7 тыс. уникальных носителей английского языка.
Microsoft на GitHub предоставила несколько примеров работы VALL-E. Но в открытом доступе технологии пока нет. Компания считает, что может быть риск неправильного использования модели мошенниками – например, они могут обмануть системы идентификации личности или выдать себя за авторитетную публичную фигуру с целью ее дискредитации.
Также вам может быть интересно
Представлен самый мощный чип в мире для искусственного интеллекта
На чипе Blackwell B200 от Nvidia смогут обучить новое поколение нейросетей.
Dyson выпустила фен с защитой кожи головы
Фен Supersonic Nural запоминает контролирует воздух так, чтобы не навредить волосам: чем ближе фен, тем ниже температура.
Samsung отправила Galaxy S24 Ultra в стратосферу, чтобы показать возможности камеры
Снимки в буквальном смысле получились космическими.
Honda показала умное кресло для езды по виртуальной реальности
Компания Honda представила свое очередное инновационное средство передвижения. По официальной информации компании, такой транспорт называется PMD UNI-CUB