Рубріки: Інфопривід

Навіть емоції й тон. ШІ від Microsoft може імітувати будь-чий голос по трьохсекундному зразку

Корпорація Microsoft розробила нову модель штучного інтелекту для перетворення тексту в мовлення під назвою VALL-E. ШІ може імітувати голос людини із 3-секундного зразка. Про це з посиланням на ArsTechnica пише MC.today.

Зазначається, що VALL-E розпізнає голос та на його основі синтезує аудіо. Створений звук імітує не лише тембр голосу людини, а і її емоційний тон і акустику кімнати.

Модель ШІ навчали на 60 тис. годин аудіозаписів мовлення понад 7 тис. людей, які розмовляють англійською. Для цього використали аудіотеку Meta LibriLight. 

Для імітації голосу потрібен трьохсекундний зразок мовлення людини, а також текст, який треба перетворити на аудіоформат. Голос, який VALL-E намагається імітувати, має бути близьким до голосу з навчальних зразків. Тоді ШІ використовує навчальні дані, щоб зробити висновок, як би звучав голос людини при озвучуванні вказаного тексту.

Microsoft не надали код VALL-E, тому не можна самостійно перевірити роботу ШІ. Це пов’язано з тим, що підроблений голос людини можна використати в незаконних цілях. Наприклад, зловмисники можуть підробити голосову ідентифікацію або видати себе за конкретного мовця.

Онлайн-курс "Excel та Power BI для аналізу даних" від robot_dreams.
Навчіться самостійно аналізувати й візуалізувати дані, знаходити зв’язки, розуміти кожен аспект отриманої інформації та перетворювати її на ефективні рішення.
Детальніше про курс

Хоча корпорація не опублікувала код, на GitHub є результати роботи моделі ШІ. З ними ви можете ознайомитися за посиланням. Спойлер: деякі голоси звучать дуже реалістично, а деякі навпаки – ні, відразу помітно, що це комп’ютерний голос. Також VALL-E вдалось добре імітувати інтонацію мовця, а також акустику приміщення.

Раніше ми розповідали про нейромережу, яка генерує музику з тексту. На відміну від розробки Microsoft, «музичною» нейромережею може скористатися кожен охочий

Нещодавні статті

У ВР розглядають моделі економічного бронювання. Які працівники можуть бути заброньовані

Парламент розглядає дві моделі економічного бронювання від мобілізації. Одна з них може бути запроваджена, поділився…

08/05/2024

Вражаючий футуризм: Wynn оприлюднив концепт-арт майбутнього курорту Wynn Al Marjan

На сайті оператора казино та готелів Wynn зʼявився перший концепт-арт майбутнього курорту Wynn Al Marjan,…

08/05/2024

«Кобра Кай» 6 сезон: дата виходу, актори, сюжет і трейлер серіалу Netflix про карате

Коли в 1984 році на екрани вийшла культова спортивна драма «Малюк-каратист», це надихнуло тисячі підлітків…

08/05/2024

Техноритейлер «Фокстрот» долучився до програми «єВідновлення». Що можна придбати

Українська мережа електроніки та побутової техніки «Фокстрот» долучилась до програми «єВідновлення». Тепер її клієнти зможуть…

08/05/2024

У Великій Британії встановлюють нові ліміти ставок у слотах. Хто і скільки зможе ставити

Восени цього року у Великій Британії почнуть діяти обмеження суми ставок у слотах – до…

08/05/2024

Повістка, контакти й не тільки. Які дані будуть у реєстрі «Оберіг» і чи можна їх змінити

Заступниця міністра оборони з питань цифровізації Катерина Черногоренко повідомила, як у реєстрі «Оберіг» відображатиметься статус…

08/05/2024