Рубріки: Інфопривід

Навіть емоції й тон. ШІ від Microsoft може імітувати будь-чий голос по трьохсекундному зразку

Корпорація Microsoft розробила нову модель штучного інтелекту для перетворення тексту в мовлення під назвою VALL-E. ШІ може імітувати голос людини із 3-секундного зразка. Про це з посиланням на ArsTechnica пише MC.today.

Зазначається, що VALL-E розпізнає голос та на його основі синтезує аудіо. Створений звук імітує не лише тембр голосу людини, а і її емоційний тон і акустику кімнати.

Модель ШІ навчали на 60 тис. годин аудіозаписів мовлення понад 7 тис. людей, які розмовляють англійською. Для цього використали аудіотеку Meta LibriLight. 

Для імітації голосу потрібен трьохсекундний зразок мовлення людини, а також текст, який треба перетворити на аудіоформат. Голос, який VALL-E намагається імітувати, має бути близьким до голосу з навчальних зразків. Тоді ШІ використовує навчальні дані, щоб зробити висновок, як би звучав голос людини при озвучуванні вказаного тексту.

Microsoft не надали код VALL-E, тому не можна самостійно перевірити роботу ШІ. Це пов’язано з тим, що підроблений голос людини можна використати в незаконних цілях. Наприклад, зловмисники можуть підробити голосову ідентифікацію або видати себе за конкретного мовця.

Хоча корпорація не опублікувала код, на GitHub є результати роботи моделі ШІ. З ними ви можете ознайомитися за посиланням. Спойлер: деякі голоси звучать дуже реалістично, а деякі навпаки – ні, відразу помітно, що це комп’ютерний голос. Також VALL-E вдалось добре імітувати інтонацію мовця, а також акустику приміщення.

Раніше ми розповідали про нейромережу, яка генерує музику з тексту. На відміну від розробки Microsoft, «музичною» нейромережею може скористатися кожен охочий

Нещодавні статті

Genesis Academy запускає безплатний онлайн-курс для ШІ-креаторів. Як долучитись

Genesis Academy запускає безплатний освітній проєкт для ШІ-креаторів. Вони навчаться створювати сценарії та креативи за…

30/05/2025

Ліміти на карткові перекази ще знизяться. Що потрібно знати українцям про зміни з 1 червня

З 1 червня в Україні посилюються обмеження на карткові перекази коштів та через реквізити IBAN.…

30/05/2025

Штучний інтелект для HR: загроза професії або крок до її еволюції? Колонка за підсумками «Своє.IT»

Майбутнє HR виглядає як симбіоз технологій та людяності. Процеси найму дедалі більше рухаються у бік…

30/05/2025

Програміст MacPaw запустив власний застосунок. Як працює Huusion

Senior Research Engineer в українській MacPaw Євгеній Петелієв запустив фоторедактор Huusion. Він зазначив, що застосунок…

30/05/2025

«Подекуди може йтися навіть про зменшення». Як можуть змінитися податки після вступу до ЄС – Гетманцев

Голова комітету ВРУ з питань фінансів, податкової та митної політики Данило Гетманцев розповів, як можуть…

30/05/2025

Бар’єр для входу високий. CEO Genesis розповів, що потрібно для початку власного ІТ-бізнесу

Співзасновник і CEO Genesis Володимир Многолєтній розповів, що потрібно для того, аби почати власну справу…

30/05/2025