Корпорація Microsoft розробила нову модель штучного інтелекту для перетворення тексту в мовлення під назвою VALL-E. ШІ може імітувати голос людини із 3-секундного зразка. Про це з посиланням на ArsTechnica пише MC.today.
Зазначається, що VALL-E розпізнає голос та на його основі синтезує аудіо. Створений звук імітує не лише тембр голосу людини, а і її емоційний тон і акустику кімнати.
Модель ШІ навчали на 60 тис. годин аудіозаписів мовлення понад 7 тис. людей, які розмовляють англійською. Для цього використали аудіотеку Meta LibriLight.
Для імітації голосу потрібен трьохсекундний зразок мовлення людини, а також текст, який треба перетворити на аудіоформат. Голос, який VALL-E намагається імітувати, має бути близьким до голосу з навчальних зразків. Тоді ШІ використовує навчальні дані, щоб зробити висновок, як би звучав голос людини при озвучуванні вказаного тексту.
Microsoft не надали код VALL-E, тому не можна самостійно перевірити роботу ШІ. Це пов’язано з тим, що підроблений голос людини можна використати в незаконних цілях. Наприклад, зловмисники можуть підробити голосову ідентифікацію або видати себе за конкретного мовця.
Хоча корпорація не опублікувала код, на GitHub є результати роботи моделі ШІ. З ними ви можете ознайомитися за посиланням. Спойлер: деякі голоси звучать дуже реалістично, а деякі навпаки – ні, відразу помітно, що це комп’ютерний голос. Також VALL-E вдалось добре імітувати інтонацію мовця, а також акустику приміщення.
Раніше ми розповідали про нейромережу, яка генерує музику з тексту. На відміну від розробки Microsoft, «музичною» нейромережею може скористатися кожен охочий
Другий за величиною цифровий токен Ethereum цієї п’ятниці різко зріс у ціні, збільшивши свій тижневий…
CEO Netpeak Group Артем Бородатюк поділився, як у групі впроваджують інструменти штучного інтелекту та роботу…
Засновуючи tTravel, Олександр Буратинський та Артем Шамбальов, маючи за плечима роки дружби, подорожей та спільної…
Компанія OpenAI почала тестувати оновлення Deep Research у ChatGPT. Функція буде працювати з репозиторіями GitHub…
EPAM Systems змінює керівництво. Засновник ІТ-компанії та генеральний директор Аркадій Добкін йде з посади. Він…
Співзасновник «Нової пошти» Володимир Поперешнюк у Школі бізнесу НП розповів, який стартап запустив би, якби…