Meta створила «ідеальний» інструмент для генерації дипфейків Voicebox. Що про нього відомо

Компанія Марка Цукерберга Meta повідомила про те, що створила штучний інтелект Voicebox для генерування розмовного діалогу з різноманітними потенційними варіантами використання. Втім, розробники не планують робити його загальнодоступним, оскільки він «ідеальний» для створення дипфейків. Редакція MC.today переповідає подробиці.

Як повідомили в компанії, Voicebox може виконувати завдання з генерування мовлення, яким його спеціально не навчали. Програма використовує короткі аудіозаписи та текстові підказки, як і багато інших схожих мовних моделей. Але на відміну від попередників Voicebox застосовує новий підхід, щоб навчатися лише з необробленого аудіо та супровідної транскрипції. Тобто в нього немає чітко окресленого переліку навчальних даних.

У Meta заявили, що Voicebox може створювати звукові доріжки шістьма мовами: англійською, французькою, німецькою, іспанською, польською та португальською. До того ж він точніше імітує саме природне мовлення, тобто говорить так, як це роблять люди в реальному житті.

Від початку розробники планували створити інструмент, який покращив би спілкування або допоміг би створювати реалістичні діалоги, наприклад, для персонажів відеоігор. Втім, зараз вони побоюються, що Voicebox можуть використовувати для  імітації артистів, політиків та інших публічних осіб і поширення дипфейків.

Тому протестувати новий інструмент принаймні поки що не вийде. В Meta відмовилися опублікувати код програми та наголосили, що хоча й вважають можливість ділитися новими технологіями важливою для їхнього розвитку, правильний баланс між відкритістю та відповідальністю знайти ще не вдалося.

Замість випустити інструмент у функціональному стані, Meta поділилася зразками аудіо та науковою статтею, щоб допомогти колегам-дослідникам зрозуміти потенціал нової технології.

  • Нагадаємо, раніше Марк Цукерберг пообіцяв інтегрувати штучний інтелект у всі до одного продукти компанії. Також нещодавно техногігант представив інструмент MusicGen, який перетворює текст на музику. 

Нещодавні статті

Найкращий тиждень з 2021 року – вартість Ethereum зросла на третину

Другий за величиною цифровий токен Ethereum цієї п’ятниці різко зріс у ціні, збільшивши свій тижневий…

09/05/2025

«Раніше це писали копірайтери, зараз – ШІ». Бородатюк про використання ШІ в Netpeak Group

CEO Netpeak Group Артем Бородатюк поділився, як у групі впроваджують інструменти штучного інтелекту та роботу…

09/05/2025

Як застосунок tTravel перетворює досвід мандрівників на контент, що приносить пасивний дохід

Засновуючи tTravel, Олександр Буратинський та Артем Шамбальов, маючи за плечима роки дружби, подорожей та спільної…

09/05/2025

ChatGPT тепер зможе аналізувати код у GitHub. Що відомо про інтеграцію

Компанія OpenAI почала тестувати оновлення Deep Research у ChatGPT. Функція буде працювати з репозиторіями GitHub…

09/05/2025

В EPAM Systems змінюється керівництво. Що відомо про нового CEO

EPAM Systems змінює керівництво. Засновник ІТ-компанії та генеральний директор Аркадій Добкін йде з посади. Він…

09/05/2025

Поперешнюк розповів, який стартап запустив би, якби не займався «Новою поштою»

Співзасновник «Нової пошти» Володимир Поперешнюк у Школі бізнесу НП розповів, який стартап запустив би, якби…

09/05/2025