Meta створила «ідеальний» інструмент для генерації дипфейків Voicebox. Що про нього відомо

Компанія Марка Цукерберга Meta повідомила про те, що створила штучний інтелект Voicebox для генерування розмовного діалогу з різноманітними потенційними варіантами використання. Втім, розробники не планують робити його загальнодоступним, оскільки він «ідеальний» для створення дипфейків. Редакція MC.today переповідає подробиці.

Як повідомили в компанії, Voicebox може виконувати завдання з генерування мовлення, яким його спеціально не навчали. Програма використовує короткі аудіозаписи та текстові підказки, як і багато інших схожих мовних моделей. Але на відміну від попередників Voicebox застосовує новий підхід, щоб навчатися лише з необробленого аудіо та супровідної транскрипції. Тобто в нього немає чітко окресленого переліку навчальних даних.

У Meta заявили, що Voicebox може створювати звукові доріжки шістьма мовами: англійською, французькою, німецькою, іспанською, польською та португальською. До того ж він точніше імітує саме природне мовлення, тобто говорить так, як це роблять люди в реальному житті.

Від початку розробники планували створити інструмент, який покращив би спілкування або допоміг би створювати реалістичні діалоги, наприклад, для персонажів відеоігор. Втім, зараз вони побоюються, що Voicebox можуть використовувати для  імітації артистів, політиків та інших публічних осіб і поширення дипфейків.

Тому протестувати новий інструмент принаймні поки що не вийде. В Meta відмовилися опублікувати код програми та наголосили, що хоча й вважають можливість ділитися новими технологіями важливою для їхнього розвитку, правильний баланс між відкритістю та відповідальністю знайти ще не вдалося.

Замість випустити інструмент у функціональному стані, Meta поділилася зразками аудіо та науковою статтею, щоб допомогти колегам-дослідникам зрозуміти потенціал нової технології.

  • Нагадаємо, раніше Марк Цукерберг пообіцяв інтегрувати штучний інтелект у всі до одного продукти компанії. Також нещодавно техногігант представив інструмент MusicGen, який перетворює текст на музику. 

Нещодавні статті

«Помилкове трактування». CEO Trustee Plus про інформацію щодо обходу обмежень НБУ

У травні Trustee Plus та Weld Money, які одні з перших в Україні привʼязали криптовалюти…

11/07/2025

«Взяв гроші, які відкладав на квартиру». Історія нової української соцмережі

«Ми почали роз’єднуватись саме тоді, коли варто було об’єднуватись. Нам бракувало універсального простору: щоб хтось…

11/07/2025

Як у «Піратах Карибського моря». CPO Prom розповів, що потрібно для онлайн-продажів

Для початку продажів на маркетплейсі не обовʼязково мати власний склад чи велику команду – достатньо…

11/07/2025

Bitget спалив 30 мільйонів BGB на $138 мільйонів. Що це означає для біржі та інвесторів?

Провідна світова криптовалютна біржа та Web3-компанія Bitget завершила спалювання 30 001 053,1 BGB, що складає 2,56% від…

11/07/2025

Що таке емоційні покупки і як їх розпізнати, використовуючи одне просте питання

Іноді емоції керують людиною навіть у плані витрати коштів. І якщо вже є розуміння цього,…

11/07/2025

Борг виявився не боргом. monobank звернувся до суду для стягнення понад 50 тис. грн з клієнта

Universal Bank (до якого належить monobank) звернувся до суду для стягнення заборгованості з клієнта розміром…

10/07/2025