Meta створила «ідеальний» інструмент для генерації дипфейків Voicebox. Що про нього відомо

Компанія Марка Цукерберга Meta повідомила про те, що створила штучний інтелект Voicebox для генерування розмовного діалогу з різноманітними потенційними варіантами використання. Втім, розробники не планують робити його загальнодоступним, оскільки він «ідеальний» для створення дипфейків. Редакція MC.today переповідає подробиці.

Як повідомили в компанії, Voicebox може виконувати завдання з генерування мовлення, яким його спеціально не навчали. Програма використовує короткі аудіозаписи та текстові підказки, як і багато інших схожих мовних моделей. Але на відміну від попередників Voicebox застосовує новий підхід, щоб навчатися лише з необробленого аудіо та супровідної транскрипції. Тобто в нього немає чітко окресленого переліку навчальних даних.

У Meta заявили, що Voicebox може створювати звукові доріжки шістьма мовами: англійською, французькою, німецькою, іспанською, польською та португальською. До того ж він точніше імітує саме природне мовлення, тобто говорить так, як це роблять люди в реальному житті.

Від початку розробники планували створити інструмент, який покращив би спілкування або допоміг би створювати реалістичні діалоги, наприклад, для персонажів відеоігор. Втім, зараз вони побоюються, що Voicebox можуть використовувати для  імітації артистів, політиків та інших публічних осіб і поширення дипфейків.

Тому протестувати новий інструмент принаймні поки що не вийде. В Meta відмовилися опублікувати код програми та наголосили, що хоча й вважають можливість ділитися новими технологіями важливою для їхнього розвитку, правильний баланс між відкритістю та відповідальністю знайти ще не вдалося.

Замість випустити інструмент у функціональному стані, Meta поділилася зразками аудіо та науковою статтею, щоб допомогти колегам-дослідникам зрозуміти потенціал нової технології.

  • Нагадаємо, раніше Марк Цукерберг пообіцяв інтегрувати штучний інтелект у всі до одного продукти компанії. Також нещодавно техногігант представив інструмент MusicGen, який перетворює текст на музику. 

Нещодавні статті

Щоб ШІ не зіпсував карʼєру. Як компанії можуть розпізнати ШІ в тестовому і що робити кандидату

Український айтівець розповів про пошук роботи в реаліях ШІ. Так, компанія йому відмовила через підозру…

20/06/2025

Навіщо потрібен єдиний реєстр рахунків і що це змінить для українців – банкір

Міністр фінансів Сергій Марченко під час конференції НБУ назвав переваги Реєстру рахунків та індивідуальних банківських…

20/06/2025

Хто має право на компенсацію за невикористану відпустку і що робити, якщо в цьому відмовляють – адвокат

Багато людей опинилися в незручній ситуації: з одного боку, вони накопичили невикористані дні відпустки, з…

20/06/2025

Маркетинг та веброзробка для девелоперів нерухомості: як запуститися в 2 рази швидше? Кейс Ana Marauli Agency та Quadroom

Ринок нерухомості стає все більш конкурентним. Розвиток нового комплексу – це не лише якісне будівництво,…

20/06/2025

Якщо ви ФОП. Що мають вказувати покупці та клієнти у призначеннях платежів – експерт 

Податковий консультант Михайло Смокович розповів про базові правила й вимоги щодо заповнення призначення платежу для…

19/06/2025

Оподаткування доходів з цифрових платформ – навіщо це і що зміниться для продавців. Пояснення адвоката

Голова податкового комітету ВРУ Данило Гетманцев знову звернув увагу на так званий «податок на OLX»…

19/06/2025