Розробники Stable Diffusion представили штучний інтелект, що перетворює текст на музику

Компанія Stability AI, яка стала відомою після релізу популярного генератора зображень зі штучним інтелектом Stable Diffusion, випустила новий ШІ-продукт Stable Audio. Це платформа для перетворення тексту в аудіо. Редакція MC.today переповідає подробиці з посиланням на сайт компанії.

Stable Audio використовує дифузію, або ту саму модель штучного інтелекту, яка працює на більш популярній платформі для створення зображень Stable Diffusion. Але її навчали не на картинках, а на великому масиві аудіозаписів.

Більшість схожих моделей штучного інтелекту, як правило, генерують доволі короткі ролики з фіксованою довжиною. Це не дуже зручно для творців, наприклад, музичних треків, адже їхня тривалість може бути різною.

Stability AI знайшла спосіб обійти подібні обмеження, а налаштування платформи тепер дозволяють користувачам Stable Audio мати більше контролю над тим, наскільки довгою буде композиція.

Курс English For Tech course від Enlgish4IT.
Лише 7 тижнів по 20-30 хвилин щоденного навчання допоможуть вам подолати комунікативні бар'єри. Отримайте знижку 10% за промокодом ITCENG.
Дійзнайтеся більше

«Ми продовжуємо вдосконалювати наші архітектури моделей, набори даних і протоколи навчання, щоби покращити якість відтворення, керованість, швидкість висновку та тривалість треку», – повідомили в компанії.

Для тренування моделі використали понад 800 тис. аудіофайлів з музикою, звуковими ефектами, інструментальними композиціями та текстові метадані від компанії AudioSparx, що ліцензує фондову музику. Stability AI стверджує, що має дозвіл на використання матеріалів, захищених авторським правом. Навчальний набір містить понад 19,5 тис. годин звуків.

У безплатній версії Stable Audio можна створювати до 20 треків на місяць тривалістю до 45 секунд. Підписка професійного рівня коштує $11,99 на місяць. За ці гроші можна створити до 500 90-секундних треків. У тарифі Enterprise ціну формують відповідно до потреб користувачів.

В Stability AI вважають, що нову платформу використовуватимуть насамперед для створення фонової музики для подкастів або відео.

  • Раніше компанія повідомила про плани розширювати свою присутність у галузі штучного інтелекту, зокрема для створення аудіо та відеоконтенту. Цікаво, що попри це очільник Stability AI Емад Мостак передрік зникнення програмістів-людей через ШІ та заявляв, що ця технологія підірве світову економіку сильніше за пандемію COVID-19.

Нещодавні статті

В Україні вже майже 7 тис. осіб обмежили себе від участі в азартних іграх – КРАІЛ

Від початку дії Реєстру осіб, яким обмежено доступ до гральних закладів та/або участь в азартних…

06/05/2024

Мережа готелів представила ШІ-блогерку Sena. Як вона виглядає та чим займається

Фото пляжу, біля пальм і з літака – звичний набір для тревел-блогерів. Однак не в…

06/05/2024

Як у Могилянці на місці старого буфету з’явився grky espresso bar – Олег Асташев

Упродовж 2023 року навіть попри повномасштабне вторгнення мережа кав’ярень grky espresso bar збільшилась на 22…

06/05/2024

Небачена удача: жінка виграла два джекпоти по мільйону доларів з різницею у два місяці

Крістін Вілсон зі штату Массачусетс двічі впродовж двох місяців виграла у лотерею по мільйону доларів.…

06/05/2024

Коли і де дивитися виступ України на «Євробаченні-2024»: список платформ і каналів

У вівторок, 7 травня, стартує міжнародний пісенний конкурс «Євробачення-2024» у Мальме (Швеція). Ділимось платформами, де…

06/05/2024

Програміст намагався виїхати з України за італійським паспортом. Що вирішив суд

Український програміст намагався виїхати з країни за італійським паспортом. Щоправда, спроба зазнала невдачі і справа…

06/05/2024