OpenAI запустила сайт для озвучування текстів – що за можливості він пропонує та як спробувати

Компанія OpenAI запустила сайт, який дає можливість безплатно озвучувати тексти. Ба більше – система дозволяє обирати з-поміж низки налаштувань те, як звучатиме голос, який робитиме начитування.

OpenAI повідомила про запуск нових генеративних аудіомоделей у своєму блозі. Йдеться про gpt-4o-transcribe і gpt-4o-mini-transcribe, які забезпечують реалістичніше звучання мовлення і водночас є керованішими за моделі синтезу мовлення попереднього покоління. Розробники можуть інструктувати їх про те, як говорити речі природною мовою – наприклад, «говорити як божевільний учений» або «використовувати спокійний голос, як учитель».

Наприклад, ось витриманий голос у «справжньому кримінальному стилі»:

А це зразок жіночого «професійного» голосу:

Читайте також: ШІ ближче, ніж ми думаємо? OpenAI інтегрує ChatGPT в робочі простори Google Drive та Slack

У компанії стверджують, що нові генеративні моделі припускаються меншої кількості помилок та можуть відтворювати мовлення навіть за так званих складних умов. Наприклад, на різній швидкості, з акцентом або ж в умовах галасливого середовища.

«Моделі базуються на архітектурах GPT‑4o та GPT‑4o-mini та проходять широку попередню підготовку на основі спеціалізованих аудіоцентричних наборів даних, які були критично важливими для оптимізації їхньої продуктивності. Цей підхід забезпечує глибше розуміння нюансів мовлення та забезпечує виняткову ефективність у завданнях, пов’язаних зі звуком», – йдеться у блозі.

Нові gpt-4o-transcribe і gpt-4o-mini-transcribe створили для того, щоби покращити досвід взаємодії користувачів із ШІ та зробити озвучування наближенішим до реального спілкування. Їх можна також інтегрувати в різні застосунки й сервіси.

Розробники можуть користуватися gpt-4o-transcribe і gpt-4o-mini-transcribe через API, але спробувати можуть усі охочі – для цього достатньо перейти на сайт openai.fm.

Скриншот: openai.fm

«Ми плануємо продовжувати інвестувати в покращення інтелекту і точності наших аудіомоделей і досліджувати способи, які дозволять розробникам додавати також власні голоси для створення ще персоналізованішого досвіду відповідно до наших стандартів безпеки», – підсумували в OpenAI. 

А тут ви можете прослухати, як звучить останній абзац голосом «божевільного вченого» в режимі Ballad.

  • Раніше ми переповідали, що OpenAI представила нову функцію Deep Research. Кому вона знадобиться та як скористатись – можна прочитати тут.

Нещодавні статті

Провідні ІТ-компанії об’єдналися для створення AI-екосистеми в Україні. Висновки першої стратегічної сесії

1 липня відбулася перша стратегічна сесія AI-комітету Асоціації IT Ukraine – нової експертної платформи, яка…

15/07/2025

Борг з нічого? Чому виникає технічний овердрафт і як цього уникати – пояснення експерта

Що таке технічний, або несанкціонований, овердрафт, чому він може виникнути на вашому рахунку (навіть коли…

15/07/2025

Як створити стабільний підробіток – 4 поради щодо ідеї та розширення

Багато працівників займаються не лише своєю роботою, а й підробітком. І, звісно, кожен хоче, аби…

14/07/2025

Куди інвестувати $10 тис. в Україні для отримання стабільного пасивного доходу – експертка

Якщо у вас є $10 тисяч, інвестиційні горизонти суттєво розширюються. Це вже не просто «перший…

14/07/2025

Для ФОПів ввели нову звітність – які терміни й кого це стосується

Для деяких категорій ФОП ввели нову статистичну звітність, яку потрібно подати до Управління статистики. Переповідаємо,…

14/07/2025

Фінансова безпека для підлітків: 5 поширених шахрайських схем і як від них уберегтися

Сучасні підлітки добре вправляються з технологіями, створюють власні стартапи і вчаться поводитись із грошима, адже…

14/07/2025