OpenAI запустила сайт для озвучування текстів – що за можливості він пропонує та як спробувати

Компанія OpenAI запустила сайт, який дає можливість безплатно озвучувати тексти. Ба більше – система дозволяє обирати з-поміж низки налаштувань те, як звучатиме голос, який робитиме начитування.

OpenAI повідомила про запуск нових генеративних аудіомоделей у своєму блозі. Йдеться про gpt-4o-transcribe і gpt-4o-mini-transcribe, які забезпечують реалістичніше звучання мовлення і водночас є керованішими за моделі синтезу мовлення попереднього покоління. Розробники можуть інструктувати їх про те, як говорити речі природною мовою – наприклад, «говорити як божевільний учений» або «використовувати спокійний голос, як учитель».

Наприклад, ось витриманий голос у «справжньому кримінальному стилі»:

А це зразок жіночого «професійного» голосу:

Читайте також: ШІ ближче, ніж ми думаємо? OpenAI інтегрує ChatGPT в робочі простори Google Drive та Slack

У компанії стверджують, що нові генеративні моделі припускаються меншої кількості помилок та можуть відтворювати мовлення навіть за так званих складних умов. Наприклад, на різній швидкості, з акцентом або ж в умовах галасливого середовища.

«Моделі базуються на архітектурах GPT‑4o та GPT‑4o-mini та проходять широку попередню підготовку на основі спеціалізованих аудіоцентричних наборів даних, які були критично важливими для оптимізації їхньої продуктивності. Цей підхід забезпечує глибше розуміння нюансів мовлення та забезпечує виняткову ефективність у завданнях, пов’язаних зі звуком», – йдеться у блозі.

Нові gpt-4o-transcribe і gpt-4o-mini-transcribe створили для того, щоби покращити досвід взаємодії користувачів із ШІ та зробити озвучування наближенішим до реального спілкування. Їх можна також інтегрувати в різні застосунки й сервіси.

Розробники можуть користуватися gpt-4o-transcribe і gpt-4o-mini-transcribe через API, але спробувати можуть усі охочі – для цього достатньо перейти на сайт openai.fm.

Скриншот: openai.fm

«Ми плануємо продовжувати інвестувати в покращення інтелекту і точності наших аудіомоделей і досліджувати способи, які дозволять розробникам додавати також власні голоси для створення ще персоналізованішого досвіду відповідно до наших стандартів безпеки», – підсумували в OpenAI. 

А тут ви можете прослухати, як звучить останній абзац голосом «божевільного вченого» в режимі Ballad.

  • Раніше ми переповідали, що OpenAI представила нову функцію Deep Research. Кому вона знадобиться та як скористатись – можна прочитати тут.

Нещодавні статті

Начальник Управління IT в Міноборони Берестовий іде з посади за півтора року служби

Айтівець і начальник Управління ІТ Міністерства оборони України Олег Берестовий іде з посади. На цій…

18/04/2025

Visa запустила в Україні оплату за обличчям та відбитком пальця – що відомо

Транснаціональна компанія Visa запустила в Україні технологію, що дозволяє підтверджувати онлайн-покупки за допомогою біометрії –…

18/04/2025

Майже 1750 компаній є резидентами «Дія.City». Скільки податків вони сплатили в першому кварталі 2025-го

Очільник Міністерства цифрової трансформації Михайло Федоров повідомив, скільки податків сплатили резиденти «Дія.City» в І кварталі…

18/04/2025

Для обʼєднання менторів і менті. Українські айтівці запустили платформу mentor.sh

Українські айтівці Влад Кампов та Діма Малєєв запустили власний стартап mentor.sh – платформу для пошуку…

18/04/2025

CEO BetterMe Рєпа назвала пораду, про яку хотіла б знати 8 років тому

Засновниця та CEO BetterMe Вікторія Рєпа назвала пораду, яку вона хотіла б дати собі 8…

18/04/2025

Будують кар’єру та стають впевненими в собі. Як можна зростати в «Аврорі»: три мотивуючі історії

Станіслав Деркач все життя працював у сфері шоубізу, потім кинув собі виклик, пішов у кардинально…

18/04/2025