Найпросунутіший у своєму класі. OpenAI додала в ChatGPT новий генератор зображень – що він вміє

OpenAI додала в ChatGPT новий інструмент генерування зображень, який називає найпросунутішим серед програм такого класу. Його ключові особливості – контроль деталей та більша точність.

Про запуск нового ШІ-генератора компанія OpenAI повідомила в соцмережах. Функцію розгортають для користувачів ChatGPT та Sora в межах підписок Plus, Pro, Team, а також у безплатному тарифі. В останньому випадку ліміт генерацій встановили на такому ж рівні, як і в DALL-E (три картинки на добу), проте із часом кількість можуть збільшити – це залежатиме від того, який попит матиме нова опція.

Нова модель працює на базі GPT-4o та характеризується покращеною здатністю до біндингу, а також уважністю до заданих характеристик об’єктів і параметрів їхнього розташування на зображеннях. Про це виданню The Verge розповів дослідник Габріель Го. Він додав, що в основі нової функції лежить «омнімодальна» модель GPT-4o – тобто така, яка може генерувати будь-які дані, як-от текст, зображення, аудіо та відео.

Читайте також: Конкуренція з OpenAI загострюється? DeepSeek оновила свою ШІ-модель

Го зазначив, що більшість сучасних генеративних моделей часто плутаються у кольорах та формах, коли користувач надсилає запит на створення зображень із великою кількістю елементів (від п’яти). Наприклад, отримавши завдання зобразити синю зірку та червоний трикутник, ШІ може намалювати просто червону зірку, взагалі проігнорувавши іншу фігуру.

У новому інструменті OpenAI розробники усунули цю проблему – вона може правильно «зв’язувати» між собою атрибути для 15-20, а отже – працювати надійніше та якісніше.

Система використовує авторегресійний підхід до генерування зображень – вона створює їх послідовно зліва направо та зверху вниз, подібно до того, як пишеться текст. Водночас більшість генераторів-конкурентів, як-от DALL-E, створюють усе зображення відразу. Го припускає, що ця технічна відмінність може бути якраз тим, завдяки чому ChatGPT випереджатиме конкурентів в можливостях відтворення тексту та прив’язки.

  • Раніше ми також розповідали, що OpenAI запустила сайт для озвучування текстів – що за можливості він пропонує та як спробувати, можна прочитати тут.

Нещодавні статті

«Це не просто черговий чек». Артем Бородатюк став Limited Partner венчурного фонду hi5 Ventures

CEO Netpeak Group Артем Бородатюк став Limited Partner венчурного фонду hi5 Ventures, що зосереджується на…

12/05/2025

Найкращий тиждень з 2021 року – вартість Ethereum зросла на третину

Другий за величиною цифровий токен Ethereum цієї п’ятниці різко зріс у ціні, збільшивши свій тижневий…

09/05/2025

«Раніше це писали копірайтери, зараз – ШІ». Бородатюк про використання ШІ в Netpeak Group

CEO Netpeak Group Артем Бородатюк поділився, як у групі впроваджують інструменти штучного інтелекту та роботу…

09/05/2025

Як застосунок tTravel перетворює досвід мандрівників на контент, що приносить пасивний дохід

Засновуючи tTravel, Олександр Буратинський та Артем Шамбальов, маючи за плечима роки дружби, подорожей та спільної…

09/05/2025

ChatGPT тепер зможе аналізувати код у GitHub. Що відомо про інтеграцію

Компанія OpenAI почала тестувати оновлення Deep Research у ChatGPT. Функція буде працювати з репозиторіями GitHub…

09/05/2025

В EPAM Systems змінюється керівництво. Що відомо про нового CEO

EPAM Systems змінює керівництво. Засновник ІТ-компанії та генеральний директор Аркадій Добкін йде з посади. Він…

09/05/2025