Статті26.03.2025 12:24

Найпросунутіший у своєму класі. OpenAI додала в ChatGPT новий генератор зображень – що він вміє

Редакторка MC: Money & Career

OpenAI додала в ChatGPT новий інструмент генерування зображень, який називає найпросунутішим серед програм такого класу. Його ключові особливості – контроль деталей та більша точність.

OpenAI запустила новий генератор зображень у ChatGPT. Зображення: Depositphotos, X / OpenAI

Про запуск нового ШІ-генератора компанія OpenAI повідомила в соцмережах. Функцію розгортають для користувачів ChatGPT та Sora в межах підписок Plus, Pro, Team, а також у безплатному тарифі. В останньому випадку ліміт генерацій встановили на такому ж рівні, як і в DALL-E (три картинки на добу), проте із часом кількість можуть збільшити – це залежатиме від того, який попит матиме нова опція.

4o image generation has arrived.

It’s beginning to roll out today in ChatGPT and Sora to all Plus, Pro, Team, and Free users. pic.twitter.com/pFXDzKhh2t

— OpenAI (@OpenAI) March 25, 2025

Нова модель працює на базі GPT-4o та характеризується покращеною здатністю до біндингу, а також уважністю до заданих характеристик об’єктів і параметрів їхнього розташування на зображеннях. Про це виданню The Verge розповів дослідник Габріель Го. Він додав, що в основі нової функції лежить «омнімодальна» модель GPT-4o – тобто така, яка може генерувати будь-які дані, як-от текст, зображення, аудіо та відео.

Creating and customizing images is as simple as chatting using GPT‑4o—just describe what you need, including any specifics like aspect ratio, exact colors using hex codes, or a transparent background. pic.twitter.com/fnen1aDjNZ

— OpenAI (@OpenAI) March 25, 2025

Читайте також: Конкуренція з OpenAI загострюється? DeepSeek оновила свою ШІ-модель

Го зазначив, що більшість сучасних генеративних моделей часто плутаються у кольорах та формах, коли користувач надсилає запит на створення зображень із великою кількістю елементів (від п’яти). Наприклад, отримавши завдання зобразити синю зірку та червоний трикутник, ШІ може намалювати просто червону зірку, взагалі проігнорувавши іншу фігуру.

У новому інструменті OpenAI розробники усунули цю проблему – вона може правильно «зв’язувати» між собою атрибути для 15-20, а отже – працювати надійніше та якісніше.

Create or transform images into a variety of styles with 4o image generation. pic.twitter.com/trEqLLZ9KL

— OpenAI (@OpenAI) March 25, 2025

Система використовує авторегресійний підхід до генерування зображень – вона створює їх послідовно зліва направо та зверху вниз, подібно до того, як пишеться текст. Водночас більшість генераторів-конкурентів, як-от DALL-E, створюють усе зображення відразу. Го припускає, що ця технічна відмінність може бути якраз тим, завдяки чому ChatGPT випереджатиме конкурентів в можливостях відтворення тексту та прив’язки.