logo
26 Бер 2025

Найпросунутіший у своєму класі. OpenAI додала в ChatGPT новий генератор зображень – що він вміє

Юлія Фещенко

Редакторка новин MC.today

OpenAI додала в ChatGPT новий інструмент генерування зображень, який називає найпросунутішим серед програм такого класу. Його ключові особливості – контроль деталей та більша точність.

OpenAI запустила новий генератор зображень у ChatGPT. Зображення: Depositphotos, X / OpenAIOpenAI запустила новий генератор зображень у ChatGPT. Зображення: Depositphotos, X / OpenAI

Про запуск нового ШІ-генератора компанія OpenAI повідомила в соцмережах. Функцію розгортають для користувачів ChatGPT та Sora в межах підписок Plus, Pro, Team, а також у безплатному тарифі. В останньому випадку ліміт генерацій встановили на такому ж рівні, як і в DALL-E (три картинки на добу), проте із часом кількість можуть збільшити – це залежатиме від того, який попит матиме нова опція.

Нова модель працює на базі GPT-4o та характеризується покращеною здатністю до біндингу, а також уважністю до заданих характеристик об’єктів і параметрів їхнього розташування на зображеннях. Про це виданню The Verge розповів дослідник Габріель Го. Він додав, що в основі нової функції лежить «омнімодальна» модель GPT-4o – тобто така, яка може генерувати будь-які дані, як-от текст, зображення, аудіо та відео.

Читайте також: Конкуренція з OpenAI загострюється? DeepSeek оновила свою ШІ-модель

Го зазначив, що більшість сучасних генеративних моделей часто плутаються у кольорах та формах, коли користувач надсилає запит на створення зображень із великою кількістю елементів (від п’яти). Наприклад, отримавши завдання зобразити синю зірку та червоний трикутник, ШІ може намалювати просто червону зірку, взагалі проігнорувавши іншу фігуру.

У новому інструменті OpenAI розробники усунули цю проблему – вона може правильно «зв’язувати» між собою атрибути для 15-20, а отже – працювати надійніше та якісніше.

Система використовує авторегресійний підхід до генерування зображень – вона створює їх послідовно зліва направо та зверху вниз, подібно до того, як пишеться текст. Водночас більшість генераторів-конкурентів, як-от DALL-E, створюють усе зображення відразу. Го припускає, що ця технічна відмінність може бути якраз тим, завдяки чому ChatGPT випереджатиме конкурентів в можливостях відтворення тексту та прив’язки.

  • Раніше ми також розповідали, що OpenAI запустила сайт для озвучування текстів – що за можливості він пропонує та як спробувати, можна прочитати тут.

Спецпроекти

Ваша жалоба отправлена модератору

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: