Найпросунутіший у своєму класі. OpenAI додала в ChatGPT новий генератор зображень – що він вміє

OpenAI додала в ChatGPT новий інструмент генерування зображень, який називає найпросунутішим серед програм такого класу. Його ключові особливості – контроль деталей та більша точність.

Про запуск нового ШІ-генератора компанія OpenAI повідомила в соцмережах. Функцію розгортають для користувачів ChatGPT та Sora в межах підписок Plus, Pro, Team, а також у безплатному тарифі. В останньому випадку ліміт генерацій встановили на такому ж рівні, як і в DALL-E (три картинки на добу), проте із часом кількість можуть збільшити – це залежатиме від того, який попит матиме нова опція.

Нова модель працює на базі GPT-4o та характеризується покращеною здатністю до біндингу, а також уважністю до заданих характеристик об’єктів і параметрів їхнього розташування на зображеннях. Про це виданню The Verge розповів дослідник Габріель Го. Він додав, що в основі нової функції лежить «омнімодальна» модель GPT-4o – тобто така, яка може генерувати будь-які дані, як-от текст, зображення, аудіо та відео.

Читайте також: Конкуренція з OpenAI загострюється? DeepSeek оновила свою ШІ-модель

Го зазначив, що більшість сучасних генеративних моделей часто плутаються у кольорах та формах, коли користувач надсилає запит на створення зображень із великою кількістю елементів (від п’яти). Наприклад, отримавши завдання зобразити синю зірку та червоний трикутник, ШІ може намалювати просто червону зірку, взагалі проігнорувавши іншу фігуру.

У новому інструменті OpenAI розробники усунули цю проблему – вона може правильно «зв’язувати» між собою атрибути для 15-20, а отже – працювати надійніше та якісніше.

Система використовує авторегресійний підхід до генерування зображень – вона створює їх послідовно зліва направо та зверху вниз, подібно до того, як пишеться текст. Водночас більшість генераторів-конкурентів, як-от DALL-E, створюють усе зображення відразу. Го припускає, що ця технічна відмінність може бути якраз тим, завдяки чому ChatGPT випереджатиме конкурентів в можливостях відтворення тексту та прив’язки.

  • Раніше ми також розповідали, що OpenAI запустила сайт для озвучування текстів – що за можливості він пропонує та як спробувати, можна прочитати тут.

Нещодавні статті

«Історія Аріни», дівчинки з Ірпеня: United24 створила документальний проєкт з ефектом повного занурення

Державна фандрейзингова платформа України UNITED24 створила документальний проєкт з ефектом повного занурення «Історія Аріни», у…

06/06/2025

ChatGPT тепер переглядатиме пошту, календарі і не тільки – OpenAI тестує Connectors. Що відомо

Компанія OpenAI запустила в бета-версії новий інструмент для ChatGPT – Connectors. Він дозволяє ШІ-боту безпечно…

06/06/2025

Як Claspo.io допомагає створювати поп-апи і віджети, що змінюють підхід до залучення клієнтів на сайтах

Як зробити так, щоб сайт не просто залучав відвідувачів, а й ефективно конвертував їх у…

06/06/2025

Як збільшити шанси сайту потрапити до ChatGPT та AI Overview – поради і застереження від СЕО Site24

Засновниця і СЕО Site24 Катерина Золотарьова поділилась порадами щодо того, як збільшити  шанси сайту потрапити…

06/06/2025

«Багато в чому можемо повчитися». Які українські компанії цікавлять польську Euvic Group і чому

Віцепрезидент польського IT-консорціуму Euvic Group, який вже купив п’ять українських аутсорс-компаній, Лукаш Чернецький розповів про…

06/06/2025

Як працює культура експериментів у Mate academy і як тут онбордять новачків – Chief of Growth

Співзасновник і Chief of Growth в Mate academy Максим Лисак розповів про культуру експериментів у…

06/06/2025