Найпросунутіший у своєму класі. OpenAI додала в ChatGPT новий генератор зображень – що він вміє

OpenAI додала в ChatGPT новий інструмент генерування зображень, який називає найпросунутішим серед програм такого класу. Його ключові особливості – контроль деталей та більша точність.

Про запуск нового ШІ-генератора компанія OpenAI повідомила в соцмережах. Функцію розгортають для користувачів ChatGPT та Sora в межах підписок Plus, Pro, Team, а також у безплатному тарифі. В останньому випадку ліміт генерацій встановили на такому ж рівні, як і в DALL-E (три картинки на добу), проте із часом кількість можуть збільшити – це залежатиме від того, який попит матиме нова опція.

Нова модель працює на базі GPT-4o та характеризується покращеною здатністю до біндингу, а також уважністю до заданих характеристик об’єктів і параметрів їхнього розташування на зображеннях. Про це виданню The Verge розповів дослідник Габріель Го. Він додав, що в основі нової функції лежить «омнімодальна» модель GPT-4o – тобто така, яка може генерувати будь-які дані, як-от текст, зображення, аудіо та відео.

Читайте також: Конкуренція з OpenAI загострюється? DeepSeek оновила свою ШІ-модель

Го зазначив, що більшість сучасних генеративних моделей часто плутаються у кольорах та формах, коли користувач надсилає запит на створення зображень із великою кількістю елементів (від п’яти). Наприклад, отримавши завдання зобразити синю зірку та червоний трикутник, ШІ може намалювати просто червону зірку, взагалі проігнорувавши іншу фігуру.

У новому інструменті OpenAI розробники усунули цю проблему – вона може правильно «зв’язувати» між собою атрибути для 15-20, а отже – працювати надійніше та якісніше.

Система використовує авторегресійний підхід до генерування зображень – вона створює їх послідовно зліва направо та зверху вниз, подібно до того, як пишеться текст. Водночас більшість генераторів-конкурентів, як-от DALL-E, створюють усе зображення відразу. Го припускає, що ця технічна відмінність може бути якраз тим, завдяки чому ChatGPT випереджатиме конкурентів в можливостях відтворення тексту та прив’язки.

  • Раніше ми також розповідали, що OpenAI запустила сайт для озвучування текстів – що за можливості він пропонує та як спробувати, можна прочитати тут.

Нещодавні статті

Що буде, якщо три місяці записувати всі свої витрати – розповідає психологиня

Запис витрат – це не просто нудна звичка, а психологічний інструмент, який може змінити ваше…

27/06/2025

Навіть без купівлі фізичного металу. Фінансист назвав чотири способи інвестувати в золото

Український фінансист, партнер iPlan.ua та засновник соціального проєкту «Сімейний Бюджет» Любомир Остапів розповів про чотири…

27/06/2025

Суд відмовив monobank у стягненні боргу з клієнта – причина й деталі справи

«Універсал Банк» (до якого належить monobank) хотів через суд стягнути з клієнта 38 тис. грн…

27/06/2025

У застосунку Alliance з’явилась функція міжнародних P2P-переказів. Комісія – лише 0,8% від суми

Alliance bank представив нову функцію у своєму застосунку — міжнародні P2P-перекази з картки на картку.…

27/06/2025

Чи варто позичати гроші друзям – що думає банкір і голова наглядової ради «Нової Пошти»

Давати в борг друзям – до сварки та втрачених коштів чи на користь? Голова наглядової…

27/06/2025

Як накопичити на навчання дитини без стресу і боргів – коли і з чого починати та які інструменти обрати

Батьки хочуть давати дітям найкраще, і якісна освіта – одна з таких фундаментальних речей. Але…

27/06/2025