logo
06 Лют 2023

Дивні долоні та сім пальців. Чому ШІ досі не вміє правильно зображати руки

Вероніка Ворожко

Редакторка новин MC.today

Штучний інтелект перемагав у конкурсах, проходив співбесіди, складав іспити та навіть вплинув на рішення суду. Це вражає, однак ШІ досі не навчився малювати руки. Чому так відбувається, пише BBC Science Focus Magazine. Редакція MC.today переповідає деталі.

руки

Попри всю роботу, яку провели для створення генераторів зображень, вони все одно не вміють правильно малювати руки. На це особливо звернули увагу після публікації зображень, створених Midjourney.

Курс-професія "Дизайнер інтер'єрів" від Skvot.
Велика практична програма для всіх, хто хоче засвоїти професію дизайнера інтер'єрів і заробляти на реальних проєктах відразу після курсу. Досвідом та інсайтами діляться одразу три лектори.
Програма курсу

На перший погляд, це звичайна вечірка, але роботу ШІ видають моторошні руки. Так, деякі люди на зображенні мають три руки, декілька зайвих пальців або надто довгу долоню.

Чому замість долоні виходить щось моторошне

Професор Пітер Бентлі з Лондона пояснив, що 2-D генератори зображень не можуть впоратися із тривимірною геометрією на зразок руки.

«Загалом вони мають добре уявлення про руку. У неї є долоня, пальці та нігті, але жодна з цих моделей насправді не розуміє, що це таке», – сказав професор.

Тобто генератори зображень просто не знають, як зобразити руки. Також вони не враховують контекст зображення, саму ситуацію. Наприклад, ШІ не може правильно згенерувати зображення руки, яка тримає щось. Нейромережа навіть не розуміє, як це працює, а тому просто комбінує інші зображення.

«Я попросив Dall-E показати фотографію двох рук зі зчепленими пальцями, і отримав кілька дивних результатів. Він показав мені два зап’ястя і клубок пальців на одному з них», – каже Бентлі.

Звісно, результат значно залежить і від людини, яка дає підказки, однак здебільшого проблема в нейромережах. «Вони просто поєднують увесь мотлох, який ми дали».

Надія є

Штучний інтелект поступово вивчає тривимірну геометрію, що дасть змогу йому створювати складніші зображення. Тому в майбутньому ситуація з дивними руками може значно покращитись.

Раніше ми розповідали, що художники подали до суду на розробників Midjourney і Stable Diffusion. А як користуватися нейромережею Midjourney ми писали тут.

Онлайн-курс "React Native Developer" від robot_dreams.
Опануйте кросплатформну розробку на React Native та навчіться створювати повноцінні застосунки для iOS та Android.
Програма курсу і реєстрація

Спецпроекти

Новини

Вакансії компаній

Менеджер з активних продажів B2B

Creators Media Group
20 000 – 40 000 грн, Ставка + відсоток

Надихаючі компанії-работодавці

Ваша жалоба отправлена модератору

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: