Рубріки: Інфопривід

Дивні долоні та сім пальців. Чому ШІ досі не вміє правильно зображати руки

Штучний інтелект перемагав у конкурсах, проходив співбесіди, складав іспити та навіть вплинув на рішення суду. Це вражає, однак ШІ досі не навчився малювати руки. Чому так відбувається, пише BBC Science Focus Magazine. Редакція MC.today переповідає деталі.

Попри всю роботу, яку провели для створення генераторів зображень, вони все одно не вміють правильно малювати руки. На це особливо звернули увагу після публікації зображень, створених Midjourney.

На перший погляд, це звичайна вечірка, але роботу ШІ видають моторошні руки. Так, деякі люди на зображенні мають три руки, декілька зайвих пальців або надто довгу долоню.

Чому замість долоні виходить щось моторошне

Професор Пітер Бентлі з Лондона пояснив, що 2-D генератори зображень не можуть впоратися із тривимірною геометрією на зразок руки.

«Загалом вони мають добре уявлення про руку. У неї є долоня, пальці та нігті, але жодна з цих моделей насправді не розуміє, що це таке», – сказав професор.

Тобто генератори зображень просто не знають, як зобразити руки. Також вони не враховують контекст зображення, саму ситуацію. Наприклад, ШІ не може правильно згенерувати зображення руки, яка тримає щось. Нейромережа навіть не розуміє, як це працює, а тому просто комбінує інші зображення.

«Я попросив Dall-E показати фотографію двох рук зі зчепленими пальцями, і отримав кілька дивних результатів. Він показав мені два зап’ястя і клубок пальців на одному з них», – каже Бентлі.

Звісно, результат значно залежить і від людини, яка дає підказки, однак здебільшого проблема в нейромережах. «Вони просто поєднують увесь мотлох, який ми дали».

Надія є

Штучний інтелект поступово вивчає тривимірну геометрію, що дасть змогу йому створювати складніші зображення. Тому в майбутньому ситуація з дивними руками може значно покращитись.

Раніше ми розповідали, що художники подали до суду на розробників Midjourney і Stable Diffusion. А як користуватися нейромережею Midjourney ми писали тут.

Нещодавні статті

Найкращий тиждень з 2021 року – вартість Ethereum зросла на третину

Другий за величиною цифровий токен Ethereum цієї п’ятниці різко зріс у ціні, збільшивши свій тижневий…

09/05/2025

«Раніше це писали копірайтери, зараз – ШІ». Бородатюк про використання ШІ в Netpeak Group

CEO Netpeak Group Артем Бородатюк поділився, як у групі впроваджують інструменти штучного інтелекту та роботу…

09/05/2025

Як застосунок tTravel перетворює досвід мандрівників на контент, що приносить пасивний дохід

Засновуючи tTravel, Олександр Буратинський та Артем Шамбальов, маючи за плечима роки дружби, подорожей та спільної…

09/05/2025

ChatGPT тепер зможе аналізувати код у GitHub. Що відомо про інтеграцію

Компанія OpenAI почала тестувати оновлення Deep Research у ChatGPT. Функція буде працювати з репозиторіями GitHub…

09/05/2025

В EPAM Systems змінюється керівництво. Що відомо про нового CEO

EPAM Systems змінює керівництво. Засновник ІТ-компанії та генеральний директор Аркадій Добкін йде з посади. Він…

09/05/2025

Поперешнюк розповів, який стартап запустив би, якби не займався «Новою поштою»

Співзасновник «Нової пошти» Володимир Поперешнюк у Школі бізнесу НП розповів, який стартап запустив би, якби…

09/05/2025