Искусственный интеллект побеждал в конкурсах, проходил собеседования, сдавал экзамены и даже повлиял на решение суда. Это поражает, однако ИИ до сих пор не научился рисовать руки. Почему так происходит, пишет BBC Science Focus Magazine. Редакция MC.today передает детали.
При всей работе, которую провели для создания генераторов изображений, они все равно не умеют правильно рисовать руки. На это особенно обратили внимание после публикации изображений, созданных Midjourney.
На первый взгляд, это обычная вечеринка, но работу ИИ выдают жуткие руки. Так, некоторые люди на изображении имеют три руки, несколько лишних пальцев или слишком длинную ладонь.
Профессор Питер Бентли из Лондона объяснил, что 2-D генераторы изображений не справляются с трехмерной геометрией вроде руки.
«В общем, они имеют хорошее представление о руке. У нее есть ладонь, пальцы и ногти, но ни одна из этих моделей не понимает, что это такое», – сказал профессор.
То есть генераторы изображений просто не знают, как изобразить руки. Также они не учитывают контекст изображения, саму ситуацию. К примеру, ИИ не может правильно сгенерировать изображение руки, которая держит что-то. Нейросеть даже не понимает, как это работает, а потому просто комбинирует другие изображения.
«Я попросил Dall-E показать фотографию двух рук со сцепленными пальцами, и получил несколько удивительных результатов. Он показал мне два запястья и комок пальцев на одном из них», – говорит Бентли.
Конечно, результат значительно зависит и от подсказки, однако в основном проблема в нейросетях. «Они просто совмещают весь хлам, который мы им дали».
Искусственный интеллект постепенно изучает трехмерную геометрию, что позволит ему создавать более сложные изображения. Поэтому в будущем ситуация со странными руками может улучшиться.
Ранее мы рассказывали, что художники подали в суд на разработчиков Midjourney и Stable Diffusion. А как пользоваться нейросетью Midjourney мы писали здесь.
Кровать — громоздкий элемент интерьера даже в просторной спальне. Но что, если помещение совсем небольшое,…
Украинские PR-агентства реализуют масштабные информационные кампании для бизнеса и придают мощный голос социальным проектам, которые…
Power BI (Business Intelligence) Microsoft – это не просто платформа для анализа данных, а ключевой…
Лас-Вегас — один из самых узнаваемых городов на планете, который ежегодно манит к себе миллионы…
Из-за широкомасштабного вторжения россии в Украине было введено военное положение и объявлена мобилизация. Военнообязанным мужчинам…
«Вижу цель – не вижу препятствий». Знакомая фраза? Часто ею руководствуются кандидаты, ищущие работу мечты.…