Рубріки: Інфопривід

Meta представила штучний інтелект ImageBind, який сприймає довкілля, як людина

Компанія американського техномагната Марка Цукерберга представила новаторський інструмент штучного інтелекту під назвою ImageBind, йдеться в блозі Meta. Розробники стверджують, що ця модель «сприймає» довкілля так, як це роблять люди. Редакція MC.today переповідає подробиці.

Якщо генератори зображень на кшталт Midjourney, Stable Diffusion і DALL-E 2 створюють візуальні сцени за текстовим описом, то нова розробка Цукерберга може працювати зі значно складнішими середовищами, як-от фрагменти відео, аудіо, та їхніми комбінаціями.

ImageBind може зв’язувати текст, медіафайли, робити 3D-вимірювання глибини об’єкта, який потрібно створити, а також враховує дані про його гіпотетичні теплові якості та переміщення у просторі. Це мультимодальний інструмент, який навчають на цілій сукупності різних моделей, тому він вміє імітувати мультисенсорні зв’язки, як це робить людина та більшість тварин.

Уявіть, що ви опинилися десь на жвавому перехресті великого міста. Для створення цілісної картинки ваш мозок аналізує безліч сенсорних вражень: звуки, інформацію про пішоходів та машини, що проїжджають повз, будівлі та дерева довкола тощо. Люди опрацьовують цю інформацію завдяки певним генетичним перевагам та набутому досвіду. А алгоритми ImageBind створюють повноцінні сцени з реального життя на фрагментах даних із різних навчальних моделей.

Реалістичність та певна тривимірність – те, що вирізняє цей продукт з-поміж аналогів. Якщо ви попросите нейромережу Midjourney зобразити басет-гаунда в костюмі Гендальфа, який балансує на м’ячику для пляжного волейболу, то, ймовірно, отримаєте цілком реалістичне зображення смішного собачати. Але не більше.

Натомість ImageBind за аналогічним текстовим запитом створить повноцінне відео, як песик «котиться» верхи на м’ячі в певному оточенні, наповненому відповідними звуками та ефектами. Наприклад, на мальовничій сільській вуличці, що просто тоне у квітах та співі пташок. Або посеред дитячої кімнати з розкиданими іграшками та веселим сміхом. Розробники також стверджують, що кожна сцена відтворюється в логічній відеопослідовності, тобто так, який вигляд вона могла б мати в реальному житті.

Зараз ImageBind працює в шести модальностях: текст, зображення, відео, аудіо, теплові та інертні дані. Втім, в Meta не планують зупинятися на цьому. В перспективі розробники навчать штучний інтелект розпізнавати й імітувати дотик, аромат та навіть мозкові сигнали. Тобто майбутні моделі будуть ще більш орієнтованими на людину.

  • Це не перший високотехнологічний продукт, який Цукерберг представив цьогоріч. Так, на початку квітня компанія презентувала модель штучного інтелекту, яка розпізнає об’єкти на зображеннях та відео, й анонсувала ШІ-технологію для створення та налаштування реклами у Facebook та Instagram.

Нещодавні статті

CEO MacPaw Косован розповів, як ставиться до тестових завдань, виконаних з ШІ

Засновник і CEO ІТ-компанії MacPaw Олександр Косован поділився, як ставиться до тестових завдань, виконаних із…

12/05/2025

«Це про нову культуру роботи». Як AI-маркетплейс віддалених розробників Wild.Codes змінює найм в IT

«Ми не хотіли бути черговою "серйозною агенцією із синім лого". Усі вони здавалися одноманітними, сухими.…

12/05/2025

CDTO Campus запрошує на безплатну програму «Monarch: Інформаційна безпека» – як долучитись

В CDTO Campus розпочали набір на нову безплатну офлайнову програму «Monarch: Інформаційна безпека», реалізовану в…

12/05/2025

У «Приват24» тепер можна придбати eSIM «Київстар» та lifecell. Як скористатись послугою

«ПриватБанк» запустив нову послугу – продаж eSIM мобільних операторів «Київстар» та lifecell. Придбати цифрову сім-картку…

12/05/2025

GovTech-освіта дає компетенції, без яких державне управління сьогодні просто не працює – Галина Пустова

У просторі CDTO Campus проходить навчання для держслужбовців. По той бік скляної стіни – розмова…

12/05/2025

Фінансові питання, оптимізація та інше. Основні причини звільнень в IT – аналітика DOU

Упродовж останнього року трьома головними причинами, через які звільняли українських айтівців, стали фінансові труднощі компаній,…

12/05/2025