Рубріки: Інфопривід

Microsoft навчила штучний інтелект розпізнавати зображення та розгадувати візуальні головоломки

Компанія Microsoft представила мультимодальну модель на основі штучного інтелекту, яка вміє опрацьовувати зображення та графічні елементи. Розробники вважають, що згодом вона зможе виконувати інтелектуальні завдання не гірше за людину, повідомляє Ars Technica.

Новий інструмент зі штучним інтелектом назвали Kosmos-1. Він вміє аналізувати, що саме зображено на картинці чи фото, розв’язувати візуальні головоломки, розпізнавати текст на малюнку та навіть проходить IQ-тести. Дослідники вважають, що мультимодальний ШІ, який об’єднує різні режими введення даних (текст, аудіо, зображення та відео) у перспективі допоможе перетворитися на загальний штучний інтелект, який виконуватиме інтелектуальні завдання на тому ж рівні, що й людина.

Розробники назвали Kosmos-1 мультимодальною великою мовною моделлю (MLLM). Вона, як і більшість продуктів зі штучним інтелектом, заснована на обробці природного мовлення. Щоби штучний інтелект зміг розпізнавати графічні елементи, дослідники навчили його інтерпретувати картинки в спеціальну серію текстових токенів, які розуміє мовна модель на кшталт ChatGPT. Приблизно за тим самим принципом Kosmos-1 розпізнає аудіо та відео.

Особливий виклик для розробників – навчити штучний інтелект розуміти послідовність форм. Зараз він проходить візуальні IQ-тести на 22–26%, проте дослідники впевнені, що Kosmos-1 здатний на більше. У майбутньому вони збираються інтегрувати в цей продукт ще й можливість мовлення.

Нагадаємо, нещодавно Microsoft представила інструмент зі штучним інтелектом, який допоможе бізнесам автоматизувати листування з клієнтами. Також компанія додала свій розумний чат-бот Bing у мобільні застосунки, завдяки чому спілкуватися з ним можна ще й голосовими повідомленнями.

Нещодавні статті

Поперешнюк розповів, який стартап запустив би, якби не займався «Новою поштою»

Співзасновник «Нової пошти» Володимир Поперешнюк у Школі бізнесу НП розповів, який стартап запустив би, якби…

09/05/2025

Без черг і за 15 хвилин. На порталі «Дія» знову запрацювали дві важливі послуги

На порталі «Дія» відновили дві важливі послуги – зняття та зміну місця проживання. Тепер це…

09/05/2025

Helsi формує команду для роботи із закордонними ринками. CEO сервісу розповів деталі

Медичний сервіс Helsi, який у 2022-му придбала «Київстар», готується до експансії. Наразі компанія створює команду,…

08/05/2025

Збереже час. Директор з питань ШІ Netpeak Group назвав дві важливі поради щодо виконання задач

Директор з питань штучного інтелекту (CAIO) Netpeak Group Сергій Саута назвав дві найважливіші поради, які…

08/05/2025

Головний приз – 600 тис. євро. Девʼять стартапів представлять українське ІТ на Latitude59

Девʼять стартапів представлятимуть українське ІТ на одній з найбільших технологічних конференцій Північної Європи Latitude59. Торік…

08/05/2025

«Перед нами багато можливостей» – співзасновник ШІ-платформи Funely AI розповів про її історію, особливості та цінності

«Мрію, аби малий бізнес мав реальні можливості конкурувати з великими гравцями не коштом бюджетів, а…

08/05/2025