Рубріки: Інфопривід

Microsoft навчила штучний інтелект розпізнавати зображення та розгадувати візуальні головоломки

Компанія Microsoft представила мультимодальну модель на основі штучного інтелекту, яка вміє опрацьовувати зображення та графічні елементи. Розробники вважають, що згодом вона зможе виконувати інтелектуальні завдання не гірше за людину, повідомляє Ars Technica.

Новий інструмент зі штучним інтелектом назвали Kosmos-1. Він вміє аналізувати, що саме зображено на картинці чи фото, розв’язувати візуальні головоломки, розпізнавати текст на малюнку та навіть проходить IQ-тести. Дослідники вважають, що мультимодальний ШІ, який об’єднує різні режими введення даних (текст, аудіо, зображення та відео) у перспективі допоможе перетворитися на загальний штучний інтелект, який виконуватиме інтелектуальні завдання на тому ж рівні, що й людина.

Розробники назвали Kosmos-1 мультимодальною великою мовною моделлю (MLLM). Вона, як і більшість продуктів зі штучним інтелектом, заснована на обробці природного мовлення. Щоби штучний інтелект зміг розпізнавати графічні елементи, дослідники навчили його інтерпретувати картинки в спеціальну серію текстових токенів, які розуміє мовна модель на кшталт ChatGPT. Приблизно за тим самим принципом Kosmos-1 розпізнає аудіо та відео.

Особливий виклик для розробників – навчити штучний інтелект розуміти послідовність форм. Зараз він проходить візуальні IQ-тести на 22–26%, проте дослідники впевнені, що Kosmos-1 здатний на більше. У майбутньому вони збираються інтегрувати в цей продукт ще й можливість мовлення.

Нагадаємо, нещодавно Microsoft представила інструмент зі штучним інтелектом, який допоможе бізнесам автоматизувати листування з клієнтами. Також компанія додала свій розумний чат-бот Bing у мобільні застосунки, завдяки чому спілкуватися з ним можна ще й голосовими повідомленнями.

Нещодавні статті

«Це величезний челендж». Співвласник Kormotech розповів, у чому не хоче наслідувати конкурентів

Співвласник Kormotech Ростислав Вовк пояснив, чому в компанії вирішили створити незалежну Раду директорів, та водночас…

29/04/2024

В Україні заблокували 2,5 тис. сайтів, повʼязаних з азартними іграми – Офіс Генпрокурора

Офіс Генерального прокурора у сфері протидії нелегальним азартним іграм відзвітував про блокування понад 2,5 тис.…

29/04/2024

«TechСomms Award: Премія за найгучніший PR-проєкт у сфері IT». ПРАВИЛА КОНКУРСУ

1.1. Організатором Конкурсу є онлайн-медіа MC.today (надалі – «Організатор»).

02/03/2023

Чоловік пішов з Dell заради догляду за газонами. Тепер його бізнес приносить $40 млн доходу

Мешканець Нешвілла в США майже вісім років працював у техногіганті Dell, де обіймав керівні посади…

29/04/2024

Чи потрібно проходити ВЛК, якщо є відстрочка від мобілізації – пояснення речника ТЦК

Після того, як закон про посилення мобілізації набере чинності (це станеться 18 травня), військовозобов’язані українці…

29/04/2024

Повернення зарплат у доларах та інші. СЕО robota.ua назвав 5 змін на українському ринку праці

Генеральний директор платформи robota.ua Валерій Решетняк у межах форуму «НадЛюди» розповів про п’ять ключових змін,…

29/04/2024