3d rendering humanoid robot playing cube puzzle
Компанія Microsoft представила мультимодальну модель на основі штучного інтелекту, яка вміє опрацьовувати зображення та графічні елементи. Розробники вважають, що згодом вона зможе виконувати інтелектуальні завдання не гірше за людину, повідомляє Ars Technica.
Новий інструмент зі штучним інтелектом назвали Kosmos-1. Він вміє аналізувати, що саме зображено на картинці чи фото, розв’язувати візуальні головоломки, розпізнавати текст на малюнку та навіть проходить IQ-тести. Дослідники вважають, що мультимодальний ШІ, який об’єднує різні режими введення даних (текст, аудіо, зображення та відео) у перспективі допоможе перетворитися на загальний штучний інтелект, який виконуватиме інтелектуальні завдання на тому ж рівні, що й людина.
Розробники назвали Kosmos-1 мультимодальною великою мовною моделлю (MLLM). Вона, як і більшість продуктів зі штучним інтелектом, заснована на обробці природного мовлення. Щоби штучний інтелект зміг розпізнавати графічні елементи, дослідники навчили його інтерпретувати картинки в спеціальну серію текстових токенів, які розуміє мовна модель на кшталт ChatGPT. Приблизно за тим самим принципом Kosmos-1 розпізнає аудіо та відео.
Особливий виклик для розробників – навчити штучний інтелект розуміти послідовність форм. Зараз він проходить візуальні IQ-тести на 22–26%, проте дослідники впевнені, що Kosmos-1 здатний на більше. У майбутньому вони збираються інтегрувати в цей продукт ще й можливість мовлення.
Нагадаємо, нещодавно Microsoft представила інструмент зі штучним інтелектом, який допоможе бізнесам автоматизувати листування з клієнтами. Також компанія додала свій розумний чат-бот Bing у мобільні застосунки, завдяки чому спілкуватися з ним можна ще й голосовими повідомленнями.
Співзасновник «Нової пошти» Володимир Поперешнюк у Школі бізнесу НП розповів, який стартап запустив би, якби…
На порталі «Дія» відновили дві важливі послуги – зняття та зміну місця проживання. Тепер це…
Медичний сервіс Helsi, який у 2022-му придбала «Київстар», готується до експансії. Наразі компанія створює команду,…
Директор з питань штучного інтелекту (CAIO) Netpeak Group Сергій Саута назвав дві найважливіші поради, які…
Девʼять стартапів представлятимуть українське ІТ на одній з найбільших технологічних конференцій Північної Європи Latitude59. Торік…
«Мрію, аби малий бізнес мав реальні можливості конкурувати з великими гравцями не коштом бюджетів, а…