Рубріки: Инфоповод

Microsoft научила искусственный интеллект распознавать изображения и разгадывать визуальные головоломки

Компания Microsoft представила мультимодальную модель на основе искусственного интеллекта, умеющую обрабатывать изображения и графические элементы. Разработчики считают, что вскоре она сможет выполнять интеллектуальные задачи не хуже человека, пишет Ars Technica.

Новый инструмент с искусственным интеллектом назвали Kosmos-1. Он умеет анализировать, что изображено на картинке или фото, разгадывать визуальные головоломки, распознавать текст на рисунке и даже проходит IQ-тесты. Исследователи считают, что мультимодальный ИИ, объединяющий различные режимы ввода данных (текст, аудио, изображение и видео) в перспективе может превратиться в общий искусственный интеллект, способный выполнять интеллектуальные задачи на том же уровне, что и человек.

Разработчики назвали Kosmos-1 мультимодальной большой языковой моделью (MLLM). Она, как и большинство продуктов с искусственным интеллектом, основывается на обработке естественной речи. Чтобы искусственный интеллект смог распознавать графические элементы, исследователи научили его интерпретировать картинки в специальную серию текстовых токенов, которые понимает языковая модель вроде ChatGPT. Приблизительно по тому же принципу Kosmos-1 распознает аудио и видео.

Еще один вызов для разработчиков – научить искусственный интеллект понимать последовательность форм. Сейчас он проходит визуальные IQ-тесты на 22-26%, но исследователи уверены, что Kosmos-1 способен на больше. В будущем они собираются интегрировать в этот продукт еще и возможность воспроизведения речи.

Напомним, недавно Microsoft представила инструмент с искусственным интеллектом, который поможет бизнесам автоматизировать переписку с клиентами. Также компания добавила свой умный чат-бот Bing в мобильные приложения, благодаря чему общаться с ним можно еще и голосовыми сообщениями.

Нещодавні статті

Power BI: какой курс выбрать для начинающих

Power BI (Business Intelligence) Microsoft – это не просто платформа для анализа данных, а ключевой…

15/01/2024

Лас-Вегас: удивительная история города азарта, мафии и головной боли для архитектора

Лас-Вегас — один из самых узнаваемых городов на планете, который ежегодно манит к себе миллионы…

24/11/2023

Более 800 раз. Пограничники подсчитали, сколько взяток им предлагали уклонисты

Из-за широкомасштабного вторжения россии в Украине было введено военное положение и объявлена ​​мобилизация. Военнообязанным мужчинам…

24/11/2023

На 100 отзывов – 100 отказов? Советы рекрутеров, как не терять мотивацию при поиске работы

«Вижу цель – не вижу препятствий». Знакомая фраза? Часто ею руководствуются кандидаты, ищущие работу мечты.…

24/11/2023

Открытый банкинг. В НБУ раскрыли детали предстоящего обмена данными между банками

Национальный банк Украины работает над открытым банкингом. Речь идет о структурированном и безопасном обмене данными…

24/11/2023

Финансовый консультант потратил более $4 млн своего клиента на азартные игры и недвижимость

В США финансовому консультанту предъявили обвинение в растрате около $5 млн, которые принадлежали его клиенту.…

24/11/2023