Dirty hands holding an old bible. Very short depth-of-field
На днях компания Meta представила новую модель искусственного интеллекта с открытым кодом, которая распознает более 4 тысяч языков. Правда, для преобразования текста в речь, то есть озвучивания фраз, она пользуется только 1,1 тыс. из них. Еще одна интересная деталь – разработчики обучают модель на Библии и других религиозных текстах, говорится в блоге компании. Редакция MC.today пересказывает подробности.
Новый искусственный интеллект Meta получил название Massively Multilingual Speech (MMS). Первой задачей разработчиков стало существенное расширение речевого потенциала ИИ. До появления MMS самые современные модели насчитывали не более 100 языков. Но этого было недостаточно, чтобы обеспечить пользователям доступ к информации и устройствам привычным и естественным для них способом.
Сегодня в мире существует более 7 тысяч «живых» языков, впрочем, многие могут исчезнуть уже в скором будущем. Поскольку Meta создавала мультилингвистический искусственный интеллект, он мог помочь сохранить некоторые из них.
Это означало, что для обучения нужно было использовать массивы информации, которые доступны на как можно большем количестве языков. Если задуматься, то из всех книг в мире наиболее читаемыми были и будут религиозные, например Библия, Коран, Тора и другие. К тому же именно их в свое время перевели едва ли не на все языки мира.
Например, для начитки учебных данных, в которые вошли религиозные истории, отрывки из священных книг, слова песен, молитв и так далее, использовали более 6,2 тыс. диалектов. Только аудиозаписи Нового Завета научили MMS распознавать текстовые сообщения на 1,1 тыс. языков и воспроизводить их голосом.
Впрочем, до сих пор возникает вопрос, насколько «нормально» использовать религиозные материалы для тренировки искусственного интеллекта. В Meta рассказали, что консультировались с экспертами, в частности, по христианской этике. По их мнению, большинство христиан, например, не считают Новый Завет и его переводы слишком священными для машинного обучения.
Еще одна проблема использования религиозных текстов для тренировки ИИ – риск того, что искусственный интеллект может сформировать основанный на них взгляд на мир. Разработчики провели дополнительные тесты и пришли к выводу, что предвзятость MMS незначительная по сравнению с моделями, которых обучали на данных из других отраслей.
Кровать — громоздкий элемент интерьера даже в просторной спальне. Но что, если помещение совсем небольшое,…
Украинские PR-агентства реализуют масштабные информационные кампании для бизнеса и придают мощный голос социальным проектам, которые…
Power BI (Business Intelligence) Microsoft – это не просто платформа для анализа данных, а ключевой…
Лас-Вегас — один из самых узнаваемых городов на планете, который ежегодно манит к себе миллионы…
Из-за широкомасштабного вторжения россии в Украине было введено военное положение и объявлена мобилизация. Военнообязанным мужчинам…
«Вижу цель – не вижу препятствий». Знакомая фраза? Часто ею руководствуются кандидаты, ищущие работу мечты.…