Українці випустили мовну модель для української мови MamayLM. Чим вона особлива
Українці розробили мовну модель для української мови MamayLM. У команді розповіли MC.today, що вона перевершує всі подібні за розміром моделі для української та англійської мов.

Команда розробників є частиною Інституту INSAIT в Болгарії та ETH Zurich у Швейцарії. MamayLM побудована на основі моделі Google Gemma 2 9B. Для її адаптації до української мови команда використала загалом 75 млрд токенів українського та англійського тексту.
MamayLM може працювати на одному графічному процесорі, а також підходить для впровадження ШІ в Україні (в освіті, юриспруденції, охороні здоров’я та державному секторі).
«Вона є потужною основою для створення застосунків та їх інтеграції в державні установи – особливо в умовах, коли критично важливо зберігати конфіденційність даних (оскільки модель такого невеликого розміру може працювати локально) – а також для особистого використання за невеликої вартості», – йдеться в блозі.
Читайте також: ШІ-асистент від MacPaw: Косован розповів про розробку і коли планується реліз
До слова, раніше повідомлялось, що Мінцифри планує розробити власну LLM-модель. Команда MamayLM уже провела перемовини щодо співпраці й перебуває на звʼязку з AI Center of Excellence.
«Наша співпраця буде сфокусована на обміні досвідом та спільних тестуваннях задля розвитку та допомоги впровадженням ШІ в країні», – додала команда MamayLM.
Якість знань MamayLM також оцінювали на завданнях ЗНОЗовнішнє незалежне оцінювання. Так, модель випередила навіть значно більші моделі, зокрема Gemma2 27B, Llama 3.1 70B та Qwen 2.5 72B.

Джерело: huggingface.co
Модель показала хороші результати і в інших перевірках.
- Нагадаємо, раніше співзасновник Fintech Farm та monobank Дмитро Дубілет пропонував реформувати судочинство в Україні за допомогою ШІ. На його думку, таке радикальне рішення спочатку може доповнити, а потім і взагалі стати заміною більшості учасників судового процесу.
Повідомити про помилку
Текст, який буде надіслано нашим редакторам: