12/01/2025 | Press release | Distributed by Public on 12/01/2025 04:22
Національний оператор електронних комунікацій Київстар та WINWIN AI Center of Excellence при Міністерстві цифрової трансформації України визначили базову модель для тренування української великої мовної моделі (LLM). Нею стане Gemma 3 - відкрита AI-модель нового покоління від Google, яка вже довела свою ефективність у міжнародних і локальних проєктах.
Київстар є стратегічним партнером держави та операційним виконавцем розробки національної LLM. Компанія інвестує в технологічні інновації та цифрові сервіси, впроваджуючи AI-рішення у довгострокову стратегію технологічної трансформації. Українська LLM стане основою для створення цифрових державних та бізнес-продуктів на базі штучного інтелекту, підвищить якість сервісів та ефективність роботи організацій.
Вибрану модель адаптують до української мови, зокрема планується:
Вдосконалити український токенайзер - це покращить роботу моделі з українською мовою, зменшить помилки під час створення україномовних текстів та оптимізує обчислювальні витрати при використанні моделі
Донавчити модель на унікальних україномовних текстах, які зараз збирають експерти
Створити бенчмарки (тести) для більш точного налаштування моделі для подальшого використання
«Вибір Gemma забезпечує оптимальний баланс між продуктивністю та ресурсами, а також високу якість навчання української LLM, - зазначає Михайло Нестор, директор з розробки диджитал-продуктів Київстар, - Модель підтримує понад 140 мов, включно з українською, має до 128 тисяч токенів, мультимодальні можливості та гнучку архітектуру, що дозволяє адаптувати її під різні завдання».
Ключовими перевагами у виборі моделі стали:
Оптимальний баланс продуктивності та ресурсів - Gemma забезпечує високу якість при оптимальних інфраструктурних вимогах. Це одна з найкращих серед відкритих моделей з погляду співвідношення розміру та якості.
Багатомовна підтримка - модель уже має українську мову у своєму діапазоні та легко адаптується через донавчання.
Мультимодальність - модель може сприймати й аналізувати не лише текст, а й зображення.
Розширений токенайзер - обсяг токенів забезпечує точне та ефективне опрацювання текстів та донавчання. Модель має довге контекстне вікно - це 128 тисяч токенів.
Наявність кількох розмірностей дозволяє гнучко обирати розмір моделі під конкретну сферу застосування.
Успішні приклади та досвід використання Gemma для створення українськомовних LLM, зокрема Lapa LLM та MamayLM.
«Ми будуємо українську LLM на готовій open-source моделі. Головне завдання в розробці - донавчити її на наших унікальних даних. При виборі орієнтувалися на те, наскільки якісно модель вже опрацьовує тексти українською мовою та її контрольованість при донавчанні. Це допоможе мінімізувати лінгвістичні та етичні ризики у нашій LLM», - зазначив Данило Цьвок, Chief AI Officer Мінцифри та CEO WINWIN AI Center of Excellence.
«Для нас велика честь, що Міністерство цифрової трансформації та Київстар обрали Gemma як основу для національної української великої мовної моделі (LLM). Це рішення підкреслює стратегічну цінність Gemma, яка забезпечує оптимальний баланс між продуктивністю та ресурсами, а також сильну багатомовну підтримку. Спираючись на успіх Gemma як бази для українських LLM-моделей, ми налаштовані й надалі підтримувати цю ключову ініціативу, спрямовану на розвиток цифрового досвіду в Україні», - зазначив Кшиштоф Казьов, керівник із Customer Engineering Google Cloud у Центральній та Східній Європі.
Gemma вже продемонструвала відмінні результати як базова модель для MamayLM та Lapa LLM - перших і наразі найкращих українських LLM, а також для INSAIT BgGPT - сучасної LLM для болгарської мови.
Довідка про Київстар
ПрАТ «Київстар» («Київстар») - провідний оператор електронних комунікацій України, який станом на 30 вересня 2025 року обслуговував близько 22,5 млн абонентів мобільного та понад 1,2 млн абонентів фіксованого зв'язку. Компанія надає послуги з використанням широкого спектра мобільних і фіксованих технологій, зокрема 4G, Big Data, хмарних рішень, сервісів для кіберзахисту, цифрового телебачення тощо. ПрАТ «Київстар» розвиває в Україні нові телекомунікаційні технології й разом із VEON планує інвестувати в цей напрям 1 млрд дол. США у 2023-2027 роках.
ПрАТ «Київстар» є дочірнім підприємством Kyivstar Group Ltd (Nasdaq: KYIV; KYIVW) - першої української компанії, чиї акції торгуються на американській фондовій біржі Nasdaq.
Компанія допомагає Україні долати виклики воєнного часу й протягом останніх трьох років спрямувала понад 3,4 млрд грн на підтримку Сил оборони, абонентів та реалізацію соціальних проєктів. ПрАТ «Київстар» працює в Україні вже 27 років і визнаний найбільшим платником податків на ринку електронних комунікацій, найкращим роботодавцем і соціально відповідальною компанією.
Додаткова інформація: [email protected], https://www.kyivstar.ua
Довідка про Google Cloud
Google Cloud - це новий підхід до хмарних технологій, що надає AI-сервіси, інфраструктуру, розробку, опрацювання даних, безпекові інструменти та співпрацю, створені для сьогодення та майбутнього. Google Cloud пропонує потужний, повністю інтегрований та оптимізований стек штучного інтелекту з власною інфраструктурою планетарного масштабу, спеціально розробленими чіпами, генеративними моделями штучного інтелекту та платформою розробки, а також додатками на базі штучного інтелекту, щоб допомогти організаціям трансформуватися. Клієнти у понад 200 країнах та територіях звертаються до Google Cloud як до свого надійного технологічного партнера.
Довідка про Міністерство цифрової трансформації України
Міністерство цифрової трансформації України - ключовий державний орган, створений у 2019 році для керівництва цифровою революцією в країні та побудови найзручнішої держави для громадян і бізнесу. Лише за шість років Україна піднялася зі 102-го до 5-го місця у світі за рівнем розвитку цифрових публічних послуг. Флагманським продуктом міністерства є Дія, новаторська «держава у смартфоні». Це державна екосистема, розроблена як єдине вікно, де громадяни можуть отримати доступ до цілого ряду послуг. Дія включає портал з понад 150 державних сервісів та додаток з 33 цифровими документами та понад 65 послугами. Додаткова інформація: digitalstate.gov.ua