Бізде қазір екі үлкен тілдік модель бар. KazLLM мен Alem LLM. Дегенмен оларды қалай қолдануға болады, кім қолдана алады? ChatGPT, Gemini секілді жүйелерден айырмашылығы бар ма, болса, қандай?
Мемлекет басшысы 10 ақпанда өткен Үкіметтің кеңейтілген отырысында Жасанды интеллект және цифрлық даму министріне KazLLM моделі туралы сұрақ қойып, атқарылған жұмыстардың нақты есебін сұраған болатын.
– KazLLM жөнінде мәлімдеме жасадыңыз, оны іске қостық деп айттыңыз. Бірақ менің білуімше, ол бағдарламаға сұраныс әлі төмен, себебі ақауы көп. Жұрт ChatGPT-ге жүгінеді. KazLLM-ге көшкісі келмейді. Сондықтан KazLLM-нің айналасында не болып жатыр деген сұрағым бар. Не айтасыз? – деп сұрады Президент министр Жаслан Мәдиевтен.
Министр қазір бізде екі тілдік модель, KazLLM мен Alem LLM бар екенін айтты. Олар қазір 40-тан астам жүйеге енгізілген, 600 мыңнан астам сұраныс түскен. Бүгінде осы модельдер нарыққа, IT компанияларға, стартаптарға, студенттерге, зерттеу институттарына қолжетімді екен. Дегенмен Жаслан Мәдиев модельдердің сапасын әрқашан жақсартып отыру қажет екенін, сондықтан халықаралық деңгейдегі сарапшылармен бірге бұл бағыттағы жұмысты жалғастыра беретінімізді жеткізді.
KazLLM-ді 2024 жылы Назарбаев университетіндегі Ақылды жүйелер мен жасанды интеллект институты (ISSAI) әзірлеген. Жобаны машиналық оқыту, деректер талдау ғылымы және компьютерлік инженерия салаларындағы қазақстандық жас зерттеушілерден құралған команда жүзеге асырған. Бұдан бөлек, жұмысқа қазақстандық зерттеушілер, мемлекеттік органдар мен бизнес өкілдері де қатысқан. Ресми деректерге сүйенсек, жобаны әзірлеуге шамамен 3,9 млрд теңге жұмсалған.
Ашық деректерде модель 148 миллиард токен негізінде үйретілгені, 8 миллиард және 70 миллиард параметрлері бар екі нұсқа әзірленгені, олар жасанды интеллект саласында жаңа өнімдер әзірлеудің негізі және сапасы мен дәлдігі бойынша өзіне ұқсас модельдерден асып түсетіні туралы ақпараттар бар. Салыстырмалы түрде алғанда, кәдімгі компьютерге 1 миллион фотосурет мұрағатын талдау үшін бірнеше күн қажет болса, KAZ-LLM-ді үйретуге пайдаланылған 8 DGX H100 сервері бұл тапсырманы бірнеше секундта орындай алады екен.
Жобаны әзірлеген Назарбаев университетінің Ақылды жүйелер мен жасанды интеллект институтына, сондай-ақ тәуелсіз сарапшы, IT маман Абылай Жүсіпбекке хабарласып, жалпы отандық тілдік модельдер, олардың басқа жүйелерден айырмашылығы мен болашағы туралы сұрап білдік.
ISSAI,
Назарбаев университетінің
Ақылды жүйелер мен жасанды интеллект институты:
Жасанды интеллект – үздіксіз бәсеке
– Үлкен тілдік модель дегеніміз – үлкен мәтін деректерінде келесі сөзді болжауға үйретілген ЖИ технологиясы. Адам сұрақ қойғанда, контекске сәйкес жауап береді. ChatGPT сияқты жүйелер осындай модельге негізделген. Түсініктірек болуы үшін мынадай аналогия келтіруге болады: үлкен тілдік модельді қозғалтқыш деп қарастырайық. Қозғалтқыш дайын көлік емес, бірақ барлық функцияны іске қосатын негізгі механизм. Сол сияқты KazLLM – ЖИ ассистенттері мен чат-боттардың негізгі компоненті. Мемлекеттік ассистенттер, корпоративтік чат-боттар немесе білім беру платформалары соның негізінде жасалуы мүмкін. Модель – қозғалтқыш, ал практикалық өнім жасап шығару үшін қосымша әзірлеу, дерек қорлары мен құралдармен интеграциялау мен ауқымды инфрақұрылым қажет. ChatGPT – толыққанды өнім және қызмет көрсету экожүйесі. Яғни, дайын көлік. Ең маңыздысы – оны қолдау үшін өте қомақты инвестиция құйылады. Мысалы, OpenAI-дың жылдық операциялық және инфрақұрылым шығындары шамамен 1,4 триллион долларға жетеді деген болжам бар, бұл жүйелерді оқыту және қолдау үшін қажетті ауқымды көрсетеді. Осындай қаржыландыру деңгейі модельді үнемі жетілдіруді және оны жаһандық деңгейде орналастыруға мүмкіндік береді. KazLLM, керісінше, фундаменталды модель. Ол жасанды интеллектінің негізгі қозғалтқышы, бірақ дайын жаһандық өнім емес. ChatGPT-ге ұқсас жүйе болу үшін оған іздеу құралдары мен дерекқорларды ықпалдастыру, пайдаланушыға арналған платформа жасау, үздіксіз қайта оқыту, қауіпсіздік жүйелерін енгізу және ірі деректер орталықтарында орналастыру қажет болады. ISSAI-ға нақты осы қозғалтқыш жасау міндеті жүктелді. Оның айналасында соңғы пайдаланушы қосымшаларын немесе қызметтерін жасауға немесе іске қосуға біздің институт қатысқан жоқ. ISSAI Қазақстанның жасанды интеллект саласындағы қажеттілігін келеді. Дегенмен KazLLM-ді құру туралы ресми сұраныс Үкімет тарапынан түсті.
Жасанды интеллект технологиялары қоғамдық қызмет, бизнес операцияларына және ақпаратқа қолжетімділікке барған сайын әсер етіп жатқандықтан, тек шетел өнімдеріне иек арту стратегиялық тәуелділікті тудыратыны анық болды. Жергілікті модельді дамыту Қазақстанға осы технологияның негізін түсінуге және оны бейімдеуге мүмкіндік береді. Осылайша, негізгі мақсаттың бірі тек модель жасау ғана емес, ұлттық сараптамалық әлеуетті қалыптастыру болды. ISSAI KazLLM-нің екі нұсқасын әзірледі: жұмыс стансасы деңгейінде қолдануға арналған 8 миллиард параметрлі модель және деректер орталықтарында енгізуге бағытталған 70 миллиард параметрлі модель. Модель Llama 3.1 архитектурасына негізделді, себебі сол кезеңде ол әлемдегі ең мықты ашық бастапқы кодты архитектуралардың бірі болды. KazLLM-ді әзірлеу кезінде жеке телекоммуникациялық компания бізге оқыту процесін жүргізу үшін 8 NVIDIA DGX H100 тораптарына қолжетімділік берді, ал жеке қор команда жұмысына қажетті операциялық шығындарды қаржыландырды. Салыстыратын болсақ, Meta LLaMA моделін жасау кезінде 16 мыңнан астам DGX H100 графикалық процессорларын пайдаланып, 400-ден астам зерттеушіні тартты. Дегенмен бұл KazLLM әлдеқайда шектеулі ресурстармен әзірленгенін көрсетеді.
Халықаралық тәжірибеде мұндай модельдер бенчмарк көрсеткіштері арқылы бағаланады. ISSAI KazLLM моделі тілдік түсіну, есеп шығару қабілеті, нақты деректерге негізделген білім және жалпы пайымдау дағдыларын жан-жақты бағалайтын кеңінен қолданылатын стандартты бенчмарктар негізінде тексерілді. Бенчмарктардың бір бөлігі қазақ тіліне бейімделді. Жарияланған KazLLM модельдері жиынтық көрсеткіш бойынша Llama моделінің сәйкес бастапқы нұсқаларынан жоғары нәтиже көрсетті. Жарияланған сәтте (2024 жылғы желтоқсан) 70B KazLLM моделі GPT-4o көрсеткіштеріне өте жақын нәтижеге жетті. Сонымен қатар халықаралық көшбасшылар мен сарапшылар Қазақстанның өзінің ұлттық KazLLM моделін әзірлеу бастамасына назар аударды. Жасанды интеллект саласының ізашар зерттеушісі Янн Лекун 2025 жылғы Париж саммитінде KazLLM көрсеткіштерін атап өтті. Сондай-ақ беделді GSMA Foundry Excellence Awards 2025 іс-шарасында KazLLM марапатқа ие болды.
Генеративті ЖИ, әсіресе үлкен тілдік модельдер (LLM), қазір дүниежүзі бойынша стратегиялық маңызды технологиялық бағытқа айналды. Жаһандық инвестициялардың көлемі бұл стратегиялық маңыздылықты айқын көрсетеді. Ірі технологиялық компаниялар генеративті ЖИ-ге қыруар ресурс бөледі. Мысалға, Microsoft OpenAI-ге 13 миллиард АҚШ долларынан астам инвестиция салған. Amazon Anthropic-ке 4 миллиардқа дейін қаржы жұмсады. Google өзінің Gemini модельдері мен ЖИ инфрақұрылымына қомақты қаржы салуды жалғастырып жатыр. OpenAI де алдағы жылдары есептеу инфрақұрылымы, деректер орталықтары және модельді оқытуға ондаған миллиард доллар жұмсауды жоспарлап отыр. Бұл инвестициялар жаһандық деңгейдегі ин-
фрақұрылым және ғылыми-зерттеу міндеттемелері ауқымды екенін көрсетеді.
LLM тек технологиялық прогресс үшін емес, технологиялық тәуелсіздік үшін де маңызды. Ұлттық модельдерді дамыту арқылы елдер тілі мен мәдени ерекшеліктерін сақтай алады, деректер қауіпсіздігін қамтамасыз етеді, экономикалық пайданы өз экожүйесінде ұстап қала алады, геосаяси тәуелділікті азайтады және жергілікті ЖИ таланттарын қалыптастырады. Қысқаша айтқанда, ұлттық немесе тәуелсіз LLM жасау – бұл цифрлық тәуелсіздік, экономикалық тұрақтылық және жаһандық бәсекеге қабілеттілікке қатысты стратегиялық шешім.
Көптеген елде генеративті ЖИ модельдерін әзірлеуде ірі технологиялық компаниялар көш бастап келеді (OpenAI ChatGPT, Alibaba Qwen, Meta LLaMA, Anthropic Claude, DeepSeekAI DeepSeek). Алайда Қазақстанда жеке сектордың ғылыми-зерттеу жұмыстарына (R&D) жұмсайтын шығындарының ЖІӨ-дегі үлесі салыстырмалы түрде төмен, әрі мұндай қызмет түрлері әдетте жеке сектор тарапынан жүзеге асырылмайды. Технологиялық жағынан дамыған елдер ЖІӨ-нің үлкен бөлігін ғылыми-зерттеу жұмыстарына (R&D) бөледі (Израиль, Оңтүстік Корея, Швеция, АҚШ және т.б.), ал тез дамып келе жатқан табысы орташа елдерде де ЖІӨ-нің 1 пайыздан астамы R&D-ге жұмсалады (Қазақстанда шамамен 0,2 пайыз). Біздің өңірде генеративті ЖИ-ге жеке сектор инвестициясының ең айқын мысалдарының бірі – Ресей Федерациясындағы Sberbank жұмысы. Банк өзінің жасанды интеллект модельдері мен құралдарын жасап, енгізіп отыр. Sberbank-тың генеративті AI өнімдері, мысалы, GigaChat, жаһандық үлкен тілдік модельдермен бәсекелесуге арналған және әртүрлі салаларда енгізіліп жатыр. Sberbank сондай-ақ ЖИ саласына белсенді инвестициялық жоспарларын жариялап, болашақта айтарлықтай шығындар бөлуді мақсат етіп, технологиялық ізін түрлендіру және осы технологиялардан елеулі пайда табу ниетін білдірді. Бұл тәжірибені ескере отырып және Қазақстанның банк секторының қаржылық тұрақтылығын қарастыра отырып, еліміздегі қаржы институттарының өзіміздің генеративті ЖИ-ді дамытуға, әсіресе ашық бастапқы кодтағы модельдер арқылы инвестиция салуға мүмкіндігі бар деп айта аламыз. Мұндай стратегиялық инвестиция тек технологиялық тәуелсіздікке ықпал етумен шектелмейді, елдің цифрлық экономикасын бәсекеге қабілетті етіп, инновацияны дамытуға да мүмкіндік береді.
Жасанды интеллект – үздіксіз бәсеке. Жаңа модельдер шамамен әр алты ай сайын ұсынылып отырады, сондықтан KazLLM-ді әрі қарай дамыту қажет. 2024 жылғы желтоқсанда KazLLM-ді Astana Hub-қа тапсырғаннан кейін оны одан әрі жетілдіру туралы тапсырма алған жоқпыз. KazLLM зерттеу мақсатында кеңінен қолданылды, бұл ашық репозиторийлерден көрінеді. Зерттеушілер мен әзірлеушілер оны әрі қарайғы жаңалықтар мен инновациялар үшін негіз ретінде тәжірибеде қолданады. 2024 жылғы желтоқсанда Astana Hub-қа айрықшалығы жоқ лицензия берілгендіктен, қазір оның операциялық немесе коммерциялық қолданылуы туралы бізде ақпарат жоқ.
Абылай Жүсіпбек,
ZIZ INC. - Digital AI Solutions компаниясының негізін қалаушы,
IT сарапшы:
Тек модель жасаумен шектелмеу керек
– Бүгінде KazLLM сияқты отандық тілдік модельдерге деген қызығушылық айтарлықтай артты. Алайда олардың рөлі мен мүмкіндіктерін байыппен бағалаған жөн.
KazLLM – қазақ тілі мен жергілікті міндеттерге бейімделген үлкен тілдік модель. Технологиялық тұрғыдан ол Llama секілді ашық модельдер негізінде құрылған және қосымша оқытудан, баптаудан өткен. Мұндай тәсіл әлемдік жасанды интеллект индустриясында қалыпты тәжірибе саналады: ірі компаниялардың өзі дайын open-source негізін пайдаланып, оны өз міндеттері, тілдері мен салаларына бейімдейді.
Сондықтан KazLLM-ді толықтай нөлден жасалған іргелі модель деп емес, локализацияланған және қосымша оқытылған модель деп сипаттау дұрысырақ. Соған қарамастан, оның басты құндылығы қазақ тіліне, жергілікті деректер мен қолдану сценарийлеріне бейімделуінде екенін айта кету керек.
Оны ChatGPT сияқты қолдануға бола ма? Ішінара болады. Кез келген тілдік модель интеллектуалды көмекші қызметін атқара алады: сұрақтарға жауап беру, мәтін жазу, аудару, құжаттарды қысқаша мазмұндау. Бірақ ChatGPT – кең инфрақұрылымы мен тұрақты жаңартулары бар дайын коммерциялық өнім. Ал KazLLM – соған ұқсас сервистерді құруға негіз болатын технологиялық база.
Ақпараттық жүйелерді әзірлеу және бизнес пен мемлекеттік ұйымдарға жасанды интеллект шешімдерін енгізу саласында жұмыс істейтін IT-компания ретінде ZIZ INC. тілдік модельдердің нақты жобаларда қалай қолданылып жатқанын тәжірибе жүзінде көріп отыр. Бұл халықаралық сервистер де, open-source модельдер де болуы мүмкін. Тапсырыс берушілер үшін модельдің өзі емес, оның нақты жүйелерге енгізілгені маңызды, мәселен сайтқа, CRM-ге, мобильді қосымшаға немесе компанияның ішкі жүйелеріне интеграциялау.
Толықтай өз тілдік моделін нөлден бастап жасау қазіргі IT индустриядағы ең күрделі міндеттердің бірі екенін түсіну қажет. Ол үшін орасан зор көлемдегі мәтін деректер; өнімділігі жоғары есептеу қуаттары, машинаны оқыту саласындағы мамандар командасы, ұзақ мерзімдегі оқыту мен тестілеу, ірі технологиялық жобалармен салыстырарлықтай инвестиция қажет. Сондықтан көптеген ел мен компания эволюциялық жолды таңдайды: алдымен дайын модельдерді пайдаланады, кейін оларды жергілікті деректер негізінде қайта оқытып, біртіндеп өз инфрақұрылымы мен деректер қорын қалыптастырады. Мұндай тәсіл тезірек практикалық нәтиже алуға және құзыреттерді дамытуға мүмкіндік береді.
Басты міндет – тек модель жасаумен шектелмеу керек. Оның айналасында қолданбалы сервистерді, білім беру бағдарламаларын, зерттеу жобаларын және бизнес экожүйесін дамыту аса маңызды. Дәл осы факторлар жасанды интеллектінің экономика мен қоғам үшін нақты құндылығы қандай екенін айқындайды.
Демек, KazLLM-ді көпшілік үйренген чат-бот форматындағы өнім ретінде қарастырмау керек.
Бұл – Қазақстан өзі, өз ішінде қалыптастыруға талпынып отырған ірі тілдік модель, яғни болашақтағы IT сервистердің өзегі, алғышарты. Ол жаппай пайдаланушыға арналған дайын чат емес, керісінше негіз ретінде жасалған. Осы дайын негізге нақты жұмыс істейтін, қоғам мен экономикаға пайда әкелетін бастамалар құрыла ма, жоқ па, ендігі мәселе – сол.