T-Newspaper

KazLLM ауқымды тіл моделі әзірленді

сурет: istockphoto.com

KazLLM-ге қажетті қазақ тіліндегі корпусты әзірлеуге атсалысқан еліміздің 26 жетекші институттарының, жоғары оқу орындарының 140-тан аса ға­лым­дары мен қызметкерлері экономика, қаржыландыру, математика, тарих, био­ло­гия, химия, медицина, технология және тағы да басқа 115 сала бойынша үл­кен көлемдегі деректерді дайындаумен айналысты.

Мемлекет басшысының тапсырмасы аясында қазақ тіліндегі жасанды интеллектті дамытуға бағытталған KazLLM ауқымды тіл моделі әзірленді.

Аталған тапсыр­маны жүзеге асыру ая­сында Қазақстан Рес­пуб­ликасы Ғылым жә­не жоғары білім ми­нистр­лігі Nazarbayev University жанындағы Ақылды жүйелер мен жасанды интеллект инс­титуты (ISSAI NU), ғы­лыми институттар мен жоғары оқу орын­дарын тарта отырып KazLLM ұлттық тіл мо­деліне қажетті қазақ ті­­лінің корпусын қам­тамасыз ету жұмысын жүргізді. Аталған шара қазақ тіліндегі мәтіндік ақ­паратты өңдеу, аудару, талдау және қазақ тілін заманауи техноло­гия­ларға кіріктіруге қа­жет­ті тиімді шешімдер жасауға бағытталған. Жаһандану және елдің мәдени біре­гейлігін сақтау жағдайында жобаның маңыздылығы тіпті артып отыр. KazLLM-ге қажетті қазақ тіліндегі корпусты әзірлеуге атсалысқан еліміздің 26 жетекші институттарының, жоғары оқу орындарының 140-тан аса ға­лым­дары мен қызметкерлері экономика, қаржыландыру, математика, тарих, био­ло­гия, химия, медицина, технология және тағы да басқа 115 сала бойынша үл­кен көлемдегі деректерді дайындаумен айналысты. Мәселен, әл-Фараби атын­дағы Қазақ ұлттық университеті философия, этика, PR, астрономия, ас-т­рофизика, ақпараттық технология салалары бойынша деректерді дайындаумен, Математика және математикалық модельдеу институты математика саласы бойынша, Ш.Уәлиханов атындағы Тарих және этнология институты тарих са­ласы бойынша, медициналық университеттер медицина саласы бойынша деректерді дайындаумен айналысты. Ғылым және жоғары білім мекемелерімен бұл ынтымақтастық модельдің сапалы әрі тиімді әзірленуін қамтамасыз ететін қазақ тіліндегі бірегей контенттің құрылуына ықпал етті. Цифрлық инфрақұрылымның маңызды бөлігі болып табылатын аталған модель коммерциялық емес ғылыми және академиялық мақсаттарда, сондай-ақ чат-боттар, виртуалды көмекшілер, Google Translate-ке ұқсас автоматты аудармашыларды әзірлеуде қолданылатын болады.