• Жариялау күні
    Наурыз 16, 2026
  • үлес

Кіріспе: Модель емес, жүйелік архитектура

 

Жасанды интеллект әлеміндегі «үлкен модельдер» үшін жарыс сыни үнсіздікке жол беріп жатқанда, саланың болашағы Open Source Summit Japan 2025 конференциясында бір сөйлеммен қорытындыланды:  «Агенттік жасанды интеллекттің болашағы модель масштабымен емес, жүйелік архитектурамен анықталады». 

 

Бұл шешім назардың тек модельдерді оқытудан осы модельдерді қолдайтын және масштабтайтын инфрақұрылымға ауысқанының ең нақты көрсеткіші болып табылады. Токиодағы Тораномон Хиллзде өткен саммит Google, Fujitsu және Honda сияқты алыптардың ашық бастапқы кодты «стратегиялық негіз» ретінде қабылдағанын дәлелдеді, ал DevOps инженері ретінде мен жасанды интеллект пен инфрақұрылым әлемдерінің қиылысындағы жаңа нормаларды жергілікті жерде зерттеу мүмкіндігіне ие болдым.
Бұл мақалада жасанды интеллект пен инфрақұрылым әлемдерінің өзара байланысы талданады, іс-шарада жеке өзім түсірген фотосуреттерге, қатысқан техникалық сессияларға және Linux қорының ресми бағдарламасынан жиналған деректерге сүйенеді.

Ekran Resmi 2026-03-16 09.52.28.png

 

Негізгі тақырыптар

Конференция бағдарламасында ерекше назар аударылған техникалық талқылаулар және мен өз орнымда қарастырған презентациялар қазіргі заманғы инфрақұрылымды басқару тұрғысынан келесі негізгі бағыттар бойынша жинақталды:

 

A. Жүйе архитектурасы және аппараттық құралдарды бөлшектеу

  • Аппараттық құралдарды бөлшектеу: Fujitsu компаниясының «Динамикалық GPU қамтамасыз ету» сессиясында егжей-тегжейлі сипатталғандай, дәстүрлі сервер құрылымынан тыс шығып, процессорды, GPU-ны және жадты физикалық жағдайларды жою арқылы динамикалық пулға (Ресурстар пулы) жинайды.
  • Жасанды интеллект зауыттары: Деректер орталықтарын статикалық сервер фермаларының орнына жасанды интеллект жұмыс жүктемелерінің айнымалы талаптарына жауап бере алатын өндірістік нысандарға айналдыру.

B. Агенттік операциялар

  • Автономды инфрақұрылымды басқару: Сахнадағы демонстрациялардан көргеніміздей, Terraform сияқты «қате болған жағдайда тоқтайтын» құралдардың құрылымынан қатені талдап, шешім шығара алатын «Агентке» негізделген құрылымдарға ауысу.3 
  • Үздіксіз кері байланыс циклі: Жасанды интеллект модельдерін орналастыруды ғана емес, сонымен қатар олардың тірі ортадағы жұмысын да үздіксіз бақылау.

C. Деректерді басқару және қауіпсіздік

  • Федеративті векторлық қолжетімділік: NTT және басқа баяндамашылар бөліскен сәулеттік диаграммаларға сәйкес, таратылған дереккөздерде деректерді өңдейтін құрылымдар нәтижелерді орталық көлге жылжытудың орнына біріктіреді.6 
  • Саясат кодексі: OPA (Open Policy Agent) сияқты қозғалтқыштармен сұраныс кезінде деректерге қол жеткізу туралы динамикалық шешімдер қабылдау. 6 

D. Маңызды және арнайы жұмыс жүктемелері

  • Ойын серверінің оркестрлеуі: Google Open Source командасының Agones презентациясында көрсетілгендей, Kubernetes платформасында жаһандық деңгейде күйдегі ойын серверлерін басқару.7 
  • Ғарыштық деңгейдегі Linux: GITAI презентациясында көрсетілген ашық бастапқы кодты бағдарламалық жасақтамамен ХҒС-тағы роботтық қаруларды басқару.8 

Конференцияның маңызды сәттері

A. Жүйе архитектурасы және аппараттық құралдарды бөлшектеу

Аппараттық құралдарды босату: CoHDI

Конференцияның ең таңғажайып техникалық сессияларының бірі «...» атты баяндама болды. «Kubernetes жүйесінде динамикалық GPU қамтамасыз ету» Fujitsu командасынан Джин Хасе мен Цубаса Ватанабе ұсынды. Сахнада көрсетілген сәулеттік схема түсіндірді CoHDI (Композиттелетін бөлшектелген инфрақұрылым) жоба келесідей:

 

Ekran Resmi 2026-03-16 09.57.20.png

 

  • Бөлшектелген ресурстар пулы: Орталық процессор, графикалық процессор, жад және желілік карталар физикалық сервер корпустарынан алынып, ортақ пулға жиналады.
  • PCIe/CXL ауыстырғыш мата: Бұл компоненттер бір-бірімен жоғары жылдамдықты қосқыштар арқылы қосылған.
  • Kubernetes интеграциясы: Диаграммада көрсетілгендей, Kubernetes Pod жасағандай жабдықты сұрайды, ал жүйе бұл жабдықты бірден жинап, «Composed Baremetal» серверлерін жасайды.2 

Неге олай CoHDI маңызды ма? Бұл архитектура GPU пайдалану тиімділігін 30%-дан 80%-ға дейін арттыру мүмкіндігіне ие.

 

Инфрақұрылымдық оркестрлеу: Crossplane 2.0

 

Іс-шарадағы тағы бір маңызды презентация көрсетті Кроссплан 2.0 архитектура. Crossplane басқару циклі арқылы Git-тегі декларативті анықтамаларды үздіксіз бақылау және оларды AWS, Azure немесе Google Cloud-тағы нақты ресурстарға айналдыру «өзін-өзі қалпына келтіретін» инфрақұрылымның көрінісін қолдады. Сондай-ақ, Кроссплан 2.0 енді Crossplane v1 нұсқасындағыдай бұлттық қызметтер үшін ғана емес, барлық Kubernetes орталарында іске қосылуы мүмкін. Технологияның арқасында ол әрбір әзірлеушіге қарапайым технологияларды көмексіз орнатуға мүмкіндік берді. Бұл DevOps процестерінің қай жерде пайда болатынын көрсету тұрғысынан әсерлі презентация болды. 

B. Агенттік операциялар

Агенттік операциялар: Бұл жасанды интеллект агенттерінің әзірлеу (ішкі цикл) және қолдану (сыртқы цикл) кезеңдерін біріктіру арқылы олардың арасындағы шындық алшақтығын жоюға бағытталған үздіксіз кері байланыс қозғалтқышы. Бұл құрылым офлайн дайындалған деректер жиынтығын бірыңғай экожүйедегі тірі ортадан алынған бақылаулармен біріктіретін, қателерді анықтауға және нақты әлемдегі деректерді тестілеу процестеріне қайта қосуға мүмкіндік беретін жасанды интеллект платформасының инженерлік саласы ретінде анықталады.5 

 

Адам және агент: Энни Талвасто өз сөзінде машиналар адамдарда кездесетін ақпаратқа ие болмаған жағдайда DevOps процестерінде толық емес болып қала беретінін алға тартты. Мысалы, ол әріптесіңізден тіпті кішкене хат алмасу болмаған кезде жүйені толық емес басқаруға болатынын айтты. Ол өз презентациясында бұл ақпараттың барлығын алдымен агенттерге беру керектігін егжей-тегжейлі атап өтті. 3 

 

Ғарышта ашық бастапқы код: ХҒС және робототехника

 

Қауіпсіздікке қатысты маңызды жүйелер сессиясында түсірілген фотосуреттерде Халықаралық ғарыш станциясының (ХҒС) және ГИТАЙ робот қолы алып экранда шағылысқан. Linux жүйесінің кеңістік вакуумында қателіктер жіберуге мүмкіндік бермейтін ортада қолданылатынын көру ашық бастапқы кодтың сенімділігінің дәлелі болды.8 

 

C. Деректерді басқару және қауіпсіздік

C. Деректерді басқару және қауіпсіздік

Ұйымдар мен OPA бойынша бірыңғай векторлық қолжетімділік: Ірі ұйымдарда деректер әдетте әртүрлі бөлімдерде немесе серіктес компанияларда, әртүрлі векторлық дерекқорларда сақталады. Бұл деректерді бір орталықта жинау заңдылыққа, деректер қауіпсіздігіне және меншік құқықтарына байланысты қиын. Презентация деректерді көшірмей «виртуалды интеграцияны» қамтамасыз етуге бағытталған.

  • vLLM: Деректер көздерінен алынған күрделі метадеректерді мағыналы және қысқа табиғи тілдік қысқаша мазмұнға айналдыру үшін қолданылады. Сондай-ақ, ол пайдаланушы сұраныстарын түсіну және нәтижелерді өңдеу процестерінде жоғары өнімді қорытынды жасау механизмі ретінде рөл атқарады.
  • Саяси шешімдер: Деректерді басқару және авторизациялау үшін жауапты. Пайдаланушы сұрауды бастаған кезде, OPA пайдаланушының сол деректер көзіне кіруге рұқсаты бар-жоғын орындалу уақытында тексереді.
  • Milvus егжей-тегжейлі: «Семантикалық каталог» ретінде қызмет етеді. Ол барлық ұйымдардағы деректер көздерінің техникалық және бизнес метадеректерін векторлық түрде сақтайды. Сұрау түскен кезде, ол қай ұйымда тиісті деректер болуы мүмкін екенін анықтау үшін бірінші кезеңдегі іздеуді орындайды.

Бұл презентация Milvus компаниясының масштабталатын іздеу мүмкіндігін, vLLM тілді өңдеу қуатын және OPA компаниясының икемді қауіпсіздік саясатын біріктіру арқылы деректерді орталық орынға жылжытпай-ақ ұйымдар арасында қауіпсіз және «ақылды» іздеу инфрақұрылымын қалай құруға болатынын дәлелдейді.6 

 

Контексттік инженерия: Спикер Кевин Ноэль жай ғана «сұрақ жазып, жауап күту» дәуірі аяқталды, оның орнына біз контекстік инженерия дәуіріне аяқ бастық деп мәлімдейді.

  • LLM дәрежесі бар студенттер азаматтығы жоқ: Модельдер сіз еске салмасаңыз, тіпті алдыңғы сөйлемді де есінде сақтамайды.
  • Мемлекеттің құрылуы: Жасанды интеллект дұрыс жауап беруі үшін сіз оған сол «сәтте» (дәл уақытында) бәрін дұрыс ұсынуыңыз керек. Бұл өткен әңгімелерді, құжаттардан алынған ақпаратты және құрал нәтижелерін біріктіру өнері.

Презентацияда жасанды интеллектке сәтті жауап беру үшін келесі бөліктерді біріктіру керек екендігі көрсетілген:

  • RAG (тиісті ақпарат): Ішкі құжаттардан немесе дерекқорлардан алынған ақпарат.
  • Жадты басқару: Пайдаланушының бұрынғы қалаулары және қысқа мерзімді әңгімелесу тарихы.
  • Сыртқы құралдар: API немесе есептеу құралдарынан алынған деректер.
  • Жүйелік командалар: Жасанды интеллекттің сипаты мен міндетін анықтайтын негізгі ережелер.

Мұндай күрделі құрылымды (RAG + Memory + Tools) қолмен тексеру мүмкін емес. Динамик келесі шешімді ұсынады:

  • Автоматты бағалау: Бізде бар деректерді пайдаланып, жасанды интеллект мыңдаған «сұрақ-жауап» жұптарын (синтетикалық деректер) жасауы керек.
  • Шынайы сценарийлер: Біз жүйенің беріктігін нақты пайдаланушылар сияқты дұрыс емес немесе толық емес сұрақтар қоятын синтетикалық пайдаланушыларды жасау арқылы өлшеуіміз керек.

Құны және жылдамдығы: Біз жүйенің табысын (дәлдігі, маңыздылығы, галлюцинациясы) адамдар үшін апталап созылатын сынақтардың орнына синтетикалық деректер жиынтығымен бірнеше минут ішінде бағалай аламыз. 10 

D. Маңызды және арнайы жұмыс жүктемелері

Ойын серверінің оркестрлеуі (Agones): Атаулы слайдта «Агондар қалай жұмыс істейді» Google Open Source командасы инфрақұрылым бойынша блок-схемамен бөлісті A.R.C. Raiders ойын. Бұл диаграммада ойыншылар жұптастырудан кейін «Agones Game Server» деп аталатын Pod-тарға тағайындалғаны және бұл серверлер жаһандық деңгейде «binpacking» (сығымдау) стратегиясымен басқарылатыны анық көрінді. Бұл әзірлеушілерге инфрақұрылым туралы ойламай, ойын әзірлеуге көбірек уақыт бөлуге мүмкіндік берді. Бұл сондай-ақ Kubernetes ойын индустриясында ашық бастапқы код ретінде қаншалықты маңызды рөл атқаратынын дәлелдейді.

Ekran Resmi 2026-03-16 10.37.12.png

Модельді тарату жылдамдығы: Презентацияда модельдер енді Docker кескіндері сияқты OCI үйлесімді тізілімдерінде сақталатыны және Pod-қа диск сияқты тікелей қосылғаны (орнатылғаны) көрсетілді. CSI драйверінің моделіБұл ГБ деректерді көшіруге кететін уақытты жояды. Бұл операциялар үшін Harbor компаниясының OCI тізілімі қолданылады.8 

 

Қорытынды өнімділігі: vLLM сессиясынан алған жазбаларым мен көрнекіліктеріме сәйкес, PagedAttention технологиясы өнімділіктің кілті болды. Бұл технология операциялық жүйелердегі виртуалды жад логикасымен GPU жадын басқарады, «Кілттік мән кэшінің» кедергісін жеңіп, өткізу қабілетін арттырады. Презентацияда Microsoft әзірлеген DeepSpeed ​​GPU тиімділігін 4-6 есеге арттыратыны, тіпті ескі жабдықта да жоғары өнімділікті қамтамасыз ететіні айтылады. Презентацияда осының арқасында бір төлемге өндірілетін токендердің саны артатыны атап өтілген. 9 

 

Қорытынды: 2025 жылғы Open Source Summit Japan саммитінен кейін мен тек жаңа техникалық біліммен ғана емес, мамандығыма деген көзқарасымды толығымен өзгертетін көзқараспен ораламын.

 

Іс-шара барысында мені ең қатты таң қалдырған мәселелердің бірі - қамту аймағының кеңдігі ашық бастапқы бағдарламалық жасақтама (OSS)Бүгінгі таңда ашық бастапқы кодтың күшіне адамзаттың ең маңызды және озық технологиялық жобаларында да сенім артылатыны айқын. Халықаралық ғарыш станциясы (ХҒС)тек веб-сайттарда немесе мобильді қосымшаларда ғана емес, сонымен қатар біз атқаратын жұмыстың жауапкершілігі мен әлеуетін тағы да еске салды.

Ekran Resmi 2026-03-16 10.39.07.png

Мен үшін саммиттің ең ұмытылмас сәті заманауи бағдарламалық жасақтама әлемінің сәулетшілерінің бірі және Linux пен Git-ті жасаушы Линус Торвальдсты тікелей тыңдау болды. Оның технологияға деген көзқарасы мен көзқарасын тікелей тыңдау маған біз қолданатын негізгі құралдардың артындағы үлкен философияны түсінуге мүмкіндік берді.

 

Бұл саммиттен алған ең үлкен сабағым мынау болды: Бағдарламалық жасақтама әлемі – кез келген уақытта дамуға ашық және үнемі қозғалыста болатын шексіз мұхит. Бұл экожүйенің бір бөлігі болу тек код жазуды ғана емес, сонымен қатар үнемі білім алуды және қоғамдастыққа үлес қосуды білдіреді. Мамандығымның бұл динамизмі мені керемет ынталандырады. Енді осы шабытпен жұмысымды әлдеқайда табанды және жылдам жалғастырудың уақыты келді! 👨‍💻✨

 

Ekran Resmi 2026-03-16 10.40.13.png

Жапонияға сапарым Галаксияда қолдау тапқан жанды оқу және білім алмасу мәдениеті арқылы алғаш рет пайда болған қызығушылықтың жүзеге асуы болды. Бұл бағытты таңдауымның басты себебі - өзімізден түбегейлі өзгеше - дерлік бөлек әлем - деп санайтын мәдениет пен аспаздық мұраға ену болды. Мен өзімнің жайлылық аймағымнан шығып, әрбір рәсім мен дәм басқа өлшемге жататын сияқты кең қарама-қайшылықты елде «бөтен адам» болу сезімін бастан кешіргім келді.

 

Дегенмен, Токионың үлкен, неон жарықтандырылған бульварларынан бастап, тар аллеялардағы дәстүрлі, жасырынған мейрамханаларға дейін барлығын аралап жүргенде, мен терең түсінікке ие болдым. Тағамның мұқият ұсынылуы мен көшелердің стоикалық тыныштығы бастапқыда бөтен болып көрінгенімен, көп ұзамай сол беттің астынан әмбебап мәнді аштым. Заманауи зәулім ғимараттың көлеңкесінде тұрып, біреудің ежелгі қасиетті жерде тыныштық табатынын бақылап отырып, мен адамның шынайылығының көрінісі онда да, өз отанымызда да бірдей екенін түсіндім. Бұл географиялық жағдайға қарамастан, адамзат бірдей негізгі құндылықтарға: мейірімділікке, еңбекке, отбасына және бөлісу рухына тоғысатынын еске салатын күшті ескерту болды.

Ekran Resmi 2026-03-16 10.41.49.png

 

Тереңде жатқан құрмет мәдениеті мен осындай керемет дәлдікпен жұмыс істейтін қоғамның артындағы «көрінбейтін үйлесімділіктің» куәсі болу менің бақылауларымды адамзаттың кеңірек сабағына айналдырды. Осындай ерекше көзқараспен қатар осы мәдени тереңдікті бастан кешіру маған әлемнің тек құрылымдармен ғана емес, сонымен қатар адам рухы мен тәртібімен де қалыптасатынын түсінуге көмектесті. Мен бұл сапардан жер шарының екінші жағында да біздің бәріміз «бір» екенімізді ұмытылмас түсінікпен және, әрине, қаланың жанын бейнелейтін бірнеше құнды фотосуреттермен ораламын.
 

Келесі аялдамада кездескенше.

Эмре Измир

Аға DevOps инженері
Жапониядағы 2025 жылғы ашық бастапқы коды бар саммиттің әсері, Токио.
 

Әдебиеттер тізімі

  1. Агенттік жасанды интеллекттің болашағы модель масштабымен анықталмайды... - Ашық бастапқы кодты саммит AI_dev трек презентациясы, 2025 жылғы 8-10 желтоқсан, Токио, Жапония. Қолжетімді жері: https://ossjapan2025.sched.com/type/AI_dev

  2. Kubernetes-те композициялық бөлшектенген инфрақұрылымы бар динамикалық GPU қамтамасыз ету - Джин Хасе және Цубаса Ватанабе, Fujitsu Limited. Ашық бастапқы коды бар Жапония саммиті 2025, бұлт және контейнерлер трегі. Қолжетімді жерде: https://github.com/CoHDI

  3. Автопилоттағы LLM: Kubernetes-те жасанды интеллект агенттерін іске қосу - Энни Талвасто, Waovo/Upbound. Жапониядағы ашық бастапқы коды бар саммит 2025. Қолжетімді жерде: https://ossjapan2025.sched.com/event/29Fqz/llms-on-autopilot-running-ai-agents-on-kubernetes-with-open-source-tools-annie-talvasto-waovo

  4. Crossplane 2.0 көмегімен инфрақұрылымды ұйымдастыру - Upbound презентациясы. Жапониядағы ашық бастапқы коды бар саммит 2025. Қолжетімді жерде:(https://ossjapan2025.sched.com/event/29FnY)

  5. Зертханадан өмірге дейін: практикалық жасанды интеллект жүйесін бағалау - Шарон Дашет және Винсент Калдейра, Red Hat презентациясы, Токио, Жапония. Қолжетімді жері: https://ossjapan2025.sched.com/event/29FnS/from-lab-to-life-practical-ai-system-evaluation-sharon-dashet-vincent-caldeira-red-hat

  6. Федеративті векторлық іздеу және саясатқа негізделген іздеу - Хироки Ито және Шусуке Такахаши, NTT. Жапониядағы ашық бастапқы коды бар саммит 2025, AI_dev Track. Қолжетімді жерде: https://ossjapan2025.sched.com/event/29FpX/federated-vector-retrieval-across-organizations-with-milvus-opa-and-vllm-hiroki-ito-shusuke-takahashi-ntt

  7. Негізгі баяндама: Агондарды не күтіп тұр? Ғаламдық басқару - Бен Хьюстон, Google Cloud компаниясының бас сәулетшісі, аға. Ашық бастапқы кодты саммит Жапония 2025, AI_dev Track. Қолжетімді жерде: https://ossjapan2025.sched.com/event/2AHMX/keynote-whats-next-for-agones-planet-scale-governance-ben-huston-sr-principal-architect-google-cloud

  8. ModelPack: бұлттық жергілікті ортада LLM-дерді орау, тарату және іске қосу үшін ашық стандарт - Вэньбо Ци және Ченью Чжан, Ant Group презентациясы. Жапониядағы ашық бастапқы коды бар саммит 2025. Қолжетімді жерде: https://ossjapan2025.sched.com/event/29FpF/modelpack-an-open-standard-for-packaging-distributing-and-running-llms-in-cloud-native-environment-wenbo-qi-chenyu-zhang-ant-group

  9. Негізгі ой: Одақтың жағдайы - Джим Землин, Linux Foundation презентациясының атқарушы директоры. Жапониядағы Open Source Summit 2025. Қолжетімді жерде: https://ossjapan2025.sched.com/event/2AEuA/keynote-state-of-the-union-jim-zemlin-executive-director-the-linux-foundation

  10. RAG/агенттік жүйелерге арналған практикалық синтетикалық деректер стратегиялары - Кевин Ноэль, Uzabase - Edge US презентациясы. Жапониядағы ашық бастапқы коды бар саммит 2025. Қолжетімді жерде: https://ossjapan2025.sched.com/event/29FlW/practical-synthetic-data-strategies-for-ragagentic-systems-kevin-noel-uzabase-edge-us

Қатысты Мақалалар