• Megjelenési dátum
    Március 16, 2026
  • Megosztás

Bevezetés: Rendszerarchitektúra, nem modell

 

Miközben a mesterséges intelligencia világában a „nagyobb modellekért” folytatott verseny kritikai csendbe fullad, az ágazat jövőjét egyetlen mondatban foglalták össze a 2025-ös japán Open Source Summit konferencián:  „Az ügynökségi mesterséges intelligencia jövőjét nem a modell léptéke, hanem a rendszerarchitektúra fogja meghatározni.” 

 

Ez az elhatározás a legkézzelfoghatóbb jele annak, hogy a hangsúly a modellek betanításáról az ezeket a modelleket fenntartó és skálázó infrastruktúrára helyeződött át. A tokiói Toranomon Hillsben tartott csúcstalálkozó bebizonyította, hogy az olyan óriások, mint a Google, a Fujitsu és a Honda, hogyan vették át a nyílt forráskódot „stratégiai alapként”, és DevOps mérnökként lehetőségem volt a helyszínen megvizsgálni a mesterséges intelligencia és az infrastruktúra világának metszéspontjában lévő új normákat.
Ez a cikk a mesterséges intelligencia és az infrastruktúra világának összekapcsolódását elemzi, felhasználva a rendezvényen személyesen készített fényképeimet, a részt vett technikai előadásokat, valamint a Linux Foundation hivatalos programjából összeállított adatokat.

Ekran Resmi 2026-03-16 09.52.28.png

 

Kulcstémák

A konferencia programjában kiemelkedő technikai megbeszélések és a helyszínen megvizsgált előadások a modern infrastruktúra-gazdálkodás szempontjából a következő főbb tengelyek köré csoportosultak:

 

A. Rendszerarchitektúra és hardver szétválasztása

  • Hardver szétválasztása: Amint azt a Fujitsu „Dinamikus GPU-kiépítés” című munkamenetében részletesen ismertettük, a hagyományos szerverstruktúrán túllépve a CPU-t, a GPU-t és a memóriát egy dinamikus erőforrás-készletbe (Resource Pool) gyűjtjük, eltávolítva azokat a fizikai házakból.
  • MI gyárak: Adatközpontok átalakítása termelési létesítményekké, amelyek képesek reagálni a mesterséges intelligencia terheléseinek változó igényeire a statikus szerverfarmok helyett.

B. Ügynöki műveletek

  • Autonóm infrastruktúra-menedzsment: Amint azt a színpadi demókon is láthattuk, az olyan eszközök struktúrájáról, mint a Terraform, amelyek „hiba esetén leállnak”, az „ügynök” alapú struktúrákra való áttérés, amelyek képesek elemezni a hibát és megoldást kínálni.3 
  • Folyamatos visszacsatolási hurok: A mesterséges intelligencia modellek telepítésének folyamatos monitorozása nemcsak a valós környezetben mutatott teljesítményükről szól.

C. Adatkezelés és biztonság

  • Összevont vektoros hozzáférés: Az NTT és más előadók által megosztott architektúra-diagramok szerint az elosztott forrásokban található helyszíni adatfeldolgozást végző struktúrák az eredményeket egyesítik ahelyett, hogy egy központi tóba helyeznék azokat.6 
  • Szabályzat-mint-kód: Dinamikus adathozzáférési döntések meghozatala a lekérdezés pillanatában olyan motorok által, mint az OPA (Open Policy Agent). 6 

D. Kritikus és különleges munkaterhelések

  • Játékszerver-összeállítás: Ahogy az a Google Open Source csapatának Agones prezentációjában is látható, állapotalapú játékszerverek kezelése globális szinten Kubernetes-en.7 
  • Űrszintű Linux: Robotkarok kezelése az ISS-en nyílt forráskódú szoftverekkel, bemutatva a GITAI előadásában.8 

Fénypontok a konferenciáról

A. Rendszerarchitektúra és hardver szétválasztása

A hardver felszabadítása: CoHDI

A konferencia egyik legkiemelkedőbb technikai szekciója a címmel elhangzott előadás volt. "Dinamikus GPU-kiépítés Kubernetesben" Jin Hase és Tsubasa Watanabe, a Fujitsu csapatának tagjai mutatják be. A színpadon bemutatott építészeti ábra elmagyarázta a CoHDI (Kompozitálható, szétválasztott infrastruktúra) projekt a következőképpen:

 

Ekran Resmi 2026-03-16 09.57.20.png

 

  • Lebontott erőforráskészlet: A CPU-t, a GPU-t, a memóriát és a hálózati kártyákat eltávolítják a fizikai szerverházakból, és egy közös készletbe gyűjtik.
  • PCIe/CXL kapcsolóhálózat: Ezek az alkatrészek nagy sebességű kapcsolókon keresztül kapcsolódnak egymáshoz.
  • Kubernetes integráció: Amint az az ábrán látható, a Kubernetes úgy kér hardvert, mintha egy Podot hozna létre, és a rendszer azonnal összeállítja ezt a hardvert „Composed Baremetal” szerverek létrehozásához.2 

Akkor miért van CoHDI fontos? Ez az architektúra képes növelni a GPU-használat hatékonyságát 30%-ról 80%-ra.

 

Infrastruktúra-összehangolás: Crossplane 2.0

 

A rendezvényen egy másik fontos előadás is bemutatta a Keresztsíkú 2.0 architektúra. A Git deklaratív definícióinak folyamatos monitorozása a Crossplane vezérlőhurok által, valamint azok valós erőforrásokká alakítása az AWS, Azure vagy Google Cloud platformokon támogatta az „öngyógyító” infrastruktúra vízióját. Továbbá, Keresztsíkú 2.0 most már minden Kubernetes környezetben futtatható, nem csak felhőszolgáltatásokhoz, mint a Crossplane v1-ben. A technológiának köszönhetően minden fejlesztő számára lehetővé tette az egyszerű technológiák telepítését segítség nélkül. Lenyűgöző prezentáció volt a DevOps folyamatok jövőjének bemutatása szempontjából. 

B. Ügynöki műveletek

AgentOps: Ez egy folyamatos visszacsatolási motor, amelynek célja, hogy áthidalja a valóság közötti szakadékot azáltal, hogy összehozza a mesterséges intelligencia ágensek fejlesztési (belső ciklus) és alkalmazási (külső ciklus) szakaszait. Ez a struktúra egy olyan MI platformmérnöki tudományág, amely egyetlen ökoszisztémában ötvözi az offline módon előkészített adatkészleteket az élő környezetből származó megfigyelésekkel, lehetővé téve a hibák észlelését és a valós adatok visszaépítését a tesztelési folyamatokba.5 

 

Ember vs. ügynök: Annie Talvasto előadásában amellett érvelt, hogy a gépek mindaddig hiányosak maradnak a DevOps folyamatokban, amíg nem rendelkeznek az emberekben található információkkal. Például megemlítette, hogy a rendszer hiányosan kezelhető, ha még egy apró, lapos levelezés sincs egy kollégától. Előadásában részletesen kitért arra, hogy ezeket az információkat először az ügynököknek kell átadni. 3 

 

Nyílt forráskód az űrben: Nemzetközi Űrállomás és robotika

 

A biztonságkritikus rendszerekkel foglalkozó ülésen készült fotókon a Nemzetközi Űrállomás (ISS) képei és GITAI robotkarok tükröződtek az óriási képernyőn. Látni, hogy a Linuxot olyan környezetben használják, ahol nincs lehetőség hibázni az űr vákuumában, a nyílt forráskód megbízhatóságát bizonyította.8 

 

C. Adatkezelés és biztonság

C. Adatkezelés és biztonság

Egységes vektoros hozzáférés szervezetek és OPA között: Nagy szervezetekben az adatokat általában különböző részlegeknél vagy partnercégeknél, különböző vektoros adatbázisokban tárolják. Ezen adatok egyetlen központba gyűjtése nehézkes a jogi megfelelés, az adatbiztonság és a tulajdonosi jogok miatt. A prezentáció célja egy „virtuális integráció” biztosítása az adatok másolása nélkül.

  • vLLM: Adatforrásokból származó összetett metaadatok értelmes és rövid, természetes nyelvű összefoglalókká alakítására szolgál. Nagy teljesítményű következtetési motorként is szerepet játszik a felhasználói lekérdezések megértésének és az eredmények feldolgozásának folyamatában.
  • Szakpolitikai döntések: Felelős az adatkezelésért és -engedélyezésért. Amikor egy felhasználó lekérdezést kezdeményez, az OPA futásidőben ellenőrzi, hogy a felhasználó rendelkezik-e engedéllyel az adott adatforrás eléréséhez.
  • Milvus részletei: „Szemantikus katalógusként” működik. Vektoros formában tárolja az összes szervezet adatforrásainak technikai és üzleti metaadatait. Lekérdezéskor elvégzi az első keresési szakaszt annak meghatározására, hogy melyik szervezet rendelkezik a releváns adatokkal.

Ez a prezentáció bemutatja, hogyan lehet biztonságos és „intelligens” keresési infrastruktúrát létrehozni a szervezetek között anélkül, hogy az adatokat egy központi helyre kellene mozgatni, a Milvus skálázható keresési képességének, a vLLM nyelvi feldolgozási teljesítményének és az OPA rugalmas biztonsági szabályzatainak kombinálásával.6 

 

Kontextusmérnökség: Kevin Noel előadó szerint a „kérdés megírása és a válaszra várakozás” korszaka lezárult, és ehelyett beléptünk a kontextus-mérnökség korszakába.

  • Az LLM-ek hontalanok: A modellek még az előző mondatra sem emlékeznek, hacsak nem emlékezteted őket rá.
  • Állam létrehozása: Ahhoz, hogy egy mesterséges intelligencia a helyes választ adja, mindent helyesen kell bemutatni neki abban a „pillanatban” (just-in-time). Ez a múltbeli beszélgetések, a dokumentumokból származó információk és az eszközök kimeneteinek összevonásának művészete.

A prezentáció bemutatja, hogy a sikeres mesterséges intelligencia válaszhoz a következő részeket kell kombinálni:

  • RAG (Vonatkozó információk): Belső dokumentumokból vagy adatbázisokból kinyert információk.
  • Memóriakezelés: A felhasználó korábbi beállításai és rövid távú beszélgetési előzményei.
  • Külső eszközök: API-kból vagy számítási eszközökből származó adatok.
  • Rendszerparancsok: A mesterséges intelligencia jellegét és feladatát meghatározó főbb szabályok.

Egy ilyen összetett struktúrát (RAG + memória + eszközök) manuálisan lehetetlen tesztelni. Az előadó a következő megoldást kínálja:

  • Automatikus kiértékelés: A mesterséges intelligenciának több ezer „kérdés-válasz” párt (szintetikus adatokat) kell előállítania a rendelkezésünkre álló adatok felhasználásával.
  • Reális forgatókönyvek: A rendszer robusztusságát úgy kell mérnünk, hogy szintetikus felhasználókat hozunk létre, akik a valódi felhasználókhoz hasonlóan helytelen vagy hiányos kérdéseket tesznek fel.

Költség és sebesség: Szintetikus adathalmazokkal percek alatt értékelhetjük a rendszer sikerességét (pontosság, irrelevancia, hallucinációk), ahelyett, hogy olyan teszteket végeznénk, amelyek embereknél hetekig tartanának. 10 

D. Kritikus és különleges munkaterhelések

Játékszerver-vezérelt vezérlés (Agones): A dián, melynek címe: "Hogyan működik az Agones" a Google Nyílt Forráskódú csapata megosztott egy folyamatábrát a A.R.C. Raiders játék. Ezen az ábrán jól látható volt, hogy a párosítás után a játékosokat „Agones Game Server” nevű Podokhoz rendelték, és ezeket a szervereket globális szinten egy „binpacking” (tömörítési) stratégiával kezelték. Ez lehetővé tette a fejlesztők számára, hogy több időt szenteljenek a játékfejlesztésnek anélkül, hogy az infrastruktúrára gondolniuk kellett volna. Ez azt is bizonyítja, hogy milyen fontos szerepet játszik a Kubernetes, mint nyílt forráskódú szoftver a játékiparban.

Ekran Resmi 2026-03-16 10.37.12.png

Sebesség a modelleloszlásban: A prezentáció bemutatta, hogy a modelleket mostantól OCI-kompatibilis nyilvántartásokban, például Docker-lemezképekben tárolják, és közvetlenül a Podhoz csatlakoztatják (felcsatolják), mint egy lemezt, a ...-nak köszönhetően. CSI illesztőprogram modellEz kiküszöböli a GB-nyi adat másolásának idejét. Ezekhez a műveletekhez a Harbor OCI nyilvántartását használja.8 

 

Következtetési teljesítmény: A vLLM ülésen készített jegyzeteim és vizuális anyagaim szerint a PagedAttention technológia volt a teljesítmény kulcsa. Ez a technológia az operációs rendszerek virtuális memória logikájával kezeli a GPU memóriát, leküzdve a „Key-Value Cache” szűk keresztmetszetet és megsokszorozva az átviteli sebességet. Az előadás azt is megemlíti, hogy a Microsoft által fejlesztett DeepSpeed ​​4-6-szorosára növeli a GPU hatékonyságát, így még régi hardvereken is nagy teljesítményt nyújt. Az előadásban hangsúlyozzák, hogy ennek köszönhetően megnő a díjonként előállított tokenek száma. 9 

 

Következtetés: A 2025-ös japán Open Source Summit konferencia után egy olyan vízióval térek vissza, amely teljesen megváltoztatja a szakmámról alkotott nézőpontomat, nem csak új technikai ismeretekkel a zsebemben.

 

Az esemény egyik legmegdöbbentőbb pontja a lefedett terület szélessége volt. nyílt forráskódú szoftver (OSS)Manapság az a tény, hogy a nyílt forráskód erejében még az emberiség legkritikusabb és legfejlettebb technológiai projektjeiben is megbíznak, mint például a Nemzetközi Űrállomás (ISS), nem csak a weboldalakon vagy mobilalkalmazásokban, ismét emlékeztetett a munkánk felelősségére és a benne rejlő lehetőségekre.

Ekran Resmi 2026-03-16 10.39.07.png

A csúcstalálkozó legfelejthetetlenebb pillanata számomra az volt, amikor élőben hallgathattam Linus Torvaldst, a modern szoftvervilág egyik építészét, a Linux és a Git megalkotóját. Azáltal, hogy első kézből hallottam a technológiához való hozzáállását és a vízióját, megérthettem az általunk használt alapvető eszközök mögött rejlő hatalmas filozófiát.

 

A legnagyobb tanulság, amit ebből a csúcstalálkozóból tanultam, ez volt: A szoftvervilág egy végtelen óceán, amely bármikor nyitott a fejlesztésre, és folyamatosan mozgásban van. Ennek az ökoszisztémának a része lenni nemcsak a kódírást jelenti, hanem a folyamatos tanulást és a közösséghez való hozzájárulást is. A szakmám dinamizmusa hihetetlenül motivál. Most itt az ideje, hogy sokkal elszántabban és gyorsabban folytassam a munkámat ezzel az inspirációval! 👨‍💻✨

 

Ekran Resmi 2026-03-16 10.40.13.png

Japánba tett látogatásom során felismertem egy kíváncsiságot, amely először a Galaksiyában ösztönzött élénk olvasási és tudásmegosztási kultúrában gyökerezett. Elsődleges motivációm az úti cél kiválasztására az volt, hogy elmerüljek egy olyan kultúrában és kulináris örökségben, amelyet alapvetően másnak – szinte egy másik világnak – éreztem a miénktől. Ki akartam lépni a komfortzónámból, és megtapasztalni, milyen érzés „kívülállónak” lenni egy ilyen hatalmas kontrasztokkal teli földön, ahol minden rituálé és íz egy másik dimenzióhoz tartozni látszott.

 

Azonban, ahogy Tokió hatalmas, neonfényes sugárútjain át a szűk sikátorokban eldugott, hagyományos étkezdékig mindent bejártam, mély felismerést éreztem. Míg az ételek aprólékos tálalása és az utcák sztoikus csendje kezdetben idegennek tűnt, hamarosan felfedeztem egy egyetemes lényeget a felszín alatt. Egy modern felhőkarcoló árnyékában állva, és figyelve, ahogy valaki egy pillanatnyi békére lel egy ősi szentélyben, rájöttem, hogy az emberi őszinteség kifejezése ott ugyanolyan, mint a saját hazánkban. Ez erőteljes emlékeztető volt arra, hogy földrajzi elhelyezkedéstől függetlenül az emberiség ugyanazokon az alapvető értékeken alapul: kedvesség, munka, család és a megosztás szelleme.

Ekran Resmi 2026-03-16 10.41.49.png

 

A mélyen gyökerező tisztelet kultúrájának és a hihetetlen pontossággal működő társadalom mögött meghúzódó „láthatatlan harmóniának” a megtapasztalása a megfigyeléseimet az emberiség tágabb tanulságává alakította. Ennek a kulturális mélységnek a megtapasztalása egy ilyen egyedülálló vízióval együtt segített megértenem, hogy a világot nemcsak a struktúrák, hanem az emberi szellem és fegyelem is formálja. Erről az utazásról egy felejthetetlen betekintéssel térek vissza abba, hogy mindannyian „egyek” vagyunk még a világ másik felén is – és természetesen néhány becses fényképpel, amelyek megragadják a város lelkét.
 

Találkozunk a következő megállónál.

Emre İZMİR

Senior DevOps mérnök
Nyílt forráskódú csúcstalálkozó Japánban 2025 – benyomások, Tokió.
 

Referenciák

  1. Az ágentikus mesterséges intelligencia jövőjét nem a modellskálája fogja meghatározni... - Nyílt forráskódú csúcstalálkozó AI_dev Track prezentáció, 2025. december 8-10., Tokió, Japán. Elérhető: https://ossjapan2025.sched.com/type/AI_dev

  2. Dinamikus GPU-kiépítés Kubernetesben, összeállítható, diszaggregált infrastruktúrával - Jin Hase és Tsubasa Watanabe, Fujitsu Limited. Nyílt Forráskódú Csúcstalálkozó Japánban 2025, Felhő- és Konténerprojekt. Elérhető a következő címen: https://github.com/CoHDI

  3. LLM-ek autopilótán: MI-ügynökök futtatása Kubernetes-en - Annie Talvasto, Waovo/Upbound. Nyílt Forráskódú Csúcstalálkozó Japánban 2025. Elérhető itt: https://ossjapan2025.sched.com/event/29Fqz/llms-on-autopilot-running-ai-agents-on-kubernetes-with-open-source-tools-annie-talvasto-waovo

  4. Infrastruktúra-összehangolás Crossplane 2.0 segítségével - Upbound prezentáció. Nyílt forráskódú csúcstalálkozó Japánban 2025. Elérhető itt:(https://ossjapan2025.sched.com/event/29FnY)

  5. A laboratóriumtól az életig: Gyakorlati mesterséges intelligencia rendszerértékelés - Sharon Dashet és Vincent Caldeira, Red Hat Presentation, Tokió, Japán. Elérhető itt: https://ossjapan2025.sched.com/event/29FnS/from-lab-to-life-practical-ai-system-evaluation-sharon-dashet-vincent-caldeira-red-hat

  6. Federated Vector Retrieval és Policy-Aware Retrieval - Hiroki Ito és Shusuke Takahashi, NTT. Nyílt Forráskódú Csúcstalálkozó Japánban 2025, AI_dev kategória. Elérhető itt: https://ossjapan2025.sched.com/event/29FpX/federated-vector-retrieval-across-organizations-with-milvus-opa-and-vllm-hiroki-ito-shusuke-takahashi-ntt

  7. Előadás: Mi a következő lépés az Agones számára? Bolygószintű kormányzás - Ben Huston, a Google Cloud vezető építésze. 2025-ös japán nyílt forráskódú csúcstalálkozó, AI_dev kategória. Elérhető itt: https://ossjapan2025.sched.com/event/2AHMX/keynote-whats-next-for-agones-planet-scale-governance-ben-huston-sr-principal-architect-google-cloud

  8. ModelPack: Nyílt szabvány LLM-ek csomagolására, terjesztésére és futtatására felhőalapú natív környezetben - Wenbo Qi és Chenyu Zhang, Ant Group prezentáció. Nyílt Forráskódú Csúcstalálkozó Japánban 2025. Elérhető: https://ossjapan2025.sched.com/event/29FpF/modelpack-an-open-standard-for-packaging-distributing-and-running-llms-in-cloud-native-environment-wenbo-qi-chenyu-zhang-ant-group

  9. Megnyitó előadás: Az Unió helyzete - Jim Zemlin, ügyvezető igazgató, The Linux Foundation prezentáció. Nyílt forráskódú csúcstalálkozó Japánban 2025. Elérhető: https://ossjapan2025.sched.com/event/2AEuA/keynote-state-of-the-union-jim-zemlin-executive-director-the-linux-foundation

  10. Gyakorlati szintetikus adatstratégiák RAG/ágensrendszerekhez - Kevin Noel, Uzabase - Edge US prezentáció. Nyílt forráskódú csúcstalálkozó Japánban 2025. Elérhető: https://ossjapan2025.sched.com/event/29FlW/practical-synthetic-data-strategies-for-ragagentic-systems-kevin-noel-uzabase-edge-us