• Publiceer datum
    16 maart 2026
  • Delen

Inleiding: Systeemarchitectuur, geen model

 

Terwijl de wedloop om "grotere modellen" in de wereld van kunstmatige intelligentie plaatsmaakt voor een kritische stilte, werd de toekomst van de sector tijdens de Open Source Summit Japan 2025 in één zin samengevat:  "De toekomst van Agentic AI zal niet worden bepaald door de schaal van het model, maar door de systeemarchitectuur." 

 

Deze vaststelling is de meest concrete indicator dat de focus is verschoven van louter modeltraining naar de infrastructuur die deze modellen ondersteunt en schaalbaar maakt. De top in Toranomon Hills, Tokio, bewees hoe giganten als Google, Fujitsu en Honda open source hebben omarmd als een "strategische basis", en als DevOps-engineer kreeg ik de kans om ter plekke de nieuwe normen op het snijvlak van kunstmatige intelligentie en infrastructuur te onderzoeken.
Dit artikel analyseert de onderlinge verbanden tussen de werelden van kunstmatige intelligentie en infrastructuur, aan de hand van foto's die ik zelf tijdens het evenement heb gemaakt, de technische sessies die ik heb bijgewoond en gegevens uit het officiële programma van de Linux Foundation.

Ekran Resmi 2026-03-16 09.52.28.png

 

Kernthema's

De technische discussies die opvielen in het conferentieprogramma en de presentaties die ik ter plaatse heb bekeken, waren te ordenen rond de volgende hoofdthema's met betrekking tot modern infrastructuurbeheer:

 

A. Systeemarchitectuur en hardware-ontleding

  • Hardware-ontkoppeling: Zoals gedetailleerd beschreven in de sessie "Dynamic GPU Provisioning" van Fujitsu, wordt er verder gegaan dan de traditionele serverstructuur door CPU, GPU en geheugen te verzamelen in een dynamische pool (resourcepool) door ze uit de fysieke behuizingen te halen.
  • AI-fabrieken: De transformatie van datacenters naar productiefaciliteiten die kunnen inspelen op de wisselende eisen van kunstmatige intelligentie-workloads, in plaats van statische serverparken.

B. Agentische operaties

  • Autonoom infrastructuurbeheer: Zoals we in de demonstraties op het podium hebben gezien, vindt de overgang plaats van de structuur van tools zoals Terraform, die "stoppen bij een fout", naar op "agenten" gebaseerde structuren die de fout kunnen analyseren en een oplossing kunnen bieden.3 
  • Continue feedbacklus: Continue monitoring van niet alleen de implementatie van kunstmatige intelligentiemodellen, maar ook van hun prestaties in de praktijk.

C. Gegevensbeheer en -beveiliging

  • Gefedereerde vectortoegang: Volgens de architectuurdiagrammen die door NTT en andere presentatoren werden gedeeld, combineren structuren die gegevens ter plaatse verwerken vanuit gedistribueerde bronnen de resultaten in plaats van ze naar een centrale opslagplaats te verplaatsen.6 
  • Beleid als code: Dynamische besluitvorming over gegevenstoegang op het moment van de query door systemen zoals OPA (Open Policy Agent). 6 

D. Kritieke en bijzondere werklasten

  • Spelserverorkestratie: Zoals te zien is in de Agones-presentatie van het Google Open Source-team, is het mogelijk om stateful game servers wereldwijd te beheren met Kubernetes.7 
  • Ruimtevaartkwaliteit Linux: Het aansturen van robotarmen op het ISS met open source software, zoals gedemonstreerd in de presentatie van GITAI.8 

Hoogtepunten van de conferentie

A. Systeemarchitectuur en hardware-ontleding

Bevrijding van hardware: CoHDI

Een van de meest opvallende technische sessies van de conferentie was de toespraak met de titel... "Dynamische GPU-provisionering in Kubernetes" Gepresenteerd door Jin Hase en Tsubasa Watanabe van het Fujitsu-team. Het architectuurdiagram dat op het podium werd getoond, gaf uitleg over de CoHDI (Composable Disaggregated Infrastructure) project als volgt:

 

Ekran Resmi 2026-03-16 09.57.20.png

 

  • Gedetailleerde resourcepool: De CPU, GPU, het geheugen en de netwerkkaarten worden uit de fysieke serverbehuizingen verwijderd en in een gezamenlijke pool verzameld.
  • PCIe/CXL-switchfabric: Deze componenten zijn met elkaar verbonden via snelle schakelaars.
  • Kubernetes-integratie: Zoals in het diagram te zien is, vraagt ​​Kubernetes hardware aan alsof het een Pod aanmaakt, en het systeem assembleert deze hardware direct om "Composed Baremetal"-servers te creëren.2 

Dus waarom is het? CoHDI Belangrijk? Deze architectuur heeft de potentie om de efficiëntie van het GPU-gebruik te verhogen van 30% naar 80%.

 

Infrastructuurorkestratie: Crossplane 2.0

 

Een andere belangrijke presentatie tijdens het evenement liet zien dat Crossplane 2.0 architectuur. De continue monitoring van declaratieve definities in Git door de Crossplane-controlloop en de transformatie ervan naar daadwerkelijke resources op AWS, Azure of Google Cloud ondersteunde de visie van een "zelfherstellende" infrastructuur. Ook, Crossplane 2.0 Het kon nu in alle Kubernetes-omgevingen worden uitgevoerd, niet alleen voor cloudservices zoals in Crossplane v1. Dankzij de technologie kon elke ontwikkelaar eenvoudige technologieën zonder hulp installeren. Het was een indrukwekkende presentatie die liet zien waar DevOps-processen naartoe zullen gaan. 

B. Agentische operaties

AgentOps: Het is een continu feedbackmechanisme dat tot doel heeft de kloof tussen de realiteit en de ontwikkelingsfase (binnenste lus) en de toepassingsfase (buitenste lus) van kunstmatige intelligentie-agenten samen te brengen. Deze structuur wordt gedefinieerd als een discipline binnen de AI-platformontwikkeling die offline voorbereide datasets combineert met observaties uit de live omgeving in één ecosysteem. Dit maakt het mogelijk om fouten op te sporen en data uit de praktijk terug te koppelen naar testprocessen.5 

 

Mens versus agent: Annie Talvasto betoogde in haar toespraak dat machines incompleet zullen blijven in DevOps-processen zolang ze niet beschikken over de informatie die mensen wel hebben. Ze noemde als voorbeeld dat een systeem onvolledig beheerd kan worden als er zelfs geen kleine Slack-correspondentie van een collega is. Ze legde in haar presentatie uitgebreid uit dat al deze informatie eerst aan de agents verstrekt moet worden. 3 

 

Open source in de ruimte: ISS en robotica

 

Op de foto's die tijdens de sessie over veiligheidskritieke systemen zijn genomen, zijn afbeeldingen te zien van het Internationale Ruimtestation (ISS) en GITAI De robotarm werd weerspiegeld op het gigantische scherm. Dat Linux werd gebruikt in een omgeving waar zich geen fouten kunnen veroorloven in het vacuüm van de ruimte, was het bewijs van de betrouwbaarheid van open source.8 

 

C. Gegevensbeheer en -beveiliging

C. Gegevensbeheer en -beveiliging

Uniforme vectortoegang voor alle organisaties en OPA: In grote organisaties worden gegevens doorgaans opgeslagen in verschillende afdelingen of partnerbedrijven, in verschillende vectordatabases. Het samenbrengen van deze gegevens in één centrale locatie is lastig vanwege wettelijke voorschriften, gegevensbeveiliging en eigendomsrechten. Deze presentatie heeft als doel een "virtuele integratie" te realiseren zonder de gegevens te kopiëren.

  • vLLM: Het wordt gebruikt om complexe metadata uit databronnen om te zetten in betekenisvolle en korte samenvattingen in natuurlijke taal. Daarnaast fungeert het als een krachtige inferentiemotor bij het begrijpen van gebruikersvragen en het verwerken van resultaten.
  • Beleidsbeslissingen: Verantwoordelijk voor gegevensbeheer en -autorisatie. Wanneer een gebruiker een query start, controleert OPA tijdens de uitvoering of de gebruiker gemachtigd is om toegang te krijgen tot die gegevensbron.
  • Milvus-details: Het fungeert als een "semantische catalogus". Het slaat de technische en zakelijke metadata van gegevensbronnen in alle organisaties op in vectorvorm. Wanneer een zoekopdracht binnenkomt, voert het een eerste zoekfase uit om te bepalen welke organisatie mogelijk over de relevante gegevens beschikt.

Deze presentatie laat zien hoe een veilige en "slimme" zoekinfrastructuur tussen organisaties kan worden opgezet zonder gegevens naar een centrale locatie te verplaatsen, door de schaalbare zoekmogelijkheden van Milvus, de taalverwerkingskracht van vLLM en het flexibele beveiligingsbeleid van OPA te combineren.6 

 

Contextengineering: Spreker Kevin Noel betoogt dat het tijdperk van simpelweg "een opdracht schrijven en wachten op een antwoord" voorbij is en dat we in plaats daarvan het tijdperk van contextengineering zijn binnengegaan.

  • LLM-afgestudeerden zijn staatloos: Modellen onthouden zelfs de vorige zin niet, tenzij je ze eraan herinnert.
  • Staatsvorming: Om een ​​kunstmatige intelligentie het juiste antwoord te laten geven, moet je op dat "moment" (just-in-time) alle informatie correct aanleveren. Dit is de kunst van het samenbrengen van eerdere gesprekken, informatie uit documenten en de output van tools.

De presentatie laat zien dat de volgende onderdelen gecombineerd moeten worden voor een succesvolle reactie van kunstmatige intelligentie:

  • RAG (Relevante informatie): Informatie afkomstig uit interne documenten of databases.
  • Geheugen management: Eerdere voorkeuren van de gebruiker en de gespreksgeschiedenis op korte termijn.
  • Externe tools: Gegevens afkomstig van API's of rekenprogramma's.
  • Systeemopdrachten: Belangrijkste regels die het karakter en de taak van de kunstmatige intelligentie bepalen.

Het is onmogelijk om zo'n complexe structuur (RAG + geheugen + tools) handmatig te testen. De spreker biedt de volgende oplossing:

  • Automatische evaluatie: We moeten kunstmatige intelligentie duizenden vraag-antwoordparen (synthetische data) laten genereren op basis van de data die we hebben.
  • Realistische scenario's: We moeten de robuustheid van het systeem meten door synthetische gebruikers te creëren die, net als echte gebruikers, onjuiste of onvolledige vragen stellen.

Kosten en snelheid: We kunnen het succes van het systeem (nauwkeurigheid, irrelevantie, hallucinatie) binnen enkele minuten beoordelen met behulp van synthetische datasets, in plaats van tests die voor mensen weken zouden duren. 10 

D. Kritieke en bijzondere werklasten

Spelserverorkestratie (Agones): In de dia met de titel "Hoe Agones werkt" Het Google Open Source-team deelde een stroomschema over de infrastructuur van de A.R.C. Raiders spel. In dit diagram was duidelijk te zien dat spelers na matchmaking werden toegewezen aan Pods genaamd "Agones Game Server" en dat deze servers wereldwijd werden beheerd met een "binpacking" (compressie) strategie. Dit stelde ontwikkelaars in staat meer tijd te besteden aan de spelontwikkeling zonder zich zorgen te hoeven maken over de infrastructuur. Het bewijst tevens hoe belangrijk Kubernetes als open source is voor de game-industrie.

Ekran Resmi 2026-03-16 10.37.12.png

Snelheid in modeldistributie: De presentatie liet zien dat modellen nu worden bewaard in OCI-compatibele registries, net als Docker-images, en dankzij de technologie direct aan de Pod worden gekoppeld (gemount) als een schijf. Model CSI-stuurprogrammaDit bespaart de tijd die anders nodig zou zijn om gigabytes aan data te kopiëren. Voor deze bewerkingen wordt gebruikgemaakt van het OCI-register van Harbor.8 

 

Inferentieprestaties: Volgens de aantekeningen en afbeeldingen die ik van de vLLM-sessie heb meegenomen, was de PagedAttention-technologie de sleutel tot de prestaties. Deze technologie beheert het GPU-geheugen met behulp van de virtuele geheugenlogica in besturingssystemen, waardoor het knelpunt van de "Key-Value Cache" wordt overwonnen en de doorvoer aanzienlijk wordt verhoogd. In de presentatie werd ook vermeld dat DeepSpeed, ontwikkeld door Microsoft, de GPU-efficiëntie met een factor 4 tot 6 verhoogt, waardoor zelfs op oudere hardware hoge prestaties worden behaald. Er werd benadrukt dat hierdoor het aantal tokens dat per transactie wordt gegenereerd, toeneemt. 9 

 

Conclusie: Na afloop van de Open Source Summit Japan 2025 keer ik terug met een visie die mijn kijk op mijn vak volledig verandert, en niet alleen met nieuwe technische kennis op zak.

 

Een van de dingen die me het meest imponeerden tijdens het evenement, was de omvang van het dekkingsgebied. open source software (OSS)Het feit dat tegenwoordig zelfs in de meest cruciale en geavanceerde technologieprojecten van de mensheid, zoals de Internationaal ruimtestation (ISS)Niet alleen op websites of mobiele applicaties, maar ook daar werd ik er weer eens aan herinnerd welke verantwoordelijkheid en mogelijkheden er schuilgaan in het werk dat we doen.

Ekran Resmi 2026-03-16 10.39.07.png

Het meest onvergetelijke moment van de topconferentie was voor mij het live luisteren naar Linus Torvalds, een van de architecten van de moderne softwarewereld en de bedenker van Linux en Git. Door zijn benadering van technologie en zijn visie uit eerste hand te horen, begreep ik de enorme filosofie achter de basistools die we gebruiken.

 

De belangrijkste les die ik van deze top heb geleerd, is deze: De softwarewereld is een oneindige oceaan, die op elk moment openstaat voor ontwikkeling en constant in beweging is. Deel uitmaken van dit ecosysteem betekent niet alleen code schrijven, maar ook continu leren en bijdragen aan de community. Deze dynamiek van mijn vak motiveert me enorm. Nu is het tijd om met deze inspiratie nog vastberadener en sneller verder te gaan! 👨‍💻✨

 

Ekran Resmi 2026-03-16 10.40.13.png

Mijn bezoek aan Japan was de verwezenlijking van een nieuwsgierigheid die was ontstaan ​​door de levendige cultuur van lezen en kennisdeling die werd aangemoedigd in Galaksiya. Mijn voornaamste motivatie om voor deze bestemming te kiezen was om me onder te dompelen in een cultuur en culinair erfgoed dat ik als fundamenteel anders – bijna een wereld apart – beschouwde dan het onze. Ik wilde uit mijn comfortzone stappen en ervaren hoe het voelde om een ​​'buitenstaander' te zijn in een land van zulke enorme contrasten, waar elk ritueel en elke smaak tot een andere dimensie leek te behoren.

 

Terwijl ik me een weg baande door alles, van de enorme, neonverlichte boulevards van Tokio tot de traditionele, verscholen eettentjes in smalle steegjes, deed zich een diepgaand inzicht voor. Hoewel de zorgvuldige presentatie van het eten en de serene stilte van de straten aanvankelijk vreemd aanvoelden, ontdekte ik al snel een universele essentie onder die oppervlakte. Staand in de schaduw van een moderne wolkenkrabber en kijkend naar iemand die een moment van rust vond bij een eeuwenoud heiligdom, besefte ik dat de uiting van menselijke oprechtheid daar hetzelfde is als in ons eigen land. Het was een krachtige herinnering dat, ongeacht de geografische locatie, de mensheid samenkomt rond dezelfde fundamentele waarden: vriendelijkheid, hard werken, familie en de geest van delen.

Ekran Resmi 2026-03-16 10.41.49.png

 

Het aanschouwen van de diepgewortelde cultuur van respect en de "onzichtbare harmonie" achter een samenleving die met zo'n ongelooflijke precisie functioneert, transformeerde mijn observaties in een bredere les over menselijkheid. Het ervaren van deze culturele diepgang in combinatie met zo'n unieke visie hielp me te begrijpen dat de wereld niet alleen wordt gevormd door structuren, maar ook door de menselijke geest en discipline. Ik keer terug van deze reis met een onvergetelijk inzicht in hoe we allemaal "één" zijn, zelfs aan de andere kant van de wereld – en natuurlijk met een paar dierbare foto's die de ziel van de stad vastleggen.
 

Tot ziens bij onze volgende halte.

Emre İZMİR

Sr. DevOps-ingenieur
Impressies van Open Source Summit Japan 2025, Tokio.
 

Referenties

  1. De toekomst van agentische AI ​​zal niet worden bepaald door de schaal van het model... - Presentatie tijdens de AI_dev Track van de Open Source Summit, 8-10 december 2025, Tokio, Japan. Beschikbaar op: https://ossjapan2025.sched.com/type/AI_dev

  2. Dynamische GPU-provisionering in Kubernetes met configureerbare, gedisaggregeerde infrastructuur. - Jin Hase & Tsubasa Watanabe, Fujitsu Limited. Open Source Summit Japan 2025, Cloud & Containers Track. Beschikbaar op: https://github.com/CoHDI

  3. LLM's op de automatische piloot: AI-agenten uitvoeren op Kubernetes - Annie Talvasto, Waovo/Upbound. Open Source Summit Japan 2025. Beschikbaar op: https://ossjapan2025.sched.com/event/29Fqz/llms-on-autopilot-running-ai-agents-on-kubernetes-with-open-source-tools-annie-talvasto-waovo

  4. Infrastructuurorkestratie met Crossplane 2.0 - Upbound-presentatie. Open Source Summit Japan 2025. Beschikbaar op:(https://ossjapan2025.sched.com/event/29FnY)

  5. Van lab naar de praktijk: evaluatie van een praktisch AI-systeem - Sharon Dashet & Vincent Caldeira, presentatie van Red Hat, Tokio, Japan. Verkrijgbaar bij: https://ossjapan2025.sched.com/event/29FnS/from-lab-to-life-practical-ai-system-evaluation-sharon-dashet-vincent-caldeira-red-hat

  6. Gefedereerde vectoropvraging en beleidsbewuste opvraging - Hiroki Ito & Shusuke Takahashi, NTT. Open Source Summit Japan 2025, AI_dev Track. Beschikbaar op: https://ossjapan2025.sched.com/event/29FpX/federated-vector-retrieval-across-organizations-with-milvus-opa-and-vllm-hiroki-ito-shusuke-takahashi-ntt

  7. Hoofdlezing: Wat is de volgende stap voor Agones? Bestuur op planetaire schaal - Ben Huston, Senior Principal Architect, Google Cloud. Open Source Summit Japan 2025, AI_dev Track. Beschikbaar op: https://ossjapan2025.sched.com/event/2AHMX/keynote-whats-next-for-agones-planet-scale-governance-ben-huston-sr-principal-architect-google-cloud

  8. ModelPack: een open standaard voor het verpakken, distribueren en uitvoeren van LLM's in een cloud-native omgeving. - Presentatie van Wenbo Qi & Chenyu Zhang, Ant Group. Open Source Summit Japan 2025. Beschikbaar op: https://ossjapan2025.sched.com/event/29FpF/modelpack-an-open-standard-for-packaging-distributing-and-running-llms-in-cloud-native-environment-wenbo-qi-chenyu-zhang-ant-group

  9. Hoofdlezing: Staat van de Unie - Presentatie van Jim Zemlin, uitvoerend directeur van The Linux Foundation. Open Source Summit Japan 2025. Beschikbaar op: https://ossjapan2025.sched.com/event/2AEuA/keynote-state-of-the-union-jim-zemlin-executive-director-the-linux-foundation

  10. Praktische synthetische datastrategieën voor RAG/agentische systemen - Kevin Noel, Uzabase - Edge US-presentatie. Open Source Summit Japan 2025. Beschikbaar op: https://ossjapan2025.sched.com/event/29FlW/practical-synthetic-data-strategies-for-ragagentic-systems-kevin-noel-uzabase-edge-us