• Udgivelsesdato
    Marts 16, 2026
  • Del

Introduktion: Systemarkitektur, ikke model

 

Mens kapløbet om "større modeller" i kunstig intelligens-verdenen viger for en kritisk tavshed, blev sektorens fremtid opsummeret i en enkelt sætning på Open Source Summit Japan 2025:  "Fremtiden for Agentic AI vil ikke blive defineret af modelskala, men af ​​systemarkitektur." 

 

Denne bestemmelse er den mest konkrete indikator for, at fokus er flyttet fra blot modeltræning til den infrastruktur, der understøtter og skalerer disse modeller. Topmødet, der blev afholdt i Toranomon Hills, Tokyo, beviste, hvordan giganter som Google, Fujitsu og Honda har indført open source som et "strategisk fundament", og som DevOps-ingeniør havde jeg mulighed for at undersøge de nye normer i krydsfeltet mellem kunstig intelligens og infrastruktur på stedet.
Denne artikel analyserer sammenhængen mellem kunstig intelligens og infrastruktur, baseret på fotografier, jeg personligt tog ved arrangementet, de tekniske sessioner, jeg deltog i, og data indsamlet fra Linux Foundations officielle program.

Ekran Resmi 2026-03-16 09.52.28.png

 

Nøgle temaer

De tekniske diskussioner, der skilte sig ud i konferenceprogrammet, og de præsentationer, jeg gennemgik på stedet, var samlet i følgende hovedakser inden for moderne infrastrukturforvaltning:

 

A. Systemarkitektur og hardwareopdeling

  • Hardware-opdeling: Som beskrevet i Fujitsus "Dynamic GPU Provisioning"-session, bevæger man sig ud over den traditionelle serverstruktur og samler CPU, GPU og hukommelse i en dynamisk pool (Resource Pool) ved at fjerne dem fra fysiske kabinetter.
  • AI-fabrikker: Transformation af datacentre til produktionsfaciliteter, der kan reagere på de variable krav fra kunstig intelligens-arbejdsbelastninger i stedet for statiske serverfarme.

B. Agentiske operationer

  • Autonom infrastrukturforvaltning: Som vi så i demonstrationerne på scenen, overgangen fra strukturen i værktøjer som Terraform, der "stopper i tilfælde af fejl" til "Agent"-baserede strukturer, der kan analysere fejlen og producere en løsning.3 
  • Kontinuerlig feedback loop: Løbende overvågning af ikke blot implementeringen af ​​kunstig intelligens-modeller, men også deres ydeevne i det virkelige miljø.

C. Datastyring og -sikkerhed

  • Federeret vektoradgang: Ifølge de arkitektoniske diagrammer, der deles af NTT og andre præsentanter, kombinerer strukturer, der behandler data på stedet i distribuerede kilder, resultaterne i stedet for at flytte dem til en central sø.6 
  • Politik-som-kode: Dynamisk beslutningstagning om dataadgang i forespørgselsøjeblikket af søgemaskiner som OPA (Open Policy Agent). 6 

D. Kritiske og særlige arbejdsbyrder

  • Spilserverorkestrering: Som vist i Agones-præsentationen fra Google Open Source-teamet, administration af stateful-spilservere på global skala på Kubernetes.7 
  • Rumgrad Linux: Styring af robotarme på ISS med open source-software, udstillet i GITAIs præsentation.8 

Højdepunkter fra konferencen

A. Systemarkitektur og hardwareopdeling

Befrielse af hardware: CoHDI

En af konferencens mest slående tekniske sessioner var talen med titlen "Dynamisk GPU-provisionering i Kubernetes" præsenteret af Jin Hase og Tsubasa Watanabe fra Fujitsu-teamet. Det arkitektoniske diagram, der blev vist på scenen, forklarede CoHDI (Komponerbar Disaggregeret Infrastruktur) projekt som følger:

 

Ekran Resmi 2026-03-16 09.57.20.png

 

  • Opdelt ressourcepulje: CPU, GPU, hukommelse og NIC'er fjernes fra fysiske serverkabinetter og samles i en fælles pulje.
  • PCIe/CXL-switchstruktur: Disse komponenter er forbundet med hinanden via højhastighedsafbrydere.
  • Kubernetes-integration: Som det ses i diagrammet, anmoder Kubernetes om hardware, som om det oprettede en Pod, og systemet samler øjeblikkeligt denne hardware for at oprette "Composed Baremetal"-servere.2 

Så hvorfor er det CoHDI vigtigt? Denne arkitektur har potentiale til at øge GPU-brugseffektiviteten fra 30 % til 80 %.

 

Infrastrukturorkestrering: Crossplane 2.0

 

En anden vigtig præsentation ved arrangementet viste Krydsplan 2.0 arkitektur. Den kontinuerlige overvågning af deklarative definitioner på Git via Crossplane-kontrolløkken og deres transformation til reelle ressourcer på AWS, Azure eller Google Cloud understøttede visionen om en "selvreparerende" infrastruktur. Derudover, Krydsplan 2.0 kunne nu køres i alle Kubernetes-miljøer, ikke kun for cloud-tjenester, som i Crossplane v1. Takket være teknologien gjorde det muligt for alle udviklere at installere simple teknologier uden hjælp. Det var en imponerende præsentation med hensyn til at vise, hvor DevOps-processer vil komme hen. 

B. Agentiske operationer

AgentOps: Det er en kontinuerlig feedbackmotor, der sigter mod at lukke kløften mellem dem i virkeligheden ved at samle udviklingsfasen (indre loop) og anvendelsesfasen (ydre loop) af kunstig intelligens-agenter. Denne struktur er defineret som en disciplin inden for AI-platformteknik, der kombinerer offline-forberedte datasæt med observationer fra live-miljøet i et enkelt økosystem, hvilket muliggør detektering af fejl og inkludering af data fra den virkelige verden tilbage i testprocesser.5 

 

Menneske vs. agent: Annie Talvasto argumenterede i sin tale for, at maskiner vil forblive ufuldstændige i DevOps-processer, så længe de ikke har den information, der findes i mennesker. For eksempel nævnte hun, at systemet kunne blive administreret ufuldstændigt, når man ikke har så meget som en lille smule sløv korrespondance fra en kollega. Hun nævnte detaljeret i sin præsentation, at al denne information først bør gives til agenterne. 3 

 

Open Source i rummet: ISS og robotteknologi

 

På billederne taget ved sessionen om sikkerhedskritiske systemer, billeder af Den Internationale Rumstation (ISS) og GITAI robotarmen blev afspejlet på den store skærm. At se, at Linux bruges i et miljø, hvor det ikke er nogen luksus at begå fejl i rummets vakuum, var et bevis på pålideligheden af ​​open source.8 

 

C. Datastyring og -sikkerhed

C. Datastyring og -sikkerhed

Samlet vektoradgang på tværs af organisationer og OPA: I store organisationer lagres data normalt i forskellige afdelinger eller partnervirksomheder i forskellige vektordatabaser. Det er vanskeligt at indsamle disse data i et enkelt center på grund af juridisk overholdelse, datasikkerhed og ejerskabsrettigheder. Præsentationen sigter mod at give en "virtuel integration" uden at kopiere dataene.

  • vLLM: Bruges til at omdanne komplekse metadata fra datakilder til meningsfulde og korte resuméer i naturligt sprog. Det spiller også en rolle som en højtydende inferensmotor i processerne med at forstå brugerforespørgsler og behandle resultater.
  • Politiske beslutninger: Ansvarlig for datastyring og -autorisation. Når en bruger starter en forespørgsel, kontrollerer OPA under kørsel, om brugeren har tilladelse til at få adgang til den pågældende datakilde.
  • Milvus-detaljer: Fungerer som et "semantisk katalog". Det lagrer de tekniske og forretningsmæssige metadata for datakilder i alle organisationer i vektorform. Når en forespørgsel kommer, udfører det den første søgning for at bestemme, hvilken organisation der muligvis har de relevante data.

Denne præsentation viser, hvordan en sikker og "smart" søgeinfrastruktur kan etableres mellem organisationer uden at flytte data til en central placering ved at kombinere Milvus' skalerbare søgefunktion, vLLM's sprogbehandlingskraft og OPA's fleksible sikkerhedspolitikker.6 

 

Kontekstteknik: Taler Kevin Noel argumenterer for, at æraen med blot at "skrive en prompt og vente på et svar" er slut, og at vi i stedet er trådt ind i æraen med kontekstudvikling.

  • LLM'er er statsløse: Modeller husker ikke engang den foregående sætning, medmindre du minder dem om det.
  • Statsoprettelse: For at en kunstig intelligens kan give det korrekte svar, skal du præsentere alt korrekt for den i det "øjeblik" (just-in-time). Dette er kunsten at sammensætte tidligere samtaler, information fra dokumenter og værktøjsoutput.

Præsentationen viser, at følgende dele skal kombineres for en vellykket kunstig intelligens-respons:

  • RAG (Relevant information): Oplysninger hentet fra interne dokumenter eller databaser.
  • Hukommelseshåndtering: Brugerens tidligere præferencer og kortsigtede samtalehistorik.
  • Eksterne værktøjer: Data, der kommer fra API'er eller beregningsværktøjer.
  • Systemkommandoer: Hovedregler, der bestemmer den kunstige intelligens' karakter og opgave.

Det er umuligt manuelt at teste en så kompleks struktur (RAG + Hukommelse + Værktøjer). Taleren tilbyder følgende løsning:

  • Automatisk evaluering: Vi skal have kunstig intelligens til at producere tusindvis af "spørgsmål-svar"-par (syntetiske data) ved hjælp af de data, vi har.
  • Realistiske scenarier: Vi skal måle systemets robusthed ved at skabe syntetiske brugere, der stiller forkerte eller ufuldstændige spørgsmål ligesom rigtige brugere.

Omkostninger og hastighed: Vi kan vurdere systemets succes (nøjagtighed, irrelevans, hallucinationer) på få minutter med syntetiske datasæt i stedet for tests, der ville tage uger for mennesker. 10 

D. Kritiske og særlige arbejdsbyrder

Spilserverorkestrering (Agones): I sliden med titlen "Sådan virker Agones" af Google Open Source-teamet blev et flowdiagram delt over infrastrukturen for A.R.C. Raiders spil. I dette diagram ses det tydeligt, at spillerne efter matchmaking blev tildelt Pods kaldet "Agones Game Server", og disse servere blev administreret med en "binpacking" (komprimerings-) strategi på global skala. Dette gjorde det muligt for udviklere at bruge mere tid på spiludvikling uden at tænke på infrastrukturen. Det beviser også, hvor vigtig en rolle Kubernetes spiller som open source i spilindustrien.

Ekran Resmi 2026-03-16 10.37.12.png

Hastighed i modelfordeling: Præsentationen viste, at modeller nu opbevares i OCI-kompatible registre som Docker-billeder og er direkte forbundet (monteret) til Pod'en som en disk takket være Model CSI-driverDette eliminerer den tid, det tager at kopiere GB'er af data. Harbors OCI-register bruges til disse operationer.8 

 

Inferenspræstation: Ifølge de noter og visuelle elementer, jeg tog fra vLLM-sessionen, var PagedAttention-teknologi nøglen til ydeevne. Denne teknologi administrerer GPU-hukommelse med virtuel hukommelseslogik i operativsystemer, overvinder flaskehalsen i "Key-Value Cache" og multiplicerer gennemløbshastigheden. Præsentationen nævner også, at DeepSpeed, der er udviklet af Microsoft, øger GPU-effektiviteten med 4-6 gange, hvilket giver høj ydeevne selv på gammel hardware. Det understreges i præsentationen, at antallet af producerede tokens pr. gebyr stiger takket være dette. 9 

 

konklusion: Jeg forlader Open Source Summit Japan 2025 og vender tilbage med en vision, der fuldstændig ændrer mit perspektiv på min profession, ikke kun med ny teknisk viden i lommen.

 

Et af de punkter, der imponerede mig mest under hele arrangementet, var bredden af ​​dækningsområdet. open source software (OSS)I dag er det faktum, at der er tillid til kraften i open source, selv i menneskehedens mest kritiske og avancerede teknologiprojekter, såsom International Space Station (ISS), ikke kun på hjemmesider eller mobilapplikationer, mindede mig endnu engang om ansvaret og potentialet i det arbejde, vi udfører.

Ekran Resmi 2026-03-16 10.39.07.png

Det mest uforglemmelige øjeblik for mig ved topmødet var at lytte live til Linus Torvalds, en af ​​arkitekterne bag den moderne softwareverden og skaberen af ​​Linux og Git. Ved at høre hans tilgang til teknologi og hans vision fik jeg en førstehåndsindsigt i den enorme filosofi bag de grundlæggende værktøjer, vi bruger.

 

Den største lektie jeg lærte fra dette topmøde var denne: Softwareverdenen er et uendeligt hav, åbent for udvikling når som helst og i konstant bevægelse. At være en del af dette økosystem betyder ikke kun at skrive kode, men også konstant at lære og bidrage til fællesskabet. Denne dynamik i mit erhverv motiverer mig utroligt meget. Nu er det tid til at fortsætte mit arbejde meget mere målrettet og hurtigt med denne inspiration! 👨‍💻✨

 

Ekran Resmi 2026-03-16 10.40.13.png

Mit besøg i Japan var en erkendelse af en nysgerrighed, der først slog rod i den levende læse- og vidensdelingskultur, der opmuntres på Galaksiya. Min primære motivation for at vælge denne destination var at fordybe mig i en kultur og kulinarisk arv, som jeg opfattede som fundamentalt anderledes – næsten en verden for sig – end vores egen. Jeg ville træde ud af min komfortzone og opleve, hvordan det føltes at være en "outsider" i et land med så store kontraster, hvor hvert ritual og hver smag syntes at tilhøre en anden dimension.

 

Men mens jeg navigerede rundt i alt fra Tokyos massive, neonoplyste boulevarder til de traditionelle, gemte spisesteder i smalle gyder, oplevede jeg en dyb erkendelse. Mens den omhyggelige præsentation af maden og den stoiske stilhed i gaderne i starten føltes fremmed, opdagede jeg snart en universel essens under overfladen. Da jeg stod i skyggen af ​​en moderne skyskraber og så nogen finde et øjebliks fred i et gammelt helligdom, indså jeg, at udtrykket af menneskelig oprigtighed er det samme der, som det er i vores eget hjemland. Det var en stærk påmindelse om, at uanset geografi samles menneskeheden om de samme grundlæggende værdier: venlighed, arbejde, familie og delingsånden.

Ekran Resmi 2026-03-16 10.41.49.png

 

At være vidne til den dybtliggende kultur af respekt og den "usynlige harmoni" bag et samfund, der opererer med så utrolig præcision, forvandlede mine observationer til en bredere lektie i menneskelighed. At opleve denne kulturelle dybde sammen med en så unik vision hjalp mig med at forstå, at verden ikke kun er formet af strukturer, men af ​​menneskelig ånd og disciplin. Jeg vender tilbage fra denne rejse med et uforglemmeligt indblik i, hvordan vi alle er "ét", selv på den anden side af kloden – og selvfølgelig et par værdsatte fotografier, der indfanger byens sjæl.
 

Vi ses ved vores næste stop.

Emre IZMIR

Senior DevOps-ingeniør
Indtryk fra Open Source-topmødet i Japan 2025, Tokyo.
 

Referencer

  1. Fremtiden for agentisk AI vil ikke blive defineret af modelskala... - Open Source Summit AI_dev Track Præsentation, 8.-10. december 2025, Tokyo, Japan. Tilgængelig på: https://ossjapan2025.sched.com/type/AI_dev

  2. Dynamisk GPU-provisionering i Kubernetes med komponerbar, disaggregeret infrastruktur - Jin Hase & Tsubasa Watanabe, Fujitsu Limited. Open Source Summit Japan 2025, Cloud & Containers Track. Tilgængelig på: https://github.com/CoHDI

  3. LLM'er på autopilot: Kørsel af AI-agenter på Kubernetes - Annie Talvasto, Waovo/Upbound. Open Source-topmøde i Japan 2025. Tilgængelig på: https://ossjapan2025.sched.com/event/29Fqz/llms-on-autopilot-running-ai-agents-on-kubernetes-with-open-source-tools-annie-talvasto-waovo

  4. Infrastrukturorkestrering med Crossplane 2.0 - Upbound-præsentation. Open Source-topmøde i Japan 2025. Tilgængelig på: (https://ossjapan2025.sched.com/event/29FnY)

  5. Fra laboratorium til liv: Praktisk AI-systemevaluering - Sharon Dashet & Vincent Caldeira, Red Hat-præsentation, Tokyo, Japan. Tilgængelig på: https://ossjapan2025.sched.com/event/29FnS/from-lab-to-life-practical-ai-system-evaluation-sharon-dashet-vincent-caldeira-red-hat

  6. Federated Vector Retrieval & Policy-Aware Retrieval - Hiroki Ito & Shusuke Takahashi, NTT. Open Source Summit Japan 2025, AI_dev Track. Tilgængelig på: https://ossjapan2025.sched.com/event/29FpX/federated-vector-retrieval-across-organizations-with-milvus-opa-and-vllm-hiroki-ito-shusuke-takahashi-ntt

  7. Hovedtale: Hvad er det næste for Agones? Styring på planetniveau - Ben Huston, senior ledende arkitekt, Google Cloud. Open Source Summit Japan 2025, AI_dev Track. Tilgængelig på: https://ossjapan2025.sched.com/event/2AHMX/keynote-whats-next-for-agones-planet-scale-governance-ben-huston-sr-principal-architect-google-cloud

  8. ModelPack: En åben standard til pakning, distribution og kørsel af LLM'er i et cloud-native miljø - Wenbo Qi & Chenyu Zhang, præsentation fra Ant Group. Open Source Summit Japan 2025. Tilgængelig på: https://ossjapan2025.sched.com/event/29FpF/modelpack-an-open-standard-for-packaging-distributing-and-running-llms-in-cloud-native-environment-wenbo-qi-chenyu-zhang-ant-group

  9. Hovedtale: Unionens tilstand - Jim Zemlin, administrerende direktør, The Linux Foundation Præsentation. Open Source Summit Japan 2025. Tilgængelig på: https://ossjapan2025.sched.com/event/2AEuA/keynote-state-of-the-union-jim-zemlin-executive-director-the-linux-foundation

  10. Praktiske syntetiske datastrategier til RAG/Agentic-systemer - Kevin Noel, Uzabase - Præsentation om Edge US. Open Source Summit Japan 2025. Tilgængelig på: https://ossjapan2025.sched.com/event/29FlW/practical-synthetic-data-strategies-for-ragagentic-systems-kevin-noel-uzabase-edge-us