• Publiseringsdato
    Mars 16, 2026
  • Del

Introduksjon: Systemarkitektur, ikke modell

 

Mens kappløpet om «større modeller» i kunstig intelligens-verdenen viker for en kritisk stillhet, ble sektorens fremtid oppsummert i én setning på Open Source Summit Japan 2025:  «Fremtiden til Agentic AI vil ikke bli definert av modellskala, men av systemarkitektur.» 

 

Denne bestemmelsen er den mest konkrete indikatoren på at fokuset har skiftet fra kun modelltrening til infrastrukturen som opprettholder og skalerer disse modellene. Toppmøtet som ble holdt i Toranomon Hills i Tokyo, beviste hvordan giganter som Google, Fujitsu og Honda har tatt i bruk åpen kildekode som et «strategisk fundament», og som DevOps-ingeniør hadde jeg muligheten til å undersøke de nye normene i skjæringspunktet mellom kunstig intelligens og infrastruktur på stedet.
Denne artikkelen analyserer sammenkoblingen mellom kunstig intelligens og infrastruktur, ved å trekke på fotografier jeg personlig tok på arrangementet, de tekniske øktene jeg deltok på, og data samlet fra Linux Foundations offisielle program.

Ekran Resmi 2026-03-16 09.52.28.png

 

Nøkkeltemaer

De tekniske diskusjonene som skilte seg ut i konferanseprogrammet og presentasjonene jeg gjennomgikk på stedet, var samlet i følgende hovedakser når det gjelder moderne infrastrukturforvaltning:

 

A. Systemarkitektur og maskinvareoppdeling

  • Maskinvareoppdeling: Som beskrevet i Fujitsus økt «Dynamic GPU Provisioning», går man utover den tradisjonelle serverstrukturen og samler CPU, GPU og minne i et dynamisk utvalg (ressursbasseng) ved å fjerne dem fra fysiske kabinetter.
  • AI-fabrikker: Transformasjon av datasentre til produksjonsanlegg som kan reagere på de variable kravene fra arbeidsbelastninger innen kunstig intelligens i stedet for statiske serverfarmer.

B. Agentoperasjoner

  • Autonom infrastrukturforvaltning: Som vi så i demonstrasjonene på scenen, overgangen fra strukturen til verktøy som Terraform som «stopper ved feil» til «Agent»-baserte strukturer som kan analysere feilen og produsere en løsning.3 
  • Kontinuerlig tilbakemeldingssløyfe: Kontinuerlig overvåking av ikke bare utplasseringen av kunstig intelligens-modeller, men også deres ytelse i live-miljøet.

C. Datastyring og sikkerhet

  • Federert vektortilgang: I følge de arkitektoniske diagrammene som deles av NTT og andre presentatører, kombinerer strukturer som behandler data på stedet i distribuerte kilder resultatene i stedet for å flytte dem til en sentral innsjø.6 
  • Retningslinjer som kode: Dynamisk beslutningstaking om datatilgang i spørringsøyeblikket av søkemotorer som OPA (Open Policy Agent). 6 

D. Kritiske og spesielle arbeidsbelastninger

  • Spillserverorkestrering: Som vist i Agones-presentasjonen fra Google Open Source-teamet, administrasjon av tilstandsfulle spillservere på global skala på Kubernetes.7 
  • Romgrad Linux: Håndtering av robotarmer på ISS med åpen kildekode-programvare, vist i GITAIs presentasjon.8 

Høydepunkter fra konferansen

A. Systemarkitektur og maskinvareoppdeling

Frigjøring av maskinvare: CoHDI

En av de mest slående tekniske sesjonene på konferansen var talen med tittelen "Dynamisk GPU-provisjonering i Kubernetes" presentert av Jin Hase og Tsubasa Watanabe fra Fujitsu-teamet. Det arkitektoniske diagrammet som ble vist på scenen forklarte CoHDI (Komponerbar, disaggregert infrastruktur) prosjekt som følger:

 

Ekran Resmi 2026-03-16 09.57.20.png

 

  • Disaggregert ressursbasseng: CPU, GPU, minne og nettverkskort fjernes fra fysiske serverkabinetter og samles i et felles basseng.
  • PCIe/CXL-svitsjstruktur: Disse komponentene er koblet til hverandre via høyhastighetsbrytere.
  • Kubernetes-integrasjon: Som vist i diagrammet, ber Kubernetes om maskinvare som om man oppretter en Pod, og systemet setter umiddelbart sammen denne maskinvaren for å lage "Composed Baremetal"-servere.2 

Så hvorfor er det CoHDI viktig? Denne arkitekturen har potensial til å øke GPU-brukseffektiviteten fra 30 % til 80 %.

 

Infrastrukturorkestrering: Crossplane 2.0

 

En annen viktig presentasjon på arrangementet viste Kryssplan 2.0 arkitektur. Den kontinuerlige overvåkingen av deklarative definisjoner på Git av Crossplane-kontrollsløyfen og deres transformasjon til reelle ressurser på AWS, Azure eller Google Cloud støttet visjonen om "selvreparerende" infrastruktur. I tillegg, Kryssplan 2.0 kunne nå kjøres i alle Kubernetes-miljøer, ikke bare for skytjenester, som i Crossplane v1. Takket være teknologien kunne alle utviklere installere enkle teknologier uten hjelp. Det var en imponerende presentasjon med tanke på å vise hvor DevOps-prosesser vil komme. 

B. Agentoperasjoner

AgentOps: Det er en kontinuerlig tilbakemeldingsmotor som tar sikte på å lukke gapet i virkeligheten mellom dem ved å samle utviklingsfasene (indre sløyfe) og anvendelsesfasene (ytre sløyfe) av kunstig intelligens-agenter. Denne strukturen er definert som en ingeniørdisiplin for AI-plattformer som kombinerer offline forberedte datasett med observasjoner fra det levende miljøet i et enkelt økosystem, noe som muliggjør deteksjon av feil og inkludering av reelle data tilbake i testprosesser.5 

 

Menneske vs. agent: Annie Talvasto argumenterte i talen sin for at maskiner vil forbli ufullstendige i DevOps-prosesser så lenge de ikke har informasjonen som finnes i mennesker. For eksempel nevnte hun at systemet kan bli ufullstendig administrert når man ikke har engang en liten slapp korrespondanse fra en kollega. Hun nevnte i detalj i presentasjonen sin at all denne informasjonen bør gis til agentene først. 3 

 

Åpen kildekode i verdensrommet: ISS og robotikk

 

På bildene som ble tatt under økten om sikkerhetskritiske systemer, er bilder av den internasjonale romstasjonen (ISS) og GITAI robotarmen ble reflektert på storskjermen. Å se at Linux brukes i et miljø der det ikke er noen luksus å gjøre feil i verdensrommets vakuum, var et bevis på påliteligheten til åpen kildekode.8 

 

C. Datastyring og sikkerhet

C. Datastyring og sikkerhet

Enhetlig vektortilgang på tvers av organisasjoner og OPA: I store organisasjoner lagres data vanligvis i forskjellige avdelinger eller partnerselskaper, i forskjellige vektordatabaser. Det er vanskelig å samle disse dataene på ett enkelt senter på grunn av juridisk samsvar, datasikkerhet og eierrettigheter. Presentasjonen tar sikte på å gi en "virtuell integrasjon" uten å kopiere dataene.

  • vLLM: Brukes til å transformere komplekse metadata fra datakilder til meningsfulle og korte sammendrag i naturlig språk. Den spiller også en rolle som en høytytende inferensmotor i prosessene med å forstå brukerspørringer og behandle resultater.
  • Politiske beslutninger: Ansvarlig for datastyring og autorisasjon. Når en bruker starter en spørring, sjekker OPA under kjøretid om brukeren har tilgang til datakilden.
  • Milvus-detaljer: Fungerer som en «semantisk katalog». Den lagrer tekniske og forretningsmessige metadata for datakilder i alle organisasjoner i vektorform. Når en spørring kommer, utfører den det første søket for å bestemme hvilken organisasjon som kan ha de relevante dataene.

Denne presentasjonen viser hvordan en sikker og «smart» søkeinfrastruktur kan etableres mellom organisasjoner uten å flytte data til et sentralt sted ved å kombinere Milvus' skalerbare søkefunksjonalitet, vLLMs språkbehandlingskraft og OPAs fleksible sikkerhetspolicyer.6 

 

Kontekstutvikling: Foredragsholder Kevin Noel argumenterer for at æraen med å bare «skrive en ledetekst og vente på et svar» er over, og at vi i stedet har gått inn i æraen med kontekstteknikk.

  • LLM-er er statsløse: Modeller husker ikke engang den forrige setningen med mindre du minner dem på det.
  • Statsopprettelse: For at en kunstig intelligens skal kunne gi det riktige svaret, må du presentere alt riktig for den i det «øyeblikket» (just-in-time). Dette er kunsten å sette sammen tidligere samtaler, informasjon fra dokumenter og verktøyresultater.

Presentasjonen viser at følgende deler må kombineres for en vellykket kunstig intelligens-respons:

  • RAG (relevant informasjon): Informasjon hentet fra interne dokumenter eller databaser.
  • Minnehåndtering: Brukerens tidligere preferanser og kortsiktig samtalehistorikk.
  • Eksterne verktøy: Data som kommer fra API-er eller beregningsverktøy.
  • Systemkommandoer: Hovedregler som bestemmer karakteren og oppgaven til kunstig intelligens.

Det er umulig å teste en så kompleks struktur manuelt (RAG + Minne + Verktøy). Høyttaleren tilbyr følgende løsning:

  • Automatisk evaluering: Vi må ha kunstig intelligens til å produsere tusenvis av «spørsmål-svar»-par (syntetiske data) ved hjelp av dataene vi har.
  • Realistiske scenarier: Vi må måle systemets robusthet ved å lage syntetiske brukere som stiller feil eller ufullstendige spørsmål, slik som ekte brukere.

Kostnad og hastighet: Vi kan måle systemets suksess (nøyaktighet, irrelevans, hallusinasjoner) på få minutter med syntetiske datasett, i stedet for tester som ville tatt uker for mennesker. 10 

D. Kritiske og spesielle arbeidsbelastninger

Spillserverorkestrering (Agones): I lysbildet med tittelen "Hvordan Agones fungerer" av Google Open Source-teamet, ble et flytskjema delt over infrastrukturen til A.R.C. Raiders spill. I dette diagrammet var det tydelig at etter matchmaking ble spillerne tildelt Pods kalt «Agones Game Server», og disse serverne ble administrert med en «binpacking»-strategi (komprimering) på global skala. Dette gjorde det mulig for utviklere å bruke mer tid på spillutvikling uten å tenke på infrastrukturen. Det beviser også hvor viktig en rolle Kubernetes spiller som åpen kildekode i spillindustrien.

Ekran Resmi 2026-03-16 10.37.12.png

Hastighet i modelldistribusjon: Presentasjonen viste at modeller nå oppbevares i OCI-kompatible registre som Docker-bilder og er direkte koblet (montert) til Poden som en disk takket være Modell CSI-driverDette eliminerer tiden det tar å kopiere GB med data. Harbors OCI-register brukes til disse operasjonene.8 

 

Inferensytelse: I følge notatene og grafikken jeg tok fra vLLM-økten, var PagedAttention-teknologi nøkkelen til ytelse. Denne teknologien administrerer GPU-minne med den virtuelle minnelogikken i operativsystemer, overvinner flaskehalsen i "Key-Value Cache" og multipliserer gjennomstrømningen. Presentasjonen nevner også at DeepSpeed ​​utviklet av Microsoft øker GPU-effektiviteten med 4–6 ganger, noe som gir høy ytelse selv på gammel maskinvare. Det understrekes i presentasjonen at antallet tokens produsert per avgift øker takket være dette. 9 

 

Konklusjon: Jeg forlater Open Source Summit Japan 2025 og kommer tilbake med en visjon som fullstendig endrer mitt perspektiv på yrket mitt, ikke bare med ny teknisk kunnskap i lomma.

 

Et av punktene som imponerte meg mest under arrangementet var bredden i dekningsområdet til åpen kildekode programvare (OSS)I dag er det faktum at kraften i åpen kildekode er betrodd selv i menneskehetens mest kritiske og avanserte teknologiprosjekter, som for eksempel Den internasjonale romstasjonen (ISS), ikke bare på nettsteder eller mobilapplikasjoner, minnet meg nok en gang om ansvaret og potensialet i arbeidet vi gjør.

Ekran Resmi 2026-03-16 10.39.07.png

Det mest uforglemmelige øyeblikket fra toppmøtet for meg var å høre direkte på Linus Torvalds, en av arkitektene bak den moderne programvareverdenen og skaperen av Linux og Git. Å høre hans tilnærming til teknologi og hans visjon på nært hold ga meg en forståelse av den enorme filosofien bak de grunnleggende verktøyene vi bruker.

 

Den største lærdommen jeg fikk fra dette toppmøtet var denne: Programvareverdenen er et uendelig hav, åpent for utvikling når som helst og i konstant bevegelse. Å være en del av dette økosystemet betyr ikke bare å skrive kode, men også å stadig lære og bidra til fellesskapet. Denne dynamikken i yrket mitt motiverer meg utrolig mye. Nå er det på tide å fortsette arbeidet mitt mye mer målrettet og raskt med denne inspirasjonen! 👨‍💻✨

 

Ekran Resmi 2026-03-16 10.40.13.png

Mitt besøk til Japan var en realisering av en nysgjerrighet som først slo rot gjennom den pulserende kulturen for lesing og kunnskapsdeling som oppmuntres på Galaksiya. Min primære motivasjon for å velge dette reisemålet var å fordype meg i en kultur og kulinarisk arv som jeg oppfattet som fundamentalt annerledes – nesten en verden for seg – fra vår egen. Jeg ønsket å gå ut av komfortsonen min og oppleve hvordan det føltes å være en «outsider» i et land med så store kontraster, hvor hvert ritual og hver smak syntes å tilhøre en annen dimensjon.

 

Men etter hvert som jeg navigerte alt fra Tokyos massive, neonbelyste boulevarder til de tradisjonelle, bortgjemte spisestedene i trange smug, opplevde jeg en dyp erkjennelse. Selv om den omhyggelige presentasjonen av maten og den stoiske stillheten i gatene i utgangspunktet føltes fremmed, oppdaget jeg snart en universell essens under overflaten. Da jeg sto i skyggen av en moderne skyskraper og så noen finne et øyeblikks fred i et gammelt helligdom, innså jeg at uttrykket for menneskelig oppriktighet er det samme der som det er i vårt eget hjemland. Det var en sterk påminnelse om at uavhengig av geografi, samles menneskeheten rundt de samme grunnleggende verdiene: vennlighet, arbeidskraft, familie og delingsånden.

Ekran Resmi 2026-03-16 10.41.49.png

 

Å være vitne til den dypt forankrede kulturen av respekt og den «usynlige harmonien» bak et samfunn som opererer med så utrolig presisjon, forvandlet observasjonene mine til en bredere lærdom i menneskelighet. Å oppleve denne kulturelle dybden sammen med en så unik visjon hjalp meg å forstå at verden ikke bare er formet av strukturer, men av menneskelig ånd og disiplin. Jeg kommer tilbake fra denne reisen med et uforglemmelig innblikk i hvordan vi alle er «ett», selv på den andre siden av kloden – og selvfølgelig noen få kjære fotografier som fanger byens sjel.
 

Vi sees på neste stopp.

Emre IZMIR

Senior DevOps-ingeniør
Inntrykk fra Open Source Summit Japan 2025, Tokyo.
 

Referanser

  1. Fremtiden for agentisk AI vil ikke bli definert av modellskala ... - Presentasjon av Open Source Summit AI_dev Track, 8.–10. desember 2025, Tokyo, Japan. Tilgjengelig på: https://ossjapan2025.sched.com/type/AI_dev

  2. Dynamisk GPU-provisionering i Kubernetes med komponerbar, disaggregert infrastruktur – Jin Hase og Tsubasa Watanabe, Fujitsu Limited. Åpen kildekode-toppmøte Japan 2025, sky- og containerspor. Tilgjengelig på: https://github.com/CoHDI

  3. LLM-er på autopilot: Kjøre AI-agenter på Kubernetes – Annie Talvasto, Waovo/Upbound. Åpen kildekode-toppmøte Japan 2025. Tilgjengelig på: https://ossjapan2025.sched.com/event/29Fqz/llms-on-autopilot-running-ai-agents-on-kubernetes-with-open-source-tools-annie-talvasto-waovo

  4. Infrastrukturorkestrering med Crossplane 2.0 - Oppadgående presentasjon. Åpen kildekode-toppmøte Japan 2025. Tilgjengelig på: (https://ossjapan2025.sched.com/event/29FnY)

  5. Fra laboratorium til liv: Praktisk evaluering av AI-systemer – Sharon Dashet og Vincent Caldeira, Red Hat-presentasjon, Tokyo, Japan. Tilgjengelig på: https://ossjapan2025.sched.com/event/29FnS/from-lab-to-life-practical-ai-system-evaluation-sharon-dashet-vincent-caldeira-red-hat

  6. Federated Vector Retrieval og Policy-Aware Retrieval – Hiroki Ito og Shusuke Takahashi, NTT. Åpen kildekode-toppmøte Japan 2025, AI_utviklingsspor. Tilgjengelig på: https://ossjapan2025.sched.com/event/29FpX/federated-vector-retrieval-across-organizations-with-milvus-opa-and-vllm-hiroki-ito-shusuke-takahashi-ntt

  7. Hovedtale: Hva blir det neste for Agones? Styring på planetnivå – Ben Huston, senior sjefsarkitekt, Google Cloud. Open Source Summit Japan 2025, AI_dev Track. Tilgjengelig på: https://ossjapan2025.sched.com/event/2AHMX/keynote-whats-next-for-agones-planet-scale-governance-ben-huston-sr-principal-architect-google-cloud

  8. ModelPack: En åpen standard for pakking, distribusjon og kjøring av LLM-er i skybaserte miljøer – Wenbo Qi og Chenyu Zhang, presentasjon fra Ant Group. Åpen kildekode-toppmøte i Japan 2025. Tilgjengelig på: https://ossjapan2025.sched.com/event/29FpF/modelpack-an-open-standard-for-packaging-distributing-and-running-llms-in-cloud-native-environment-wenbo-qi-chenyu-zhang-ant-group

  9. Hovedtale: Unionens tilstand – Jim Zemlin, administrerende direktør, The Linux Foundation Presentasjon. Open Source Summit Japan 2025. Tilgjengelig på: https://ossjapan2025.sched.com/event/2AEuA/keynote-state-of-the-union-jim-zemlin-executive-director-the-linux-foundation

  10. Praktiske syntetiske datastrategier for RAG/Agentic-systemer – Kevin Noel, Uzabase – Presentasjon om Edge US. Åpen kildekode-toppmøte i Japan 2025. Tilgjengelig på: https://ossjapan2025.sched.com/event/29FlW/practical-synthetic-data-strategies-for-ragagentic-systems-kevin-noel-uzabase-edge-us