• Publiceringsdatum
    Mars 16, 2026
  • Dela

Introduktion: Systemarkitektur, inte modell

 

Medan kapplöpningen om "större modeller" i artificiell intelligens-världen ger vika för en kritisk tystnad, sammanfattades sektorns framtid i en enda mening vid Open Source Summit Japan 2025:  "Framtiden för Agentic AI kommer inte att definieras av modellskala, utan av systemarkitektur." 

 

Denna bedömning är den mest konkreta indikatorn på att fokus har flyttats från enbart modellträning till den infrastruktur som upprätthåller och skalar upp dessa modeller. Toppmötet som hölls i Toranomon Hills, Tokyo, bevisade hur jättar som Google, Fujitsu och Honda har anammat öppen källkod som en "strategisk grund", och som DevOps-ingenjör hade jag möjlighet att undersöka de nya normerna i skärningspunkten mellan artificiell intelligens och infrastruktur på plats.
Den här artikeln analyserar sambandet mellan artificiell intelligens och infrastruktur, med utgångspunkt i fotografier jag personligen tog vid evenemanget, de tekniska sessioner jag deltog i och data som sammanställts från Linux Foundations officiella program.

Ekran Resmi 2026-03-16 09.52.28.png

 

Viktiga teman

De tekniska diskussioner som utmärkte sig i konferensprogrammet och de presentationer jag granskade på plats samlades i följande huvudaxlar vad gäller modern infrastrukturförvaltning:

 

A. Systemarkitektur och hårdvaruuppdelning

  • Hårdvaruuppdelning: Som beskrivs i Fujitsus session "Dynamic GPU Provisioning", går man bortom den traditionella serverstrukturen och samlar CPU, GPU och minne i en dynamisk pool (Resurspool) genom att ta bort dem från fysiska chassin.
  • AI-fabriker: Omvandling av datacenter till produktionsanläggningar som kan svara på de varierande kraven från arbetsbelastningar inom artificiell intelligens istället för statiska serverfarmar.

B. Agentoperationer

  • Autonom infrastrukturhantering: Som vi såg i demonstrationerna på scenen, övergången från strukturen hos verktyg som Terraform som "stoppar vid fel" till "Agent"-baserade strukturer som kan analysera felet och ta fram en lösning.3 
  • Kontinuerlig återkopplingsslinga: Kontinuerlig övervakning av inte bara implementeringen av modeller för artificiell intelligens utan även deras prestanda i den verkliga miljön.

C. Datastyrning och säkerhet

  • Federerad vektoråtkomst: Enligt de arkitektoniska diagram som delats av NTT och andra presentatörer kombinerar strukturer som bearbetar data på plats i distribuerade källor resultaten istället för att flytta dem till en central sjö.6 
  • Policy-som-kod: Dynamiskt fattande av beslut om dataåtkomst i förfrågningsögonblicket av sökmotorer som OPA (Open Policy Agent). 6 

D. Kritiska och speciella arbetsbelastningar

  • Spelserverorkestrering: Som visas i Agones-presentationen av Googles Open Source-team, hantering av tillståndskänsliga spelservrar på global skala på Kubernetes.7 
  • Rymdklassad Linux: Hantering av robotarmar på ISS med öppen källkodsprogramvara, visas i GITAI:s presentation.8 

Höjdpunkter från konferensen

A. Systemarkitektur och hårdvaruuppdelning

Befrielse av hårdvara: CoHDI

En av konferensens mest slående tekniska sessioner var talet med titeln "Dynamisk GPU-provisionering i Kubernetes" presenterades av Jin Hase och Tsubasa Watanabe från Fujitsu-teamet. Det arkitektoniska diagrammet som visades på scenen förklarade CoHDI (Kompositerbar Disaggregated Infrastructure) projekt enligt följande:

 

Ekran Resmi 2026-03-16 09.57.20.png

 

  • Disaggregerad resurspool: CPU, GPU, minne och nätverkskort tas bort från fysiska serverhöljen och samlas i en gemensam pool.
  • PCIe/CXL-switchstruktur: Dessa komponenter är anslutna till varandra via höghastighetsbrytare.
  • Kubernetes-integration: Som framgår av diagrammet begär Kubernetes hårdvara som om man skapar en Pod, och systemet monterar omedelbart denna hårdvara för att skapa "Composed Baremetal"-servrar.2 

Så varför är det CoHDI viktigt? Den här arkitekturen har potential att öka GPU-användningseffektiviteten från 30 % till 80 %.

 

Infrastrukturorkestrering: Crossplane 2.0

 

En annan viktig presentation vid evenemanget visade Korsplan 2.0 arkitektur. Den kontinuerliga övervakningen av deklarativa definitioner på Git av Crossplane-kontrollslingan och deras omvandling till verkliga resurser på AWS, Azure eller Google Cloud stödde visionen om en "självläkande" infrastruktur. Dessutom, Korsplan 2.0 kunde nu köras i alla Kubernetes-miljöer, inte bara för molntjänster, som i Crossplane v1. Tack vare tekniken kunde alla utvecklare installera enkla tekniker utan hjälp. Det var en imponerande presentation när det gällde att visa var DevOps-processer kommer att hamna. 

B. Agentoperationer

AgentOps: Det är en kontinuerlig feedbackmotor som syftar till att minska verklighetsklyftan mellan dem genom att sammanföra utvecklingsstadierna (inre loopen) och tillämpningsstadierna (yttre loopen) för artificiella intelligensagenter. Denna struktur definieras som en AI-plattformsteknikdisciplin som kombinerar offline-förberedda datamängder med observationer från den verkliga miljön i ett enda ekosystem, vilket möjliggör upptäckt av fel och inkludering av verkliga data tillbaka i testprocesser.5 

 

Människa vs. Agent: Annie Talvasto menade i sitt tal att maskiner kommer att förbli ofullständiga i DevOps-processer så länge de inte har den information som finns hos människor. Till exempel nämnde hon att systemet kan hanteras ofullständigt när man inte har ens en liten slackkorrespondens från en kollega. Hon nämnde utförligt i sin presentation att all denna information bör lämnas till agenterna först. 3 

 

Öppen källkod i rymden: ISS och robotik

 

På bilderna som togs vid sessionen om säkerhetskritiska system, bilder av den internationella rymdstationen (ISS) och GITAI robotarmen reflekterades på jätteskärmen. Att se att Linux används i en miljö där det inte finns någon lyx att göra misstag i rymdens vakuum var ett bevis på öppen källkods tillförlitlighet.8 

 

C. Datastyrning och säkerhet

C. Datastyrning och säkerhet

Enhetlig vektoråtkomst mellan organisationer och OPA: I stora organisationer lagras data vanligtvis på olika avdelningar eller hos partnerföretag, i olika vektordatabaser. Att samla in dessa data på ett enda center är svårt på grund av lagefterlevnad, datasäkerhet och äganderätt. Presentationen syftar till att tillhandahålla en "virtuell integration" utan att kopiera data.

  • vLLM: Används för att omvandla komplexa metadata från datakällor till meningsfulla och korta sammanfattningar i naturligt språk. Den spelar också en roll som en högpresterande inferensmotor i processerna för att förstå användarfrågor och bearbeta resultat.
  • Policybeslut: Ansvarig för datastyrning och auktorisering. När en användare initierar en fråga kontrollerar OPA vid körning om användaren har behörighet att komma åt den datakällan.
  • Milvus-detaljer: Fungerar som en "semantisk katalog". Den lagrar tekniska och affärsmässiga metadata för datakällor i alla organisationer i vektorform. När en fråga kommer utför den det första sökningssteget för att avgöra vilken organisation som kan ha relevant information.

Denna presentation visar hur en säker och "smart" sökinfrastruktur kan etableras mellan organisationer utan att flytta data till en central plats genom att kombinera Milvus skalbara sökfunktion, vLLMs språkbehandlingskraft och OPAs flexibla säkerhetspolicyer.6 

 

Kontextteknik: Talaren Kevin Noel menar att eran av att helt enkelt "skriva en prompt och vänta på ett svar" är över, och istället har vi gått in i eran av kontextutveckling.

  • LLM:er är statslösa: Modeller kommer inte ihåg ens föregående mening om du inte påminner dem om det.
  • Statsskapande: För att en artificiell intelligens ska kunna ge rätt svar måste du presentera allt korrekt för den i just det "ögonblicket" (just-in-time). Detta är konsten att sammanföra tidigare samtal, information från dokument och verktygsresultat.

Presentationen visar att följande delar måste kombineras för en framgångsrik respons på artificiell intelligens:

  • Relevant information (RAG): Information hämtad från interna dokument eller databaser.
  • Minneshantering: Användarens tidigare preferenser och kortsiktiga konversationshistorik.
  • Externa verktyg: Data som kommer från API:er eller beräkningsverktyg.
  • Systemkommandon: Huvudregler som bestämmer den artificiella intelligensens karaktär och uppgift.

Det är omöjligt att manuellt testa en så komplex struktur (RAG + Minne + Verktyg). Talaren erbjuder följande lösning:

  • Automatisk utvärdering: Vi måste låta artificiell intelligens producera tusentals "fråga-svar"-par (syntetisk data) med hjälp av den data vi har.
  • Realistiska scenarier: Vi måste mäta systemets robusthet genom att skapa syntetiska användare som ställer felaktiga eller ofullständiga frågor likt riktiga användare.

Kostnad och hastighet: Vi kan bedöma systemets framgång (noggrannhet, irrelevans, hallucinationer) på några minuter med syntetiska datamängder, istället för tester som skulle ta veckor för människor. 10 

D. Kritiska och speciella arbetsbelastningar

Spelserverorkestrering (Agones): I bilden med titeln "Hur Agones fungerar" Av Googles team för öppen källkod delades ett flödesschema över infrastrukturen för A.R.C. Raiders spel. I detta diagram syntes tydligt att spelarna efter matchmaking tilldelades Pods kallade "Agones Game Server" och dessa servrar hanterades med en "binpacking" (komprimerings-) strategi på global skala. Detta gjorde det möjligt för utvecklare att ägna mer tid åt spelutveckling utan att tänka på infrastrukturen. Det bevisar också hur viktig roll Kubernetes spelar som öppen källkod i spelindustrin.

Ekran Resmi 2026-03-16 10.37.12.png

Hastighet i modelldistribution: Presentationen visade att modeller nu lagras i OCI-kompatibla register som Docker-avbildningar och är direkt anslutna (monterade) till Poden som en disk tack vare Modell CSI-drivrutinDetta eliminerar tiden det tar att kopiera GB data. Harbors OCI-register används för dessa operationer.8 

 

Inferensprestanda: Enligt anteckningarna och bilderna jag tog från vLLM-sessionen var PagedAttention-tekniken nyckeln till prestanda. Denna teknik hanterar GPU-minne med virtuell minneslogiken i operativsystem, övervinner flaskhalsen i "Key-Value Cache" och multiplicerar dataflödet. Presentationen nämner också att DeepSpeed, utvecklad av Microsoft, ökar GPU-effektiviteten med 4-6 gånger, vilket ger hög prestanda även på gammal hårdvara. Det betonas i presentationen att antalet tokens som produceras per avgift ökar tack vare detta. 9 

 

Slutsats: Jag lämnar Open Source Summit Japan 2025 och återvänder med en vision som fullständigt förändrar mitt perspektiv på mitt yrke, inte bara med ny teknisk kunskap i fickan.

 

En av de punkter som imponerade mest på mig under evenemanget var bredden av täckningsområdet. öppen källkodsprogramvara (OSS)Idag är det faktum att kraften i öppen källkod är betrodd även i mänsklighetens mest kritiska och avancerade teknikprojekt, såsom Internationella rymdstationen (ISS), inte bara på webbplatser eller mobilapplikationer, påminde mig återigen om ansvaret och potentialen i det arbete vi gör.

Ekran Resmi 2026-03-16 10.39.07.png

Det mest oförglömliga ögonblicket från toppmötet för mig var att lyssna live på Linus Torvalds, en av arkitekterna bakom den moderna mjukvaruvärlden och skaparen av Linux och Git. Att höra hans syn på teknologi och hans vision på nära håll gjorde att jag fick en förståelse för den stora filosofin bakom de grundläggande verktyg vi använder.

 

Den största lärdomen jag fick från detta toppmöte var denna: Mjukvaruvärlden är ett oändligt hav, öppet för utveckling när som helst och i ständig rörelse. Att vara en del av detta ekosystem innebär inte bara att skriva kod utan också att ständigt lära sig och bidra till gemenskapen. Denna dynamik i mitt yrke motiverar mig otroligt mycket. Nu är det dags att fortsätta mitt arbete mycket mer beslutsamt och snabbt med denna inspiration! 👨‍💻✨

 

Ekran Resmi 2026-03-16 10.40.13.png

Mitt besök i Japan var en insikt om en nyfikenhet som först slog rot genom den livliga läskulturen och kunskapsdelningen som uppmuntras på Galaksiya. Min främsta motivation för att välja denna destination var att fördjupa mig i en kultur och ett kulinariskt arv som jag uppfattade som fundamentalt annorlunda – nästan en värld bortom – vårt eget. Jag ville kliva utanför min komfortzon och uppleva hur det kändes att vara en "outsider" i ett land med så stora kontraster, där varje ritual och smak verkade tillhöra en annan dimension.

 

Men när jag navigerade allt från Tokyos massiva, neonupplysta boulevarder till de traditionella, undangömda restaurangerna i smala gränder, upplevde jag en djupgående insikt. Medan den noggranna presentationen av maten och den stoiska tystnaden på gatorna till en början kändes främmande, upptäckte jag snart en universell essens under ytan. När jag stod i skuggan av en modern skyskrapa och såg någon finna en stund av frid i en forntida helgedom, insåg jag att uttrycket för mänsklig uppriktighet är detsamma där som i vårt eget hemland. Det var en kraftfull påminnelse om att oavsett geografi, konvergerar mänskligheten kring samma grundläggande värderingar: vänlighet, arbete, familj och delningsanda.

Ekran Resmi 2026-03-16 10.41.49.png

 

Att bevittna den djupt rotade kulturen av respekt och den "osynliga harmonin" bakom ett samhälle som fungerar med sådan otrolig precision förvandlade mina observationer till en bredare läxa i mänskligheten. Att uppleva detta kulturella djup tillsammans med en sådan unik vision hjälpte mig att förstå att världen formas inte bara av strukturer, utan av mänsklig anda och disciplin. Jag återvänder från denna resa med en oförglömlig inblick i hur vi alla är "ett" även på andra sidan jordklotet – och naturligtvis några värdefulla fotografier som fångar stadens själ.
 

Vi ses vid nästa stopp.

Emre IZMIR

Sr. DevOps-ingenjör
Intryck från Öppen källkodstoppmötet i Japan 2025, Tokyo.
 

Referensprojekt

  1. Framtiden för agentisk AI kommer inte att definieras av modellskala... - Presentation om AI_dev Track vid Open Source Summit, 8-10 december 2025, Tokyo, Japan. Tillgänglig på: https://ossjapan2025.sched.com/type/AI_dev

  2. Dynamisk GPU-provisionering i Kubernetes med komponerbar disaggregerad infrastruktur - Jin Hase & Tsubasa Watanabe, Fujitsu Limited. Öppen källkodstoppmöte Japan 2025, Moln- och containerspår. Tillgänglig på: https://github.com/CoHDI

  3. Jurister på autopilot: Köra AI-agenter på Kubernetes - Annie Talvasto, Waovo/Upbound. Öppen källkodstoppmöte Japan 2025. Tillgänglig på: https://ossjapan2025.sched.com/event/29Fqz/llms-on-autopilot-running-ai-agents-on-kubernetes-with-open-source-tools-annie-talvasto-waovo

  4. Infrastrukturorkestrering med Crossplane 2.0 - Uppåtgående presentation. Öppen källkodstoppmöte Japan 2025. Tillgänglig på: (https://ossjapan2025.sched.com/event/29FnY)

  5. Från lab till liv: Praktisk AI-systemutvärdering - Sharon Dashet & Vincent Caldeira, Red Hat-presentation, Tokyo, Japan. Tillgänglig på: https://ossjapan2025.sched.com/event/29FnS/from-lab-to-life-practical-ai-system-evaluation-sharon-dashet-vincent-caldeira-red-hat

  6. Federerad vektorhämtning och policymedveten hämtning - Hiroki Ito och Shusuke Takahashi, NTT. Öppen källkodstoppmöte Japan 2025, AI_utvecklingsspår. Tillgänglig på: https://ossjapan2025.sched.com/event/29FpX/federated-vector-retrieval-across-organizations-with-milvus-opa-and-vllm-hiroki-ito-shusuke-takahashi-ntt

  7. Huvudtal: Vad händer härnäst för Agones? Styrning på planetnivå – Ben Huston, senior huvudarkitekt, Google Cloud. Öppen källkodstoppmötet i Japan 2025, AI_utvecklingsspår. Tillgänglig på: https://ossjapan2025.sched.com/event/2AHMX/keynote-whats-next-for-agones-planet-scale-governance-ben-huston-sr-principal-architect-google-cloud

  8. ModelPack: En öppen standard för paketering, distribution och körning av LLM:er i molnbaserad miljö - Wenbo Qi och Chenyu Zhang, presentation av Ant Group. Öppen källkodstoppmötet i Japan 2025. Tillgänglig på: https://ossjapan2025.sched.com/event/29FpF/modelpack-an-open-standard-for-packaging-distributing-and-running-llms-in-cloud-native-environment-wenbo-qi-chenyu-zhang-ant-group

  9. Huvudanförande: Tillståndet i unionen - Jim Zemlin, verkställande direktör, The Linux Foundation Presentation. Öppen källkodstoppmötet Japan 2025. Tillgänglig på: https://ossjapan2025.sched.com/event/2AEuA/keynote-state-of-the-union-jim-zemlin-executive-director-the-linux-foundation

  10. Praktiska syntetiska datastrategier för RAG/Agentic-system - Kevin Noel, Uzabase - Presentation om Edge US. Öppen källkodstoppmöte Japan 2025. Tillgänglig på: https://ossjapan2025.sched.com/event/29FlW/practical-synthetic-data-strategies-for-ragagentic-systems-kevin-noel-uzabase-edge-us