• Date de publication
    16 mars
  • Partagez

Introduction : Architecture système, et non modèle

 

Alors que la course aux « modèles plus grands » dans le monde de l'intelligence artificielle cède la place à un silence critique, l'avenir du secteur a été résumé en une seule phrase lors de l'Open Source Summit Japan 2025 :  « L’avenir de l’IA agentique ne sera pas défini par la taille du modèle, mais par l’architecture du système. » 

 

Cette constatation est l'indicateur le plus concret du passage d'une focalisation sur la simple formation de modèles à l'infrastructure qui les soutient et les fait évoluer. Le sommet organisé à Toranomon Hills, à Tokyo, a démontré comment des géants comme Google, Fujitsu et Honda ont adopté l'open source comme « fondement stratégique ». En tant qu'ingénieur DevOps, j'ai eu l'opportunité d'observer sur place les nouvelles normes à la croisée de l'intelligence artificielle et des infrastructures.
Cet article analyse l'interconnexion entre les mondes de l'intelligence artificielle et des infrastructures, en s'appuyant sur des photographies que j'ai prises personnellement lors de l'événement, les sessions techniques auxquelles j'ai assisté et les données compilées à partir du programme officiel de la Linux Foundation.

Ekran Resmi 2026-03-16 09.52.28.png

 

Thèmes clés

Les discussions techniques qui ont marqué le programme de la conférence et les présentations que j'ai examinées sur place se sont regroupées autour des axes principaux suivants en matière de gestion des infrastructures modernes :

 

A. Architecture système et désagrégation matérielle

  • Désagrégation matérielle : Comme détaillé dans la session « Provisionnement dynamique des GPU » de Fujitsu, il s'agit de dépasser la structure de serveur traditionnelle en regroupant le processeur, le GPU et la mémoire dans un pool dynamique (pool de ressources) en les retirant des boîtiers physiques.
  • Usines d'IA : Transformation des centres de données en installations de production capables de répondre aux exigences variables des charges de travail d'intelligence artificielle, au lieu de fermes de serveurs statiques.

B. Opérations d'agents

  • Gestion autonome des infrastructures : Comme nous l'avons vu lors des démonstrations sur scène, on observe une transition entre la structure d'outils tels que Terraform qui « s'arrêtent en cas d'erreur » et les structures basées sur des « agents » capables d'analyser l'erreur et de proposer une solution.3 
  • Boucle de rétroaction continue : Surveillance continue non seulement du déploiement des modèles d'intelligence artificielle, mais aussi de leurs performances en environnement réel.

C. Gouvernance et sécurité des données

  • Accès fédéré aux vecteurs : D'après les schémas architecturaux présentés par NTT et d'autres intervenants, les structures qui traitent les données sur site à partir de sources distribuées combinent les résultats au lieu de les transférer vers un système central.6 
  • Politique en tant que code : Prise de décisions dynamiques d'accès aux données au moment de la requête par des moteurs comme OPA (Open Policy Agent). 6 

D. Charges de travail critiques et spéciales

  • Orchestration du serveur de jeu : Comme l'a montré la présentation d'Agones de l'équipe Google Open Source, gestion de serveurs de jeux avec état à l'échelle mondiale sur Kubernetes.7 
  • Linux de qualité spatiale : Gestion des bras robotiques à bord de l'ISS grâce à un logiciel libre, présentée lors du colloque GITAI.8 

Faits marquants de la conférence

A. Architecture système et désagrégation matérielle

Libération du matériel : CoHDI

L'une des sessions techniques les plus marquantes de la conférence fut le discours intitulé « Provisionnement dynamique de GPU dans Kubernetes » Présenté par Jin Hase et Tsubasa Watanabe de l'équipe Fujitsu. Le schéma architectural projeté sur scène expliquait… CoHDI (Infrastructure désagrégée composable) projet comme suit :

 

Ekran Resmi 2026-03-16 09.57.20.png

 

  • Pool de ressources désagrégées : Le processeur, la carte graphique, la mémoire et les cartes réseau sont retirés des boîtiers de serveurs physiques et rassemblés dans un pool commun.
  • Matrice de commutation PCIe/CXL : Ces composants sont reliés entre eux par des commutateurs à grande vitesse.
  • Intégration Kubernetes : Comme le montre le schéma, Kubernetes demande du matériel comme s'il créait un Pod, et le système assemble instantanément ce matériel pour créer des serveurs « Composed Baremetal ».2 

Alors pourquoi est- CoHDI Est-ce important ? Cette architecture a le potentiel d'augmenter l'efficacité d'utilisation du GPU de 30 % à 80 %.

 

Orchestration de l'infrastructure : Crossplane 2.0

 

Une autre présentation importante lors de l'événement a montré que Crossplane 2.0 L'architecture. La surveillance continue des définitions déclaratives sur Git par la boucle de contrôle Crossplane et leur transformation en ressources réelles sur AWS, Azure ou Google Cloud ont soutenu la vision d'une infrastructure « auto-réparatrice ». De plus, Crossplane 2.0 Il est désormais possible de l'exécuter dans tous les environnements Kubernetes, et non plus seulement pour les services cloud comme avec Crossplane v1. Grâce à cette technologie, chaque développeur peut installer des outils simples en toute autonomie. La présentation était impressionnante et illustrait parfaitement l'évolution future des processus DevOps. 

B. Opérations d'agents

AgentOps : Il s'agit d'un moteur de rétroaction continue visant à réduire l'écart entre la réalité et l'application des agents d'intelligence artificielle en reliant leurs phases de développement (boucle interne) et d'application (boucle externe). Cette structure, définie comme une discipline d'ingénierie de plateforme d'IA, combine des ensembles de données préparés hors ligne avec des observations issues de l'environnement réel au sein d'un écosystème unique, permettant ainsi la détection d'erreurs et l'intégration de données réelles dans les processus de test.5 

 

Humain contre agent : Dans son intervention, Annie Talvasto a soutenu que les machines resteraient incomplètes dans les processus DevOps tant qu'elles n'auraient pas accès aux informations détenues par les humains. Elle a notamment mentionné qu'un système pourrait être géré de manière incomplète en l'absence même d'un bref échange avec un collègue. Elle a détaillé dans sa présentation que toutes ces informations devraient être fournies en priorité aux agents. 3 

 

Logiciel libre dans l'espace : l'ISS et la robotique

 

Parmi les photos prises lors de la session consacrée aux systèmes critiques pour la sécurité, on pouvait voir des images de la Station spatiale internationale (ISS) et GITAÏ Le bras robotique se reflétait sur l'écran géant. Voir Linux utilisé dans un environnement où l'erreur est impossible, dans le vide spatial, était une preuve de la fiabilité des logiciels libres.8 

 

C. Gouvernance et sécurité des données

C. Gouvernance et sécurité des données

Accès vectoriel unifié entre les organisations et OPA : Dans les grandes organisations, les données sont généralement stockées dans différents services ou chez des entreprises partenaires, au sein de bases de données vectorielles distinctes. Le regroupement de ces données dans un centre unique s'avère complexe en raison des contraintes légales, de la sécurité des données et des droits de propriété. Cette présentation vise à proposer une « intégration virtuelle » sans duplication des données.

  • vLLM : Il sert à transformer des métadonnées complexes issues de sources de données en résumés concis et pertinents en langage naturel. Il joue également un rôle de moteur d'inférence haute performance dans les processus de compréhension des requêtes utilisateur et de traitement des résultats.
  • Décisions politiques : Responsable de la gouvernance et de l'autorisation des données. Lorsqu'un utilisateur lance une requête, OPA vérifie en temps réel si l'utilisateur est autorisé à accéder à cette source de données.
  • Détail de Milvus : Il fait office de « catalogue sémantique ». Il stocke les métadonnées techniques et fonctionnelles des sources de données de toutes les organisations sous forme vectorielle. Lorsqu'une requête est reçue, il effectue une première recherche afin de déterminer quelle organisation est susceptible de détenir les données pertinentes.

Cette présentation démontre comment une infrastructure de recherche sécurisée et « intelligente » peut être mise en place entre organisations sans déplacer les données vers un emplacement central, en combinant la capacité de recherche évolutive de Milvus, la puissance de traitement du langage de vLLM et les politiques de sécurité flexibles d'OPA.6 

 

Ingénierie du contexte : L'orateur Kevin Noel affirme que l'époque où l'on se contentait de « rédiger une question et d'attendre une réponse » est révolue, et que nous sommes entrés dans l'ère de l'ingénierie du contexte.

  • Les titulaires d'un LLM sont apatrides : Les mannequins ne se souviennent même pas de la phrase précédente à moins que vous ne la leur rappeliez.
  • Création de l'état : Pour qu'une intelligence artificielle fournisse la bonne réponse, il faut lui présenter toutes les informations correctement et au bon moment. C'est tout l'art de combiner les échanges précédents, les informations issues des documents et les résultats des outils.

La présentation montre que les éléments suivants doivent être combinés pour une réponse efficace de l'intelligence artificielle :

  • RAG (Informations pertinentes) : Informations extraites de documents ou de bases de données internes.
  • Gestion de la mémoire: Préférences passées de l'utilisateur et historique des conversations à court terme.
  • Outils externes : Données provenant d'API ou d'outils de calcul.
  • Commandes système : Règles principales déterminant la nature et la tâche de l'intelligence artificielle.

Il est impossible de tester manuellement une structure aussi complexe (RAG + Mémoire + Outils). L'orateur propose la solution suivante :

  • Évaluation automatique : Nous devons faire en sorte que l'intelligence artificielle produise des milliers de paires « question-réponse » (données synthétiques) à partir des données dont nous disposons.
  • Scénarios réalistes : Nous devons mesurer la robustesse du système en créant des utilisateurs synthétiques qui posent des questions incorrectes ou incomplètes, comme de vrais utilisateurs.

Coût et rapidité : nous pouvons évaluer le succès du système (précision, pertinence, hallucination) en quelques minutes grâce à des ensembles de données synthétiques, au lieu de tests qui prendraient des semaines pour les humains. 10 

D. Charges de travail critiques et spéciales

Orchestration du serveur de jeu (Agones) : Dans la diapositive intitulée « Comment fonctionne Agones » L'équipe Google Open Source a partagé un organigramme concernant l'infrastructure de Raiders de l'ARC Dans ce diagramme, on constate clairement qu'après la recherche de joueurs, ces derniers sont affectés à des pods appelés « Serveurs de jeu Agones ». Ces serveurs sont gérés à l'échelle mondiale grâce à une stratégie de compression (« binpacking »). Cela permet aux développeurs de se concentrer sur le développement du jeu sans se soucier de l'infrastructure. Cela démontre également le rôle crucial de Kubernetes, en tant que logiciel libre, dans l'industrie du jeu vidéo.

Ekran Resmi 2026-03-16 10.37.12.png

Vitesse de distribution des modèles : La présentation a montré que les modèles sont désormais stockés dans des registres compatibles OCI, tels que les images Docker, et directement connectés (montés) au Pod comme un disque grâce à Modèle de pilote CSICela permet de gagner du temps en évitant de copier des gigaoctets de données. Le registre OCI de Harbor est utilisé pour ces opérations.8 

 

Performances d'inférence : D'après les notes et les supports visuels de la session vLLM, la technologie PagedAttention était essentielle à la performance. Cette technologie gère la mémoire GPU grâce à la logique de mémoire virtuelle des systèmes d'exploitation, surmontant ainsi le goulot d'étranglement du cache clé-valeur et multipliant le débit. La présentation mentionne également que DeepSpeed, développé par Microsoft, augmente l'efficacité du GPU de 4 à 6 fois, offrant des performances élevées même sur du matériel ancien. Il est souligné que le nombre de jetons produits par transaction augmente grâce à cette technologie. 9 

 

Conclusion: En quittant l'Open Source Summit Japan 2025, je reviens avec une vision qui change complètement ma perspective sur ma profession, et pas seulement avec de nouvelles connaissances techniques en poche.

 

L'un des points qui m'a le plus impressionné durant l'événement a été l'étendue de la zone couverte. logiciel open source (OSS)Aujourd'hui, le fait que la puissance de l'open source soit reconnue même dans les projets technologiques les plus critiques et les plus avancés de l'humanité, tels que… Station spatiale internationale (ISS)Cela m’a rappelé une fois de plus, et pas seulement sur les sites web ou les applications mobiles, la responsabilité et le potentiel de notre travail.

Ekran Resmi 2026-03-16 10.39.07.png

Le moment le plus inoubliable du sommet a été pour moi l'intervention en direct de Linus Torvalds, l'un des architectes du monde du logiciel moderne et le créateur de Linux et de Git. Entendre de visu son approche de la technologie et sa vision m'a permis de comprendre la vaste philosophie qui sous-tend les outils fondamentaux que nous utilisons.

 

La plus grande leçon que j'ai tirée de ce sommet est la suivante : Le monde du logiciel est un océan infini, toujours en mouvement et ouvert au développement. Faire partie de cet écosystème, c'est non seulement écrire du code, mais aussi apprendre et contribuer constamment à la communauté. Ce dynamisme est une source de motivation incroyable pour moi. Il est temps maintenant de poursuivre mon travail avec encore plus de détermination et de rapidité, portée par cette inspiration ! 👨‍💻✨

 

Ekran Resmi 2026-03-16 10.40.13.png

Mon voyage au Japon a concrétisé une curiosité née de la culture stimulante de la lecture et du partage des connaissances encouragée à Galaksiya. Ma principale motivation était de m'immerger dans une culture et un patrimoine culinaire que je percevais comme fondamentalement différents des nôtres, presque à l'opposé. Je voulais sortir de ma zone de confort et expérimenter ce que signifie être une étrangère dans un pays aux contrastes si saisissants, où chaque rituel, chaque saveur semblait appartenir à une autre dimension.

 

Cependant, en parcourant les immenses boulevards illuminés au néon de Tokyo et les petits restaurants traditionnels nichés dans d'étroites ruelles, j'ai eu une révélation. Si la présentation soignée des plats et le silence stoïque des rues m'ont d'abord paru étranges, j'ai rapidement découvert une essence universelle sous cette apparente simplicité. Debout à l'ombre d'un gratte-ciel moderne, observant une personne trouver un moment de paix dans un sanctuaire ancien, j'ai compris que l'expression de la sincérité humaine est la même là-bas que dans notre propre pays. Ce fut un puissant rappel que, par-delà les frontières, l'humanité converge vers les mêmes valeurs fondamentales : la bonté, le travail, la famille et l'esprit de partage.

Ekran Resmi 2026-03-16 10.41.49.png

 

Observer la culture du respect profondément ancrée et l'harmonie invisible qui sous-tendent une société fonctionnant avec une précision incroyable a transformé mes observations en une leçon d'humanité plus vaste. Cette richesse culturelle, alliée à une vision si singulière, m'a permis de comprendre que le monde est façonné non seulement par les structures, mais aussi par l'esprit et la discipline humains. Je reviens de ce voyage avec une révélation : nous ne faisons qu'un, même à l'autre bout du monde. Et bien sûr, quelques précieuses photographies qui capturent l'âme de cette ville.
 

On se retrouve à notre prochaine étape.

Emre İZMİR

Ingénieur DevOps senior
Impressions du Sommet Open Source Japan 2025, Tokyo.
 

Références

  1. L'avenir de l'IA agentielle ne sera pas défini par la taille du modèle... Présentation lors du Open Source Summit AI_dev Track, du 8 au 10 décembre 2025 à Tokyo, au Japon. Disponible sur : https://ossjapan2025.sched.com/type/AI_dev

  2. Provisionnement dynamique de GPU dans Kubernetes avec une infrastructure désagrégée composable — Jin Hase et Tsubasa Watanabe, Fujitsu Limited. Open Source Summit Japan 2025, volet Cloud et conteneurs. Disponible sur : https://github.com/CoHDI

  3. Masters en droit en mode automatique : Exécution d’agents d’IA sur Kubernetes — Annie Talvasto, Waovo/Upbound. Open Source Summit Japan 2025. Disponible sur : https://ossjapan2025.sched.com/event/29Fqz/llms-on-autopilot-running-ai-agents-on-kubernetes-with-open-source-tools-annie-talvasto-waovo

  4. Orchestration de l'infrastructure avec Crossplane 2.0 - Présentation Upbound. Open Source Summit Japan 2025. Disponible sur :(https://ossjapan2025.sched.com/event/29FnY)

  5. Du laboratoire à la vie réelle : évaluation pratique des systèmes d’IA — Sharon Dashet et Vincent Caldeira, présentation Red Hat, Tokyo, Japon. Disponible sur : https://ossjapan2025.sched.com/event/29FnS/from-lab-to-life-practical-ai-system-evaluation-sharon-dashet-vincent-caldeira-red-hat

  6. Recherche vectorielle fédérée et recherche tenant compte des politiques — Hiroki Ito et Shusuke Takahashi, NTT. Open Source Summit Japan 2025, AI_dev Track. Disponible sur : https://ossjapan2025.sched.com/event/29FpX/federated-vector-retrieval-across-organizations-with-milvus-opa-and-vllm-hiroki-ito-shusuke-takahashi-ntt

  7. Discours d'ouverture : Quel avenir pour Agones ? Gouvernance à l'échelle planétaire — Ben Huston, architecte principal senior chez Google Cloud. Open Source Summit Japan 2025, session AI_dev. Disponible sur : https://ossjapan2025.sched.com/event/2AHMX/keynote-whats-next-for-agones-planet-scale-governance-ben-huston-sr-principal-architect-google-cloud

  8. ModelPack : une norme ouverte pour l’empaquetage, la distribution et l’exécution de modules linguistiques logiques dans un environnement natif du cloud. — Présentation de Wenbo Qi et Chenyu Zhang, Ant Group. Open Source Summit Japan 2025. Disponible sur : https://ossjapan2025.sched.com/event/29FpF/modelpack-an-open-standard-for-packaging-distributing-and-running-llms-in-cloud-native-environment-wenbo-qi-chenyu-zhang-ant-group

  9. Discours d'ouverture : État de l'Union — Présentation de Jim Zemlin, directeur exécutif de la Linux Foundation. Open Source Summit Japan 2025. Disponible sur : https://ossjapan2025.sched.com/event/2AEuA/keynote-state-of-the-union-jim-zemlin-executive-director-the-linux-foundation

  10. Stratégies pratiques de données synthétiques pour les systèmes RAG/Agent — Kevin Noel, Uzabase - Présentation Edge US. Open Source Summit Japan 2025. Disponible sur : https://ossjapan2025.sched.com/event/29FlW/practical-synthetic-data-strategies-for-ragagentic-systems-kevin-noel-uzabase-edge-us