• Fecha de publicación
    Marzo 16, 2026
  • Compartir

Introducción: Arquitectura del sistema, no modelo.

 

Si bien la carrera por los "modelos más grandes" en el mundo de la inteligencia artificial está dando paso a un silencio crítico, el futuro del sector se resumió en una sola frase en la Open Source Summit Japan 2025:  "El futuro de la IA agente no estará definido por la escala del modelo, sino por la arquitectura del sistema." 

 

Esta determinación es el indicador más concreto de que el enfoque ha pasado del simple entrenamiento de modelos a la infraestructura que los sustenta y escala. La cumbre celebrada en Toranomon Hills, Tokio, demostró cómo gigantes como Google, Fujitsu y Honda han adoptado el código abierto como una "base estratégica", y como ingeniero de DevOps, tuve la oportunidad de examinar in situ las nuevas normas en la intersección de los mundos de la inteligencia artificial y la infraestructura.
Este artículo analiza la interconexión entre los mundos de la inteligencia artificial y la infraestructura, basándose en fotografías que tomé personalmente en el evento, las sesiones técnicas a las que asistí y los datos recopilados del programa oficial de la Linux Foundation.

Ekran Resmi 2026-03-16 09.52.28.png

 

Temas Clave

Los debates técnicos que destacaron en el programa de la conferencia y las presentaciones que examiné in situ se agruparon en los siguientes ejes principales en lo que respecta a la gestión moderna de infraestructuras:

 

A. Arquitectura del sistema y desagregación del hardware

  • Desagregación de hardware: Como se detalla en la sesión "Aprovisionamiento dinámico de GPU" de Fujitsu, se va más allá de la estructura de servidor tradicional, agrupando la CPU, la GPU y la memoria en un grupo dinámico (grupo de recursos) al retirarlas de las carcasas físicas.
  • Fábricas de IA: Transformación de los centros de datos en instalaciones de producción capaces de responder a las demandas variables de las cargas de trabajo de inteligencia artificial, en lugar de granjas de servidores estáticas.

B. Operaciones con agentes

  • Gestión autónoma de infraestructuras: Como pudimos ver en las demostraciones en el escenario, se observa una transición desde la estructura de herramientas como Terraform, que "se detienen en caso de error", a estructuras basadas en "agentes" que pueden analizar el error y producir una solución.3 
  • Bucle de retroalimentación continua: Supervisión continua no solo del despliegue de modelos de inteligencia artificial, sino también de su rendimiento en el entorno real.

C. Gobernanza y seguridad de los datos

  • Acceso federado a vectores: Según los diagramas arquitectónicos compartidos por NTT y otros presentadores, las estructuras que procesan datos in situ en fuentes distribuidas combinan los resultados en lugar de trasladarlos a un repositorio central.6 
  • Política como código: Toma de decisiones dinámica sobre el acceso a los datos en el momento de la consulta por parte de motores como OPA (Open Policy Agent). 6 

D. Cargas de trabajo críticas y especiales

  • Orquestación de servidores de juegos: Tal como se muestra en la presentación Agones del equipo de código abierto de Google, se trata de la gestión de servidores de juegos con estado a escala global en Kubernetes.7 
  • Linux de grado espacial: La gestión de brazos robóticos en la ISS mediante software de código abierto se mostró en la presentación de GITAI.8 

Aspectos destacados de la conferencia

A. Arquitectura del sistema y desagregación del hardware

Liberación del hardware: CoHDI

Una de las sesiones técnicas más destacadas de la conferencia fue el discurso titulado "Aprovisionamiento dinámico de GPU en Kubernetes" presentado por Jin Hase y Tsubasa Watanabe del equipo Fujitsu. El diagrama arquitectónico mostrado en el escenario explicaba la CoHDI (Infraestructura Desagregada Componible) El proyecto es el siguiente:

 

Ekran Resmi 2026-03-16 09.57.20.png

 

  • Conjunto de recursos desagregados: La CPU, la GPU, la memoria y las tarjetas de red se extraen de las carcasas de los servidores físicos y se recogen en un grupo común.
  • Estructura de conmutación PCIe/CXL: Estos componentes están conectados entre sí mediante interruptores de alta velocidad.
  • Integración de Kubernetes: Como se puede ver en el diagrama, Kubernetes solicita hardware como si estuviera creando un Pod, y el sistema ensambla instantáneamente este hardware para crear servidores "Composed Baremetal".2 

¿Por qué es CoHDI ¿Importante? Esta arquitectura tiene el potencial de aumentar la eficiencia del uso de la GPU del 30% al 80%.

 

Orquestación de infraestructura: Crossplane 2.0

 

Otra presentación importante en el evento mostró la Plano cruzado 2.0 arquitectura. El monitoreo continuo de definiciones declarativas en Git por el bucle de control de Crossplane y su transformación en recursos reales en AWS, Azure o Google Cloud respaldaron la visión de una infraestructura "autorreparable". Además, Plano cruzado 2.0 Ahora se puede ejecutar en todos los entornos de Kubernetes, no solo en servicios en la nube, como en Crossplane v1. Gracias a esta tecnología, cualquier desarrollador puede instalar tecnologías sencillas sin ayuda. Fue una presentación impresionante que mostró el futuro de los procesos DevOps. 

B. Operaciones con agentes

AgentOps: Se trata de un motor de retroalimentación continua que busca cerrar la brecha entre la realidad y el mundo real, integrando las etapas de desarrollo (bucle interno) y aplicación (bucle externo) de los agentes de inteligencia artificial. Esta estructura se define como una disciplina de ingeniería de plataformas de IA que combina conjuntos de datos preparados fuera de línea con observaciones del entorno real en un único ecosistema, lo que permite la detección de errores y la incorporación de datos del mundo real en los procesos de prueba.5 

 

Humano contra agente: Annie Talvasto argumentó en su discurso que las máquinas seguirán siendo incompletas en los procesos DevOps mientras no cuenten con la información que poseen los humanos. Por ejemplo, mencionó que el sistema podría gestionarse de forma incompleta si no se dispone ni siquiera de una breve comunicación informal con un compañero. En su presentación, explicó detalladamente que toda esta información debería proporcionarse primero a los agentes. 3 

 

Código abierto en el espacio: la ISS y la robótica

 

En las fotos tomadas en la sesión de sistemas críticos de seguridad, imágenes de la Estación Espacial Internacional (ISS) y GITAI Los brazos robóticos se reflejaban en la pantalla gigante. Ver que Linux se utiliza en un entorno donde no hay margen de error en el vacío del espacio demostraba la fiabilidad del software de código abierto.8 

 

C. Gobernanza y seguridad de los datos

C. Gobernanza y seguridad de los datos

Acceso unificado a vectores en todas las organizaciones y OPA: En las grandes organizaciones, los datos suelen almacenarse en distintos departamentos o empresas asociadas, en diferentes bases de datos vectoriales. Recopilar estos datos en un único centro resulta complejo debido al cumplimiento de la normativa legal, la seguridad de los datos y los derechos de propiedad. Esta presentación tiene como objetivo proporcionar una «integración virtual» sin necesidad de copiar los datos.

  • vLLM: Se utiliza para transformar metadatos complejos de diversas fuentes de datos en resúmenes concisos y significativos en lenguaje natural. Además, funciona como un motor de inferencia de alto rendimiento en los procesos de comprensión de las consultas de los usuarios y el procesamiento de los resultados.
  • Decisiones de política: Responsable de la gobernanza y autorización de datos. Cuando un usuario inicia una consulta, OPA comprueba en tiempo de ejecución si el usuario tiene permiso para acceder a esa fuente de datos.
  • Detalle de Milvus: Funciona como un "catálogo semántico". Almacena los metadatos técnicos y comerciales de las fuentes de datos de todas las organizaciones en formato vectorial. Cuando se recibe una consulta, realiza una primera búsqueda para determinar qué organización podría tener los datos relevantes.

Esta presentación demuestra cómo se puede establecer una infraestructura de búsqueda segura e "inteligente" entre organizaciones sin trasladar los datos a una ubicación central, combinando la capacidad de búsqueda escalable de Milvus, la potencia de procesamiento del lenguaje de vLLM y las políticas de seguridad flexibles de OPA.6 

 

Ingeniería de contexto: El orador Kevin Noel argumenta que la era de simplemente "escribir una pregunta y esperar una respuesta" ha terminado, y que, en cambio, hemos entrado en la era de la ingeniería de contexto.

  • Los másteres en Derecho (LLM) no tienen Estado: Los modelos no recuerdan ni siquiera la frase anterior a menos que se lo recuerdes.
  • Creación de estado: Para que una inteligencia artificial dé la respuesta correcta, es necesario presentarle toda la información de forma precisa en ese preciso instante (justo a tiempo). Este es el arte de combinar conversaciones previas, información de documentos y resultados de herramientas.

La presentación muestra que para obtener una respuesta de inteligencia artificial exitosa, deben combinarse las siguientes partes:

  • RAG (Información relevante): Información extraída de documentos o bases de datos internas.
  • Gestión de la memoria: Preferencias anteriores del usuario e historial de conversaciones a corto plazo.
  • Herramientas externas: Datos procedentes de API o herramientas de cálculo.
  • Comandos del sistema: Reglas principales que determinan el carácter y la función de la inteligencia artificial.

Es imposible probar manualmente una estructura tan compleja (RAG + Memoria + Herramientas). El ponente propone la siguiente solución:

  • Evaluación automática: Debemos lograr que la inteligencia artificial genere miles de pares de "preguntas y respuestas" (datos sintéticos) utilizando los datos que tenemos.
  • Escenarios realistas: Debemos medir la robustez del sistema creando usuarios sintéticos que formulen preguntas incorrectas o incompletas, al igual que los usuarios reales.

Coste y velocidad: Podemos evaluar el éxito del sistema (precisión, irrelevancia, alucinaciones) en minutos con conjuntos de datos sintéticos, en lugar de realizar pruebas que llevarían semanas a los humanos. 10 

D. Cargas de trabajo críticas y especiales

Orquestación de servidores de juegos (Agones): En la diapositiva titulada "Cómo funciona Agones" Por parte del equipo de código abierto de Google, se compartió un diagrama de flujo sobre la infraestructura de la Asaltantes ARC En este diagrama se observa claramente que, tras el emparejamiento, los jugadores se asignan a pods denominados "Servidores de Juego Agones". Estos servidores se gestionan mediante una estrategia de compresión global. Esto permite a los desarrolladores dedicar más tiempo al desarrollo del juego sin preocuparse por la infraestructura. Además, demuestra la importancia de Kubernetes como plataforma de código abierto en la industria de los videojuegos.

Ekran Resmi 2026-03-16 10.37.12.png

Velocidad en la distribución de modelos: La presentación mostró que los modelos ahora se almacenan en registros compatibles con OCI como imágenes Docker y se conectan (montan) directamente al Pod como un disco gracias a la Controlador modelo CSIEsto elimina el tiempo necesario para copiar gigabytes de datos. Para estas operaciones se utiliza el registro OCI de Harbor.8 

 

Rendimiento de la inferencia: Según las notas y las imágenes que tomé de la sesión de vLLM, la tecnología PagedAttention fue clave para el rendimiento. Esta tecnología gestiona la memoria de la GPU con la lógica de memoria virtual de los sistemas operativos, superando el cuello de botella de la caché de clave-valor y multiplicando el rendimiento. La presentación también menciona que DeepSpeed, desarrollado por Microsoft, aumenta la eficiencia de la GPU entre 4 y 6 veces, proporcionando un alto rendimiento incluso en hardware antiguo. Se destaca que, gracias a esto, aumenta el número de tokens generados por comisión. 9 

 

Conclusión: Tras asistir a la Open Source Summit Japan 2025, regreso con una visión que cambia por completo mi perspectiva sobre mi profesión, y no solo con nuevos conocimientos técnicos en mi haber.

 

Uno de los aspectos que más me impresionó durante el evento fue la amplitud del área de cobertura. software de código abierto (OSS)Hoy en día, el hecho de que se confíe en el poder del código abierto incluso en los proyectos tecnológicos más críticos y avanzados de la humanidad, como el Estación Espacial Internacional (ISS)No solo en sitios web o aplicaciones móviles, me recordó una vez más la responsabilidad y el potencial del trabajo que hacemos.

Ekran Resmi 2026-03-16 10.39.07.png

El momento más inolvidable de la cumbre para mí fue escuchar en directo a Linus Torvalds, uno de los arquitectos del mundo del software moderno y creador de Linux y Git. Escuchar de primera mano su enfoque de la tecnología y su visión me permitió comprender la profunda filosofía que subyace a las herramientas básicas que utilizamos.

 

La lección más importante que aprendí de esta cumbre fue esta: El mundo del software es un océano infinito, abierto al desarrollo en cualquier momento y en constante movimiento. Formar parte de este ecosistema significa no solo escribir código, sino también aprender continuamente y contribuir a la comunidad. Este dinamismo de mi profesión me motiva enormemente. ¡Ahora, con esta inspiración, es momento de continuar mi trabajo con mucha más determinación y rapidez! 👨‍💻✨

 

Ekran Resmi 2026-03-16 10.40.13.png

Mi viaje a Japón fue la materialización de una curiosidad que había surgido gracias a la vibrante cultura de lectura e intercambio de conocimientos que se fomentaba en Galaksiya. Mi principal motivación para elegir este destino fue sumergirme en una cultura y una herencia culinaria que percibía como fundamentalmente diferentes —casi un mundo aparte— de la nuestra. Quería salir de mi zona de confort y experimentar lo que se siente al ser un forastero en una tierra de contrastes tan grandes, donde cada ritual y sabor parecía pertenecer a una dimensión distinta.

 

Sin embargo, mientras recorría desde los enormes bulevares iluminados con neón de Tokio hasta los restaurantes tradicionales escondidos en callejones estrechos, tuve una profunda revelación. Si bien la meticulosa presentación de la comida y el silencio estoico de las calles me resultaron extraños al principio, pronto descubrí una esencia universal bajo esa superficie. De pie a la sombra de un moderno rascacielos, observando a alguien encontrar un momento de paz en un antiguo santuario, comprendí que la expresión de la sinceridad humana es la misma allí que en nuestra propia tierra. Fue un poderoso recordatorio de que, independientemente de la geografía, la humanidad converge en los mismos valores fundamentales: la bondad, el trabajo, la familia y el espíritu de compartir.

Ekran Resmi 2026-03-16 10.41.49.png

 

Ser testigo de la arraigada cultura del respeto y la «armonía invisible» que subyace en una sociedad que funciona con una precisión asombrosa transformó mis observaciones en una valiosa lección sobre la humanidad. Experimentar esta profundidad cultural junto con una visión tan singular me ayudó a comprender que el mundo no solo se moldea por estructuras, sino también por el espíritu y la disciplina humanos. Regreso de este viaje con una perspectiva inolvidable sobre cómo todos somos «uno», incluso al otro lado del mundo, y, por supuesto, con algunas fotografías entrañables que capturan el alma de la ciudad.
 

Nos vemos en nuestra próxima parada.

Emre Esmirna

Ingeniero sénior de DevOps
Impresiones de la Cumbre de Código Abierto de Japón 2025, Tokio.
 

Referencias

  1. El futuro de la IA con capacidad de gestión de agentes no estará definido por la escala del modelo... - Presentación en la sección AI_dev de la Cumbre de Código Abierto, del 8 al 10 de diciembre de 2025, Tokio, Japón. Disponible en: https://ossjapan2025.sched.com/type/AI_dev

  2. Aprovisionamiento dinámico de GPU en Kubernetes con infraestructura desagregada componible - Jin Hase y Tsubasa Watanabe, Fujitsu Limited. Open Source Summit Japan 2025, sección de Nube y Contenedores. Disponible en: https://github.com/CoHDI

  3. LLM en piloto automático: Ejecución de agentes de IA en Kubernetes - Annie Talvasto, Waovo/Upbound. Open Source Summit Japan 2025. Disponible en: https://ossjapan2025.sched.com/event/29Fqz/llms-on-autopilot-running-ai-agents-on-kubernetes-with-open-source-tools-annie-talvasto-waovo

  4. Orquestación de infraestructura con Crossplane 2.0 - Presentación Upbound. Open Source Summit Japan 2025. Disponible en:(https://ossjapan2025.sched.com/event/29FnY)

  5. Del laboratorio a la vida real: Evaluación práctica de sistemas de IA - Sharon Dashet y Vincent Caldeira, Presentación de Red Hat, Tokio, Japón. Disponible en: https://ossjapan2025.sched.com/event/29FnS/from-lab-to-life-practical-ai-system-evaluation-sharon-dashet-vincent-caldeira-red-hat

  6. Recuperación de vectores federados y recuperación con conocimiento de políticas - Hiroki Ito y Shusuke Takahashi, NTT. Open Source Summit Japan 2025, sección AI_dev. Disponible en: https://ossjapan2025.sched.com/event/29FpX/federated-vector-retrieval-across-organizations-with-milvus-opa-and-vllm-hiroki-ito-shusuke-takahashi-ntt

  7. Conferencia magistral: ¿Qué sigue para Agones? Gobernanza a escala planetaria - Ben Huston, arquitecto principal sénior de Google Cloud. Open Source Summit Japan 2025, sección AI_dev. Disponible en: https://ossjapan2025.sched.com/event/2AHMX/keynote-whats-next-for-agones-planet-scale-governance-ben-huston-sr-principal-architect-google-cloud

  8. ModelPack: Un estándar abierto para empaquetar, distribuir y ejecutar LLM en un entorno nativo de la nube. - Wenbo Qi y Chenyu Zhang, Presentación de Ant Group. Open Source Summit Japan 2025. Disponible en: https://ossjapan2025.sched.com/event/29FpF/modelpack-an-open-standard-for-packaging-distributing-and-running-llms-in-cloud-native-environment-wenbo-qi-chenyu-zhang-ant-group

  9. Discurso principal: Estado de la Unión - Presentación de Jim Zemlin, Director Ejecutivo de The Linux Foundation. Open Source Summit Japan 2025. Disponible en: https://ossjapan2025.sched.com/event/2AEuA/keynote-state-of-the-union-jim-zemlin-executive-director-the-linux-foundation

  10. Estrategias prácticas de datos sintéticos para sistemas RAG/agenticos - Kevin Noel, Uzabase - Presentación Edge US. Open Source Summit Japan 2025. Disponible en: https://ossjapan2025.sched.com/event/29FlW/practical-synthetic-data-strategies-for-ragagentic-systems-kevin-noel-uzabase-edge-us