• Data de publicação
    16 de março de 2026
  • Compartilhar

Introdução: Arquitetura de Sistemas, Não Modelo

 

Enquanto a corrida por "modelos maiores" no mundo da inteligência artificial dá lugar a um silêncio crítico, o futuro do setor foi resumido em uma única frase na Open Source Summit Japan 2025:  "O futuro da IA ​​Agética não será definido pela escala do modelo, mas sim pela arquitetura do sistema." 

 

Essa constatação é o indicador mais concreto de que o foco mudou do mero treinamento de modelos para a infraestrutura que sustenta e escala esses modelos. A conferência realizada em Toranomon Hills, Tóquio, comprovou como gigantes como Google, Fujitsu e Honda adotaram o código aberto como uma "base estratégica", e, como engenheiro DevOps, tive a oportunidade de examinar as novas normas na interseção dos mundos da inteligência artificial e da infraestrutura no local.
Este artigo analisa a interconexão entre os mundos da inteligência artificial e da infraestrutura, com base em fotografias que tirei pessoalmente no evento, nas sessões técnicas que assisti e em dados compilados do programa oficial da Linux Foundation.

Ekran Resmi 2026/03/16 09.52.28.png

 

Temas chave

As discussões técnicas que se destacaram no programa da conferência e nas apresentações que examinei no local foram agrupadas nos seguintes eixos principais em termos de gestão moderna de infraestrutura:

 

A. Arquitetura do Sistema e Desagregação de Hardware

  • Desagregação de hardware: Conforme detalhado na sessão "Provisionamento Dinâmico de GPU" da Fujitsu, a abordagem vai além da estrutura tradicional de servidores, agrupando CPU, GPU e memória em um pool dinâmico (Resource Pool) ao removê-las dos gabinetes físicos.
  • Fábricas de IA: Transformação de centros de dados em instalações de produção capazes de responder às demandas variáveis ​​das cargas de trabalho de inteligência artificial, em vez de fazendas de servidores estáticas.

B. Operações Agónicas

  • Gestão Autônoma de Infraestrutura: Como vimos nas demonstrações no palco, a transição da estrutura de ferramentas como o Terraform, que "param em caso de erro", para estruturas baseadas em "agentes" que podem analisar o erro e produzir uma solução.3 
  • Ciclo de feedback contínuo: Monitoramento contínuo não apenas da implantação de modelos de inteligência artificial, mas também de seu desempenho em ambiente real.

C. Governança e Segurança de Dados

  • Acesso vetorial federado: De acordo com os diagramas arquitetônicos compartilhados pela NTT e outros apresentadores, as estruturas que processam dados localmente em fontes distribuídas combinam os resultados em vez de movê-los para um repositório central.6 
  • Política como código: Tomada dinâmica de decisões de acesso a dados no momento da consulta por mecanismos como o OPA (Open Policy Agent). 6 

D. Cargas de trabalho críticas e especiais

  • Orquestração de Servidor de Jogos: Conforme demonstrado na apresentação da equipe de código aberto do Google no Agones, é possível gerenciar servidores de jogos com estado em escala global usando o Kubernetes.7 
  • Linux de nível espacial: Gerenciamento de braços robóticos na ISS com software de código aberto, apresentado na palestra do GITAI.8 

Destaques da Conferência

A. Arquitetura do Sistema e Desagregação de Hardware

Libertação do Hardware: CoHDI

Uma das sessões técnicas mais marcantes da conferência foi a palestra intitulada "Provisionamento dinâmico de GPUs no Kubernetes" Apresentado por Jin Hase e Tsubasa Watanabe, da equipe Fujitsu. O diagrama arquitetônico exibido no palco explicava o CoHDI (Infraestrutura Desagregada Componível) projeto da seguinte forma:

 

Ekran Resmi 2026/03/16 09.57.20.png

 

  • Conjunto de recursos desagregados: CPUs, GPUs, memórias e placas de rede são removidas dos gabinetes físicos dos servidores e armazenadas em um pool comum.
  • Switch Fabric PCIe/CXL: Esses componentes estão conectados entre si por meio de interruptores de alta velocidade.
  • Integração com Kubernetes: Conforme ilustrado no diagrama, o Kubernetes solicita hardware como se estivesse criando um Pod, e o sistema monta instantaneamente esse hardware para criar servidores "Composed Baremetal".2 

Então, porque é que CoHDI Importante? Essa arquitetura tem o potencial de aumentar a eficiência de uso da GPU de 30% para 80%.

 

Orquestração de Infraestrutura: Crossplane 2.0

 

Outra apresentação importante no evento mostrou o Crossplane 2.0 arquitetura. O monitoramento contínuo de definições declarativas no Git pelo loop de controle do Crossplane e sua transformação em recursos reais na AWS, Azure ou Google Cloud sustentaram a visão de uma infraestrutura "autorrecuperável". Além disso, Crossplane 2.0 Agora, o Crossplane pode ser executado em todos os ambientes Kubernetes, não apenas em serviços de nuvem, como no Crossplane v1. Graças a essa tecnologia, qualquer desenvolvedor pode instalar tecnologias simples sem ajuda. Foi uma apresentação impressionante que mostrou o futuro dos processos DevOps. 

B. Operações Agónicas

AgentOps: Trata-se de um mecanismo de feedback contínuo que visa reduzir a discrepância entre a realidade e a aplicação, integrando as etapas de desenvolvimento (ciclo interno) e aplicação (ciclo externo) de agentes de inteligência artificial. Essa estrutura é definida como uma disciplina de engenharia de plataforma de IA que combina conjuntos de dados preparados offline com observações do ambiente real em um único ecossistema, permitindo a detecção de erros e a inclusão de dados do mundo real nos processos de teste.5 

 

Humano vs. Agente: Em seu discurso, Annie Talvasto argumentou que as máquinas permanecerão incompletas nos processos de DevOps enquanto não possuírem as informações encontradas nos humanos. Por exemplo, ela mencionou que o sistema pode ser gerenciado de forma incompleta se não houver sequer uma pequena troca de mensagens com um colega. Ela detalhou em sua apresentação que todas essas informações devem ser fornecidas aos agentes em primeiro lugar. 3 

 

Código aberto no espaço: a ISS e a robótica

 

Nas fotos tiradas na sessão sobre sistemas críticos de segurança, aparecem imagens da Estação Espacial Internacional (ISS) e GITAI O reflexo do braço robótico foi projetado na tela gigante. Ver o Linux sendo usado em um ambiente onde não há margem para erros, como no vácuo do espaço, comprovou a confiabilidade do código aberto.8 

 

C. Governança e Segurança de Dados

C. Governança e Segurança de Dados

Acesso vetorial unificado entre organizações e OPA: Em grandes organizações, os dados geralmente são armazenados em diferentes departamentos ou empresas parceiras, em diferentes bancos de dados vetoriais. Reunir esses dados em um único centro é difícil devido a questões legais, segurança de dados e direitos de propriedade. Esta apresentação visa proporcionar uma "integração virtual" sem a necessidade de copiar os dados.

  • vLLM: Utilizado para transformar metadados complexos de fontes de dados em resumos concisos e significativos em linguagem natural. Também funciona como um mecanismo de inferência de alto desempenho nos processos de compreensão de consultas de usuários e processamento de resultados.
  • Decisões políticas: Responsável pela governança e autorização de dados. Quando um usuário inicia uma consulta, o OPA verifica em tempo de execução se o usuário tem permissão para acessar essa fonte de dados.
  • Detalhes de Milvus: Funciona como um "Catálogo Semântico". Ele armazena os metadados técnicos e comerciais das fontes de dados em todas as organizações em formato vetorial. Quando uma consulta é recebida, realiza a busca inicial para determinar qual organização pode ter os dados relevantes.

Esta apresentação demonstra como uma infraestrutura de busca segura e "inteligente" pode ser estabelecida entre organizações sem a necessidade de mover dados para um local central, combinando a capacidade de busca escalável do Milvus, o poder de processamento de linguagem do vLLM e as políticas de segurança flexíveis do OPA.6 

 

Engenharia de Contexto: O palestrante Kevin Noel argumenta que a era de simplesmente "escrever uma pergunta e esperar por uma resposta" acabou e, em vez disso, entramos na era da engenharia de contexto.

  • Os mestrados em Direito (LLMs) são apátridas: Os modelos não se lembram nem da frase anterior, a menos que você os lembre.
  • Criação do Estado: Para que uma inteligência artificial forneça a resposta correta, é preciso apresentar todas as informações corretamente naquele "momento" (just-in-time). Essa é a arte de reunir conversas anteriores, informações de documentos e resultados de ferramentas.

A apresentação demonstra que as seguintes partes devem ser combinadas para uma resposta bem-sucedida da inteligência artificial:

  • RAG (Informação Relevante): Informações extraídas de documentos ou bancos de dados internos.
  • Gerenciamento de memória: Preferências anteriores do usuário e histórico de conversas recentes.
  • Ferramentas externas: Dados provenientes de APIs ou ferramentas de cálculo.
  • Comandos do sistema: Regras principais que determinam o caráter e a função da inteligência artificial.

É impossível testar manualmente uma estrutura tão complexa (RAG + Memória + Ferramentas). O palestrante oferece a seguinte solução:

  • Avaliação Automática: Precisamos que a inteligência artificial produza milhares de pares "pergunta-resposta" (dados sintéticos) usando os dados que já possuímos.
  • Cenários realistas: Devemos medir a robustez do sistema criando usuários sintéticos que façam perguntas incorretas ou incompletas, assim como os usuários reais.

Custo e velocidade: Podemos avaliar o sucesso do sistema (precisão, irrelevância, alucinação) em minutos com conjuntos de dados sintéticos, em vez de testes que levariam semanas para humanos. 10 

D. Cargas de trabalho críticas e especiais

Orquestração de Servidor de Jogo (Agones): No slide intitulado "Como funciona o Agones" Pela equipe de código aberto do Google, um fluxograma foi compartilhado sobre a infraestrutura do A.R.C. Raiders Neste diagrama, fica claro que, após o pareamento, os jogadores são alocados a Pods chamados "Agones Game Server", e esses servidores são gerenciados globalmente com uma estratégia de "binpacking" (compressão). Isso permite que os desenvolvedores dediquem mais tempo ao desenvolvimento do jogo, sem se preocuparem com a infraestrutura. Também demonstra a importância do Kubernetes como software livre na indústria de jogos.

Ekran Resmi 2026/03/16 10.37.12.png

Velocidade na distribuição do modelo: A apresentação mostrou que os modelos agora são armazenados em registros compatíveis com OCI, como imagens Docker, e conectados diretamente (montados) ao Pod como um disco, graças ao Motorista modelo CSIIsso elimina o tempo gasto na cópia de gigabytes de dados. O registro OCI da Harbor é usado para essas operações.8 

 

Desempenho de inferência: De acordo com as anotações e imagens que tirei da sessão vLLM, a tecnologia PagedAttention foi a chave para o desempenho. Essa tecnologia gerencia a memória da GPU com a lógica de memória virtual dos sistemas operacionais, superando o gargalo do "Cache Chave-Valor" e multiplicando a taxa de transferência. A apresentação também menciona que o DeepSpeed, desenvolvido pela Microsoft, aumenta a eficiência da GPU de 4 a 6 vezes, proporcionando alto desempenho mesmo em hardware antigo. É enfatizado na apresentação que o número de tokens produzidos por taxa aumenta graças a isso. 9 

 

Conclusão: Ao sair do Open Source Summit Japan 2025, retorno com uma visão que muda completamente minha perspectiva sobre minha profissão, e não apenas com novos conhecimentos técnicos em mãos.

 

Um dos pontos que mais me impressionou durante todo o evento foi a abrangência da área de cobertura. software de código aberto (OSS)Hoje, o fato de o poder do código aberto ser confiável até mesmo nos projetos tecnológicos mais críticos e avançados da humanidade, como o Estação Espacial Internacional (ISS), não apenas em sites ou aplicativos móveis, me lembrou mais uma vez da responsabilidade e do potencial do trabalho que fazemos.

Ekran Resmi 2026/03/16 10.39.07.png

O momento mais inesquecível da conferência para mim foi ouvir ao vivo Linus Torvalds, um dos arquitetos do mundo do software moderno e criador do Linux e do Git. Ouvir em primeira mão sua abordagem à tecnologia e sua visão me permitiu compreender a enorme filosofia por trás das ferramentas básicas que usamos.

 

A maior lição que aprendi nesta cúpula foi esta: O mundo do software é um oceano infinito, aberto ao desenvolvimento a qualquer momento e em constante movimento. Fazer parte desse ecossistema significa não apenas escrever código, mas também aprender constantemente e contribuir para a comunidade. Esse dinamismo da minha profissão me motiva incrivelmente. Agora, é hora de continuar meu trabalho com muito mais determinação e rapidez, inspirado por essa nova energia! 👨‍💻✨

 

Ekran Resmi 2026/03/16 10.40.13.png

Minha visita ao Japão foi a concretização de uma curiosidade que nasceu na vibrante cultura de leitura e compartilhamento de conhecimento incentivada em Galaksiya. Minha principal motivação para escolher esse destino foi mergulhar em uma cultura e herança culinária que eu percebia como fundamentalmente diferentes — quase um mundo à parte — da nossa. Eu queria sair da minha zona de conforto e experimentar a sensação de ser um "estrangeiro" em uma terra de tantos contrastes, onde cada ritual e sabor parecia pertencer a uma dimensão diferente.

 

Contudo, enquanto percorria Tóquio, desde os imensos bulevares iluminados a néon até os restaurantes tradicionais e escondidos em vielas estreitas, tive uma profunda revelação. Embora a apresentação meticulosa da comida e o silêncio estoico das ruas inicialmente me parecessem estranhos, logo descobri uma essência universal por trás dessa superfície. Parado à sombra de um arranha-céu moderno e observando alguém encontrar um momento de paz em um santuário antigo, percebi que a expressão da sinceridade humana é a mesma ali como em nossa própria terra natal. Foi um poderoso lembrete de que, independentemente da geografia, a humanidade converge para os mesmos valores fundamentais: bondade, trabalho, família e o espírito de partilha.

Ekran Resmi 2026/03/16 10.41.49.png

 

Testemunhar a cultura profundamente enraizada de respeito e a "harmonia invisível" por trás de uma sociedade que opera com tamanha precisão transformou minhas observações em uma lição mais ampla sobre a humanidade. Vivenciar essa profundidade cultural, juntamente com uma visão tão singular, me ajudou a compreender que o mundo é moldado não apenas por estruturas, mas pelo espírito e pela disciplina humanos. Retorno dessa jornada com uma percepção inesquecível de como somos todos "um", mesmo do outro lado do globo — e, claro, com algumas fotografias preciosas que capturam a alma da cidade.
 

Nos vemos na nossa próxima parada.

Emre Izmir

Engenheiro DevOps Sênior
Impressões da Open Source Summit Japan 2025, Tóquio.
 

Referências

  1. O futuro da IA ​​agente não será definido pela escala do modelo... Apresentação na trilha AI_dev da Open Source Summit, de 8 a 10 de dezembro de 2025, Tóquio, Japão. Disponível em: https://ossjapan2025.sched.com/type/AI_dev

  2. Provisionamento dinâmico de GPUs no Kubernetes com infraestrutura desagregada e componível - Jin Hase e Tsubasa Watanabe, Fujitsu Limited. Open Source Summit Japan 2025, Trilha de Nuvem e Contêineres. Disponível em: https://github.com/CoHDI

  3. LLMs no piloto automático: executando agentes de IA no Kubernetes - Annie Talvasto, Waovo/Upbound. Open Source Summit Japan 2025. Disponível em: https://ossjapan2025.sched.com/event/29Fqz/llms-on-autopilot-running-ai-agents-on-kubernetes-with-open-source-tools-annie-talvasto-waovo

  4. Orquestração de infraestrutura com Crossplane 2.0 Apresentação Upbound. Open Source Summit Japan 2025. Disponível em: (https://ossjapan2025.sched.com/event/29FnY)

  5. Do laboratório à vida real: avaliação prática de sistemas de IA - Sharon Dashet e Vincent Caldeira, apresentação da Red Hat, Tóquio, Japão. Disponível em: https://ossjapan2025.sched.com/event/29FnS/from-lab-to-life-practical-ai-system-evaluation-sharon-dashet-vincent-caldeira-red-hat

  6. Recuperação vetorial federada e recuperação orientada por políticas - Hiroki Ito e Shusuke Takahashi, NTT. Open Source Summit Japan 2025, Trilha de Desenvolvimento de IA. Disponível em: https://ossjapan2025.sched.com/event/29FpX/federated-vector-retrieval-across-organizations-with-milvus-opa-and-vllm-hiroki-ito-shusuke-takahashi-ntt

  7. Palestra principal: O que vem a seguir para a Agones? Governança em escala planetária - Ben Huston, Arquiteto Principal Sênior do Google Cloud. Open Source Summit Japan 2025, Trilha de Desenvolvimento de IA. Disponível em: https://ossjapan2025.sched.com/event/2AHMX/keynote-whats-next-for-agones-planet-scale-governance-ben-huston-sr-principal-architect-google-cloud

  8. ModelPack: Um padrão aberto para empacotar, distribuir e executar LLMs em ambientes nativos da nuvem. Apresentação de Wenbo Qi e Chenyu Zhang, do Ant Group. Open Source Summit Japan 2025. Disponível em: https://ossjapan2025.sched.com/event/29FpF/modelpack-an-open-standard-for-packaging-distributing-and-running-llms-in-cloud-native-environment-wenbo-qi-chenyu-zhang-ant-group

  9. Palestra principal: Estado da União Apresentação de Jim Zemlin, Diretor Executivo da Linux Foundation, no Open Source Summit Japan 2025. Disponível em: https://ossjapan2025.sched.com/event/2AEuA/keynote-state-of-the-union-jim-zemlin-executive-director-the-linux-foundation

  10. Estratégias práticas de dados sintéticos para sistemas RAG/agentes - Kevin Noel, Uzabase - Apresentação da Edge US. Open Source Summit Japan 2025. Disponível em: https://ossjapan2025.sched.com/event/29FlW/practical-synthetic-data-strategies-for-ragagentic-systems-kevin-noel-uzabase-edge-us