O Cenário: Kubernetes Cresce (de Novo)

Kubernetes sempre foi sobre maturidade operacional. Mas a infraestrutura de IA tem sido um caos nos últimos anos. A mudança de "está funcionando?" para "a resposta é boa?" é um problema completamente diferente. No KubeCon + CloudNativeCon Europe 2026 em Amsterdam, Brendan Burns e o time da Azure mostraram a tese: os mesmos padrões que fizeram do Kubernetes o padrão para containers precisam ser aplicados às cargas de IA.

Não é só sobre mais ferramentas. É sobre interfaces compartilhadas, padrões construídos pela comunidade e filosofia operacional. Os anúncios desse ciclo — agendamento, rede, observabilidade, armazenamento e ciclo de vida de clusters — refletem exatamente isso. Bora mergulhar!

Fonte: Microsoft Open Source Blog

Microsoft Azure Kubernetes Service logo with cloud infrastructure and container orchestration diagram Software Concept Art

Cargas de IA Viram Cidadãs de Primeira Classe

O maior tema foi tornar workloads com GPU nativas do Kubernetes. A Microsoft colaborou com parceiros da indústria em padrões abertos, e vários projetos importantes amadureceram:

  • Dynamic Resource Allocation (DRA) agora é GA. O driver de exemplo e o DRA Admin Access já estão disponíveis.
  • Workload Aware Scheduling (Kubernetes 1.36) adiciona suporte a DRA na Workload API e se integra ao KubeRay. Desenvolvedores podem solicitar e gerenciar infraestrutura GPU sem gambiarras.
  • DRANet agora suporta Azure RDMA NICs, permitindo gerenciamento de recursos de rede baseado em DRA onde o alinhamento topológico GPU-NIC impacta diretamente o desempenho do treinamento.

Novos Projetos Open Source para IA no Kubernetes

A Microsoft também lançou ou contribuiu com vários projetos:

  • AI Runway — Uma API comum do Kubernetes para workloads de inferência. Times de plataforma gerenciam deployments de modelo de forma centralizada. Inclui UI web (para quem não sabe Kubernetes), descoberta no HuggingFace, indicadores de memória GPU, estimativas de custo em tempo real e suporte a NVIDIA Dynamo, KubeRay, llm-d e KAITO.
  • HolmesGPT — Virou projeto CNCF Sandbox. Troubleshooting agêntico para ecossistemas cloud-native.
  • Dalec — Projeto CNCF novo para builds declarativos de pacotes de sistema. Produz imagens de container mínimas com SBOM e atestações de proveniência.
# Exemplo: Deploy de modelo com AI Runway (simplificado)
apiVersion: runway.ai/v1alpha1
kind: InferenceModel
metadata:
  name: meu-llm
spec:
  runtime: nvidia-dynamo
  modelSource:
    huggingFace:
      modelId: "meta-llama/Llama-3.2-8B"
  resources:
    gpu:
      count: 1
      memory: "80Gi"
  scaling:
    minReplicas: 1
    maxReplicas: 5

Relacionado: Data Commons MCP Agora no Google Cloud: Consulte Dados Públicos com IA, Sem Configuração

Developer using AKS desktop to run Kubernetes workloads locally on laptop Technical Structure Concept

Revolução na Rede: Identidade, Sem Sidecars

Um dos maiores calos no Kubernetes sempre foi a complexidade dos service meshes. As atualizações de rede da Microsoft visam eliminar essa sobrecarga.

Azure Kubernetes Application Network

Essa nova funcionalidade oferece mTLS, autorização consciente de aplicação e telemetria detalhada de tráfego — com conectividade multi-região integrada. O resultado: segurança baseada em identidade sem rodar um service mesh completo.

Contribuições ao Cilium

A Microsoft fez contribuições importantes ao Cilium:

  • Suporte nativo a mTLS ztunnel — Comunicação criptografada entre pods sem sidecar.
  • Controles de cardinalidade de métricas do Hubble — Gerencie custos de observabilidade em escala.
  • Agregação de logs de fluxo — Reduza volume de armazenamento.
  • Duas CFPs de Cluster Mesh aceitas — Avançando a rede entre clusters.

WireGuard + Cilium mTLS

No plano de dados, a criptografia WireGuard com o Cilium protege o tráfego entre nós. O Cilium mTLS (no Advanced Container Networking Services) estende isso para comunicação entre pods usando certificados X.509 e SPIRE para gerenciamento de identidade. Tudo sem sidecars.

FuncionalidadeAntesDepois (AKS)
Criptografia pod-a-podSidecar ou CNI customizadomTLS + WireGuard nativo
Conectividade entre clustersVPN ou mesh customizadoCilium Cluster Mesh gerenciado
Observabilidade de tráfegoExportadores manuaisPor fluxo L3/L4/L7 nativo
Entrada para novos usuáriosCurva de aprendizado totalAKS Desktop (cluster local)

Relacionado: Como Blockchain Está Revolucionando a Rastreabilidade Agrícola: Um Mergulho no Algodão Tokenizado

Network diagram showing Cilium cluster mesh connecting multiple AKS clusters with mTLS encryption Development Concept Image

Atualizações Operacionais: Mais Seguras, Mais Rápidas, Reversíveis

Blue-Green Agent Pool Upgrades

Em vez de aplicar mudanças no lugar, um pool paralelo com a nova configuração é criado. Times podem validar antes de migrar tráfego e manter um caminho de rollback claro.

Agent Pool Rollback

Se um upgrade der problema, você reverte o node pool para a versão anterior do Kubernetes e imagem — sem rebuild completo.

AKS Desktop (GA)

Uma experiência completa do AKS que roda na sua máquina local. Desenvolvedores testam e iteram em workloads Kubernetes localmente com a mesma configuração de produção.

Outros Destaques

  • Expansão de Pod CIDR — Aumente ranges de IP dos pods sem reconstruir clusters.
  • Prepared image specification — Imagens de nó customizadas com containers pré-carregados para scale-out mais rápido.
  • Agentic container networking — Consultas em linguagem natural viram diagnósticos de rede.

Limitações e Cuidados

  • AI Runway é novo — Espere breaking changes e comunidade pequena inicialmente.
  • Cilium Cluster Mesh gerenciado — Sujeito a disponibilidade regional da Azure; pode não cobrir todos os cenários multi-cloud.
  • mTLS sem sidecar — Mudança grande; usuários de service mesh atuais precisam planejar migração.

Próximos Passos

Se você está no KubeCon Europa 2026 em Amsterdam, passe no estande da Microsoft (#200) para demos ao vivo. Se não, aqui vai o que testar:

  1. Rode o AKS Desktop para testar as novidades localmente.
  2. Explore o AI Runway no GitHub e tente fazer deploy de um modelo.
  3. Revise as contribuições ao Cilium — especialmente se você gerencia redes multi-cluster.

Kubernetes não é mais só sobre containers. É sobre rodar cargas de IA com a mesma maturidade operacional que a infraestrutura cloud-native nos acostumou. Os anúncios da Microsoft no KubeCon Europe 2026 tornam esse futuro muito mais tangível. Vamos nessa! 🚀

Este conteúdo foi elaborado com o auxílio de ferramentas de IA, com base em fontes confiáveis, e revisado pela nossa equipe editorial antes da publicação. Não substitui o aconselhamento de um profissional especializado.