Da Infraestrutura Física ao Cloud: A Evolução dos Custos em Tecnologia
Neste episódio do Mesa Cast, Jeferson recebeu Luiz Reda e Vittor Viana, ambos da Cast AI, além de Rodolfo, diretor de comunidade da FinOps Foundation. A conversa explorou a jornada desde os antigos data centers até a era do cloud computing, destacando como os modelos de custo e gestão de infraestrutura mudaram drasticamente. Os convidados compartilharam suas experiências iniciais com datacenters físicos, mencionando o trabalho com servidores on-premises, cabeamento estruturado, switches KVM, Fiber Channel e SCSI, épocas em que provisionar um novo servidor demandava 30, 60 ou até 90 dias devido a processos burocráticos e de compras.
Com a chegada do cloud, a dinâmica mudou completamente: hoje, um novo servidor está a um clique de distância, permitindo escalar de 1 para 1000 réplicas em minutos. No entanto, essa facilidade trouxe um novo problema: a gestão de custos. Enquanto antes a área de custos era a mesma que cuidava de despesas prediais, hoje o provisionamento rápido e muitas vezes feito por profissionais técnicos sem treinamento em finanças resultou em desperdício significativo. Luiz Reda destacou que, via de regra, o provisionamento de CPU e memória em contêineres é de 70% a 80% maior do que a aplicação efetivamente utiliza, criando uma oportunidade enorme de otimização.
Instâncias Spot, GPU e o Mercado Volátil de Nuvem
Um dos tópicos mais técnicos abordados foi o uso de instâncias spot nas clouds. Vittor explicou que spots são capacidades reservadas que podem custar 70% a 90% menos que instâncias on-demand, mas com o risco de serem interrompidas a qualquer momento (a AWS dá aviso de 2 minutos, enquanto a GCP dá apenas 30 segundos). O grande desafio é gerenciar essas interrupções de forma graceful, e muitas aplicações não estão preparadas para isso, especialmente as stateful. A solução apresentada foi o uso de live migration para pods, uma tecnologia que permite migrar workloads stateful entre nodes sem interrupção, similar ao vMotion de VMs, mas agora para contêineres.
A conversa também destacou a escassez e o alto custo de GPUs, impulsionados pela demanda de inteligência artificial e machine learning. A NVIDIA atingiu valor de mercado próximo de 2 trilhões de dólares, com um múltiplo preço/lucro superior a 100 vezes, levantando discussões sobre uma possível bolha de IA. A Cast AI desenvolveu capacidades de anexar nós de diferentes provedores e regiões a um mesmo cluster Kubernetes, permitindo capturar as melhores oportunidades de preço de GPU globalmente, incluindo um roteador de modelos de LLM que sugere modelos mais baratos para tarefas menos críticas, podendo até fazer deploy local de modelos open-source como Llama.
FinOps: Cultura, Framework e a Evolução da Gestão de Custos em Nuvem
Rodolfo apresentou a FinOps Foundation, parte do mesmo guarda-chuva da Linux Foundation e CNCF, focada em desenvolver pessoas que gerenciam valor de nuvem. Ele explicou a diferença crucial entre redução de custos e FinOps: redução de custo é uma ação reativa e isolada (cortar recursos), enquanto FinOps é um framework operacional e uma prática cultural que busca maximizar o valor do negócio a partir dos gastos em nuvem. FinOps não é apenas sobre economizar, mas sobre responder perguntas como: qual o custo por requisição? Qual o custo de aquisição de um novo cliente? Quanto se gasta para manter um cliente existente?
Rodolfo destacou que FinOps deve ser habilitado centralmente, mas praticado por todos. A fundação oferece certificações (FinOps Practitioner, Engineer, Analyst e Professional), eventos gratuitos no Brasil (a cada dois meses em São Paulo, com próximo em Campinas), um livro traduzido para português (Cloud FinOps, segunda edição), e o projeto FOCUS (FinOps Open Cost and Usage Specification), uma especificação técnica que normaliza dados de custo entre diferentes provedores (AWS, GCP, Azure, etc.), permitindo que empresas usem um dicionário comum (ex: "billed cost") independentemente da cloud. A FOCUS está na versão 1.3, com lançamento da 1.4 em breve, e é open-source no GitHub.
Casos Reais de Redução de Custos com Automação e Inteligência
Luiz Reda compartilhou casos concretos de otimização atendidos pela Cast AI na América Latina, incluindo uma empresa de varejo brasileira que alcançou 76% de redução e uma linha aérea latino-americana que atingiu 80%. Vittor complementou que mesmo empresas que já usam instâncias spot podem otimizar ainda mais, pois o mercado spot é extremamente volátil – a melhor instância spot hoje pode não ser a melhor amanhã. A Cast AI utiliza machine learning para escolher não apenas as instâncias mais baratas, mas também as de menor risco de interrupção.
Jeferson mencionou sua experiência no iFood, onde a migração de KOPS para EKS (Kubernetes gerenciado da AWS) resultou em uma redução de 7% na conta total de cloud, validada pela própria AWS. Ele enfatizou que essa conquista só foi possível porque o time de Cloud Economics (FinOps) forneceu relatórios e análises que orientaram as decisões técnicas – um DevOps sozinho não teria tempo ou visibilidade para identificar todas as oportunidades. Vittor destacou que a Cast AI oferece um assessment gratuito em console.cast.ai, onde o usuário conecta o cluster Kubernetes com permissão somente leitura e recebe instantaneamente um relatório de oportunidades de redução, sem custo e sem instalação intrusiva.
Desperdício Global, Variação Cambial e a Realidade Brasileira
O grupo discutiu se o desperdício em cloud é um fenômeno global ou regional. A conclusão foi que é global, embora regiões mais maduras tecnologicamente desperdicem um pouco menos. No entanto, o Brasil tem uma dor adicional: a dolarização da conta de cloud. Rodolfo observou que empresas de varejo, que operam com margens muito baixas, sentem fortemente qualquer variação cambial – uma oscilação de 5% no dólar pode representar um impacto gigantesco nos custos. Por isso, algumas empresas estão considerando provedores nacionais como a Magalu Cloud para pagar em reais e evitar o risco cambial. Vittor acrescentou que empresas maiores conseguem fazer contratos de longo prazo e congelar a taxa de câmbio, mas empresas médias e pequenas não têm esse poder de barganha.
Outro ponto levantado foi a sustentabilidade dos data centers, especialmente para IA, que consome grandes quantidades de água e energia. O Brasil tem um diferencial por gerar energia limpa e excedente (especialmente solar), o que atrai investimentos em data centers, mas Jeferson expressou ceticismo quanto ao real benefício para o país – muitos desses data centers são "caixas pretas" de hardware importado, geram poucos empregos (frequentemente remotos) e não desenvolvem tecnologia local.
A Importância da Comunidade, Networking e Habilidades Sociais na Carreira
Rodolfo enfatizou que a comunidade FinOps é o ponto de partida para quem quer migrar para a área. Ele mencionou que existe um programa global de mentoria, além de um deck pronto para download (Adopting FinOps) que qualquer pessoa pode usar para apresentar o conceito dentro de sua empresa e propor a criação de uma área de FinOps. Vittor e Reda complementaram que a proatividade é fundamental: profissionais que identificam oportunidades de otimização e as apresentam à liderança conseguem se destacar e até criar a própria área de FinOps na empresa onde trabalham.
Jeferson fez uma reflexão contundente sobre a evolução da carreira em tecnologia: o profissional puramente técnico, que não entende de negócio e não sabe se comunicar, está ficando para trás. Ele citou o exemplo do iFood: ninguém lembra da migração técnica de KOPS para EKS, mas todos lembram dos 7% de redução de custo. A mensagem foi clara: habilidades sociais, comunicação e visão de negócio são tão importantes quanto o conhecimento técnico. Reda concordou, afirmando que o profissional de tecnologia precisa entender o negócio da empresa (ex: "se fabricamos água, o software precisa ajudar a vender mais água") e saber vender seus projetos e ideias. Vittor acrescentou que times com maior maturidade e senioridade já nascem mais otimizados e preocupados com eficiência, enquanto times menos maduros tendem a desperdiçar mais.
Certificações, Livros e o Caminho para se Tornar um Profissional FinOps
Para quem deseja migrar para FinOps, Rodolfo recomendou começar pela certificação FinOps Practitioner (custo aproximado de $300 para prova, ou $500 incluindo treinamento). Em seguida, há certificações para Engineer (foco em automação e engenharia), Analyst (foco em dados e FOCUS), e Professional (espécie de MBA com trabalhos práticos e interação global). Todos os recursos de estudo estão disponíveis gratuitamente em finops.org e learn.finops.org. O livro "Cloud FinOps" (segunda edição) está disponível em português na Amazon e na Editora Nova Tech.
Os convidados incentivaram a participação na comunidade: os eventos são agnósticos de ferramenta, com cases de usuários finais, não patrocinados por vendors. O Brasil tem cinco embaixadores da FinOps Foundation, e Rodolfo cobre Brasil, Argentina, Peru, Colômbia, Chile, Equador e México. A conclusão foi otimista: FinOps é uma área em crescimento acelerado, com escassez de profissionais, e uma excelente oportunidade de carreira para quem vem de SRE, DevOps ou desenvolvimento, pois combina conhecimento técnico com visão de negócio e pode abrir portas para trabalho remoto no exterior ganhando em dólar.