A Ressaca do Capex: Quando a Aposta de $725 bi de 2026 Encontra a Parede de Depreciação de 2028

💡 TL;DR (Too Long; Didn't Read)

Principais conclusões em 75 segundos:

As Big Four gastarão até $725 bi em 2026 — um salto de 77% sobre os $410 bi de 2025. Todos estão de olho na demanda. O risco mais interessante está no balanço patrimonial, não na demonstração de resultados.

O capex não afeta os lucros quando você o gasta. Ele impacta ao longo da vida útil que você atribui ao ativo. Alongar a vida útil presumida de uma GPU de 3 para 6 anos corta a depreciação deste ano pela metade — e infla o lucro atual.

Em 2025, as hyperscalers se dividiram publicamente sobre essa questão: a Amazon encurtou a vida útil de uma parcela de seus servidores, enquanto a Meta estendeu a de quase toda a sua frota. Essa divergência é o sinal — a vida útil é uma escolha gerencial, não um fato de engenharia.

A Nvidia lança uma arquitetura mais rápida praticamente todo ano. Se a vida econômica real é de 2 a 3 anos, mas os livros contábeis dizem 5 a 6, a depreciação está subestimada agora e a correção cairá depois — concentrada em 2027–2028, à medida que a frota de 2025–2026 envelhece.

As neoclouds são o canário na mina. A depreciação da CoreWeave quase triplicou em um ano, enquanto ela financiava GPUs com dívida classificada e garantida por hardware. Os provedores de segundo escalão sentirão o impacto primeiro.

Esta não é uma tese de colapso de demanda. É uma tese de acerto de contas contábil — e ela acelera a consolidação em vez do colapso. Projete sua arquitetura para o cenário onde o capital volta a ser caro.

Existe um tipo particular de ressaca que não se anuncia na noite da festa. Você se sente bem enquanto está gastando. Sente-se bem na manhã seguinte. O acerto de contas é diferido, estrutural, e chega precisamente quando você parou de se preparar para ele.

Esse é o formato do ciclo de despesas de capital (capex) em IA de 2026. Google, Amazon, Microsoft e Meta agora planejam gastar até $725 bilhões em capex este ano — um aumento de aproximadamente 77% sobre o recorde anterior de $410 bilhões in 2025, a maior construção de infraestrutura concentrada na história da contabilidade corporativa.

Verified Source

As quatro hyperscalers elevaram a projeção combinada de capex de 2026 para cerca de $725 bi (Microsoft ~$190 bi, Amazon ~$200 bi, Alphabet até ~$190 bi, Meta ~$115–145 bi), uma alta de cerca de 77% em relação aos ~$410 bi de 2025, de acordo com os resultados do primeiro trimestre de 2026 compilados pelo Financial Times.

Eu abordei a configuração dos mercados de capitais para isso no artigo sobre o backlog de $80 bilhões — a demanda era real, a energia era a restrição, a fila de IPOs estava carregando. Aquela era a história da demonstração de resultados. Esta é a história do balanço patrimonial, e é aquela que quase ninguém na sua equipe de liderança está modelando.

A tese é simples de enunciar e desconfortável de digerir: o número mais consequente nesta expansão não são os $725 bilhões que as hyperscalers vão gastar. É a vida útil que elas atribuem ao que compram. E esse número vai acabar sendo reajustado — não porque a demanda vá colapsar, mas porque a física e o ritmo de lançamentos da Nvidia tornam as suposições atuais indefensáveis. Quando isso acontecer, a correção será concentrada, guiada pela contabilidade e cairá por volta de 2028.

O número que ainda não é uma despesa

Aqui está a mecânica que a maioria dos líderes de engenharia nunca internaliza, porque ela vive dois andares abaixo de onde eles trabalham, na diretoria de controladoria.

Quando uma hyperscaler gasta $50 bilhões em GPUs e na construção de data centers, quase nada disso atinge a demonstração de resultados naquele trimestre. O valor é capitalizado — registrado no balanço patrimonial como um ativo — e então amortizado gradualmente ao longo da vida útil presumida do ativo sob a forma de depreciação. Compre um servidor de $50.000, atribua a ele uma vida útil de cinco anos e você registrará $10.000 de depreciação por ano. O caixa saiu imediatamente. O custo reportado goteja ao longo de meia década.

Isso é contabilidade comum. Não é, por si só, manipulação. O risco de manipulação reside inteiramente na escolha do número da vida útil — porque a depreciação é uma subtração direta do lucro operacional e, quanto mais longa a vida presumida, menor a subtração anual e maior o lucro reportado.

Entre 2020 e 2024, a indústria moveu discretamente essa alavanca em uma única direção. A vida útil de servidores, historicamente estimada entre três e quatro anos, subeu para cinco e depois para seis. Cada extensão reduziu a depreciação anual, inflou as margens reportadas e chegou — convenientemente — exato no momento em que o capex iniciou sua subida vertical.

Verified Source

Analistas que acompanham a contabilidade das hyperscalers observam as suposições de vida útil de servidores/redes derivando de ~3–4 anos historicamente para 5–6 anos até 2024, com a tendência divergindo no início de 2025 — a Amazon encurtando uma parcela das vidas úteis de seus servidores, enquanto a Meta estendeu a maior parte de seus ativos de servidor e rede para cerca de cinco anos e meio.

A aritmética não é sutil em grande escala. Quando se capitaliza centenas de bilhões de dólares em hardware, cada ano adicional de vida útil presumida transfere bilhões da linha de depreciação para a do lucro líquido. Em um ritmo de build de GPUs superior a $600 bilhões anuais, a diferença entre um cronograma de três e de seis anos não é um ajuste de arredondamento. É a diferença entre um setor que parece estruturalmente lucrativo e um que parece estar despejando caixa em ativos que não consegue deprecia o rápido o suficiente.

A Grande Divergência de 2025

A evidência mais clara de que a vida útil é uma decisão, e não uma medição, surgiu no início de 2025, quando dois dos operadores de infraestrutura mais sofisticados do planeta olharam para a mesma tecnologia e moveram-se em direções opostas.

A Amazon encurtou a vida útil de uma parcela de seus servidores e equipamentos de rede, citando explicitamente o ritmo acelerado de desenvolvimento tecnológico em IA e aprendizado de máquina. A Meta, olhando para o mesmo roadmap da Nvidia, estendeu a vida útil presumida da maior parte da sua frota. Duas empresas, um único lote de chips físicos, conclusões contraditórias — registradas em relatórios auditados com poucos meses de diferença.

Quando operadores desse calibre discordam tão publicamente sobre um número que oscila o lucro reportado em bilhões, o número não é uma constante de engenharia. É uma alavanca, e todos estão com a mão nela.

Este é o contexto em que Michael Burry — o investidor mais conhecido por A Grande Aposta — veio a público em novembro de 2025 acusando as hyperscalers de estarem sistematicamente superestimando seus lucros ao depreciar o hardware da Nvidia em cinco a seis anos, quando a vida econômica real estaria mais próxima de dois ou três. Sua estimativa: cerca de $176 bilhões em depreciação subestimada e lucros superestimados em todo o grupo entre 2026 e 2028.

Reported

O investidor Michael Burry argumentou em novembro de 2025 que as hyperscalers inflam seus lucros ao presumir vidas úteis de 5 a 6 anos para servidores quando a vida econômica real é de ~2 a 3 anos, estimando ~$176 bi de depreciação subestimada entre 2026 e 2028. Burry divulgou posições de opções de venda (puts) contra a Nvidia e a Palantir, portanto a alegação carrega um interesse comercial direto e é relatada como uma visão contestada, não como fato consolidado. A Nvidia rebateu afirmando que os clientes observam vidas úteis de quatro a seis anos na prática.

Trate o número específico de Burry com o ceticismo que a manchete de um portador de puts merece — ele lucra se o mercado concordar com ele. Mas perceba que você não precisa do número dele para levar a sério o ponto estrutural, porque os próprios operadores continuam a admiti-lo. Satya Nadella, explicando por que a Microsoft espaça suas compras de chips em vez de comprar uma única geração inteira em lote, declarou que "a maior concorrente para qualquer novo chip de IA da Nvidia é a sua predecessora". Esse é um CEO descrevendo a obsolescência tecnológica em uma cadência quase anual — enquanto seu próprio balanço deprecia o hardware ao longo de cinco ou seis anos.

Verified Source

O CEO da Microsoft, Satya Nadella, sobre a estratégia de compra de chips da empresa, caracterizou o principal concorrente de cada nova geração da Nvidia como a sua própria predecessora — e disse que a Microsoft deliberadamente espaça as compras para evitar o comprometimento excessivo com uma única geração.

Não dá para defender as duas posições de forma coerente: que o hardware torna-se obsoleto anualmente e que ele deve ser amortizado ao longo de seis anos. Uma delas é uma história para a equipe de engenharia. A outra é uma história para os analistas. A lacuna entre elas é a ressaca.

Por que 2028, especificamente

Uma parede precisa de uma localização. Aqui está o porquê de o impacto se concentrar em torno de 2027–2028, em vez de chegar como uma ladeira suave.

A depreciação acumula-se no final do ciclo, ao contrário de uma expansão que é concentrada no início (front-loaded). A colossal frota de GPUs de 2025–2026 está sendo lançada agora nos livros com cronogramas de cinco a seis anos, o que significa que continuará gerando despesas de depreciação — sob a taxa presumida e subestimada — ao longo de toda a segunda metade da década. Se a premissa se sustentar, ótimo. Mas duas forças convergem para quebrá-la justamente quando essa frota amadurece:

Primeiro, a cadência da Nvidia. Uma nova arquitetura topo de linha quase todo ano significa que o silício de 2025–2026 estará de duas a três gerações atrasado em 2028, com cada nova geração entregando melhorias brutais de performance por watt. O argumento econômico para rodar aceleradores obsoletos em treinamento de fronteira desmorona muito antes de a contabilidade declarar que o ativo foi totalmente amortizado.

Segundo, o relógio de refinanciamento e receita. A capacidade construída hoje leva de 18 na 36 meses para gerar retorno proporcional. Se o crescimento da receita meramente desacelerar, em vez de reverter, o grupo atingirá 2027–2028 com a depreciação finalmente alcançando a realidade econômica, o crescimento da receita normalizando e as extensões anteriores de vida útil deixando de funcionar como alavanca — afinal, você só pode estender o cronograma uma única vez. A correção, quando vier, será, portanto, um evento de readequação (re-statement): redução de vidas úteis, depreciação acelerada e, nos cenários mais severos, baixas contábeis (impairments).

Note o que este diagrama not está dizendo. Ele não prevê que a demanda por computação de IA vá evaporar. Ele prevê que os resultados financeiros reportados do fornecimento dessa computação serão reajustados para refletir a realidade, e que esse ajuste será descontínuo porque as estimativas contábeis mudam em degraus, e não em declives suaves. Isso está mais próximo do padrão da Cisco em 2001 do que do da Enron: não se trata de fraude, mas de despesas de capital exuberantes baseadas em premissas otimistas que depois se reconciliam com a realidade, de uma só vez.

As neoclouds são o canário

Se você quer ver a parede antes que ela alcance as gigantes, observe as empresas que não têm fluxos de caixa diversificados para absorver o impacto. As Big Four podem engolir um reajuste de depreciação porque publicidade, varejo e software corporativo mantêm as luzes acesas. As nuvens exclusivas de IA — as "neoclouds" — não podem. Elas são a depreciação.

A CoreWeave é o termômetro mais nítido aqui. Suas despesas de depreciação e amortização chegaram a aproximadamente $2,45 bilhões em 2025, contra cerca de $863 milhões no ano anterior — quase triplicando em doze meses — diante de um prejuízo líquido de cerca de $1,17 bilhão no ano completo. A linha de depreciação não é uma nota de rodapé neste negócio; ela é o negócio.

Verified Source

Os resultados do 4º trimestre e do ano completo de 2025 da CoreWeave (Formulário 8-K da SEC) mostram depreciação e amortização de ~$2.454 mi no ano, contra ~$863 mi em 2024, diante de um prejuízo líquido em 2025 de ~$1.167 mi.

O que torna as neoclouds um indicador antecedente, em vez de apenas uma versão menor da mesma história, é como elas financiam o hardware. A CoreWeave construiu uma classe inteira de ativos baseada em dívida garantida por GPUs — empréstimos de prazo com desembolso diferido colateralizados pelos próprios chips e por contratos específicos com clientes. No início de 2026, fechou uma linha de crédito de $8,5 bi que obteve uma classificação de grau de investimento inédita para esse tipo de ativo, seguida por uma linha de $3,1 bi sindicalizada publicamente e classificada no território de junk bonds (Ba2/BB+) poucas semanas depois.

Verified Source

A CoreWeave fechou um empréstimo de prazo com desembolso diferido de $8,5 bi ("DDTL 4.0") em março de 2026, classificado como A3 / A (baixo) — descrito como o primeiro financiamento garantido por infraestrutura de HPC com classificação de grau de investimento atrelado a um contrato de cliente.

Verified Source

Em maio de 2026, a CoreWeave fechou uma linha de crédito de $3,1 bi garantida por GPUs e sindicalizada publicamente ("DDTL 5.0"), classificada como Ba2 (Moody's) / BB+ (Fitch) — abaixo do grau de investimento — explicitamente apresentada como validação de uma classe emergente de ativos de financiamento de infraestrutura de IA.

Analise essas duas linhas de crédito em conjunto e a fragilidade estrutural fica exposta. Você está financiando um ativo em rápida depreciação — cuja vida econômica pode ser de dois a três anos — com uma dívida que vence em um horizonte mais longo, garantida por contratos e pelo valor de revenda de GPUs de geração anterior. Isso funciona maravilhosamente enquanto a utilização é alta, os preços de GPUs no mercado secundário se mantêm estáveis e o refinanciamento permanece barato. Funciona bem menos se o reajuste de vida útil em 2028 também derrubar o valor da garantia. O valor contábil de uma GPU e o valor da sua garantia de empréstimo são o mesmo número usando dois chapéus diferentes. Reduza um e você terá reduzido o outro automaticamente.

Esta é a narrativa exclusiva de fronteira vista sob a perspectiva do credor: a arquitetura que sobrevive a um choque no custo de capital é aquela que não depende de dinheiro perpetuamente barato para refinanciar silício em perpétua depreciação.

O que de fato quebra — e o que não

Permita-me ser preciso sobre o modo de falha, porque a versão preguiçosa desse argumento ("a bolha da IA vai estourar") está errada e é inútil para planejar qualquer estratégia.

A compressão do fluxo de caixa livre (FCF) já é visível e não está em disputa. Nos níveis de gastos de 2026, os analistas projetam que o fluxo de caixa livre da Amazon ficará negativo no ano, com forte compressão em todo o grupo, simplesmente porque o caixa para a construção sai agora, enquanto a receita e a amortização chegam mais tarde.

Reported

Com o capex combinado de 2026 próximo de $700 bi+, analistas projetaram uma forte compressão do fluxo de caixa livre em todas as hyperscalers — incluindo o fluxo de caixa livre da Amazon ficando negativo no ano — à medida que as saídas de caixa precedem a receita de IA. Estas são projeções futuras de analistas, relatadas como tal.

No entanto, a compressão do FCF é o custo conhecido — aquele que a gestão já preparou os investidores para esperar. A ressaca é o custo não reconhecido: a depreciação diferida que a demonstração de resultados ainda não absorveu. Quando essas duas pressões chegam juntas — fluxo de caixa livre negativo ou magro e uma readequação forçada das vidas úteis — o resultado não é um crash. É a consolidação.

O capital fica caro. As Big Four, com balanços patrimoniais diversificados, absorvem a baixa contábil e continuam construindo. As neoclouds e provedores de segundo escalão, cuja história de valor inteira repousa sobre a premissa de que os ativos de GPU retêm valor em um cronograma longo, enfrentam barreiras de refinanciamento contra garantias desvalorizadas. Alguns são adquiridos pelas próprias hyperscalers a quem alugavam capacidade — os compromissos bilionários e plurianuais da Meta com a CoreWeave já são uma amostra desse puxão gravitacional. Alguns reestruturam suas dívidas. A capacidade instalada não desaparece; ela apenas muda de dono, com desconto e sob pressão. É assim que o acerto de contas contábil se expressa na economia real: não como data centers vazios, mas como uma mudança na titularidade das chaves.

Isso se conecta diretamente à transparência do harness e pressão de procurement que crescem do lado da demanda. Os fornecedores estão prestes a ser espremidos por duas direções ao mesmo tempo — readequação de depreciação no lado da oferta e compradores corporativos que agora rejeitam propostas por falta de governança e transparência de custos no lado da demanda. A margem que financiava a expansão está sob ataque de ambas as pontas. A dinâmica de opacidade dos fornecedores que documentamos anteriormente torna-se mais afiada, e não mais suave, sob essa pressão.

O que um Engenheiro Staff+ ou CTO deve de fato fazer

Você não controla a política de depreciação das hyperscalers. Mas os efeitos colaterais caem direto na sua arquitetura e no seu orçamento, e há movimentos reais a serem feitos antes de 2028, e não depois.

Trate a computação barata como um subsídio temporário, não como um insumo permanente. Os preços de inferência e treinamento de hoje estão artificialmente baixos, em parte, devido a uma expansão financiada por contabilidade otimista e capital barato. Projete sua arquitetura partindo do princípio de que ambos podem reverter. Concretamente: a postura de roteamento e modelos pequenos — usando o menor modelo que atenda aos requisitos da tarefa, reservando a fronteira para o que realmente necessita dela — não é apenas uma otimização de custo hoje. É uma proteção para o dia em que a economia unitária da computação de fronteira sofrer um forte reajuste para cima.

Audite sua exposição a uma única neocloud. Se uma fatia significativa de sua inferência ou treinamento roda em uma nuvem de GPU exclusiva financiada com dívida garantida por hardware, você carrega um risco de contraparte que não tem relação alguma com o SLA de uptime deles. Saiba como será sua rota de migração caso esse provedor seja adquirido ou passe por reestruturação em 2027–2028. Portabilidade multi-host deixa de ser um diferencial opcional quando o risco está no balanço patrimonial do host.

Leia as divulgações de vida útil você mesmo. O número está no formulário 10-K, nas notas explicativas sobre imobilizado (property and equipment). Quando um fornecedor do qual você depende encurta a vida útil dos servidores ou registra uma despesa de depreciação acelerada, isso é a parede chegando — e é um sinal muito mais forte sobre a real vida útil econômica do hardware que você está alugando do que qualquer palestra promocional. Você é técnico o suficiente para ler essas notas. A maioria dos seus pares não fará isso.

Distingua a questão da demanda da questão contábil em cada conversa. Quando a liderança perguntar "o gasto com IA é uma bolha?", a resposta útil é: a demanda é real e provavelmente durável; a lucratividade reportada do fornecimento dessa demanda apoia-se em premissas que serão revistas, e essa revisão concentra-se em torno de 2028. Trata-se de riscos diferentes com proteções diferentes. Confundi-los é a receita para as organizações entrarem em pânico na hora errada ou serem pegas de surpresa no pior momento.

A festa é genuinamente boa. A computação é real, a demanda é real, os ganhos de capacidade são reais. Nada disso é a ressaca. A ressaca é a decisão silenciosa, tomada em uma sala de controladoria e ratificada por um comitê de auditoria, de fingir que um ativo de três anos dura seis — e a manhã, em algum momento por volta de 2028, em que os livros contábeis são forçados a admitir que não durava.

Gaste de acordo.