As empresas que passaram o último ano a pressionar os colaboradores a utilizarem ferramentas de IA da forma mais agressiva possível estão agora a lutar para gerir os custos.
Os CFOs estão agora a exigir retornos mensuráveis sobre as faturas de API cada vez mais elevadas, ameaçando as projeções de crescimento da OpenAI, Anthropic e outros fornecedores de modelos de linguagem de grande escala.

As empresas estão agora a reduzir os seus gastos com IA à medida que os CFOs exigem justificação para as faturas de API em crescimento. Esta inversão marca o fim do que o setor apelidou de "tokenmaxxing", e a correção está a acontecer rapidamente.
A Amazon desmantelou recentemente um ranking interno que acompanhava a utilização de IA pelos colaboradores, depois de a liderança ter concluído que o sistema estava a produzir mais trabalho inútil impulsionado por IA do que resultados úteis. "Por favor, não utilizem IA apenas pelo facto de utilizar IA", disse um vice-presidente sénior da Amazon aos colaboradores.
A Uber esgotou todo o seu orçamento de programação com IA para 2026 em quatro meses, e a Meta enviou um memorando interno a cerca de 6.000 colaboradores sinalizando o que chamou de "aumento exponencial" na utilização de IA, alertando que a empresa enfrentava milhares de milhões em custos internos de IA. A Uber impôs desde então um limite mensal de gastos de 1.500 dólares por colaborador em ferramentas de programação com IA.
A gigante de consultoria Accenture avisou anteriormente os colaboradores que poderiam "correr o risco de perder promoções" se não adotassem ferramentas de IA. Agora, a Accenture está a tentar impedir os colaboradores de utilizarem IA em tarefas triviais.
Áudio vazado de uma reunião interna captou um executivo da Accenture a dizer que os gastos com IA estão a "tornar-se muito imprevisíveis." O mesmo executivo disse que a liderança ao "nível do CFO, COO e CIO ainda está a questionar se estão a obter valor daquilo que estamos a gastar."
Adam McDaniel e Markus Eisele, da International Business Machines (IBM), argumentaram numa análise recente que a minimização de tokens é tão má quanto o tokenmaxxing, porque ambas tornam o consumo de tokens o objetivo principal em vez de se focarem nos resultados de negócio.
A IBM defende o que chama de "valuemaxxing", que se concentra em medir tarefas concluídas, tempo poupado e retrabalho evitado, em vez de tokens consumidos.
A OpenAI e a Anthropic construíram os seus planos de crescimento com base na ideia de que as empresas continuariam a consumir cada vez mais tokens.
A OpenAI ultrapassou os 25 mil milhões de dólares em receitas anualizadas no início deste ano, ao mesmo tempo que colocou a sua própria avaliação em 1 bilião de dólares, enquanto a Anthropic está avaliada alguns milhares de milhões de dólares abaixo. Ambas as empresas estão a consumir dinheiro em computação, investigação e contratações, esperando que a adoção empresarial as torne lucrativas.
Mas as empresas já estão a reservar os modelos flagship mais caros para trabalhos complexos e a utilizar alternativas mais pequenas e mais baratas para tarefas de rotina. Algumas estão a migrar cargas de trabalho para modelos de código aberto que funcionam na sua própria infraestrutura sem cobranças por token.
A International Data Corporation (IDC) prevê que até 2028, 70% das principais empresas impulsionadas por IA utilizarão múltiplos modelos em vez de dependerem de um único fornecedor. Isso transformaria a IA numa mercadoria em que os fornecedores competem pelo preço e não apenas pela capacidade.
A questão financeira não vai desaparecer tão cedo. Até o CEO da OpenAI, Sam Altman, reconheceu que o custo da IA se tornou um "enorme problema" para os clientes este ano.
Se está a ler isto, já está à frente. Mantenha-se assim com a nossa newsletter.


