Tecnologia · Fonte: Canaltech

Google reduz limites do Gemini e assinantes pagos relatam cotas esgotando em minutos

Mudança implementada pelo Google em 17 de maio de 2026 substitui contagem de requisições por custo computacional no Gemini, derrubando drasticamente os limites efetivos dos planos pagos e provocando reclamações generalizadas de usuários.

Google reduz limites do Gemini e assinantes pagos relatam cotas esgotando em minutos

Google reduz limites do Gemini e assinantes pagos relatam cotas esgotando em minutos

Uma mudança silenciosa nos critérios de uso do Gemini, implementada pelo Google em 17 de maio de 2026, está gerando uma onda de reclamações entre usuários de planos pagos. Em vez de contabilizar requisições fixas — como era feito anteriormente —, o sistema passou a medir o custo computacional total de cada interação. O resultado prático é que assinantes relatam ver suas cotas diárias evaporarem em questão de minutos, mesmo em tarefas consideradas rotineiras.

O que mudou nos planos

Antes da alteração, os planos pagos do Gemini ofereciam limites significativamente mais generosos em comparação com a camada gratuita: as proporções chegavam a 10x, 33x e até 166x mais capacidade, dependendo do nível de assinatura. Com a reestruturação, esses multiplicadores foram drasticamente reduzidos para 2x, 4x e 20x, respectivamente. O Google também renovou sua oferta com um novo patamar chamado AI Ultra, que promete até 20 vezes mais limite do que a versão padrão — mas o corte nos demais planos acendeu o alerta entre quem já pagava pelo serviço. Os limites são reestabelecidos a cada cinco horas, o que na prática não alivia a sensação de escassez relatada por boa parte dos usuários.

Reclamações e transparência

A falta de clareza sobre o novo modelo é uma das principais queixas. Recursos avançados como a geração de mídia e o Deep Research consomem cotas de forma acelerada, mas o sistema não informa, de maneira intuitiva, quanto de capacidade cada operação vai consumir. Em relatos publicados em fóruns e redes sociais, usuários descrevem situações como atingir o teto de cinco horas com apenas um único comando elaborado. "O limite das cinco horas foi atingido em poucos minutos com apenas um comando", escreveu um assinante, ilustrando o impacto real da mudança para quem utiliza o serviço de forma intensiva.

Resposta do Google

Diante da repercussão, Josh Woodward, líder da divisão Gemini no Google, reconheceu publicamente as preocupações levantadas pela comunidade. Como medida paliativa, a empresa lançou o Gemini 3.5 Flash (Low), uma variante do modelo projetada para reduzir o consumo de tokens em até 45%, oferecendo aos usuários uma alternativa menos custosa computacionalmente para tarefas cotidianas. Ainda assim, críticos apontam que a solução não resolve o problema de fundo: a falta de transparência sobre como os créditos são calculados e a redução expressiva dos limites nos planos já existentes. O episódio evidencia a tensão crescente entre provedores de IA que precisam gerenciar custos de infraestrutura e usuários que esperam consistência no serviço pelo qual já pagam.


Fonte: Canaltech, publicado em 26 de maio de 2026.

forum

Discussão no X

Intensidade da discussão: média

Comentários (0)

Entre pra comentar. Fazer login →