
Modelos de IA, como GPT-5, Claude Opus 4.8 ou Gemini 2.5, são as versões internas que alimentam assistentes, como ChatGPT, Claude e Gemini. Eles funcionam como o “motor” por trás das respostas. Para isso, são treinados com grandes volumes de dados para entender a linguagem, gerar textos, programar e resolver problemas complexos.
Quando um modelo deixa de aparecer na IA ou é substituído, isso pode dar a impressão de que ele “sumiu”. Mas esse processo geralmente faz parte de uma atualização planejada, em que versões mais novas tomam o lugar de modelos antigos que já não são o foco principal.
O que significa “modelo aposentado”?
A aposentadoria de um modelo de IA ocorre quando ele deixa de ser prioridade dentro das empresas e começa a ser retirado do uso público. Para isso, ele passa por alguns estágios: ativo, quando é o modelo principal em uso nos produtos; legado, quando ainda funciona, mas não recebe grandes melhorias; descontinuado, quando já tem substituto definido, mas ainda pode estar disponível por um período; e aposentado, quando sai das interfaces e pode ser desligado do acesso público.
Por que modelos de IA são aposentados?
Os modelos são aposentados por uma combinação de fatores técnicos e estratégicos. Versões mais novas tendem a ser mais rápidas, precisas e seguras, o que naturalmente faz com que elas substituam as anteriores. Manter vários modelos grandes em operação ao mesmo tempo exige muita infraestrutura, o que aumenta custos, consumo de servidores e complexidade técnica.
Com a migração dos usuários para versões mais recentes, manter modelos antigos deixa de ser eficiente do ponto de vista operacional. Por exemplo, ao justificar o desligamento do GPT-4o, a OpenAI disse que cerca de 0,1% dos usuários ainda utilizavam o modelo diariamente e que a maioria já havia migrado para o GPT-5.2. Reduzir o número de modelos disponíveis também melhora a experiência do usuário, deixando a escolha mais simples. Também existe um fator de segurança envolvido, já que os laboratórios priorizam versões mais recentes com melhor alinhamento e correções atualizadas.
O que acontece com os modelos de IA aposentados?
Mesmo depois de serem aposentados, esses modelos nem sempre deixam de existir. Eles podem seguir caminhos diferentes. O modelo pode ser removido da interface principal, mas ainda continuar acessível por meio de API para desenvolvedores. Isso permite que empresas que já integraram aquele modelo em seus produtos não precisem migrar imediatamente para uma nova versão. Ele sai do uso cotidiano do público geral, mas continua funcionando em aplicações específicas.
Em alguns casos, um modelo pode voltar temporariamente quando há forte demanda dos usuários. Isso aconteceu com o GPT-4o, já que muitos usuários relataram preferência pelo estilo mais caloroso e conversacional, considerado especialmente eficiente para tarefas criativas. Esse retorno geralmente não é permanente. Os modelos aposentados podem ter seus parâmetros, conhecidos como pesos, armazenados para uso futuro. Com isso, é possível reativá-los em cenários de pesquisa, auditoria ou comparação de desempenho. O modelo Claude Opus 3, por exemplo, passou “entrevistas de aposentadoria” com a Anthropic, para registrar como ele “preferia” ser guardado a longo prazo.
Modelos antigos também podem ser aproveitados no treinamento de versões futuras. O reaproveitamento de conhecimento ajuda a transferir padrões aprendidos para sistemas mais modernos. Além disso, as customizações construídas em cima do modelo aposentado, como ajustes finos e versões especializadas, nem sempre sobrevivem. Assim, as ferramentas dependentes daquele modelo precisam ser refeitas ou adaptadas.
Quais são os modelos que não podem aposentar?
Os modelos de pesos abertos são os únicos que não podem ser realmente aposentados por uma empresa, já que seus parâmetros são disponibilizados publicamente. Depois do lançamento, eles podem ser baixados, executados localmente e modificados pela comunidade. Exemplos incluem Llama (Meta), Mistral, DeepSeek e Qwen (Alibaba). Mesmo que as empresas deixem de atualizar essas versões, elas continuam existindo fora do controle central, desde que haja hardware capaz de rodá-las.
Esses modelos também vivem em plataformas de hospedagem voltadas para IA, como o Hugging Face, onde ficam disponíveis para download e uso contínuo pela comunidade. A partir desses modelos, a comunidade cria novas versões adaptadas a diferentes necessidades. Esse processo envolve fine-tuning, que ajusta o modelo para tarefas específicas, e quantização, que reduz o tamanho do sistema para permitir execução em dispositivos mais simples, como notebooks e celulares. A presença desses modelos também se espalha por diferentes empresas e ecossistemas. O Vertex AI Model Garden do Google, por exemplo, reúne modelos Llama ao lado de versões proprietárias, como o Gemini.


