Preços ChatGPT (OpenAI) – 2025-05

Fozzels · 21 mai 2025

Última atualização: maio de 2025

Os modelos de API mais recentes da OpenAI têm novos preços e capacidades. Em maio de 2025, a série GPT-4o (Omni) e os modelos GPT-Image-1 possuem as seguintes tarifas (todas conforme a página oficial de preços da API da OpenAI openai.com). Este guia abrange os custos baseados em tokens para cada modelo, taxas de geração de imagens e o custo das chamadas da ferramenta Web Search para GPT-4o e GPT-4.1. Também menciona os limites de janela de contexto e onde esses modelos estão disponíveis (OpenAI ou Azure).

Índice

Preços do GPT-4o e GPT-4o Mini

GPT-4o (modelo grande): Os tokens de entrada custam $5,00 por 1M, e os tokens de saída $20,00 por 1 milhão de tokens.
GPT-4o Mini (modelo pequeno): Os tokens de entrada custam $0,60 por 1 milhão de tokens, e os tokens de saída $2,40 por 1 milhão de tokens. Este modelo “mini” é projetado para eficiência de custo, custando aproximadamente um terço do preço do GPT-3.5 Turbo.
Diferenças de custo de tokens: Observe que os tokens de saída são cobrados a taxas mais altas - as saídas do GPT-4o custam 4x a taxa de entrada ($20 vs. $5) e as saídas do GPT-4o mini custam 4x a taxa de entrada ($2,40 vs. $0,60). Isso reflete o trabalho de gerar texto versus recebê-lo.
Janela de contexto: Tanto o GPT-4o quanto o GPT-4o Mini suportam janelas de contexto muito grandes (até 128.000 tokens de entrada, com ~16.384 tokens de saída). Isso os torna adequados para documentos longos ou conversas extensas.

Ambos os modelos são acessíveis pela plataforma da API da OpenAI.

Preços do GPT-Image-1 (Vision)

O GPT-Image-1 é um modelo multimodal para geração de imagens. Seus preços dependem dos tokens de texto (prompt) e das saídas de imagem:

Prompts de texto: Os tokens de entrada para o GPT-Image-1 (texto) são $5,00 por 1 milhão de tokens. Não há custo de saída de texto ao gerar imagens (o modelo não retorna texto, apenas imagens).
Geração de imagens: Para gerar imagens, o custo do prompt (texto) é $10,00 por 1 milhão de tokens e as saídas de imagem custam $40,00 por 1 milhão de tokens.
Taxas por imagem: Além das cobranças de tokens, cada imagem gerada tem uma taxa fixa baseada na resolução e qualidade. De forma geral, uma imagem quadrada de baixa resolução custa ~$0,01, média ~$0,04 e alta resolução ~$0,17 por imagem. (Estes são valores aproximados citados pela OpenAI para imagens padrão de 1024x1024.)

Na prática, você paga pelo prompt de texto (nas tarifas acima) mais o custo da imagem. Por exemplo, pedir ao GPT-Image-1 para criar uma imagem de alta qualidade seria cobrado a $10/1 milhão de tokens no prompt mais ~$0,17 pela imagem em si. A API da OpenAI oferece isso nos termos da “API de Geração de Imagens”.

Preços de chamadas da ferramenta Web Search (GPT-4o & GPT-4.1)

A ferramenta Web Search da OpenAI (usada internamente por alguns modelos GPT para recuperar informações atualizadas) é cobrada por chamada. Para GPT-4o e GPT-4.1, os custos dependem do tamanho do contexto de pesquisa:

GPT-4o/GPT-4.1 (grande):
- Contexto baixo: $30,00 por 1.000 chamadas
- Médio (padrão): $35,00 por 1.000 chamadas
- Alto: $50,00 por 1.000 chamadas
GPT-4o/GPT-4.1 Mini (pequeno):
- Contexto baixo: $25,00 por 1.000 chamadas
- Médio: $27,50 por 1.000 chamadas
- Alto: $30,00 por 1.000 chamadas.

Essas taxas aparecem na sua fatura como “web search tool calls | GPT-4o” (ou “GPT-4o-mini”). (O GPT-4.1 compartilha as mesmas faixas de preço do GPT-4o para chamadas de pesquisa.) Tamanhos de contexto de pesquisa maiores significam que o sistema da OpenAI recupera mais resultados, daí o preço mais alto.

Notas de uso & Acesso aos modelos

Disponibilidade dos modelos: Todos os modelos acima podem ser usados pela API da OpenAI (Chat Completions/Assistants). GPT-4o e GPT-4o Mini requerem acesso à API (fazem parte da plataforma da OpenAI). O Fozzels utiliza esta API da OpenAI.
Limites de tokens: GPT-4o/GPT-4o Mini suportam 128K tokens de entrada (saídas de até ~16K). Para comparação, os modelos GPT-4 anteriores tinham limites de 8K ou 32K. Este suporte a contexto grande é uma característica chave da nova série “Omni”.
Gerenciamento de custos: Lembre-se de que os tokens de saída custam mais do que os tokens de entrada. Para uso intenso, considere o modelo mini ou entradas em cache para economizar custos.

Resumo: Em maio de 2025, os preços de tokens do GPT-4o e GPT-4o Mini são $5/$20 e $0,60/$2,40 (entrada/saída) por 1 milhão de tokens, respectivamente. Os prompts do GPT-Image-1 custam $5/1M e a geração de imagens $10/1M entrada + $40/1M saída (aproximadamente $0,01-$0,17 por imagem). As chamadas de pesquisa web para GPT-4o/GPT-4.1 custam $30-$50 por 1K chamadas (dependendo do contexto). Todas as tarifas e limites são confirmados pela documentação oficial da OpenAI, e os modelos estão disponíveis pela API da OpenAI que o Fozzels utiliza.

O que é um token?

Você pode pensar em tokens como pedaços de palavras usados para processamento de linguagem natural. Para texto em inglês, 1 token é aproximadamente 4 caracteres ou 0,75 palavras. Como ponto de referência, as obras completas de Shakespeare têm cerca de 900.000 palavras ou 1,2M de tokens.

Para saber mais sobre como os tokens funcionam e estimar seu uso: a) Experimente a ferramenta interativa Tokenizer da OpenAI; ou b) faça login na sua conta OpenAI e insira texto no Playground. O contador no rodapé exibirá quantos tokens há no seu texto.

A OpenAI oferece vários modelos de linguagem, cada um com diferentes capacidades e faixas de preço.

Os preços mostrados na tabela são por 1 milhão de tokens. Você pode pensar em tokens como pedaços de palavras, onde 1M de tokens é aproximadamente 750.000 palavras.

Quais custos esperar ao usar a OpenAI via Fozzels

Para ter uma ideia dos custos para gerar automaticamente textos de descrição de produtos para sua loja online usando o Fozzels.com, veja a tabela abaixo.

Geralmente observamos que, para gerar, digamos, um texto de 500 palavras, em média cerca de 625 “tokens de entrada” são usados (para o prompt), e cerca de 725 “tokens de saída” são usados para o texto gerado.

Colocamos isso em uma tabela para você entender melhor.

Provedor	Modelo	Preço por 1M tokens de entrada	Preço por 1M tokens de saída	625 tokens de entrada	725 tokens de saída	Preço por texto de 500 palavras
OpenAI	GPT-4o	$2,50	$10,00	$0,0015625	$0,0072500	$0,0088125
OpenAI	GPT-o1	$15,00	$60,00	$0,0093750	$0,0435000	$0,0528750
OpenAI	GPT-4.1	$2,00	$8,00	$0,0012500	$0,0058000	$0,0070500

Preço por conteúdo gerado de 500 palavras

Qual modelo devo usar?

OpenAI o3 é o modelo de raciocínio mais poderoso da OpenAI, que avança as fronteiras em programação, matemática, ciência, percepção visual e muito mais. Ele estabelece um novo estado da arte em benchmarks incluindo Codeforces, SWE-bench (sem construir um scaffold específico para o modelo) e MMMU. É ideal para consultas complexas que exigem análise multifacetada e cujas respostas podem não ser imediatamente óbvias. Ele tem um desempenho especialmente forte em tarefas visuais como análise de imagens, gráficos e infográficos. Em avaliações por especialistas externos, o o3 comete 20% menos erros graves do que o OpenAI o1 em tarefas difíceis do mundo real - especialmente se destacando em áreas como programação, negócios/consultoria e ideação criativa. Os primeiros testadores destacaram seu rigor analítico como parceiro de pensamento e enfatizaram sua capacidade de gerar e avaliar criticamente novas hipóteses - particularmente em contextos de biologia, matemática e engenharia.

o4-mini

OpenAI o4-mini é um modelo menor otimizado para raciocínio rápido e econômico - ele alcança um desempenho notável para seu tamanho e custo, particularmente em matemática, programação e tarefas visuais. É o modelo com melhor desempenho em benchmarks no AIME 2024 e 2025. Em avaliações de especialistas, ele também supera seu antecessor, o3-mini, em tarefas não-STEM e em domínios como ciência de dados. Graças à sua eficiência, o o4-mini suporta limites de uso significativamente mais altos do que o o3, tornando-o uma opção forte de alto volume e alta vazão para perguntas que se beneficiam de raciocínio.

GPT-4.5

A OpenAI lançou uma prévia de pesquisa do GPT-4.5 - o maior e melhor modelo da OpenAI para chat até agora. O GPT-4.5 é um avanço na escalabilidade do pré-treinamento e pós-treinamento. Ao escalar o aprendizado não supervisionado, o GPT-4.5 melhora sua capacidade de reconhecer padrões, fazer conexões e gerar insights criativos sem raciocínio.

Os testes iniciais mostram que interagir com o GPT-4.5 parece mais natural. Sua base de conhecimento mais ampla, capacidade aprimorada de seguir a intenção do usuário e maior “QE” o tornam útil para tarefas como melhorar a escrita, programação e resolver problemas práticos. A OpenAI também espera que ele alucine menos.

OpenAI o1 e o1-mini

Os modelos OpenAI o1 e o1-mini são uma série de modelos de raciocínio para resolver problemas difíceis. Embora o GPT-4o ainda seja a melhor opção para a maioria dos prompts, a série o1 é útil para lidar com tarefas complexas de resolução de problemas em domínios como pesquisa, estratégia, programação, matemática e ciência.

Para a maioria dos casos de uso, especialmente aqueles que envolvem o uso de ferramentas e visão, a OpenAI recomenda usar o GPT-4o no ChatGPT. Observe as seguintes limitações dos modelos OpenAI o1 e o1-mini no ChatGPT:

Os modelos o1 e o3-mini da OpenAI não têm acesso às seguintes ferramentas e recursos avançados:

Memória
Instruções personalizadas
Descobrir e usar GPTs
Voz

Mude para o GPT-4o para usar as ferramentas e recursos avançados listados acima.

OpenAI o3-mini

O OpenAI o3-mini é a mais recente adição à série de raciocínio da OpenAI, projetado para se destacar em programação e outras tarefas avançadas de raciocínio. Ele oferece uma combinação atraente de velocidade, eficiência e flexibilidade tanto para casos de uso em produção quanto em desenvolvimento.

Notavelmente, o o3-mini demonstra fortes capacidades de programação e raciocínio complexo no mesmo nível (ou até superando em alguns momentos) do o1, ao mesmo tempo que oferece respostas muito mais rápidas em média e sendo um modelo muito econômico. A OpenAI recomenda usar o o3-mini como modelo de raciocínio pequeno preferencial na série o, que oferecerá desempenho aprimorado, respostas mais rápidas e uma variedade de modos de raciocínio.

Além disso, o o3-mini funciona com pesquisa e permite que o modelo encontre respostas atualizadas com links para fontes web relevantes. No entanto, observe que o o3-mini não lida com tarefas baseadas em visão. Para raciocínio visual, o o1 ainda é recomendado.

O OpenAI o3-mini continuará compartilhando muitas das mesmas limitações listadas acima para os modelos da série o1 da OpenAI, mas será capaz de realizar pesquisas na web.

GPT-4o

O GPT-4o é o modelo principal da OpenAI que pode raciocinar sobre áudio, visão e texto em tempo real. O GPT-4o está disponível no ChatGPT e na API como modelo de texto e visão (o ChatGPT continuará tendo suporte para voz através do recurso Voice Mode pré-existente) inicialmente. Especificamente, o GPT-4o está disponível no ChatGPT Free, Plus, Pro, Team e Enterprise, e na API de Chat Completions, API de Assistants e API de Batch.

GPT-4.1

O GPT-4.1 é um modelo especializado que se destaca em tarefas de programação. Comparado ao GPT-4o, é ainda mais forte no seguimento preciso de instruções e em tarefas de desenvolvimento web, e oferece uma alternativa ao OpenAI o3 e ao OpenAI o4-mini para necessidades de programação mais simples e cotidianas.

GPT-4.1 mini

O GPT-4.1 mini é um modelo pequeno rápido, capaz e eficiente que se destaca no seguimento de instruções, programação e inteligência geral. O GPT-4.1 mini está disponível no seletor de modelos em “mais modelos” para usuários pagos, e servirá como modelo alternativo para usuários gratuitos quando atingirem seus limites de uso do GPT-4o.