Última atualização: maio de 2025
Os modelos de API mais recentes da OpenAI têm novos preços e capacidades. Em maio de 2025, a série GPT-4o (Omni) e os modelos GPT-Image-1 possuem as seguintes tarifas (todas conforme a página oficial de preços da API da OpenAI openai.com). Este guia abrange os custos baseados em tokens para cada modelo, taxas de geração de imagens e o custo das chamadas da ferramenta Web Search para GPT-4o e GPT-4.1. Também menciona os limites de janela de contexto e onde esses modelos estão disponíveis (OpenAI ou Azure).
Índice
Preços do GPT-4o e GPT-4o Mini
-
GPT-4o (modelo grande): Os tokens de entrada custam $5,00 por 1M, e os tokens de saída $20,00 por 1 milhão de tokens.
-
GPT-4o Mini (modelo pequeno): Os tokens de entrada custam $0,60 por 1 milhão de tokens, e os tokens de saída $2,40 por 1 milhão de tokens. Este modelo “mini” é projetado para eficiência de custo, custando aproximadamente um terço do preço do GPT-3.5 Turbo.
-
Diferenças de custo de tokens: Observe que os tokens de saída são cobrados a taxas mais altas - as saídas do GPT-4o custam 4x a taxa de entrada ($20 vs. $5) e as saídas do GPT-4o mini custam 4x a taxa de entrada ($2,40 vs. $0,60). Isso reflete o trabalho de gerar texto versus recebê-lo.
-
Janela de contexto: Tanto o GPT-4o quanto o GPT-4o Mini suportam janelas de contexto muito grandes (até 128.000 tokens de entrada, com ~16.384 tokens de saída). Isso os torna adequados para documentos longos ou conversas extensas.
Ambos os modelos são acessíveis pela plataforma da API da OpenAI.
Preços do GPT-Image-1 (Vision)
O GPT-Image-1 é um modelo multimodal para geração de imagens. Seus preços dependem dos tokens de texto (prompt) e das saídas de imagem:
-
Prompts de texto: Os tokens de entrada para o GPT-Image-1 (texto) são $5,00 por 1 milhão de tokens. Não há custo de saída de texto ao gerar imagens (o modelo não retorna texto, apenas imagens).
-
Geração de imagens: Para gerar imagens, o custo do prompt (texto) é $10,00 por 1 milhão de tokens e as saídas de imagem custam $40,00 por 1 milhão de tokens.
-
Taxas por imagem: Além das cobranças de tokens, cada imagem gerada tem uma taxa fixa baseada na resolução e qualidade. De forma geral, uma imagem quadrada de baixa resolução custa ~$0,01, média ~$0,04 e alta resolução ~$0,17 por imagem. (Estes são valores aproximados citados pela OpenAI para imagens padrão de 1024x1024.)
Na prática, você paga pelo prompt de texto (nas tarifas acima) mais o custo da imagem. Por exemplo, pedir ao GPT-Image-1 para criar uma imagem de alta qualidade seria cobrado a $10/1 milhão de tokens no prompt mais ~$0,17 pela imagem em si. A API da OpenAI oferece isso nos termos da “API de Geração de Imagens”.
Preços de chamadas da ferramenta Web Search (GPT-4o & GPT-4.1)
A ferramenta Web Search da OpenAI (usada internamente por alguns modelos GPT para recuperar informações atualizadas) é cobrada por chamada. Para GPT-4o e GPT-4.1, os custos dependem do tamanho do contexto de pesquisa:
-
GPT-4o/GPT-4.1 (grande):
-
Contexto baixo: $30,00 por 1.000 chamadas
-
Médio (padrão): $35,00 por 1.000 chamadas
-
Alto: $50,00 por 1.000 chamadas
-
-
GPT-4o/GPT-4.1 Mini (pequeno):
-
Contexto baixo: $25,00 por 1.000 chamadas
-
Médio: $27,50 por 1.000 chamadas
-
Alto: $30,00 por 1.000 chamadas.
-
Essas taxas aparecem na sua fatura como “web search tool calls | GPT-4o” (ou “GPT-4o-mini”). (O GPT-4.1 compartilha as mesmas faixas de preço do GPT-4o para chamadas de pesquisa.) Tamanhos de contexto de pesquisa maiores significam que o sistema da OpenAI recupera mais resultados, daí o preço mais alto.
Notas de uso & Acesso aos modelos
-
Disponibilidade dos modelos: Todos os modelos acima podem ser usados pela API da OpenAI (Chat Completions/Assistants). GPT-4o e GPT-4o Mini requerem acesso à API (fazem parte da plataforma da OpenAI). O Fozzels utiliza esta API da OpenAI.
-
Limites de tokens: GPT-4o/GPT-4o Mini suportam 128K tokens de entrada (saídas de até ~16K). Para comparação, os modelos GPT-4 anteriores tinham limites de 8K ou 32K. Este suporte a contexto grande é uma característica chave da nova série “Omni”.
-
Gerenciamento de custos: Lembre-se de que os tokens de saída custam mais do que os tokens de entrada. Para uso intenso, considere o modelo mini ou entradas em cache para economizar custos.
Resumo: Em maio de 2025, os preços de tokens do GPT-4o e GPT-4o Mini são $5/$20 e $0,60/$2,40 (entrada/saída) por 1 milhão de tokens, respectivamente. Os prompts do GPT-Image-1 custam $5/1M e a geração de imagens $10/1M entrada + $40/1M saída (aproximadamente $0,01-$0,17 por imagem). As chamadas de pesquisa web para GPT-4o/GPT-4.1 custam $30-$50 por 1K chamadas (dependendo do contexto). Todas as tarifas e limites são confirmados pela documentação oficial da OpenAI, e os modelos estão disponíveis pela API da OpenAI que o Fozzels utiliza.
O que é um token?
Você pode pensar em tokens como pedaços de palavras usados para processamento de linguagem natural. Para texto em inglês, 1 token é aproximadamente 4 caracteres ou 0,75 palavras. Como ponto de referência, as obras completas de Shakespeare têm cerca de 900.000 palavras ou 1,2M de tokens.
Para saber mais sobre como os tokens funcionam e estimar seu uso: a) Experimente a ferramenta interativa Tokenizer da OpenAI; ou b) faça login na sua conta OpenAI e insira texto no Playground. O contador no rodapé exibirá quantos tokens há no seu texto.
A OpenAI oferece vários modelos de linguagem, cada um com diferentes capacidades e faixas de preço.
Os preços mostrados na tabela são por 1 milhão de tokens. Você pode pensar em tokens como pedaços de palavras, onde 1M de tokens é aproximadamente 750.000 palavras.
Quais custos esperar ao usar a OpenAI via Fozzels
Para ter uma ideia dos custos para gerar automaticamente textos de descrição de produtos para sua loja online usando o Fozzels.com, veja a tabela abaixo.
Geralmente observamos que, para gerar, digamos, um texto de 500 palavras, em média cerca de 625 “tokens de entrada” são usados (para o prompt), e cerca de 725 “tokens de saída” são usados para o texto gerado.
Colocamos isso em uma tabela para você entender melhor.
| Provedor | Modelo | Preço por 1M tokens de entrada | Preço por 1M tokens de saída | 625 tokens de entrada | 725 tokens de saída | Preço por texto de 500 palavras |
|---|---|---|---|---|---|---|
| OpenAI | GPT-4o | $2,50 | $10,00 | $0,0015625 | $0,0072500 | $0,0088125 |
| OpenAI | GPT-o1 | $15,00 | $60,00 | $0,0093750 | $0,0435000 | $0,0528750 |
| OpenAI | GPT-4.1 | $2,00 | $8,00 | $0,0012500 | $0,0058000 | $0,0070500 |
Preço por conteúdo gerado de 500 palavras
Qual modelo devo usar?
OpenAI o3 é o modelo de raciocínio mais poderoso da OpenAI, que avança as fronteiras em programação, matemática, ciência, percepção visual e muito mais. Ele estabelece um novo estado da arte em benchmarks incluindo Codeforces, SWE-bench (sem construir um scaffold específico para o modelo) e MMMU. É ideal para consultas complexas que exigem análise multifacetada e cujas respostas podem não ser imediatamente óbvias. Ele tem um desempenho especialmente forte em tarefas visuais como análise de imagens, gráficos e infográficos. Em avaliações por especialistas externos, o o3 comete 20% menos erros graves do que o OpenAI o1 em tarefas difíceis do mundo real - especialmente se destacando em áreas como programação, negócios/consultoria e ideação criativa. Os primeiros testadores destacaram seu rigor analítico como parceiro de pensamento e enfatizaram sua capacidade de gerar e avaliar criticamente novas hipóteses - particularmente em contextos de biologia, matemática e engenharia.
o4-mini
OpenAI o4-mini é um modelo menor otimizado para raciocínio rápido e econômico - ele alcança um desempenho notável para seu tamanho e custo, particularmente em matemática, programação e tarefas visuais. É o modelo com melhor desempenho em benchmarks no AIME 2024 e 2025. Em avaliações de especialistas, ele também supera seu antecessor, o3-mini, em tarefas não-STEM e em domínios como ciência de dados. Graças à sua eficiência, o o4-mini suporta limites de uso significativamente mais altos do que o o3, tornando-o uma opção forte de alto volume e alta vazão para perguntas que se beneficiam de raciocínio.
GPT-4.5
A OpenAI lançou uma prévia de pesquisa do GPT-4.5 - o maior e melhor modelo da OpenAI para chat até agora. O GPT-4.5 é um avanço na escalabilidade do pré-treinamento e pós-treinamento. Ao escalar o aprendizado não supervisionado, o GPT-4.5 melhora sua capacidade de reconhecer padrões, fazer conexões e gerar insights criativos sem raciocínio.
Os testes iniciais mostram que interagir com o GPT-4.5 parece mais natural. Sua base de conhecimento mais ampla, capacidade aprimorada de seguir a intenção do usuário e maior “QE” o tornam útil para tarefas como melhorar a escrita, programação e resolver problemas práticos. A OpenAI também espera que ele alucine menos.
OpenAI o1 e o1-mini
Os modelos OpenAI o1 e o1-mini são uma série de modelos de raciocínio para resolver problemas difíceis. Embora o GPT-4o ainda seja a melhor opção para a maioria dos prompts, a série o1 é útil para lidar com tarefas complexas de resolução de problemas em domínios como pesquisa, estratégia, programação, matemática e ciência.
Para a maioria dos casos de uso, especialmente aqueles que envolvem o uso de ferramentas e visão, a OpenAI recomenda usar o GPT-4o no ChatGPT. Observe as seguintes limitações dos modelos OpenAI o1 e o1-mini no ChatGPT:
Os modelos o1 e o3-mini da OpenAI não têm acesso às seguintes ferramentas e recursos avançados:
-
Memória
-
Instruções personalizadas
-
Descobrir e usar GPTs
-
Voz
Mude para o GPT-4o para usar as ferramentas e recursos avançados listados acima.
OpenAI o3-mini
O OpenAI o3-mini é a mais recente adição à série de raciocínio da OpenAI, projetado para se destacar em programação e outras tarefas avançadas de raciocínio. Ele oferece uma combinação atraente de velocidade, eficiência e flexibilidade tanto para casos de uso em produção quanto em desenvolvimento.
Notavelmente, o o3-mini demonstra fortes capacidades de programação e raciocínio complexo no mesmo nível (ou até superando em alguns momentos) do o1, ao mesmo tempo que oferece respostas muito mais rápidas em média e sendo um modelo muito econômico. A OpenAI recomenda usar o o3-mini como modelo de raciocínio pequeno preferencial na série o, que oferecerá desempenho aprimorado, respostas mais rápidas e uma variedade de modos de raciocínio.
Além disso, o o3-mini funciona com pesquisa e permite que o modelo encontre respostas atualizadas com links para fontes web relevantes. No entanto, observe que o o3-mini não lida com tarefas baseadas em visão. Para raciocínio visual, o o1 ainda é recomendado.
O OpenAI o3-mini continuará compartilhando muitas das mesmas limitações listadas acima para os modelos da série o1 da OpenAI, mas será capaz de realizar pesquisas na web.
GPT-4o
O GPT-4o é o modelo principal da OpenAI que pode raciocinar sobre áudio, visão e texto em tempo real. O GPT-4o está disponível no ChatGPT e na API como modelo de texto e visão (o ChatGPT continuará tendo suporte para voz através do recurso Voice Mode pré-existente) inicialmente. Especificamente, o GPT-4o está disponível no ChatGPT Free, Plus, Pro, Team e Enterprise, e na API de Chat Completions, API de Assistants e API de Batch.
GPT-4.1
O GPT-4.1 é um modelo especializado que se destaca em tarefas de programação. Comparado ao GPT-4o, é ainda mais forte no seguimento preciso de instruções e em tarefas de desenvolvimento web, e oferece uma alternativa ao OpenAI o3 e ao OpenAI o4-mini para necessidades de programação mais simples e cotidianas.
GPT-4.1 mini
O GPT-4.1 mini é um modelo pequeno rápido, capaz e eficiente que se destaca no seguimento de instruções, programação e inteligência geral. O GPT-4.1 mini está disponível no seletor de modelos em “mais modelos” para usuários pagos, e servirá como modelo alternativo para usuários gratuitos quando atingirem seus limites de uso do GPT-4o.