Contador de Tokens de IA

Conte tokens exatos e estime custos para OpenAI GPT, Anthropic Claude e Google Gemini localmente e em tempo real.

Texto do Prompt

Métricas em Tempo Real

0Tokens
0Caracteres
0Palavras
1Linhas
Limite de Janela de Contexto0.00%
00 usados de 128,000

Estimativa de Custo (USD)

Preço por milhão de tokens: $2.5 (In) / $10 (Out)

Custo de Entrada$0.000000
Custo de Saída (Est.)$0.005000
Custo Total Est.$0.005000

Sobre o cálculo de tokens:

100% exato rodando offline usando as codificações oficiais cl100k_base/o200k_base do OpenAI.

Nota: As estimativas financeiras são baseadas nos preços públicos vigentes e assumem que o prompt e a resposta não usam recursos de cache de contexto ou descontos de lote.

Como Utilizar a Ferramenta

O Contador de Tokens de IA foi desenhado para ajudar desenvolvedores e engenheiros de prompt a otimizarem o design de instruções, mantendo controle preciso sobre a janela de contexto de modelos populares e prevendo o orçamento gasto em chamadas de API.

  1. Selecione o Modelo: Escolha a família e o modelo específico no painel de seleção inferior para calibrar a contagem e as métricas de precificação.
  2. Digite ou Cole o Prompt: A análise de texto e a contagem de tokens são processadas localmente e de forma determinística à medida que você digita.
  3. Ajuste os Tokens de Resposta: Use o slider de tokens de resposta estimados para prever o custo do ciclo completo (entrada + saída).
  4. Monitore o Contexto: A barra de progresso avisa dinamicamente se o seu prompt corre o risco de estourar a janela do modelo escolhido.

Perguntas Frequentes (FAQ)

Por que o número de tokens é diferente do número de palavras?

Os modelos de linguagem processam texto em blocos chamados tokens. Um token pode ser uma palavra inteira, uma parte de uma palavra (como uma sílaba) ou até mesmo um único caractere (como pontuações ou caracteres não latinos). Em média, para o inglês, 1 token equivale a cerca de 4 caracteres ou 0,75 palavras.

Os meus prompts são enviados para algum servidor externo?

Não. A contagem de tokens e a estimativa de custos ocorrem inteiramente dentro do seu próprio navegador. A lógica de tokenização é executada localmente via JavaScript (tiktoken) com zero chamadas a APIs de terceiros. Seu prompt nunca deixa a sua máquina.

Como funciona o cálculo para o Gemini e Claude?

Os modelos Claude usam um tokenizador baseado em BPE muito similar à especificação cl100k_base do GPT-4, o que nos permite ter alta precisão no navegador. Para o Gemini, o SentencePiece nativo requer arquivos de vocabulário pesados que degradariam a performance de carregamento da página. Como alternativa, realizamos uma estimativa robusta (4 caracteres por token) com um aviso transparente de margem de erro.

Compartilhar esta ferramenta

Reagir:

Avalie este artigo

Seja o primeiro a avaliar

Comentários (0)

Nenhum comentário ainda. Seja o primeiro a comentar!

Receba as novidades do site

Cadastre-se para receber novidades do site direto no seu email

Não enviaremos spam. Você pode cancelar a inscrição a qualquer momento.