Estimativas direcionais. Preços de tabela de abril de 2026 — v2.0. Não incluem descontos por volume, preços negociados ou variações regionais. Use como ponto de partida.
Menor total mensal
–
Maior total mensal
–
Diferença
–
Peso da inferência
Composição de custos
Detalhamento mensal do stack
| Componente | AWS | Google Cloud | Azure |
|---|
Entradas da carga
Tabela de preços por provedor
Descontos de compromisso
On-demand vs Reservado / Savings Plans
| Provedor | On-demand / mês | Reservado 1 ano / mês | Economia anual | Reservado 3 anos / mês | Economia em 3 anos |
|---|
Total anual — 1 ano
Total em 3 anos
Spot / Preemptible / Spot VMs
| Provedor | On-demand / mês | Spot / mês | Economia mensal | Economia anual |
|---|
Economia de GPU
Requisições de equilíbrio
Tabela econômica de inferência
| Opção de inferência | Fixo mensal / base | Variável por requisição | Requisições de equilíbrio / mês | Custo mensal na carga atual |
|---|
Comparar cenários
Detalhamento comparativo
| Componente | A — AWS | A — GCP | A — Azure | B — AWS | B — GCP | B — Azure | Δ Total % |
|---|
Total por provedor
Notas do modelo
Kubernetes: plano de controle + horas de nó × workers. SQL gerenciado: computação, armazenamento e backup.
Object storage: GB armazenado + recuperação/API. CDN: GB de saída + volume de requisições.
Load Balancer: horas ativas (modelo simplificado, sem LCU/RCU). Egress: saída inter-região em GB.
LLM gerenciado: volume de tokens com tarifas separadas de entrada e saída.
Serverless: taxa de invocação por milhão + duração em GB-s (memória × tempo). Lambda, Cloud Functions, Azure Functions.
Cache gerenciado: nós × horas (ElastiCache, Memorystore, Azure Cache for Redis).
API Gateway: chamadas faturadas por milhão (Amazon API GW, Cloud Endpoints, Azure APIM).
GPU self-hosted: amortização + energia + rack + overhead de plataforma. Use para análise de break-even.
Descontos de compromisso são médias de mercado. Variam por tipo de instância e região — substitua pelos valores do seu contrato.
Referência de fórmulas
Métrica
Fórmula
Exemplo
Unidades
Obs.
Kubernetes
plano + nó × h × workers
74 + 0,12 × 730 × 3
USD/mês
Com taxa do cluster
SQL gerenciado
base + vCPU × h + GB × tarifa
55 + 0,18 × 730 × 2 + 0,12 × 200
USD/mês
–
CDN
GB × tarifa + req ÷ 10k × tarifa
3000 × 0,08 + 2000 × 0,0075
USD/mês
Cobrança dupla
Load Balancer
horas × tarifa
730 × 0,008
USD/mês
Sem LCU
Egress
GB × tarifa
500 × 0,09
USD/mês
Inter-região
LLM
Mtok-in × t-in + Mtok-out × t-out
250 × 0,8 + 60 × 3,2
USD/mês
–
Reservado
total × (1 − desconto)
8500 × (1 − 0,37)
USD/mês
Média de mercado
Break-even GPU
fixo ÷ custo-variável
4200 ÷ 0,022
req/mês
–
Serverless
inv/M × tarifa + GB-s × tarifa
1M × 0,20 + 46800 × 0,0000167
USD/mês
GB-s = mem(GB)×dur(s)×inv
Cache
nós × horas × tarifa
2 × 730 × 0,068
USD/mês
–
API Gateway
chamadas(M) × tarifa/M
50 × 3,50
USD/mês
–