AITOT

Calculator

Calculator giá thuê GPU

So sánh chi phí thuê GPU theo giờ/tháng giữa các cloud, gồm spot vs on-demand và chi phí điện.

Pricing cập nhật:

AITOT GPU Pricing Calculator so sánh giá thuê GPU NVIDIA H100, H200, A100, B200, RTX 5090 và GPU consumer trên 12 cloud provider — AWS, GCP, Azure, RunPod, Lambda Labs, Vast.ai, CoreWeave, Together, Replicate, Modal, Banana, Paperspace.

H100 80GB dao động từ $1.85/giờ trên spot (Vast.ai) đến $7.20/giờ trên Azure on-demand — chênh 4×. RunPod community $2.49/giờ và Lambda Labs $2.99/giờ là sweet spot cho training và stateless inference. Hyperscaler thắng cho workload regulated cần VPC, IAM, S3.

Toggle "include power cost" để cộng tiền điện theo $/kWh × TDP của GPU. H100 ở 700W với $0.12/kWh tốn khoảng $61/tháng tiền điện chạy 24/7 — thường bị bỏ qua khi tính break-even self-host. Spot giảm 50–70% nhưng instance có thể bị preempt.

Rẻ nhất · On-demand

Hyperbolic · H100-SXM

$1,072.80

/tháng · 720 h

ProviderMỗi giờCompute / thángTổng / tháng
HyperbolicSXM5 (spot-style)· Spot-style; community reliability$1.49$1,072.80$1,072.80
Vast.aiSXM5· 24h median$2.40$1,728.00$1,728.00
CrusoeSXM5 HGX$2.65$1,908.00$1,908.00
Lambda LabsSXM5$2.99$2,152.80$2,152.80
RunPodSXM5$3.29$2,368.80$2,368.80
CoreWeaveSXM5 HGX$3.30$2,376.00$2,376.00
PaperspaceSXM5$5.95$4,284.00$4,284.00
GCPSXM5 (A3)· A3 ÷ 8$11.06$7,963.20$7,963.20
AWSSXM5 HGX (8-GPU)· p5.48xlarge ÷ 8 GPUs$12.29$8,848.80$8,848.80
AzureSXM5 (NDH100v5)· ND H100 v5 ÷ 8$12.96$9,331.20$9,331.20

Giá spot là median 30 ngày và có thể nhảy vọt. Community-tier kém tin cậy hơn secure-spot — không dùng cho production training mà không checkpoint.

Calculator này làm được gì

So sánh 12 GPU cloud

AWS, GCP, Azure, RunPod, Lambda, Vast.ai, CoreWeave, Together, Replicate, Modal, Banana, Paperspace.

Spot vs on-demand

Hiển thị cả hai tier song song. Spot giảm 50–70% trên H100; tốt cho training fault-tolerant.

Toggle chi phí điện

Cộng tiền điện theo $/kWh × TDP. Quan trọng cho tính break-even self-host.

Lọc GPU đủ VRAM

Tool đánh dấu GPU không fit model — Llama 4 70B FP16 cần 140GB, H100 (80GB) không vừa.

Theo giờ + tháng

Nhập utilization dự kiến để xem chi phí tháng thực, không chỉ giá niêm yết theo giờ.

Reserved discount

Đã gồm pricing reserved 1 năm của AWS, GCP, Azure. Tiết kiệm 30–40% so với on-demand.

So sánh nhanh

Giá H100 80GB theo giờ trên các provider chính

ProviderSpot / CommunityOn-DemandGhi chú
Vast.ai$1.85$2.20Marketplace community; độ tin cậy biến động
RunPod Community$2.49Container bare; tốt cho training
Lambda Labs$2.49$2.99Tin cậy; DX tốt
RunPod Secure$3.99SOC 2; production-grade
CoreWeave$3.50DC cao cấp; có reserved discount
GCP$4.40$5.50A3 instance; full GCP stack
AWS$4.91$5.45p5.48xlarge per-GPU; full AWS
Azure$7.20NC H100 v5; enterprise focus

Cách dùng calculator

Tìm GPU thuê rẻ nhất cho workload AI trên 12 cloud provider.

  1. 1

    Chọn GPU + model

    Chọn H100, H200, A100, hoặc RTX 5090. Tool tự đánh dấu cặp GPU/model thiếu VRAM.

  2. 2

    Đặt số giờ utilization

    Nhập số giờ utilization/tháng (160h part-time, 730h 24/7).

  3. 3

    Chọn tier giá

    Toggle spot vs on-demand. Spot tiết kiệm 50–70% nếu workload chịu được preempt.

  4. 4

    Thêm chi phí điện (tùy chọn)

    Cho so sánh self-host, bật power-cost với mức kWh tại địa phương.

Vì sao nên dùng calculator này

  • 12 GPU cloud, refresh hàng tháng
  • Giá spot + on-demand + reserved
  • Tính được chi phí điện
  • Kiểm tra VRAM tự động
  • Có cả provider community open
  • Không cần đăng nhập

Câu hỏi thường gặp

H100 thuê bao nhiêu một giờ 2026?+
H100 80GB từ $1.85/giờ trên spot (Vast.ai, provider community) đến $2.49/giờ trên RunPod community, $3.99/giờ RunPod Secure Cloud, $4.50–$7.20/giờ trên AWS, GCP, Azure on-demand. Reserved 1 năm trên hyperscaler cắt còn $3.10–$3.50/giờ.
RunPod có rẻ hơn AWS cho GPU không?+
Có — thường rẻ 40–60% cho H100 và A100. RunPod community $2.49/giờ H100; AWS p5.48xlarge $4.91/giờ mỗi H100 tương đương. Đánh đổi: AWS có sẵn VPC, IAM, S3 integration; RunPod chỉ là container bare. Cho training hoặc stateless inference, RunPod thắng. Workload regulated thì hyperscaler vẫn thắng.
Spot vs on-demand GPU pricing khác nhau sao?+
Spot tiết kiệm 50–70% nhưng instance có thể bị preempt bất cứ lúc nào. Tốt cho training fault-tolerant (checkpoint mỗi 10 phút) và batch inference. Tránh cho production serving hoặc training run critical không có chiến lược checkpoint.
Calculator này có tính tiền điện cho GPU self-host không?+
Có — toggle "include power cost" để cộng tiền điện theo $/kWh × TDP của GPU. H100 ở 700W với $0.12/kWh tốn khoảng $61/tháng tiền điện chạy 24/7. Thường bị quên trong tính break-even self-host.
Khi nào mua GPU thắng thuê?+
Với H100 capex $30,000 và giá cloud $2.50/giờ, break-even ~12,000 giờ utilization — khoảng 16 tháng dùng 24/7. Cộng điện, làm mát, colo datacenter. Phần lớn team underutilize GPU đã mua và thua. Thuê trừ khi có utilization steady-state 80%+.
Có thể chạy open-weight 70B trên một GPU không?+
Model 70B trong FP16 cần ~140GB VRAM — một H100 (80GB) không vừa. Dùng 2× H100, 1× H200 (141GB), hoặc quantize int4 để vừa một GPU 80GB. Calculator đánh dấu cặp GPU + model thiếu VRAM.