H100-Cloud-Vergleich · April 2026

Beste H100-Cloud-Anbieter 2026

Q: Wie viele H100s brauche ich, um Llama-3 70B zu fine-tunen?

Volles Fine-Tuning: 8× H100 (ein DGX-Equivalent-Knoten) für ~12-24 Stunden pro Epoche bei 100K Samples. Für QLoRA: 1× H100 80GB reicht für ~6-8 Stunden. CoreWeave und Lambda Labs sind am besten für Multi-Node-H100-Jobs (InfiniBand).

Q: H100 SXM vs. PCIe — wo ist der Unterschied?

H100 SXM (CoreWeave, AWS p5, GCP A3) hat NVLink bis 900 GB/s für Multi-GPU-Jobs, während H100 PCIe (RunPod, Lambda) auf PCIe Gen5 ~128 GB/s begrenzt ist, dafür ~10-15 % günstiger. SXM ist essenziell für ≥4-GPU-Training, PCIe reicht für Single-GPU-Inferenz und ≤2-GPU-Training.

Wo man tatsächlich H100-Kapazität bekommt — 16 Clouds verglichen nach On-Demand-Preis, Verfügbarkeit und Cluster-Größe. Ab 1,99 $/h.

Der H100-Markt im April 2026

Die NVIDIA H100 ist 2026 der dominante Beschleuniger für ernsthaftes LLM-Training und High-Throughput-Inferenz. Verglichen mit der A100 liefert sie ~3× FP16- und ~6× FP8-Durchsatz dank Transformer Engine — aber nicht die Leistung ist der Engpass, sondern die Verfügbarkeit.

Bei den 16 GPU-Clouds mit On-Demand-H100s reichen die Stundenpreise von 1,99 $/h bis 4,10 $/h für identische Hardware. Die Wahl ist selten nur eine Preisfrage — sondern wo du gerade tatsächlich H100-Kapazität bekommst.

Spezialisierte Clouds gewinnen beim Preis. RunPod, Lambda Labs und CoreWeave dominieren On-Demand-H100-Verfügbarkeit und kosten 40–60 % weniger als AWS p5 / GCP A3 / Azure NDA100 v5 bei gleicher Rechenleistung.

Anbieter	Startpreis	Top-GPUs	Stärken	Bewertung	CTA
V Vast.ai Editor's Choice	ab 0,10 $/h	RTX 3090, RTX 4090, A100 ≤80GB	Absolut günstigste verfügbare GPU-Compute Größte GPU-Auswahl inklusive Consumer-Karten	★★★★☆ 4.1	Zu den Preisen
H Hyperstack	ab 0,11 $/h	RTX A6000, A100 80GB, H100 ≤80GB	Hervorragende Einsteigerpreise für A6000 Vollständiger Networking-Stack (VPC, Firewall, NAT)	★★★★☆ 4.3	Zu den Preisen
R RunPod Editor's Choice	ab 0,20 $/h	RTX 3090, RTX 4090, A100 80GB ≤80GB	Günstigste Community-GPUs ab 0,20 $/h Riesige GPU-Auswahl inklusive H100	★★★★★ 4.6	Zu den Preisen
T TensorDock	ab 0,21 $/h	RTX 4090, RTX 3090, A100 80GB ≤80GB	Mit dem günstigsten H100-Zugang 2026 Großes Host-Netzwerk = bessere Verfügbarkeit	★★★★☆ 4.2	Zu den Preisen
M Massed Compute	ab 0,35 $/h	RTX A6000, A40, A100 80GB ≤80GB	Starkes A6000-/A40-Angebot zum moderaten Preis Vorgefertigte VFX- und KI-Templates	★★★★☆ 4.1	Zu den Preisen
J Jarvis Labs	ab 0,39 $/h	RTX 6000 Ada, A100 40GB, A100 80GB ≤80GB	Hervorragende Preise für H100 RTX 6000 Ada — 48 GB zum moderaten Preis	★★★★☆ 4.3	Zu den Preisen
L Lyceum Editor's Choice	ab 0,39 $/h	A100 80GB, H100, H200 ≤141GB	Starke EU-Datenresidenz (kein US-Transit) H200-Verfügbarkeit in Europa	★★★★☆ 4.2	Zu den Preisen
C Crusoe	ab 0,40 $/h	H100, H200, B200 ≤192GB	Mit am günstigsten für H200-Zugang — ab 2,10 $/h B200 verfügbar, während andere Clouds Wartelisten haben	★★★★☆ 4.4	Zu den Preisen
Scaleway	ab €0,83/h	L4, L40S, H100 ≤80GB	Starke EU-Präsenz (Paris + Amsterdam) Reife Cloud-Plattform (S3, k8s, Networking)	★★★★☆ 4.0	Zu den Preisen
λ Lambda Labs Editor's Choice	ab 1,10 $/h	A100 40GB, A100 80GB, H100 ≤80GB	Zuverlässige On-Demand-H100-Verfügbarkeit Kein komplexes Setup — SSH binnen Sekunden	★★★★★ 4.5	Zu den Preisen
T Together AI	ab 1,49 $/h	H100, H200, A100 80GB ≤141GB	Erstklassige Inferenz-Performance Exzellente Open-Source-Modell-Abdeckung	★★★★☆ 4.4	Zu den Preisen
N Nebius Editor's Choice	ab 1,55 $/h	H100, H200, B200 ≤192GB	Starke EU-Datenresidenz — perfekt für DE/EU-Enterprise Moderne Hardware inklusive B200 SXM	★★★★★ 4.5	Zu den Preisen
C CoreWeave	ab 2,06 $/h	H100 SXM, A100 SXM, A40 ≤80GB	Beste Multi-Node-GPU-Cluster-Performance Schnelle InfiniBand-Verbindungen	★★★★☆ 4.4	Zu den Preisen
Google Cloud GPU	ab 2,48 $/h	A100 40GB, A100 80GB, H100 ≤80GB	Beste TPU-Verfügbarkeit für TF-Workloads Tiefe Vertex-AI- und BigQuery-Integration	★★★★☆ 4.3	Zu den Preisen
Azure GPU (NCv3/NDA)	ab 2,94 $/h	A100, H100, V100 ≤80GB	Tiefe OpenAI- und Azure-OpenAI-Integration Beste Wahl für Microsoft-Stack-Unternehmen	★★★★☆ 4.1	Zu den Preisen
AWS GPU (EC2)	ab 3,06 $/h	A100, H100, V100 ≤80GB	Umfassendste ML-Toolchain (SageMaker) Spot-Instanzen für massive Kostenersparnis	★★★★☆ 4.2	Zu den Preisen

Vast.ai

Günstigster GPU-Cloud — Peer-to-Peer-Marktplatz für Budget-Training

ab 0,10 $/h ★ 4.1

Absolut günstigste verfügbare GPU-Compute
Größte GPU-Auswahl inklusive Consumer-Karten

Zu den Preisen →

Preis aktuell?

Hyperstack

Globaler GPU-Cloud-Spezialist — H100, A100 80GB und L40 ab 0,11 $/h

ab 0,11 $/h ★ 4.3

Hervorragende Einsteigerpreise für A6000
Vollständiger Networking-Stack (VPC, Firewall, NAT)

Zu den Preisen →

Preis aktuell?

RunPod

Beste Preis-Leistung — riesige Auswahl, Community- und Secure-Cloud

ab 0,20 $/h ★ 4.6

Günstigste Community-GPUs ab 0,20 $/h
Riesige GPU-Auswahl inklusive H100

Zu den Preisen →

Preis aktuell?

TensorDock

GPU-Cloud-Marktplatz — RTX 4090 ab 0,21 $/h, H100 ab 1,99 $/h

ab 0,21 $/h ★ 4.2

Mit dem günstigsten H100-Zugang 2026
Großes Host-Netzwerk = bessere Verfügbarkeit

Zu den Preisen →

Preis aktuell?

Massed Compute

Workstation-Grade-GPUs für KI/ML/VFX — A100 ab 1,79 $/h

ab 0,35 $/h ★ 4.1

Starkes A6000-/A40-Angebot zum moderaten Preis
Vorgefertigte VFX- und KI-Templates

Zu den Preisen →

Preis aktuell?

Jarvis Labs

On-Demand H100 / A100 / RTX 6000 Ada ab 0,39 $/h

ab 0,39 $/h ★ 4.3

Hervorragende Preise für H100
RTX 6000 Ada — 48 GB zum moderaten Preis

Zu den Preisen →

Preis aktuell?

Häufige Fragen

Welche Cloud hat 2026 die günstigste H100? +

RunPod Secure Cloud bei 1,99 $/h ist die günstigste On-Demand-H100-80GB. RunPod Community kann günstiger sein, ist aber unterbrechbar. Für Reservierungen / Langzeit-Verträge können Lambda Labs und CoreWeave deutlich unter dem 1,99 $/h-Preis anbieten.

Warum sind H100s auf AWS oft nicht verfügbar? +

AWS p5 (8× H100) ist auf wenige Regionen konzentriert (us-east-1, us-west-2, eu-west-1) und stark von Enterprise-Kunden reserviert. On-Demand-Engpässe sind während der US-Geschäftszeiten üblich. Spezialisierte Clouds wie RunPod und CoreWeave haben größere freie Kontingente.

H100 vs. A100 — was sollte ich mieten? +

Für Llama-3-70B-Fine-Tuning oder großes Training ist H100 2–3× schneller und trotz höherem Stundenpreis oft günstiger pro Trainingslauf. Für Inferenz von <13B-Modellen oder Forschungsworkloads ist die A100 80GB kosteneffizienter.

Wie viele H100s brauche ich, um Llama-3 70B zu fine-tunen? +

Volles Fine-Tuning: 8× H100 (ein DGX-Equivalent-Knoten) für ~12-24 Stunden pro Epoche bei 100K Samples. Für QLoRA: 1× H100 80GB reicht für ~6-8 Stunden. CoreWeave und Lambda Labs sind am besten für Multi-Node-H100-Jobs (InfiniBand).

H100 SXM vs. PCIe — wo ist der Unterschied? +

H100 SXM (CoreWeave, AWS p5, GCP A3) hat NVLink bis 900 GB/s für Multi-GPU-Jobs, während H100 PCIe (RunPod, Lambda) auf PCIe Gen5 ~128 GB/s begrenzt ist, dafür ~10-15 % günstiger. SXM ist essenziell für ≥4-GPU-Training, PCIe reicht für Single-GPU-Inferenz und ≤2-GPU-Training.

Beste H100-Cloud-Anbieter 2026

Der H100-Markt im April 2026

Vast.ai

Hyperstack

RunPod

TensorDock

Massed Compute

Jarvis Labs

Häufige Fragen

Benachrichtigung bei Preisänderungen

Verwandte Vergleiche