Question 1

Welche GPU-Instanzen bietet AWS an?

Accepted Answer

AWS bietet eine umfassende Auswahl an GPU-Instanzfamilien an. Die g4dn-Familie nutzt NVIDIA T4 GPUs für kosteneffiziente Inferenz. Die p3-Familie verwendet V100 (älter, aber weit verbreitet). Die p4d-Familie nutzt A100-40-GB-GPUs in 8-GPU-Konfigurationen mit NVSwitch-Verbindungen. Die p5-Familie bietet H100-80-GB in 8-GPU-Konfigurationen mit EFA-Netzwerk. Für verwaltetes ML verwendet SageMaker dieselbe Hardware mit zusätzlichem Orchestrierungs-Overhead.

Question 2

Wie viel können AWS Spot-Instanzen für GPU-Compute einsparen?

Accepted Answer

AWS Spot-Instanzen für GPU-Workloads sparen typischerweise 60–90 % gegenüber On-Demand-Preisen. Eine T4 g4dn-Instanz sinkt von 0,526 $/h auf etwa 0,16 $/h auf Spot. A100-8-GPU-p4d-Instanzen fallen von 32,77 $/h auf unter 10 $/h auf Spot. H100-p5-Instanzen haben Spot-Ersparnisse, die je nach Region und Nachfrage variieren. Der Haken: Spot-Instanzen können mit 2 Minuten Vorwarnung unterbrochen werden. Verwende immer checkpoint-basiertes Training mit Spot-GPU-Instanzen.

Question 3

Was ist SageMaker und wann sollte ich es verwenden?

Accepted Answer

AWS SageMaker ist ein vollständig verwalteter ML-Service, der Training, Modell-Registry, Deployment und Monitoring auf AWS-Infrastruktur abdeckt. Er fügt etwa 15–20 % Kosten-Overhead über rohen EC2-GPU-Preisen hinzu, nimmt aber erheblichen Betriebsaufwand ab: automatisches GPU-Instanz-Provisioning, Distributed-Training-Job-Management, Modell-Artefakt-Speicherung und verwaltete Inferenz-Endpunkte. SageMaker ist für Enterprise-MLOps-Teams richtig, die Produktions-Pipelines aufbauen. Für Forscher oder Entwickler, die einfache GPU-Miete wollen, sind direkte EC2-GPU-Instanzen oder RunPod bessere Optionen.

Question 4

Wie vergleicht sich AWS mit CoreWeave für Large-Scale-Training?

Accepted Answer

Für reine GPU-zu-GPU-Trainings-Performance bei großen Distributed-Jobs übertrifft CoreWeave AWS oft. CoreWeave nutzt InfiniBand-Netzwerk mit 400 Gb/s; AWS p4d und p5 verwenden EFA (Elastic Fabric Adapter), das wettbewerbsfähig, aber nicht identisch ist. CoreWeave H100-SXM-Reserved-Preise sind auch günstiger als AWS p5 On-Demand. Jedoch gewinnt AWS bei Ökosystem-Breite, Compliance-Zertifikaten, geografischer Verfügbarkeit und SageMaker für verwaltetes Training.

Question 5

Ist AWS gut für Einsteiger?

Accepted Answer

AWS ist nicht einsteigerfreundlich für reine GPU-Miete. Das IAM-Berechtigungssystem, VPC-Netzwerk, EC2-Instanzkonfiguration und EBS-Speicherverwaltung erfordern erhebliches Lernen. Das Einrichten einer GPU-Instanz auf AWS beinhaltet das Erstellen einer VPC, das Konfigurieren von Sicherheitsgruppen, das Wählen des richtigen AMI und das Verwalten von EBS-Volumes. Für Lernen und Experimente sind RunPod, Paperspace oder Google Colab drastisch einfacher. Starte mit AWS, wenn dein Team Enterprise-SLAs, Compliance oder SageMaker-Pipelines benötigt.

GPU	VRAM	On-Demand	Spot-Schätzung	Ideal für
g4dn.xlarge (T4)	16 GB	0,526 $/h	~0,16 $/h	Inferenz, Dev
p3.2xlarge (V100)	16 GB	3,06 $/h	~0,92 $/h	Training
p4d.24xlarge (A100 ×8)	320 GB	32,77 $/h	~9,83 $/h	Distributed Training
p5.48xlarge (H100 ×8)	640 GB	98,32 $/h	~29,50 $/h	Foundation-Modelle
SageMaker p4d	320 GB	37,69 $/h	~11 $/h	Verwaltetes ML

AWS GPU Test 2026

Was ist AWS GPU (EC2)?

SageMaker – Die AWS ML-Plattform

AWS GPU Preise (April 2026)

AWS GPU Vor- & Nachteile

Für wen ist AWS GPU geeignet?

AWS GPU Alternativen

Fazit

AWS GPU FAQ