STT & TTS API Kosten 2026: Whisper vs ElevenLabs vs Google Speech
Voice-KI verursacht bei hohem Volumen erhebliche Kosten. 10.000 Audiostunden mit Whisper zu transkribieren kostet 3.600 $ — mit Google STT Standard 14.400 $. Der 4×-Unterschied ist relevant. Dieser Leitfaden schlüsselt alle wichtigen STT- und TTS-API-Preise für 2026 auf.
Wie STT- und TTS-Preisgestaltung funktioniert
STT-APIs berechnen pro verarbeiteter Audio-Minute. TTS-APIs berechnen pro 1.000 synthetisierten Zeichen. Whisper hat kein kostenloses Kontingent per API. Google Cloud STT bietet 60 Minuten kostenlos pro Monat.
STT API Preisvergleich 2026
| Anbieter | Preis / Min. | Freikontingent | Beste für |
|---|---|---|---|
| Deepgram Nova-2 | 0,0043 $ | 200 Min. | Echtzeit, Genauigkeit |
| OpenAI Whisper | 0,006 $ | Keins | Batch-Transkription |
| Google STT Standard | 0,024 $ | 60 Min./Mo. | GCP-Ökosystem |
| AWS Transcribe | 0,024 $ | 60 Min./Mo. | AWS-Ökosystem |
TTS API Preisvergleich 2026
| Anbieter | Preis / 1M Zeichen | Sprachqualität | Beste für |
|---|---|---|---|
| Google TTS Standard | 16 $ | Gut | Hohe Volumen |
| OpenAI TTS Standard | 15 $ | Ausgezeichnet | Natürliche Stimme |
| OpenAI TTS HD | 30 $ | Studio | Podcasts, Premium |
| ElevenLabs Starter | 330 $ | Geklonte Stimmen | Stimmklonen |
Reale Kosten: 10.000 Audiostunden / Monat
| STT-Anbieter | 1K Std. | 10K Std. | 100K Std. |
|---|---|---|---|
| Deepgram Nova-2 | 258 $ | 2.580 $ | 25.800 $ |
| OpenAI Whisper | 360 $ | 3.600 $ | 36.000 $ |
| Google STT | 1.440 $ | 14.400 $ | 144.000 $ |
Wann ElevenLabs vs OpenAI TTS wählen?
ElevenLabs (330 $/1M Zeichen) ist 22× teurer als OpenAI TTS Standard (15 $/1M Zeichen). ElevenLabs bietet Stimmklonen, benutzerdefinierte Stile und emotionale Kontrolle. OpenAI TTS für App-Benachrichtigungen, IVR und hohes Volumen.
Häufige Fragen
Was kostet die Whisper API?
OpenAI Whisper API kostet 0,006 $ pro Audio-Minute (0,36 $/Stunde). Kein Freikontingent. Für 10.000 Audiostunden: 3.600 $.
Ist ElevenLabs günstiger als Google TTS?
Nein — ElevenLabs Starter kostet 330 $/1M Zeichen vs Google TTS Standard 16 $/1M. ElevenLabs ist 20× teurer, bietet aber Stimmklonen.
Welche STT-API ist am günstigsten?
Deepgram Nova-2 bei 0,0043 $/Min. ist derzeit die günstigste qualitativ hochwertige STT-API — 30% günstiger als Whisper.
Kostenlose Entwickler-Kostenrechner. Preise monatlich geprüft.