Le vrai cout d'un AI SaaS en 2026 — Analyse complete de l'infrastructure

16 juin 2026 · 13 min de lecture · Blog APICalculators

Tout le monde parle du potentiel des AI SaaS. Personne ne parle du cout reel de leur exploitation. Ce guide fournit de vrais chiffres mensuels pour chaque couche d'infrastructure majeure — API LLM, bases de donnees vectorielles, authentification, hebergement, traitement des paiements et fonctions serverless — a trois echelles de production : Startup (1 000 utilisateurs), Croissance (10 000 utilisateurs) et Scale (100 000 utilisateurs).

Tous les prix proviennent de la documentation officielle des fournisseurs en juin 2026. Notre modele d'application : un AI SaaS ou les utilisateurs envoient 5 requetes par jour actif, chacune necessitant un appel LLM (500 tokens de prompt + 300 tokens de sortie) et une recherche de similarite vectorielle. Modele de revenus : 3% de conversion vers des plans a 29$/mois.

En bref : Un AI SaaS leger a 1 000 utilisateurs coute 51–143 USD/mois. A 10 000 utilisateurs : 432–1 313 USD/mois. A 100 000 utilisateurs : 4 201–14 488 USD/mois. La difference 3x entre le stack budget et premium vient presque entierement de trois decisions : le choix du modele, le fournisseur d'auth et le mode de deploiement de la base vectorielle.

1. Couts des API LLM

Les depenses en API LLM constituent le poste de cout le plus important et le plus variable de tout AI SaaS. Le modele choisi cree un multiplicateur de cout de 15x entre l'option la moins chere et la plus performante. A l'echelle, cette seule decision determine si l'infrastructure est rentable ou insoutenable.

EchelleUtilisateurs actifs/jourRequetes mensuellesGPT-5.4 nano (0,20$/1M)Claude Sonnet 4.6 (3,00$/1M)
Startup (1K)10015 0007$/mois90$/mois
Croissance (10K)1 000150 00071$/mois900$/mois
Scale (100K)10 0001 500 000713$/mois9 000$/mois

L'approche intelligente : Router 80% des requetes vers GPT-5.4 nano (recuperation simple, formatage, reponses FAQ) et 20% vers Sonnet 4.6 (raisonnement complexe, generation de code, analyse). A l'echelle Scale, cette approche mixte coute environ 1 942$/mois — 78% moins cher que tout-Sonnet 4.6, avec un impact minimal sur la qualite des requetes routinieres.

Modelisez vos ratios de tokens avec le calculateur de couts API LLM.

2. Couts des bases de donnees vectorielles

Les bases de donnees vectorielles stockent et interrogent la base de connaissances de votre IA. Le cout augmente avec le nombre de vecteurs (taille du corpus) et le volume de requetes. Nous estimons la taille du corpus proportionnelle au nombre d'utilisateurs : 1K → 1M vecteurs, 10K → 5M, 100K → 50M (1 536 dimensions, format OpenAI text-embedding-3-small).

EchelleVecteursPinecone ServerlessQdrant auto-heberge (Hetzner)
Startup (1K)1M~4$/mois5$/mois (CX22)
Croissance (10K)5M~15$/mois9$/mois (CX32)
Scale (100K)50M~100$/mois20$/mois (CX42)

Hetzner CX42 (8 vCPU, 16 Go RAM, 19,90$/mois) gere 50M vecteurs sans frais par requete. La configuration de Qdrant avec Docker Compose prend moins de 2 heures. Comparez toutes les options avec le calculateur de couts de bases vectorielles.

3. Couts d'authentification

L'authentification est la source la plus courante de mauvaises surprises de cout d'infrastructure. Le tier gratuit de Clerk est genereux jusqu'a 10 000 MAU — mais le saut a l'echelle est dramatique. Supabase Auth est gratuit jusqu'a 50 000 MAU, et le plan Pro inclut 100 000 MAU pour un tarif fixe de 25$/mois.

EchelleMAUClerkSupabase Auth
Startup (1K)1 0000$ (gratuit <10K)0$ (gratuit <50K)
Croissance (10K)10 00025$/mois (Pro, 10K inclus)0$ (gratuit <50K)
Scale (100K)100 0001 825$/mois (25$+90K×0,02$)25$/mois (Pro)

A 100 000 MAU, Supabase Auth est 73 fois moins cher que Clerk. Conseil : planifiez la migration vers Supabase avant d'atteindre 10K MAU, pas apres 50K MAU quand la pression et le risque de migration sont bien plus eleves. Modelisez votre trajectoire MAU avec le calculateur de couts d'auth.

4. Couts d'hebergement

Pour un AI SaaS qui traite des requetes HTTP, un VPS ou une plateforme de conteneurs est le standard. Nous comparons Hetzner Cloud (fournisseur europeen avec un excellent rapport qualite/prix) avec AWS EC2 (le choix enterprise par defaut).

EchelleHetzner CloudAWS EC2 (equivalent)
Startup (1K)4,50$/mois (CX22, 2 vCPU, 4 Go)15$/mois (t3.small)
Croissance (10K)8,80$/mois (CX32, 4 vCPU, 8 Go)30$/mois (t3.medium)
Scale (100K)19,90$/mois (CX42, 8 vCPU, 16 Go)120$/mois (t3.xlarge)

Hetzner offre un rapport qualite/prix 3 a 6 fois superieur a AWS EC2 pour les charges de travail de serveurs web. Les datacenters de Hetzner en Allemagne et en Finlande offrent une faible latence vers les utilisateurs europeens. Pour les startups francaises cherchant a optimiser les couts tout en restant proches de leurs donnees en Europe, Hetzner est le choix evident. Comparez avec le comparateur de VPS cloud.

5. Couts de traitement des paiements

Les frais de traitement des paiements s'adaptent directement aux revenus. Calcul base sur notre modele : 3% de conversion vers 29$/mois. Startup : 30 payants × 29$ = 870$ MRR. Croissance : 300 × 29$ = 8 700$ MRR. Scale : 3 000 × 29$ = 87 000$ MRR.

EchelleRevenusStripe (2,9% + 0,30$)Paddle (5,0% + 0,50$)
Startup (1K)870$34$/mois58$/mois
Croissance (10K)8 700$342$/mois585$/mois
Scale (100K)87 000$3 423$/mois5 850$/mois

Pour les AI SaaS français vendant dans toute l'Europe, Paddle comme Merchant of Record est particulierement pertinent : il gere automatiquement la TVA europeenne, les declarations fiscales et la conformite dans chaque pays de l'UE. La prime de 2,1% peut valoir la peine quand on prend en compte les couts d'expert-comptable, les declarations de TVA dans plusieurs pays de l'UE et les risques d'audit. Calculez votre seuil de rentabilite avec le calculateur de frais de paiement.

6. Couts des fonctions serverless

EchelleInvocations mensuellesAWS LambdaCloudflare Workers
Startup (1K)30K<1$/mois (tier gratuit)0$ (tier gratuit)
Croissance (10K)300K~1$/mois0$ (tier gratuit)
Scale (100K)3M~20$/mois5$/mois (plan paye)

Les couts serverless sont negligeables par rapport aux depenses LLM et auth a toutes les echelles dans ce modele. Comparez les configurations avec le calculateur de couts serverless.

7. Recapitulatif des couts mensuels totaux

Deux stacks : Budget — GPT-5.4 nano, Qdrant auto-heberge sur Hetzner, Supabase Auth, Hetzner VPS, Stripe, AWS Lambda. Premium — Claude Sonnet 4.6, Pinecone Serverless, Clerk, AWS EC2, Stripe, Lambda.

ComposantStartup BudgetStartup PremiumCroissance BudgetCroissance PremiumScale BudgetScale Premium
API LLM7$90$71$900$713$9 000$
Base vectorielle5$4$9$15$20$100$
Auth0$0$0$25$25$1 825$
Hebergement5$15$9$30$20$120$
Paiements34$34$342$342$3 423$3 423$
Serverless<1$<1$1$1$20$20$
TOTAL / MOIS51$143$432$1 313$4 201$14 488$

Note : les frais de paiement ne sont pas un cout pur — ils representent un pourcentage des revenus. A l'echelle Scale, les 3 423$ verses a Stripe proviennent de 87 000$ de MRR. Le cout net d'infrastructure (hors frais de paiement) sur le stack budget a 100K utilisateurs est de 778$/mois — environ 0,9% du MRR. C'est une economie unitaire tres saine.

8. Comment reduire la facture de moitie

La difference de cout total entre stack budget et premium vient de trois decisions. Voici les quatre optimisations au ROI le plus eleve, classees par impact :

1. Tiering de modeles — economie de 60 a 90% sur les couts LLM. Auditez vos types de requetes. La plupart des charges AI SaaS se repartissent ainsi : 70% augmentation de recuperation (modele nano suffisant), 20% synthese/formatage (modele mini suffisant), 10% raisonnement complexe (modele frontier necessaire). Implementez un classificateur qui route vers le modele le moins cher capable de traiter la tache. Cela seul reduit les couts LLM de 9 000$/mois a moins de 2 000$/mois a l'echelle Scale.

2. Changer de fournisseur d'auth avant la limite — economie de 1 800$/mois a 100K utilisateurs. La migration de Clerk vers Supabase prend 3 a 5 jours de travail d'ingenierie. Faites-le avant 10K MAU, pas apres 50K MAU quand la pression est deja presente et que les risques de migration sont plus eleves. Chaque mois passe sur Clerk au-dela de 10K MAU coute 0,02$ par utilisateur supplementaire.

3. Auto-heberger votre base vectorielle — economie de 80 a 200$/mois. Qdrant sur un Hetzner CX42 (20$/mois) gere 50M vecteurs. La configuration necessite un fichier Docker Compose et une tache cron de sauvegarde hebdomadaire. Si votre equipe gere deja des services conteneurises, c'est une configuration de 2 heures avec une reduction de cout de plus de 80%.

4. Activer le prompt caching pour les contextes repetes — economie de 40 a 90% sur les tokens en cache. Si votre prompt systeme est important (500+ tokens) et que votre application traite plusieurs messages consecutifs par session utilisateur, le prompt caching d'Anthropic (tokens caches factures a 90% de reduction apres le premier appel) peut reduire considerablement les couts LLM par session. Pour les applications de type chatbot avec des conversations multi-tours, c'est souvent l'optimisation LLM au meilleur ROI apres le tiering de modeles.

Questions frequentes

Combien coute un AI SaaS a 1 000 utilisateurs ?+

Un AI SaaS leger a 1 000 utilisateurs coute environ 51 a 143 USD/mois. GPT-5.4 nano maintient les couts LLM sous 10$/mois ; Claude Sonnet 4.6 les porte a 90$/mois. L'hebergement (Hetzner 4,50$), l'auth (Supabase Auth gratuit jusqu'a 50K MAU) et le serverless (quasi gratuit a ce volume) ajoutent des couts minimaux.

Quel est le principal poste de depense d'un AI SaaS ?+

Les couts d'API LLM dominent a toutes les echelles avec 60 a 80% des depenses d'infrastructure. Le choix du modele cree un multiplicateur de 15x. A 100K utilisateurs, la seule ligne LLM varie de 713$/mois a 9 000$/mois. Le deuxieme poste surprise a l'echelle est Clerk Auth : 1 825$/mois a 100K MAU.

Pinecone ou Qdrant auto-heberge — lequel est moins cher ?+

Qdrant auto-heberge sur Hetzner est significativement moins cher a chaque echelle. A 100K utilisateurs (50M vecteurs), Pinecone coute environ 100$/mois. Qdrant sur Hetzner CX42 (19,90$/mois) gere la meme charge sans frais par requete. La mise en place avec Docker Compose prend moins de 2 heures.

Clerk ou Supabase Auth — que choisir ?+

Supabase Auth gagne clairement sur le cout. A 100 000 MAU, Clerk coute 1 825$/mois ; Supabase Auth Pro coute 25$/mois pour jusqu'a 100K MAU — 73 fois moins cher. Choisissez Clerk uniquement pour ses composants d'interface React/Next.js preconçus en restant sous 10K MAU.

Stripe ou Paddle pour un AI SaaS en France ?+

Pour des ventes franco-françaises ou B2B, Stripe (2,9% + 0,30$) est moins cher. Pour des produits grand public europeens avec TVA communautaire, Paddle comme Merchant of Record gere automatiquement toute la conformite fiscale europeenne. A 10 000 euros de MRR, Paddle coute environ 210 euros de plus par mois que Stripe.

Comment reduire de moitie ma facture d'infrastructure AI SaaS ?+

Les quatre optimisations a plus fort ROI : (1) Router 80% des requetes vers des modeles nano/mini — economie de 60 a 90% sur les couts LLM. (2) Migrer vers Supabase Auth avant 10K MAU — economie de 1 800$/mois a 100K utilisateurs. (3) Auto-heberger Qdrant sur Hetzner — economie de 80 a 200$/mois. (4) Activer le prompt caching — economie de 40 a 90% sur les tokens en cache. Ensemble : reduction de 50 a 70% du cout total.