Présentation
AWS Lambda est un service de calcul sans serveur qui vous permet d'exécuter du code sans allouer ni gérer de serveurs. Créez une logique de mise à l'échelle de cluster d'application déductive, conservez les intégrations d'événements et gérez les exécutions en toute simplicité. Avec Lambda, vous pouvez exécuter du code pour pratiquement tout type d'application ou de service backend, sans aucune tâche administrative. De plus, vous ne payez que ce que vous utilisez. Vous payez en fonction du nombre de demandes pour vos fonctions et pour la durée, c’est-à-dire le temps nécessaire à l’exécution de votre code.
Lambda compte une demande chaque fois qu'elle commence à s'exécuter en réponse à une déclencheur de notification d'événement - par exemple, à partir d'Amazon Simple Notification Service (SNS) ou Amazon EventBridge -, à une appel d'invocation, comme à partir d'Amazon API Gateway ou par le kit AWS SDK. Cela comprend également des invocations de test depuis la console AWS.
La durée est calculée à partir du moment où votre code commence à s’exécuter jusqu’à ce qu’il retourne ou à sa fin ; elle est arrondie à 1 ms près*. Le prix est fonction de la quantité de mémoire que vous allouez à votre fonction. Dans le modèle de ressources AWS Lambda, vous choisissez la quantité de mémoire que vous souhaitez pour votre fonction, puis la puissance CPU et les autres ressources sont attribuées en conséquence. Une augmentation de la taille de la mémoire entraîne une augmentation équivalente du nombre de processeurs disponibles pour votre fonction. Pour en savoir plus, consultez la documentation relative à la configuration des fonctions.
Vous pouvez exécuter vos fonctions Lambda sur des processeurs qui reposent sur des architectures x86 ou Arm. Les fonctions AWS Lambda qui s'exécutent sur Graviton2, à l'aide de l'architecture de processeurs basée sur Arm et conçue par AWS, fournissent jusqu'à 34 % de rapport prix/performances en plus par rapport aux fonctions qui s'exécutent sur des processeurs x86. Cela s'applique à une variété de charges de travail sans serveur, par exemple les backends web et mobiles, les données et le traitement multimédia.
* Les frais de durée s’appliquent au code qui s’exécute dans le gestionnaire d’une fonction et au code d’initialisation déclaré en dehors du gestionnaire. Pour les fonctions Lambda avec des extensions AWS Lambda, la durée inclut également le temps nécessaire à la dernière exécution du code pour terminer l’exécution durant la phase d’interruption. Pour les fonctions Lambda configurées avec SnapStart, la durée inclut également le temps nécessaire au chargement de l’environnement d’exécution, tout code exécuté dans un hook d’exécution et le code d’initialisation exécuté lors de la création de copies d’instantanés créées pour la résilience. Pour plus de détails, consultez la documentation Modèle de programmation Lambda.
Le niveau d’offre gratuite AWS Lambda comprend au total un million de demandes gratuites et 400 000 Go secondes de temps de calcul par mois, utilisables pour les fonctions à technologie de processeurs x86 et Graviton2, en agrégat. De plus, le niveau gratuit inclut 100 Go de streaming de réponse HTTP par mois, au-delà des 6 premiers Mo par demande, qui sont gratuits. Lambda propose également des options de tarification progressive pour la durée à la demande supérieure à certains seuils d'utilisation mensuelle. AWS Lambda fait partie des Compute Savings Plans, un modèle de tarification flexible qui permet une utilisation d'Amazon Elastic Compute Cloud (Amazon EC2), d'AWS Fargate et Lambda à prix avantageux en échange d'un engagement à une consommation régulière (mesurée en USD/heure) sur une période d'un ou trois ans. Avec les Compute Savings Plans, vous pouvez économiser jusqu'à 17 % sur AWS Lambda. Les Savings s'appliquent à la durée et à la simultanéité allouée. En savoir plus »
Calculateur de prix AWS
Calculez le coût de votre AWS Lambda et de votre architecture en une seule estimation.
Tarification AWS Lambda
Le coût de la durée est fonction de la quantité de mémoire que vous attribuez à votre fonction. Vous pouvez allouer n'importe quelle quantité de mémoire (entre 128 Mo et 10 240 Mo) à votre fonction, et ceci par tranches de 1 Mo. Le tableau ci-dessous contient quelques exemples du prix par ms associé à différentes tailles de mémoire, pour une utilisation dans les limites du premier niveau de tarification, par exemple jusqu'à 6 milliards de Go-secondes par mois dans la région USA Est (Ohio).
-
Prix x86
-
Prix (Arm)
-
Prix x86
-
Mémoire (Mo)
Tarif par 1 ms 128 {priceOf!lambda/lambda!Lambda!Duration!*!0.000125!decimals=10} 512 {priceOf!lambda/lambda!Lambda!Duration!*!0.0005!decimals=10} 1 024 {priceOf!lambda/lambda!Lambda!Duration!*!0.001!decimals=10} 1 536 {priceOf!lambda/lambda!Lambda!Duration!*!0.0015!decimals=10} 2 048 {priceOf!lambda/lambda!Lambda!Duration!*!0.002!decimals=10} 3 072 {priceOf!lambda/lambda!Lambda!Duration!*!0.003!decimals=10} 4 096 {priceOf!lambda/lambda!Lambda!Duration!*!0.004!decimals=10} 5 120 {priceOf!lambda/lambda!Lambda!Duration!*!0.005!decimals=10} 6 144 {priceOf!lambda/lambda!Lambda!Duration!*!0.006!decimals=10} 7 168 {priceOf!lambda/lambda!Lambda!Duration!*!0.007!decimals=10} 8 192 {priceOf!lambda/lambda!Lambda!Duration!*!0.008!decimals=10} 9 216 {priceOf!lambda/lambda!Lambda!Duration!*!0.009!decimals=10} " data-pricing-endpoint="https://b0.p.awsstatic.com/pricing/2.0/meteredUnitMaps" data-partition="aws" data-locale="fr-FR" data-token-component-type="native-react">10 240 {priceOf!lambda/lambda!Lambda!Duration!*!0.01!decimals=10} -
Prix (Arm)
-
Mémoire (Mo)
Tarif par 1 ms 128 {priceOf!lambda/lambda!Lambda!Duration-ARM!*!0.000125!decimals=10} 512 {priceOf!lambda/lambda!Lambda!Duration-ARM!*!0.0005!decimals=10} 1 024 {priceOf!lambda/lambda!Lambda!Duration-ARM!*!0.001!decimals=10} 1 536 {priceOf!lambda/lambda!Lambda!Duration-ARM!*!0.0015!decimals=10} 2 048 {priceOf!lambda/lambda!Lambda!Duration-ARM!*!0.002!decimals=10} 3 072 {priceOf!lambda/lambda!Lambda!Duration-ARM!*!0.003!decimals=10} 4 096 {priceOf!lambda/lambda!Lambda!Duration-ARM!*!0.004!decimals=10} 5 120 {priceOf!lambda/lambda!Lambda!Duration-ARM!*!0.005!decimals=10} 6 144 {priceOf!lambda/lambda!Lambda!Duration-ARM!*!0.006!decimals=10} 7 168 {priceOf!lambda/lambda!Lambda!Duration-ARM!*!0.007!decimals=10} 8 192 {priceOf!lambda/lambda!Lambda!Duration-ARM!*!0.008!decimals=10} 9 216 {priceOf!lambda/lambda!Lambda!Duration-ARM!*!0.009!decimals=10} " data-pricing-endpoint="https://b0.p.awsstatic.com/pricing/2.0/meteredUnitMaps" data-partition="aws" data-locale="fr-FR" data-token-component-type="native-react">10 240 {priceOf!lambda/lambda!Lambda!Duration-ARM!*!0.01!decimals=10}
Les niveaux de tarification de durée à la demande Lambda sont appliquées à la durée mensuelle regroupée des fonctions s'exécutant sur la même architecture (x86 ou Arm, respectivement), dans la même région, au sein du compte. Si vous faites appel à la facturation consolidée dans AWS Organizations, les niveaux de tarification sont appliqués à la durée mensuelle regroupée de vos fonctions s'exécutant sur la même architecture, dans la même région, sur les différents comptes au sein de l'organisation.
Tarification du stockage éphémère Lambda
Le coût du magasin éphémère dépend de la quantité de magasin éphémère que vous allouez à votre fonction et de la durée d’exécution de la fonction, mesurée en millisecondes. Vous pouvez allouer n’importe quelle quantité de stockage supplémentaire à votre fonction entre 512 Mo et 10 240 Mo, par incréments de 1 Mo. Vous pouvez configurer le magasin éphémère pour les fonctions exécutées aussi bien sur les architectures x86 et Arm. 512 Mo de magasin éphémère sont disponibles pour chaque fonction Lambda sans frais supplémentaires. Vous ne payez que pour le magasin éphémère supplémentaire que vous configurez.
Tous les exemples ci-dessous sont basés sur les prix de la région USA Est (Virginie du Nord).
-
Exemple 1 : Backend d'application mobile
Supposons que vous êtes un développeur d'application mobile et que vous voulez créer une application de commande de nourriture. Les clients peuvent utiliser l'appli pour commander de la nourriture depuis un emplacement de restaurant précis, recevoir des mises à jour de l'état de la commande et emporter leur commande une fois qu'elle est prête. Étant donné que vous prévoyez une hausse de la variation de la demande de votre application, en fonction du moment de la journée et de l'emplacement du restaurant, vous créez votre backend mobile à l'aide de services sans serveur, notamment AWS Lambda.Supposons que vous êtes un développeur d'application mobile et que vous voulez créer une application de commande de nourriture. Les clients peuvent utiliser l'appli pour commander de la nourriture depuis un emplacement de restaurant précis, recevoir des mises à jour de l'état de la commande et emporter leur commande une fois qu'elle est prête. Étant donné que vous prévoyez une hausse de la variation de la demande de votre application, en fonction du moment de la journée et de l'emplacement du restaurant, vous créez votre backend mobile à l'aide de services sans serveur, notamment AWS Lambda.Pour des besoins de simplicité, supposons que votre application traite trois millions de requêtes par mois. Dans ce cas, la durée moyenne d'exécution de la fonction est de 120 ms. Votre fonction est configurée avec 1 536 Mo de mémoire et sur un processeur basé sur x86. Vos frais seront calculés comme suit :
Frais de calcul mensuels
Le prix de calcul mensuel revient à 0,0000166667 USD par GO et l'offre gratuite fournit 400 000 GO.
Total pour le calcul (en secondes) = 3 millions x 120 ms = 360 000 secondes
Total pour le calcul (GO) = 360 000 x 1 536 Mo/1 024 Mo = 540 000 GO
Total pour le calcul – Valeur de l'offre gratuite pour le calcul = Valeur facturable pour le calcul par mois (en GO)
540 000 GO – 400 000 GO (offre gratuite) = 140 000 GO
Frais de calcul mensuels = 140 000 x 0,0000166667 USD = 2,33 USDFrais de demandes mensuelles
Le prix de demande mensuel est de 0,20 USD par million de demandes et l'offre gratuite offre un million de demandes par mois.
Nombre total de requêtes – Nombre de requêtes comprises dans l'offre gratuite = nombre de requêtes facturables par mois
3 millions de demandes – 1 million de demandes comprises dans l'offre gratuite = 2 millions de demandes facturables par mois
Frais de requêtes mensuels = 2 M * 0,2 USD/M = 0,40 USDFrais mensuels totaux
Frais totaux = Frais de calcul + Frais de demandes = 2,33 USD + 0,40 USD = 2,73 USD par mois
-
Exemple 2 : Enrichissement de la télémétrie de streaming avec des métadonnées supplémentaires
Imaginons que vous êtes une entreprise de logistique disposant d'une flotte de véhicules sur le terrain, dont chacun est doté de capteurs et d'une connectivité 4G/5G permettant d'émettre des données télémétriques à l'intérieur d'un flux de données Amazon Kinesis. Vous souhaitez utiliser des modèles de machine learning (ML) que vous avez développé pour inférer l'état du véhicule et prédire à quel moment une maintenance d'un composant en particulier est nécessaire.Imaginons que vous êtes une entreprise de logistique disposant d'une flotte de véhicules sur le terrain, dont chacun est doté de capteurs et d'une connectivité 4G/5G permettant d'émettre des données télémétriques à l'intérieur d'un flux de données Amazon Kinesis. Vous souhaitez utiliser des modèles de machine learning (ML) que vous avez développé pour inférer l'état du véhicule et prédire à quel moment une maintenance d'un composant en particulier est nécessaire.Supposons que vous possédez 10 000 véhicules sur le terrain et que chacun émette des données télémétriques une fois par heure de manière échelonnée avec suffisamment de gigue. Vous envisagez d'effectuer cette inférence sur chaque charge utile pour vous assurer que les véhicules sont immédiatement programmés pour la maintenance et ainsi garantir un état optimal de votre flotte de véhicules.
Supposons que le modèle ML comprend la fonction et que sa taille est de 512 Mo. Pour l'inférence, votre fonction est configurée avec 1 Go de mémoire et son exécution prend deux secondes en moyenne sur un processeur basé sur x86.
Frais de requêtes mensuels :
La fonction Lambda traite chaque mois 10 000 x 24 x 31 = 7 440 000 messages émis par les véhicules.Frais de requêtes mensuels → 7,44 M x 0,20 USD/M = 1,488 USD ~= 1,49 USD
Frais de calcul mensuels :
Les fonctions seront exécutées une fois par message toutes les deux secondes, et ce, une fois par mois.Durée mensuelle du calcul (secondes) → 7,44 millions x 2 secondes = 14,88 millions de secondes.
Calcul mensuel (GO) → 14,88 M de secondes x 1 024 Mo/1 024 Mo = 14,88 GO
Frais mensuels pour le calcul = 14,88 millions de GO x 0,0000166667 USD = 248 USDFrais mensuels totaux :
Frais mensuels pour le calcul = Frais de requête + Frais de calcul = 1,49 USD + 248 USD = 249,49 USD -
Exemple 3 : Du ML appliqué aux tickets de support client et aux interactions pour une meilleure expérience client
Supposons que vous êtes une société de services financiers qui veut mieux cerner les problèmes de son principal service client. Votre objectif est d'améliorer l'expérience client et réduire ainsi des pertes de clients. Vos clients peuvent échanger en temps réel avec votre support client au moyen de l'application mobile fournie à cet effet. Vous décidez de déployer un Modèle de traitement du langage naturel (NLP).Supposons que vous êtes une société de services financiers qui veut mieux cerner les problèmes de son principal service client. Votre objectif est d'améliorer l'expérience client et réduire ainsi des pertes de clients. Vos clients peuvent échanger en temps réel avec votre support client au moyen de l'application mobile fournie à cet effet. Vous décidez de déployer un Modèle de traitement du langage naturel (NLP).Dans ce cas, vous utilisez le modèle populaire BERT (Bidirectional Encoder Representations from Transformers) disponible dans AWS Lambda. Ce modèle vous aide à analyser et à comprendre les interactions du service client grâce à l'application mobile, de manière à afficher du contenu d'assistance pertinent ou à acheminer le client vers l'agent de service client approprié. Le nombre de demandes de support que votre modèle d'inférence traite varie largement pendant la semaine.
Supposons que les fonctions qui exécutent votre modèle d'inférence reçoivent six millions de demandes par mois. Dans ce cas, la durée moyenne d'exécution de la fonction est de 280 ms. Votre fonction est configurée avec 4096 Mo de mémoire et sur un processeur basé sur x86.
Vous configurez également votre fonction pour utiliser 2048 Mo de magasin éphémère.
Vos frais seront calculés comme suit :
Frais de calcul mensuels :
Le tarif de calcul mensuel revient à 0,0000166667 USD par Go-s et le niveau gratuit offre 400 000 Go-s.
Total pour le calcul (en secondes) = 6 M x 280 ms = 1 680 000 secondes
Total pour le calcul (GO) = 1 680 000 x 4096 Mo/1 024 Mo = 6 720 000 GO
Total pour le calcul – Valeur de l'offre gratuite AWS pour le calcul = Valeur facturable pour le calcul par mois (en GO)
6 720 000 GO – 400 000 GO (offre gratuite) = 6 320 000 GO
Frais de calcul mensuels = 6 320 000 x 0,0000166667 USD = 105,33 USDFrais de requêtes mensuels :
Le prix de requête mensuel est de 0,20 USD par million de requêtes et l'offre gratuite fournit un million de requêtes par mois.
Nombre total de requêtes – Nombre de requêtes comprises dans l'offre gratuite = nombre de requêtes facturables par mois
6 millions de requêtes – 1 million de requêtes comprises dans l'offre gratuite = 5 millions de requêtes facturables par mois
Frais de requête par mois = 5 millions x 0,2 USD/million = 1 USDCoût mensuel du magasin éphémère :
Le prix mensuel du magasin éphémère est de 0,0000000309 USD pour chaque Go-seconde et Lambda fournit 512 Mo de stockage sans frais supplémentaires.
Total pour le calcul (en secondes) = 6 M x 280 ms = 1 680 000 secondes
Magasin éphémère facturable total = 2048 Mo – 512 Mo = 1536 Mo
Magasin éphémère total (Go-s) = 1 680 000 * 1536 Mo/1024 Mo = 2 520 000 Go-s
Frais mensuels de magasin éphémère = 2 520 000 * 0,0000000309 $ = 0,08 $Frais mensuels totaux :
Total des frais = Frais de calcul + Frais de demandes = 105,33 USD + 1 USD + 0,08 USD = 106,41 USD par mois
Tarification pour la simultanéité allouée
Vous pouvez activer la simultanéité allouée pour vos fonctions Lambda afin de mieux contrôler les performances de vos applications sans serveur. Lorsqu'elle est activée, la simultanéité allouée conserve les fonctions initialisées et hyperprêtes à réagir en millisecondes à deux chiffres. Vous payez le montant de la simultanéité que vous configurez ainsi que le temps de configuration. Dès que la simultanéité allouée est activée pour votre fonction et que vous l'exécutez, vous payez également pour les requêtes et la durée aux prix indiqués ci-dessous. Si votre fonction dépasse la simultanéité configurée, vous êtes facturé pour l'exécution des fonctions excédentaires aux prix indiqués dans la section Tarification AWS Lambda ci-dessus. Vous pouvez activer la simultanéité allouée pour les fonctions qui s'exécutent sur les architectures x86 et Arm. Pour en savoir plus sur la simultanéité allouée, consultez la documentation.
La simultanéité allouée est calculée entre le moment où vous l'activez sur votre fonction et celui de sa désactivation. Sa valeur est arrondie à 5 minutes près. Le prix est fonction de la quantité de mémoire que vous allouez à votre fonction et de la quantité de simultanéité que vous configurez sur celle-ci. La durée est calculée à partir du moment où votre code commence à s'exécuter jusqu'à ce qu'il retourne ou à sa fin ; elle est arrondie à 1 ms près**. Le prix est fonction de la quantité de mémoire que vous attribuez à votre fonction.
** Les frais de durée s'appliquent au code qui s'exécute dans le gestionnaire d'une fonction et au code d'initialisation déclaré en dehors du gestionnaire. Pour les fonctions Lambda avec des extensions AWS Lambda, la durée inclut également la durée nécessaire à la dernière exécution du code pour terminer l'exécution durant la phase d'interruption. Pour les fonctions configurées avec la simultanéité allouée, AWS Lambda recycle périodiquement les environnements d'exécution et réexécute votre code d'initialisation. Pour plus de détails, consultez la documentation Modèle de programmation Lambda.
L'offre gratuite pour Lambda ne concerne pas les fonctions pour lesquelles la simultanéité allouée est activée. Si vous activez la simultanéité allouée pour votre fonction et que vous l'exécutez, vous serez facturé pour les requêtes et la durée sur la base du prix indiqué ci-dessous.
Tous les exemples ci-dessous sont basés sur les prix de la région USA Est (Virginie du Nord).
-
Exemple 1 : Backend d'application mobile
Supposons que vous êtes un développeur d'appli mobile et que vous êtes en train de créer une application mobile de commande de nourriture. Les clients peuvent utiliser l'application pour commander de la nourriture depuis un emplacement de restaurant précis, recevoir des mises à jour de l'état de la commande et emporter leur commande une fois qu'elle est prête. Étant donné vos prévoyez une hausse de la variation de la demande de votre application, en fonction du moment de la journée et de l'emplacement du restaurant, vous créez votre backend mobile à l'aide de services sans serveur, notamment AWS Lambda.Supposons que vous êtes un développeur d'appli mobile et que vous êtes en train de créer une application mobile de commande de nourriture. Les clients peuvent utiliser l'application pour commander de la nourriture depuis un emplacement de restaurant précis, recevoir des mises à jour de l'état de la commande et emporter leur commande une fois qu'elle est prête. Étant donné vos prévoyez une hausse de la variation de la demande de votre application, en fonction du moment de la journée et de l'emplacement du restaurant, vous créez votre backend mobile à l'aide de services sans serveur, notamment AWS Lambda.Pour des besoins de simplicité, supposons que votre application traite trois millions de requêtes par mois. La
durée moyenne d'exécution de la fonction, dans ce cas, est de 120 ms. Votre fonction est configurée avec 1 536 Mo de mémoire et sur un processeur basé sur une architecture x86.Vous lancez la nouvelle version de votre application mobile, qui est d'ailleurs fortement commercialisée. Vous prévoyez un pic de la demande, de la période allant de midi à 20 heures, pendant la journée de lancement. Vous souhaitez que votre application mobile réagisse même lorsque la demande augmente et diminue rapidement, ce qui vous permet d'activer la simultanéité allouée sur vos fonctions Lambda. La simultanéité allouée est définie à 100.
Pendant huit heures, vos fonctions reçoivent 500 000 requêtes. La durée moyenne
d'exécution de la fonction lorsque la simultanéité allouée est activée est de 100 ms. Pendant le reste du mois, votre application reçoit 2,5 millions de requêtes en plus et vos fonctions s'exécutent en réponse à celles-ci sans que la simultanéité allouée ne soit activée.Vos frais seront calculés comme suit :
Frais pour la simultanéité allouée :
Le prix de la simultanéité allouée est facturé 0,0000041667 USD par GO
La période totale pendant laquelle la simultanéité allouée est activée (secondes) = 8 heures x 3 600 secondes = 28 800 secondes
Total pour la simultanéité configurée (Go) : 100 x 1 536 Mo/1 024 Mo = 150 Go
Total pour la simultanéité allouée (GO) : 150 Go x 28 800 secondes = 4 320 000 GO
Frais pour la simultanéité allouée : 4,32 millions de GO x 0,0000041667 USD = 18 USDFrais pour les requêtes :
Le prix de la requête mensuel est de 0,20 USD par million de requêtes et l'offre gratuite fournit un million de requêtes par mois.
Nombre total de requêtes – Nombre de requêtes comprises dans l'offre gratuite = nombre de requêtes facturables par mois
3 000 000 de requêtes – 1 000 000 de requêtes comprises dans l'offre gratuite = 2 000 000 de requêtes facturables par mois
Frais mensuels pour les requêtes = 2 x 0,20 USD = 0,40 USDFrais mensuels pour le calcul lorsque la simultanéité allouée est activée :
Le prix applicable au calcul est de 0,0000097222 USD par GO
Durée totale du calcul (secondes) = 500 000 x 100 ms = 50 000 secondes
Durée totale du calcul (GO) = 50 000 secondes x 1 536 Mo/1 024 Mo = 75 000 GO.
Frais de calcul mensuels = 75 000 GO x 0,0000097222 USD = 0,73 USD
Frais mensuels pour le calcul lorsque la simultanéité allouée est désactivée :
Le prix de calcul mensuel revient à 0,0000166667 USD par GO et l'offre gratuite fournit 400 000 GO.
Taux de calcul total (en secondes) = 2,5 millions x 120 ms = 300 000 secondes
Durée totale du calcul (GO) = 300 000 x 1 536 Mo/1 024 Mo = 450 000 GO
Total pour le calcul – Valeur de l'offre gratuite pour le calcul = Valeur facturable pour le calcul par mois (en GO)
450 000 GO – 400 000 GO (offre gratuite) = 50 000 GO
Frais de calcul mensuels = 50 000 x 0,0000166667 USD = 0,83 USD
Frais mensuels totaux :
Total des frais = Frais de la simultanéité allouée + Frais de la requête + Frais de calcul lorsque la simultanéité allouée est activée + Frais de calcul lorsque la simultanéité allouée est désactivée
Total des frais = 18 USD + 0,40 USD + 0,73 USD + 0,83 USD = 19,96 USD
-
Exemple 2 : Routage des clients vers le contenu de la solution d'assistance la plus pertinente pendant le Cyber Monday
Supposons que vous êtes un détaillant qui organise une grande vente pendant le Cyber Monday, un jour férié aux États-Unis, dédié au e-commerce et qui a lieu le lundi qui suit Thanksgiving. Vos clients peuvent échanger en temps réel avec le support client au moyen de l'application mobile fournie à cet effet. Vous décidez de déployer un modèle de traitement du langage naturel (NLP).Supposons que vous êtes un détaillant qui organise une grande vente pendant le Cyber Monday, un jour férié aux États-Unis, dédié au e-commerce et qui a lieu le lundi qui suit Thanksgiving. Vos clients peuvent échanger en temps réel avec le support client au moyen de l'application mobile fournie à cet effet. Vous décidez de déployer un modèle de traitement du langage naturel (NLP).Dans ce cas, vous utilisez le modèle populaire BERT (Bidirectional Encoder Representations from Transformers) disponible dans AWS Lambda. Ce modèle vous aide à analyser et à comprendre les interactions du service client grâce à l'application mobile, de manière à afficher du contenu d'assistance pertinent ou à acheminer le client vers l'agent de service client approprié. Vous recevez des demandes d'assistance client beaucoup plus élevées que d'habitude pendant cette vente. Vous décidez donc d'activer la simultanéité allouée sur vos fonctions Lambda pour que votre application réponde rapidement même en cas de pic de trafic.
Supposons que vos fonctions reçoivent deux millions de requêtes pendant les 24 heures suivant cette vente et que la simultanéité allouée est activée. Dans ce cas, la durée moyenne d'exécution de la fonction est de 280 ms. Votre fonction est configurée avec 4,096 Mo de mémoire, sur un processeur basé sur x86, et la simultanéité allouée est défini à 7.
Vos frais seront calculés comme suit :
Frais pour la simultanéité allouée :
Le prix de la simultanéité allouée est facturée 0,0000041667 USD par GO.
La période totale pendant laquelle la simultanéité allouée est activée (secondes) = 24 heures x 3 600 secondes = 86 400 secondes
Le total de la simultanéité configurée (GO) : 7 x 4 096 Mo/1 024 Mo = 28 GO
Total pour la simultanéité allouée (GO) = 28 Go x 86 400 secondes = 2 419 200 GO
Frais pour la simultanéité allouée = 2 419 200 GO x 0,0000041667 USD = 10,08 USDFrais mensuels pour le calcul lorsque la simultanéité allouée est activée :
Le prix applicable au calcul est de 0,0000097222 USD par GO.
Durée totale du calcul (secondes) = 2 000 000 x 280 ms = 560 000 secondes
Durée totale du calcul (GO) = 560 000 secondes x 4 096 Mo/1 024 Mo = 2 240 000 GO.
Frais de calcul mensuels = 2 240 000 GO x 0,0000097222 USD = 21,78 USDFrais de requêtes mensuels :
Le prix mensuel pour les requêtes est de 0,20 USD par million de requêtes
Frais de requêtes mensuels = 2 M * 0,2 USD/M = 0,40 USDFrais mensuels totaux :
Frais totaux = Frais de la simultanéité allouée + Frais de calcul lorsque la simultanéité allouée est activée + Frais de la requête = 10,08 USD + 21,78 USD + 0,40 USD = 32,26 USD
Tarification du flux de réponse HTTP Lambda
Tous les exemples ci-dessous sont basés sur les prix de la région USA Est (Virginie du Nord).
-
Exemple de tarification : diffusion de contenu Web rendu côté serveur
Supposons que vous êtes un développeur d'applications Web et que vous créez un site Web rendu côté serveur dans une fonction Lambda. Votre fonction Lambda génère dynamiquement du contenu HTML en fonction de la demande et des résultats de plusieurs appels de service en aval. Certains de ces appels peuvent mettre du temps à renvoyer une réponse. Pour optimiser l'expérience de chargement des pages de vos utilisateurs, vous utilisez les fonctionnalités de streaming des réponses HTTP de Lambda pour améliorer les performances du délai de chargement du premier octet en affichant les premiers segments de code HTML dans le navigateur dès que votre fonction les génère.
Pour des besoins de simplicité, supposons que votre application traite trois millions de requêtes par mois. Supposons également que vous ayez épuisé les 100 Go de réponse en continu inclus dans l'offre gratuite d'AWS. La durée moyenne d'une fonction est de 500 ms. Votre fonction est configurée avec 1 536 Mo de mémoire et sur un processeur basé sur une architecture x86. La taille moyenne de la charge utile par demande est de 100 Ko pour les deux premiers millions de demandes par mois et de 7 Mo pour le dernier million de demandes par mois. L'exemple de calcul suppose que 1 Go = 1 024 Mo.
Vos frais seront calculés comme suit :
Frais de calcul mensuels
Le prix de calcul mensuel revient à 0,0000166667 USD par Go et l'offre gratuite fournit 400 000 Go.
Temps de calcul total (secondes) = 3 millions * 500 ms = 1 500 000 secondes
Temps de calcul total (Go/s) = 1 500 000* 1 536 Mo/1 024 Mo = 2 250 000 Go/s
Temps de calcul total – Valeur de l'offre gratuite pour le calcul = Valeur facturable pour le calcul par mois (en Go/s)
2 250 000 Go/s – 400 000 Go/s offerts = 1 850 000 Go/s
Frais de calcul mensuels = 1 850 000 x 0,0000166667 USD = 30,83 USDFrais de requêtes mensuels
Le prix mensuel des demandes est de 0,20 USD pour un million de demandes et le niveau gratuit fournit 1 million de demandes par mois.
Nombre total de requêtes – Nombre de requêtes comprises dans l'offre gratuite = nombre de requêtes facturables par mois
3 millions de requêtes : 1 million de requêtes de niveau gratuit = 2 millions de requêtes facturables par mois
Frais de requêtes mensuels = 2 M * 0,2 USD/M = 0,40 USDFrais par nombre d'octets traités
Le prix mensuel du nombre d'octets diffusés est de 0,008 USD par Go diffusé et le niveau gratuit fournit 100 Go par mois. Les 6 premiers Mo diffusés par demande sont également gratuits.
Octets gratuits diffusés (Go) = 2 millions de requêtes* 100 Ko = 190,7 Go
Étant donné que 100 Ko < 6 Mo par requête, les 190,7 Go diffusés sont gratuits.
Nombre d'octets rechargeables diffusés (Go) = 1 million de requêtes* (7 Mo à 6 Mo) = 976,56 Go
Frais mensuels de diffusion d'octets = 976,56 Go* 0,008 USD = 7,81 USDFrais mensuels totaux :
Frais totaux = frais de calcul + frais de requêtes + frais de diffusion d'octets = 30,83 USD + 0,40 USD + 7,81 USD = 39,04 USD par mois
Transfert de données et frais divers
Transfert de données
Les données transférées « à l'intérieur » et « à l'extérieur » de vos fonctions AWS Lambda, depuis l'extérieur de la région où elles ont été exécutées, sont facturées aux débits de transfert de données Amazon EC2 indiqués ici sous « Transfert de données ».
Le transfert de données avec les fonctions AWS Lambda est gratuit dans la même région AWS entre les services suivants : Amazon Simple Storage Service (S3), Amazon Glacier, Amazon DynamoDB, Amazon Simple Email Service (SES), Amazon Simple Queue Service (SQS), Amazon Kinesis, Amazon Elastic Container Registry (ECR), Amazon Simple Notification Service (SNS), Amazon Elastic File System (EFS) et Amazon SimpleDB.
L'utilisation d'Amazon Virtual Private Cloud (VPC) ou de l'appairage de VPC, avec les fonctions AWS Lambda, entraîne des frais supplémentaires tel qu'expliqué sur la page relative à la tarification à la demande d'Amazon Elastic Compute Cloud (EC2). Une connexion d'appairage de VPC est une connexion de mise en réseau entre deux VPC qui permet d'acheminer le trafic entre ces derniers à l'aide d'adresses IPv4 ou IPv6 privées.
Pour plus de détails sur la tarification des services AWS, consultez la section Tarification de chaque service AWS concerné.
Tarification Lambda@Edge
La durée des fonctions Lambda@Edge est mesurée avec une granularité de 1 ms
-
Exemple de tarification :
Si votre fonction Lambda@Edge a été exécutée 10 millions de fois au cours du mois, avec une durée de 10 ms pour chaque exécution, vos frais sont calculés de la manière suivante :Si votre fonction Lambda@Edge a été exécutée 10 millions de fois au cours du mois, avec une durée de 10 ms pour chaque exécution, vos frais sont calculés de la manière suivante :Frais de calcul mensuels
Le tarif mensuel pour le calcul correspond à 0,00000625125 USD par 128 Mo-seconde
Calcul total (en secondes) = 10 millions * (0,01 s) = 100 000 secondes
Frais de calcul mensuels = 100 000 * 0,00000625125 USD = 0,63 USD
Frais de requêtes mensuelsLe tarif mensuel pour les requêtes correspond à 0,60 USD par million de requêtes.
Frais de requêtes mensuels = 10 millions * 0,6 USD/million = 6,00 USD
Frais mensuels totaux
Frais totaux = frais de calcul + frais de requêtes = 0,63 USD + 6,00 USD = 6,63 USD par mois
Ressources de tarification supplémentaires
Calculez facilement vos coûts mensuels avec AWS
Contacter les spécialistes AWS pour obtenir un devis personnalisé