Gå til hovedindhold

Priser for Azure OpenAI Service

Oversigt over prisfastsættelse for Azure OpenAI-tjenesten

Unlock the power of Azure OpenAI Service's generative AI models with flexible Standard (On-Demand) and Provisioned Throughput Units (PTUs). The Standard model lets you pay only for tokens processed, while PTUs ensure consistent throughput and minimal latency variance for scalable solutions. Pricing includes costs per 1,000 tokens, and PTU rates provide a predictable cost structure. Azure OpenAI Service offers advanced capabilities like GPT-4o, fine-tuning for customization, DALL-E for image generation, and Whisper for speech-to-text. For personalized guidance on optimizing AI deployments, contact a sales specialist.

Se prismuligheder

Anvend filtre for at tilpasse prismulighederne efter dine behov.

Priserne er kun estimater og er ikke beregnet som faktiske pristilbud. De faktiske priser kan variere afhængigt af den type aftale, der er indgået med Microsoft, købsdatoen og valutakursen. Priserne beregnes ud fra den amerikanske dollar og konverteres ved hjælp af London børsens slutkurs, der registreres i løbet af de to hverdage før den sidste hverdag i den forrige måned. Hvis de to hverdage før månedens slutning falder på en banklukkedag på større markeder, angives kursen umiddelbart dagen før de to hverdage. Denne kurs gælder for alle transaktioner i løbet af den kommende måned. Log på Azure-prisberegneren for at se priser baseret på dit aktuelle program/tilbud med Microsoft. Kontakt en Azure-salgsspecialist for at få flere oplysninger om priser eller for at anmode om et pristilbud. Se ofte stillede spørgsmål om Azure-priser.

Oplysninger om prisfastsættelse:

Sprogmodeller

Modeller Kontekst Input (pr. 1.000 tokens) Output (pr. 1.000 tokens) Price per PTU per Hour Minimum Scaling Increment Monthly Reservation per PTU Yearly Reservation per PTU
Global GPT-4o-udrulning 128K $- $- I/T I/T I/T I/T
Regional GPT-4o-API 128K $- $- $- 50 PTUs $- $-
GPT-4o-mini Global Deployment 128K $- $- I/T I/T I/T I/T
GPT-4o-mini Regional API 128K $- $- $- 25 PTUs $- $-
GPT-3.5-Turbo-0125 16K $- $- $- 100 PTUs $- $-
GPT-3.5-Turbo-Instruct 4K $- $- I/T I/T I/T I/T
GPT-4-Turbo 128K $- $- $- 100 PTUs $- $-
GPT-4-Turbo-Vision 128K $- $- I/T I/T I/T I/T
GPT-4 8K $- $- $- 50 PTUs $- $-
GPT-4 32K $- $- $- 200 PTUs $- $-

This table provides a detailed comparison of Standard (On-Demand) versus Provisioned (PTU) pricing for various language models. The 'Context' column specifies the maximum number of tokens each model can handle per response. Pricing details for input and output tokens are listed, reflecting the cost per 1,000 tokens. The PTU pricing model includes an hourly rate and a minimum scaling increment, representing the minimum number of PTUs required for each model. The "Monthly Reservation per PTU" and "Yearly Reservation per PTU" columns indicate the reservation costs per PTU. This comparison helps users understand the cost implications of using each model under both Standard (On-Demand) and Provisioned (PTU) billing options, allowing for informed decisions based on their specific usage needs.

Language models are also now available in the Batch API that returns completions within 24 hours for a 50% discount.

Ældre sprogmodeller

Modeller Kontekst Input (pr. 1.000 tokens) Output (pr. 1.000 tokens)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-

Assistent-API

The Assistants API and its tools make it easy for developers to build AI Assistants in their applications.

The tokens used for the Assistants API are billed at the chosen language model's per token input/output rates used with each Assistant. Additionally, we charge the following fees for tool usage:

Værktøj Input
File Search* $-/GB of vector-storage per day (1 GB free)
Code Interpreter** $-/session

*GB refers to binary gigabytes, where 1 gb is 2^30 bytes.

**If your assistant calls Code Interpreter simultaneously in two different threads, this would create two Code Interpreter sessions (2 * $-). Each session is active by default for one hour, which means that you would only pay this fee once if your user keeps giving instructions to Code Interpreter in the same thread for up to one hour.

Inference cost (input and output) varies based on the GPT model used with each Assistant. If your assistant calls Code Interpreter simultaneously in two different threads, this would create two Code Interpreter sessions (2 * $-). Each session is active by default for one hour, which means that the price is for up to one hour of giving instructions to Code Interpreter in the same thread.

Basismodeller

Modeller Forbrug pr. 1.000 tokens
Babbage-002 $-
Davinci-002 $-

Modeller til finjustering

Modeller Kursus pr. 1.000 tokens Hosting pr. time Inputforbrug pr. 1.000 tokens Outputforbrug pr. 1.000 tokens
Babbage-002 $- $- $- $-
Davinci-002 $- $- $- $-
GPT-3.5-Turbo (4K) $- $- $- $-
GPT-3.5-Turbo (16K) $- $- $- $-

Billedmodeller

Modeller Kvalitet Opløsning Pris (pr. 100 billeder)
Dall-E-3 Standard 1024 * 1024 $-
Standard 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standard 1024 * 1024 $-

Integrering af modeller

Modeller Pr. 1.000 tokens
Ada $-
tekstintegrering-3-stor $-
tekstintegrering-3-lille $-

Talemodeller

Modeller Pris
Hviske $- pr. time
TTS (Tekst-til-tale) $-/1 mio. tegn
TTS HD $-/1 mio. tegn

Azure-priser og købsmuligheder

Få direkte kontakt til os

Få en gennemgang af Azure-prisfastsættelse. Få en forståelse af prisfastsættelsen på din skyløsning, få mere at vide om omkostningsoptimering, og anmod om et tilpasset tilbud.

Tal med en sælger

Se flere måder at købe på

Køb Azure-tjenester via Azure-webstedet, en Microsoft-repræsentant eller en Azure-partner.

Se nærmere på dine muligheder

Flere ressourcer

Azure OpenAI Service

Få mere at vide om funktioner og egenskaber i forbindelse med Azure OpenAI Service.

Prisberegner

Anslå dine forventede månedlige omkostninger ved hjælp af en hvilken som helst kombination af Azure-produkter.

SLA

Gennemse serviceniveauaftalen for Azure OpenAI Service.

Dokumentation

Se tekniske vejledninger, videoer og andet Azure OpenAI Service-materiale.

  • Azure OpenAI-tjenesten tilbyder priser, der er baseret på både betal efter forbrug og klargjorte enheder for gennemløb (PTU'er). Betalt efter forbrug giver dig mulighed for at betale for de ressourcer, du bruger, hvilket gør det fleksibelt for variable arbejdsbelastninger. PTU'er tilbyder en forudsigelig prismodel, hvor du reserverer og udruller en bestemt mængde modelbehandlingskapacitet. Denne model er ideel til arbejdsbelastninger med konsekvente eller forudsigelige brugsmønstre, der giver stabilitets- og omkostningsstyring.
  • Hvis du vil vide mere om PTUs- og Azure Open AI-priser, kan du læse PTU-dokumentation eller kontakte vores salgsspecialist

Tal med en sælger, og få en gennemgang af Azure-priserne. Få en forståelse af prisen på din cloudløsning.

Få gratis cloudtjenester og en kredit på $200, så du kan udforske Azure i 30 dage.

Tilføjet for at beregne. Tryk på 'v' for at få vist på beregner
Kan vi hjælpe dig?