Pāriet uz saturu

Multipurpose Internet Mail Extensions

Vikipēdijas lapa
(Pāradresēts no MIME)

Multipurpose Internet Mail Extensions (angļu valodā "interneta pasta vairākmērķu paplašinājumi") jeb MIME ir interneta standarts, kas paplašina e-pasta vēstules formātu. Galvenie paplašinājumi:

  • teksts iespējams kodējumā, kas atšķiras no US-ASCII;
  • vēstulei var pievienot ne teksta piesaistnes;
  • vēstuli atļauts veidot no vairākiem ķermeņiem
  • galvenes informācija iespējama no ASCII atšķirīga kodējuma.

MIME ir aprakstīts sešos RFC : RFC 2045, RFC 2046, RFC 2047, RFC 4288, RFC 4289 un RFC 2077.

MIME standartā definētie satura tipi tiek izmantoti arī ārpus e-pasta, piemēram, HTTP protokolā.

E-pasta sūtīšanas protokols SMTP pieļauj vēstules tikai 7 bitu ASCII kodējumā. Tas bija pietiekami, rakstot tikai ar latīņu alfabēta burtiem. Citās valodās, kas izmantoja latīņu alfabētu, kurā iekļautas diaktriskās zīmes (izmantoti 8 biti kā ASCII papildkodējums), rakstīto nevarēja korekti attēlot e-pasta vēstulē (8. bits tika nonullēts). To atrisināja ar SMTP paplašinājumu 8BITMIME, kas tika publicēts 1994. gadā (RFC 1652).

E-pasta vēstules pamatformāts ir definēts RFC 2822, kas nosaka, kādā veidā jāveido sūtījuma galvenes lauki un ķermenis. MIME paredzēti papildu galvenes lauki, kurā paziņo par satura tipu, vēstules ķermeņa teksta kodējumu. MIME ir ietverts kodēšanas mehānisms galvenes laukiem, piemēram, "Subject", kas ļauj galvenē izmantot citu valodu simbolus.

MIME standarts ir paplašināms. Tajā ir noteikts, kādā veidā var reģistrēt jaunus satura tipus un citas MIME atribūtu vērtības.

MIME tika izstrādāts tādā veidā, lai eksistējošie pasta serveri varētu darboties bez izmaiņām, ļaujot sūtīt parasta teksta vēstules abos virzienos kā agrāk. Tas tika panākts, izmantojot papildu RFC 822 veida galvenes laukus visiem MIME atribūtiem un veidojot MIME galvenes laukus neobligātus ar vērtībām pēc noklusējuma, kas nodrošināja, ka MIME neatbilstošus sūtījumus korekti interpretēts MIME atbalstošs klients. Bez tam, vienkāršu MIME teksta vēstuli MIME neatbilstošs klients pareizi interpretētu, pat nezinot MIME lauku nozīmi, un tekstu, kas saturētu ASCII simbolus, lietotājs varētu izlasīt.

Galvene MIME-Version norāda, ka sūtījums ir formatēts MIME standartā. Tā vērtība parasti ir "1.0". Galvene tiks parādīta:

MIME-Version: 1.0

Content-Type rāda sūtījuma satura interneta medija tipu, kas sastāv no tipa un apakštipa. Piemēram:

Content-Type: text/plain

Izmantojot vairākdaļu tipu, MIME ļauj veidot vēstuli no vairākām daļām, kas izkārtotas koka struktūrā, kurā lapu mezgli ir ar nevairākdaļas tipu, un nelapu mezgliem ir kāds no vairākdaļu tipa. Šis mehānisms atbalsta:

  • vienkāršus teksta sūtījumus, izmantojot text/plain (tā ir arī noklusējuma vērtība);
  • tekstu ar pievienojumiem (multipart/mixed ar text/plain un citām neteksta daļām);
  • atbildes sūtīšanu ar pievienotu oriģinālu (multipart/mixed ar text/plain daļu un oriģinālo vēstuli kā message/rfc822 daļu);
  • alternatīvo saturu, tādu kā vēstules sūtīšanu gan vienkāršā tekstā, gan citā formātā, piemēram HTML (multipart/alternative ar saturu text/plain un text/html formātā);
  • attēlus, audio, video un lietojumprogrammas (piemeram, image/jpg, audio/mp3, video/mp4, and application/mswork);
  • daudzas citas sūtījuma konstrukcijas.

Satura sūtīšanas kodējums

[labot šo sadaļu | labot pirmkodu]

1992. gada jūnijā (RFC 1341, vēlāk tika aizstāts ar RFC 2045) tika noteiktas MIME metodes, kā attēlot bināros datus ASCII teksta formātā. Galvene Content-Transfer-Encoding rāda, kura kodēšanas metode tiek lietota:

  • izmantojami normālam SMTP:
    • 7bit — līdz 998 oktetiem rindā ar kodu no 1 līdz 127, kur ir atļauti tikai CR un LF (attiecīgi 13 un 10) kā daļa no CRLF rindas beigām. Šī ir vērtība pēc noklusējuma.
    • quoted-printable — lieto, lai kodētu 8 bitu simbolus formā, kas apmierina 7bit noteikumus. Paredzēts, ja dati pamatā sastāv no US-ASCII simboliem, bet ir arī neliels daudzums baitu, kuru kodi ir virs 127.
    • base64 — lieto, lai kodētu 8 bitu simbolus formā, kas apmierina 7bit noteikumus. Pamatā izmanto 8 bitu neteksta datiem, bet reizēm arī teksta datiem, kuros bieži ir ne US-ASCII simboli.
  • izmantojami SMTP serveriem, kas atbalsta 8BITMIME SMTP paplašinājumu:
    • 8bit — līdz 998 oktetiem rindā, kur ir atļauti tikai CR un LF (attiecīgi 13 un 10) kā daļa no CRLF rindas beigām.
  • izmantojami SMTP serveriem, kas atbalsta BINARYMIME SMTP paplašinājumu (RFC 3030):
    • binary — jebkurā oktetu secībā.

Pēc RFC 2822 standarta sūtījuma galvenes nosaukumiem un vērtībām vienmēr jābūt ar ASCII simboliem; vērtībām, kuras satur ne ASCII datus, jālieto MIME kodēto vārdu sintaksi (RFC 2047). Šī sintakse izmanto ASCII simbolus, ar kuriem parāda gan oriģinālo rakstzīmju kopu (charset), gan satura pārkodēšanas shēmu, kas parāda, kādā veidā simboli tikuši pārkodēti ASCII kodējumā.

Formāts ir: "=?rakstzīmju kopa?kodējums?pārkodētais teksts?=".

  • rakstzīmju kopa var būt jebkura, kas reģistrēta IANA. Parasti tā ir tā pati, kas izmantota vēstules ķermenī.
  • kodējums var būt vai nu "Q" (Q-kodējums jeb quoted-printable kodējums) vai "B" (base64 kodējums).
  • pārkodētais teksts ir attiecīgi Q-kodējumā vai base64 kodējumā.

Kodētajā vārdā jautājuma zīme "?" un vienādības zīme "=" ir rezervētie simboli, tad tie ir jāpārveido citādi. Arī atstarpes rakstzīmi nevar tieši attēlot, jo vecāki parseri var nevēlami sadalīt vārdu. Lai samazinātu pārkodēto tekstu un padarītu to vieglāk lasāmu, atstarpe tiek aizvietota ar pasvītrojuma rakstzīmi, bet līdz ar to pasvītrojumu nevar tieši attēlot.

Piemērs:

Subject: =?utf-8?Q?=C2=A1Hola,_se=C3=B1or!?=

ko var interpretēt kā "Subject: ¡Hola, señor!".

Kodēto vārdu formātu nevar izmantot galvenes nosaukumam (piem., Subject). Galvenes nosaukumi vienmēr ir angļu valodā. Ja tiek skatīta vēstule ar citas valodas e-pasta klientu, tad galvenes nosaukumus klienta programma var parādīt pārtulkotus, ja tai ir tāda funkcija.

Vairākdaļu sūtījumi

[labot šo sadaļu | labot pirmkodu]

MIME vairākdaļu sūtījuma Content-type: galvenē ir jānorāda robežatdalītājs boundary. Šai simbolu virknei nav jāparādās nevienā no vēstules daļām, tā atrodas starp daļām, ka arī sūtījuma ķermeņa sākumā un beigās. Piemēram:

MIME-version: 1.0
Content-type: multipart/mixed; boundary="frontier"

This is a multi-part message in MIME format.
--frontier
Content-type: text/plain

This is the body of the message.
--frontier
Content-type: application/octet-stream
Content-transfer-encoding: base64

PGh0bWw+CiAgPGhlYWQ+CiAgPC9oZWFkPgogIDxib2R5PgogICAgPHA+VGhpcyBpcyB0aGUg
Ym9keSBvZiB0aGUgbWVzc2FnZS48L3A+CiAgPC9ib2R5Pgo8L2h0bWw+Cg==
--frontier--

Katra daļa sastāv no pašas satura galvenes (neviens vai vairāki Content- galvenes lauki) un ķermeņa. Vairākdaļu saturs var būt ligzdojams. Content-Transfer-Encoding jābūt 7bit, 8bit vai binary. Vairākdaļu blokam kā veselam nav rakstzīmju kopas, no ASCII atšķirīgi simboli daļas galvenē tiek pārveidoti pēc kodēto vārdu sistēmas, un daļas ķermenim ir rakstzīmju kopa, kas noteikta satura tipā (content-type.

Piezīmes:

  • pirms pirmā robežatdalītāja atrodas zona, kuru ignorē MIME atbalstoša klientprogramma. Šī zona parasti paredzēta, lai informētu lietotājus, kuri izmanto vecus ne MIME klientus.
  • vēstules sūtītāja klientprogramma pati izvēlas robežatdalītāju, kurš nekonfliktē ar ķermeņa tekstu. Parasti to veido no garas gadījumsimbolu virknes.

Vairākdaļu apakštipi

[labot šo sadaļu | labot pirmkodu]

MIME standarts paredz dažādus vairākdaļu sūtījuma apakštipus, kuru raksturo vēstules daļas un to saistību vienai ar otru. Apakštipu norāda visa sūtījuma Content-Type galvenē. RFC sākotnēji definēja četrus apakštipus: mixed, digest, alternative un parallel. Minimālā prasība pasta programmām ir tāda, ka tām jāatbalsta mixed un digest, citi apakstipi nav obligāti. Citi apakštipi tika definēti vēlāk.

Zemāk ir apskatīti biežāk lietotie apakštipi.

Multipart/mixed tiek lietoti, lai sūtītu failus ar iekļautām dažādām Content-Type galvenēm (jeb kā pievienojums). Ja tiek pārsūtīti attēli vai citi viegli lasāmi faili, vairums mūsdienu klientprogrammu var tos attēlot iekļautajā skatītājā. Citādi tie tiks piedāvāti kā pievienojumfaili. Pēc noklusējuma satura tips katrai daļai ir text/plain

Definēts RFC 2046, sekcija 5.1.3

Multipart/digest ir vienkāršs veids, kā sūtīt saliktas teksta vēstules. Pēc noklusējuma satura tips katrai daļai ir message/rfc822

Definēts RFC 2231, sekcija 5.1.5

Multipart/alternative rāda, ka katra daļa ir "alternatīva" versija vienam un tam pašam (vai līdzīgam) saturam, katra dažādā formātā, kas noteikts tās Content-Type galvenē. Šis formāts ir paredzēts, lai formatētam saturam līdzi tiktu "dots" arī oriģināls, ar "uzticamāko" (vienkārša teksta variantā) vispirms, un "mazāk uzticamo" beigās. Sistēma attēlošanai izvēlas labāko sūtījuma daļu, ja labāko daļu klientprogramma nespēj apstrādāt, tiek parādīta vienkāršākā daļa. Tas dod iespēju vēstuli vienkāršāk izlasīt lietotajiem, kuru klienti neatbalsta vairākdaļu sūtījumus.

Visbiežāk alternatīvo veidu izmanto HTML e-pasta sūtīšanai. To sagatavo no divām daļām: pirmajā ir vienkāršais teksts (text/plain), otrajā ir teksts, formatēts HTML (text/html). Ja klients neatbalsta HTML formatēšanu, tas parādīs vēstuli kā vienkāršu tekstu, HTML atbalstošs parādīs līdzīgu kā HTML lapu.

Definēts RFC 2046, sekcija 5.1.4

Multipart/related izmanto, lai informētu, ka sūtījuma daļas nav jāapskata individuāli, bet gan ka tās ir daļas no viena vesela. Vēstule sastāv no "saknes" daļas (pēc noklusējuma pirmās), kas norāda uz citām iekļautajām daļām, kuras savukārt var saistīt citas daļas. Sūtījuma daļas parasti saista ar daļas galveni Content-ID. Atsauces sintakse nav noteikta, un to nosaka atkarībā no kodējuma vai protokola, kuru izmanto saistāmajā daļā.

Šo apakštipu plaši izmanto, lai sūtītu vēstuli kā tīmekļa lappusi kopā ar attēliem. Saknes daļai jāsatur HTML dokuments, un tajā ietvertie attēlu tagi atsaucas uz attēliem, kas ir saglabāti nākamajās daļās.

Definēts RFC 2387

Multipart/report ir sūtījuma tips, kas paredzēts e-pasta servera informēšanai. Tas ir sadalīts divās daļās, no kurām viena ir text/plain (vai cits viegli lasāms satura tips), bet otra ir message/delivery-status, kura satur īpaši e-pasta serverim formatētus datus.

Definēts RFC 3462

Multipart/signed lieto, lai sūtījumam pievienotu ciparu parakstu. Tas sastāv no divam daļām: ķermeņa daļas un paraksta daļas. Ir iespējami daudzi paraksta tipi, piemeram, application/pgp-signature, application/x-pkcs7-signature.

Definēts RFC 1847, sekcija 2.1

Multipart/encrypted izmanto, lai sūtītu šifrētu vēstuli. Pirmā daļa satur kontrolinformāciju, kas nepieciešama, lai atšifrētu application/octet-stream otro daļu.

Definēts RFC 1847, sekcija 2.2

Multipart/form-data ir paredzēts vērtību nosūtīšanai ar formas palīdzību. Sākotnēji tas ir definēts kā daļa no HTML 4.0, un tiek plaši lietots, lai nodotu failus ar HTTP.

Definēts RFC 2388

RFC 1426
SMTP Service Extension for 8bit-MIMEtransport. J. Klensin, N. Freed, M. Rose, E. Stefferud, D. Crocker. February 1993.
RFC 1847
Security Multiparts for MIME: Multipart/Signed and Multipart/Encrypted
RFC 2045
MIME 1. daļa: Format of Internet Message Bodies.
RFC 2046
MIME 2. daļa: Media Types. N. Freed, Nathaniel Borenstein. November 1996.
RFC 2047
MIME 3. daļa: Message Header Extensions for Non-ASCII Text. Keith Moore. November 1996.
RFC 4288
MIME 4. daļa: Media Type Specifications and Registration Procedures.
RFC 4289
MIME 4. daļa: Registration Procedures. N. Freed, J. Klensin. December 2005.
RFC 2049
MIME 5. daļa: Conformance Criteria and Examples. N. Freed, N. Borenstein. November 1996.
RFC 2231
MIME Parameter Value and Encoded Word Extensions: Character Sets, Languages, and Continuations. N. Freed, K. Moore. November 1997.
RFC 2387
The MIME Multipart/Related Content-type
RFC 1521
Mechanisms for Specifying and Describing the Format of Internet Message Bodies

Ārējās saites

[labot šo sadaļu | labot pirmkodu]