LaTeXML
LaTeXML konvertuje LaTeX dokumenta u XML, HTML i EPUB.[1][2][3]
LaTeXML primarni izvorni format je XML reprezentacija (La)TeX's dokument modela. Postprocesor može pretvarati ove XML dokumente u formate poput HTML sa matematičkim formulama kao slikama ili XHTML, HTML5, i EPUB sa formulama kao MathML. U poređenju sa drugim LaTeX-to-XML procesorima, LaTeXML ima za cilj da sačuva semantičke strukture LaTeX oznaka. To ga čini dobrom osnovom za semantičke usluge kao što su Math search.
Konverzija u rasponu 30 milisekunde u jednostavnim formulama (u LaTeXML daemon-u) do minuta za dokument veličine knjige.
LaTeXML je počeo u kontekstu digitalne biblioteke matematičke funkcije u NIST, gde je LaTeX dokumentima potrebno da se pripreme za objavljivanje na vebu. Sistem je bio pod aktivnim razvojem za više od jedne decenije, i privukao mali, ali posvećeni broj programera i korisnika usmereni na Bruce Miller, LaTeXML.
Sadašnja verzija je objavljena kao LaTeXML 0.8.1. To je objavljeno u februaru 2015. godine, ali razvoj je bio aktivan na javnom skladištu od tada.
LaTeXML je korišćen za konvertovanje 90% (60% bez grešaka) od 530.000 dokumenata iz arXiv u XML.[4] Kao rezultat ovih napora, LaTeXML održava veliki raspon LaTeX paketa. ACL 2014 je koristio LaTeXML za konvertovanje pristiglih radova u XML.[5] Ovaj postojeći posao je pokušavao da konvertuje ACL Anthology papire u visoko-kvalitetnu semantičku oznaku za dalje analize.[6] Od februara 2013. godine, LaTeXML je korišćen da donese veb stranice na matematičke proizvode na sajtu.
Jezgro LaTeXML je Perl reimplementacija TeX raščlanjivanja i digestije algoritma sa prilagodljivim XML emiterom. Kovertovanje semantičke strukture u LaTeX oznaku, LaTeXML ima XML povezivanje za LaTeX pakete. LaTeXML distribucija trenutno pruža XML povezivanja za preko 200 obično korišćenjem LaTeX paketa kao što su AMSTeX, Babel ili PGF/TikZ (koji ima samo eksperimentalnu podršku).[7] Dodatni (nepotpuni ali korisni) povezi su dobijeni od strane zajednice.
LaTeXML konverzija se sastoji iz dve faze:
- prvo raščlanjavanje LaTeX i konvertuje LaTeX blizu XML tip dokumenta, i
- druga (post-procesiranje) stvara iz tog jednog izlaznog formata XHTML, HTML5, HTML sa slikama, EPUB.
LaTeXML 0.8 je dodao daemon funkcionalnost koja je omogućila više konvertobanje i jednostavno uklapanje veb servisa.
- ↑ "Gecko-based EPUB Readers and LaTeXML" Arhivirano 2014-08-22 na Wayback Machine-u.
- ↑ "Tools for Converting LaTeX to XML".
- ↑ "Free Techno Blog: LaTeXML" Arhivirano 2015-05-11 na Wayback Machine-u.
- ↑ Stamerjohanns, Heinrich; Kohlhase, Michael; Ginev, Deyan; David, Catalin; Miller, Bruce (2010).
- ↑ "ACL 2014 Publication - Papers in XML format".
- ↑ Schäfer, Ulrich; Read, Jonathon; Oepen, Stephan (2012).
- ↑ "LaTeXML: Localization with Babel".