LaTeXML

LaTeXML konvertuje LaTeX dokumenta u XML, HTML i EPUB.[1][2][3]

Proces rada

LaTeXML primarni izvorni format je XML reprezentacija (La)TeX's dokument modela. Postprocesor može pretvarati ove XML dokumente u formate poput HTML sa matematičkim formulama kao slikama ili XHTML, HTML5, i EPUB sa formulama kao MathML. U poređenju sa drugim LaTeX-to-XML procesorima, LaTeXML ima za cilj da sačuva semantičke strukture LaTeX oznaka. To ga čini dobrom osnovom za semantičke usluge kao što su Math search.

Konverzija u rasponu 30 milisekunde u jednostavnim formulama (u LaTeXML daemon-u) do minuta za dokument veličine knjige.

Istorija

LaTeXML je počeo u kontekstu digitalne biblioteke matematičke funkcije u NIST, gde je LaTeX dokumentima potrebno da se pripreme za objavljivanje na vebu. Sistem je bio pod aktivnim razvojem za više od jedne decenije, i privukao mali, ali posvećeni broj programera i korisnika usmereni na Bruce Miller, LaTeXML.

Sadašnja verzija je objavljena kao LaTeXML 0.8.1. To je objavljeno u februaru 2015. godine, ali razvoj je bio aktivan na javnom skladištu od tada.

LaTeXML je korišćen za konvertovanje 90% (60% bez grešaka) od 530.000 dokumenata iz arXiv u XML.[4] Kao rezultat ovih napora, LaTeXML održava veliki raspon LaTeX paketa. ACL 2014 je koristio LaTeXML za konvertovanje pristiglih radova u XML.[5] Ovaj postojeći posao je pokušavao da konvertuje ACL Anthology papire u visoko-kvalitetnu semantičku oznaku za dalje analize.[6] Od februara 2013. godine, LaTeXML je korišćen da donese veb stranice na matematičke proizvode na sajtu.

Implementacija

Jezgro LaTeXML je Perl reimplementacija TeX raščlanjivanja i digestije algoritma sa prilagodljivim XML emiterom. Kovertovanje semantičke strukture u LaTeX oznaku, LaTeXML ima XML povezivanje za LaTeX pakete. LaTeXML distribucija trenutno pruža XML povezivanja za preko 200 obično korišćenjem LaTeX paketa kao što su AMSTeX, Babel ili PGF/TikZ (koji ima samo eksperimentalnu podršku).[7] Dodatni (nepotpuni ali korisni) povezi su dobijeni od strane zajednice.

LaTeXML konverzija se sastoji iz dve faze:

  • prvo raščlanjavanje LaTeX i konvertuje LaTeX blizu XML tip dokumenta, i
  • druga (post-procesiranje) stvara iz tog jednog izlaznog formata XHTML, HTML5, HTML sa slikama, EPUB.

LaTeXML 0.8 je dodao daemon funkcionalnost koja je omogućila više konvertobanje i jednostavno uklapanje veb servisa.

Reference

  1. "Gecko-based EPUB Readers and LaTeXML" Arhivirano 2014-08-22 na Wayback Machine-u.
  2. "Tools for Converting LaTeX to XML".
  3. "Free Techno Blog: LaTeXML" Arhivirano 2015-05-11 na Wayback Machine-u.
  4. Stamerjohanns, Heinrich; Kohlhase, Michael; Ginev, Deyan; David, Catalin; Miller, Bruce (2010).
  5. "ACL 2014 Publication - Papers in XML format".
  6. Schäfer, Ulrich; Read, Jonathon; Oepen, Stephan (2012).
  7. "LaTeXML: Localization with Babel".

Spoljašnje veze

  • http://dlmf.nist.gov/LaTeXML/
  • LaTeXML source code
  • LaTeXML web server, services, and demos
  • p
  • r
  • u
KlaseLaTeX integracijaAlatke za konverziju
Povezano