<div dir="ltr">Can this package be on github? </div><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Mar 21, 2016 at 7:58 AM, Deyan Ginev <span dir="ltr"><<a href="mailto:d.ginev@jacobs-university.de" target="_blank">d.ginev@jacobs-university.de</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Dear all,<br>
<br>
Since I noticed there is a brief tex -> html discussion going on, let me<br>
add one more perspective here. I'm a contributor to the LaTeXML<br>
conversion project, which I am guessing is the one implied by the<br>
reference to "Perl" in Uwe's last email.<br>
<span class=""><br>
<br>
On 20.03.2016 20:08, Uwe Lueck wrote:<br>
>> This is a LaTeX package which causes LaTeX to directly generate HTML tags,<br>
>> using pdftotext and a few other utilities to convert the resulting PDF file<br>
>> into HTML files.<br>
> The approach is interesting, yet if you convert LaTeX to PDF<br>
> and the result to HTML, the meaning of "direct" forbids calling<br>
> this a "direct" generation of HTML. It is just as "direct" as<br>
> the late Eitan Gurari's tex4ht.<br>
<br>
</span>Another point to sneak in here is now that libarries such as "pdf.js"<br>
exist, and browsers have native PDF previews via the HTML5 canvas,<br>
having a TeX-near mapping from PDF to HTML may have little added value.<br>
In a way it is only worth the effort if it produces a "better" HTML5<br>
document, where "better" is parametric in the goal the author is trying<br>
to achieve (e.g. eBooks have different requirements than web sites, or<br>
say even more modern - interactive exercise sheets.)<br>
<span class=""><br>
> I have never used tex4ht, but my impression is that this is the<br>
> most promising way to get HTML from LaTeX. So you should tell<br>
> what lwarp offers that tex4ht doesn't.<br>
<br>
</span>Well, that measure of being "promising" depends on the goal you're<br>
trying to achieve...<br>
<span class=""><br>
> Now as to "native": There are LaTeX-to-HTML converters that use<br>
> Perl or things like this (Pandoc). For those I could accept<br>
> calling them "direct" conversion, but not "native", as they use<br>
> external software for the conversion rather than the LaTeX<br>
> typesetting system.<br>
<br>
</span>This seems to be a fair distinction.<br>
<span class=""><br>
>  A problem with this approach is that the<br>
> author's custom macros cannot be processed.<br>
<br>
</span>Well, that's not entirely true. It's definitely true for early stage<br>
reimplementations (such as pandoc), which are quite limited in coverage.<br>
LaTeXML on the other hand already supports an impressive subset of TeX.<br>
A brief illustration could be the classic xii.tex example [1].<br>
<br>
It is certainly not complete in coverage yet, with about 61% of<br>
arXiv.org's academic sources converting without issues [2]. But it's<br>
also definitely not a toy project at this stage.<br>
<br>
That being said, I find lwarp.sty to be a fascinating project, and the<br>
"Alternatives" section in its manual is a rather on-point overview of<br>
the current solution attempts [3]. Looking at the implementation<br>
details, it seems that much of the inevitable customization is again<br>
present - in order to resolve the "impedance mismatch" between the<br>
printed page and the hypertext webpage, various high level constructs<br>
need to be mapped correctly over to the HTML, before TeX gets to have<br>
its way with them. (I had some more thoughts in that vein in an old blog<br>
post of mine [4]).<br>
<br>
I think each conversion process has done significant work in that<br>
direction, and I find myself wishing that we could reuse and exchange<br>
our bindings more effectively between projects.<br>
<span class=""><br>
> I should not advertise my blog package in the moreyhpe bundle<br>
><br>
>     <a href="http://ctan.org/pkg/morehype" rel="noreferrer" target="_blank">http://ctan.org/pkg/morehype</a><br>
><br>
> (at present) but the original posting provokes the question<br>
> of what "native" conversion of LaTeX to HTML could be:<br>
> With blog.sty, the source code is actually parsed by LaTeX<br>
> (I consider it so perverse to parse LaTeX source code<br>
>  by non-TeX software), and it "directly" \writes HTML,<br>
> the TeX macros expand to HTML.<br>
<br>
</span>Right, there is a clear difference of perspective there. My view is that<br>
LaTeX's markup should need no further extensions to generate (semantic,<br>
high quality) HTML5, as the alternative increases the already high<br>
learning curve, and makes a highly technical writing experience even<br>
more involved. For me the pain of having to reeducate the entirety of<br>
the latex authoring world to write "web-friendly" latex is a worse<br>
approach than silently offering a solution under the hood. And that is<br>
something I really appreciate in lwarp's current vision, as Brian seems<br>
to be sheltering the authors as much as possible.<br>
<br>
I think there is an interesting design problem there, and I am always<br>
curious to see the trade-offs that each of these projects decides on.<br>
I'm curious to learn more about the differences between lwarp and<br>
tex4ht, the amount of work that it took to get to the current stage, and<br>
the estimated difficulty for adding support for new packages. Looking at<br>
lwarp's support list, I see that there is a Tikz -> SVG support already<br>
operational. Is that building on the tex4ht driver for SVG directly?<br>
<br>
<br>
Wishing everyone a nice week ahead,<br>
Deyan<br>
<br>
[1] xii.tex example in the latexml showcase<br>
<a href="http://latexml.mathweb.org/editor?demo=xii" rel="noreferrer" target="_blank">http://latexml.mathweb.org/editor?demo=xii</a><br>
<br>
[2] arXMLiv conversion status<br>
<a href="http://cortex.mathweb.org/corpus/arXMLiv/tex_to_html" rel="noreferrer" target="_blank">http://cortex.mathweb.org/corpus/arXMLiv/tex_to_html</a><br>
<br>
Note: And the 61% here are missing a baseline, since it's unclear how<br>
many of these sources run error-free with a stock pdflatex installation.<br>
Apologies for the hanging number.<br>
<br>
[3] lwarp 0.12 manual<br>
<a href="http://bdtechconcepts.com/portfolio/lwarp_v0_12.pdf" rel="noreferrer" target="_blank">http://bdtechconcepts.com/portfolio/lwarp_v0_12.pdf</a><br>
<br>
[4] "LaTeX is Dead (long live LaTeX)" blog post<br>
<a href="http://prodg.org/blog/latex_today/2015-02-20/LaTeX%20is%20Dead,%20Long%20Live%20LaTeX" rel="noreferrer" target="_blank">http://prodg.org/blog/latex_today/2015-02-20/LaTeX%20is%20Dead,%20Long%20Live%20LaTeX</a><br>
<div class="HOEnZb"><div class="h5"><br>
><br>
> Cheers,<br>
><br>
>     Uwe.<br>
><br>
> _______________________________________________<br>
> TeX FAQ: <a href="http://www.tex.ac.uk/faq" rel="noreferrer" target="_blank">http://www.tex.ac.uk/faq</a><br>
> Mailing list archives: <a href="http://tug.org/pipermail/texhax/" rel="noreferrer" target="_blank">http://tug.org/pipermail/texhax/</a><br>
> More links: <a href="http://tug.org/begin.html" rel="noreferrer" target="_blank">http://tug.org/begin.html</a><br>
><br>
> Automated subscription management: <a href="http://tug.org/mailman/listinfo/texhax" rel="noreferrer" target="_blank">http://tug.org/mailman/listinfo/texhax</a><br>
> Human mailing list managers: <a href="mailto:postmaster@tug.org">postmaster@tug.org</a><br>
<br>
_______________________________________________<br>
TeX FAQ: <a href="http://www.tex.ac.uk/faq" rel="noreferrer" target="_blank">http://www.tex.ac.uk/faq</a><br>
Mailing list archives: <a href="http://tug.org/pipermail/texhax/" rel="noreferrer" target="_blank">http://tug.org/pipermail/texhax/</a><br>
More links: <a href="http://tug.org/begin.html" rel="noreferrer" target="_blank">http://tug.org/begin.html</a><br>
<br>
Automated subscription management: <a href="http://tug.org/mailman/listinfo/texhax" rel="noreferrer" target="_blank">http://tug.org/mailman/listinfo/texhax</a><br>
Human mailing list managers: <a href="mailto:postmaster@tug.org">postmaster@tug.org</a><br>
</div></div></blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature">Shubho Roy<br>National Institute of Public Finance and Policy<br>18/2 Satsang Vihar Marg,<br>Special Institutional Area,<br>New Delhi 110067.<br>[Near JNU East Gate]<br><br>Mobile:- +91-9716479606<br>Location:- <a href="http://goo.gl/ICCjh" target="_blank">http://goo.gl/ICCjh</a></div>
</div>