<div dir="ltr"><div class="gmail_default" style="font-family:trebuchet ms,sans-serif;font-size:small">I have had similar problems with PubMedCentral.  While I was a Wellcome Trust Senior Research Fellow, I was contractually obliged to submit all my publications to PMC.  But in every case it took over a year for my work to appear, and involved a huge wrangle about XML, XeTeX, and conversion.  <br><br>PMC uses tools to convert the author's PDF into XML.  Then they generate a new PDF from their XML.  They publish their own XML and their own PDF.   <br><br>I get it that they want XML.  But their conversion pipeline is not good for complex work, especially if it includes Unicode characters.  Their re-generated PDFs were a complete mess and my articles were quite literally unreadable.  (And the page numbers were all changed, making reference ambiguous.)  Admittedly, my articles use Sanskrit in Unicode and complex layout formatting.  That's why I use XeTeX, of course.<br><br>For an example, see especially pp.211 onwards of my article here:<br><ul><li><a href="http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2772122/">http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2772122/</a></li></ul><p>In the end, PMC agreed that their tech could not handle my writings, so they published my PDF and no XML.</p><p>It sounds as if arXiv is facing similar difficulties.  The best way forward for arXiv and PMC is to identify authors who are knowledgeable about advanced document processing (i.e., the members of this list!), and talk to them in a cooperative spirit about complex documents, metadata, and conversion issues.  This would be better than treating such authors as "difficulties."<br></p><p>Best, <br></p><p>Dominik<br></p><p><br></p></div></div><div class="gmail_extra"><br><div class="gmail_quote">On 23 September 2014 08:16,  <span dir="ltr"><<a href="mailto:mskala@ansuz.sooke.bc.ca" target="_blank">mskala@ansuz.sooke.bc.ca</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">On Tue, 23 Sep 2014, Ross Moore wrote:<br>
> It is the insistence on being able to reproduce the PDF<br>
> *automatically from source* that is where the problem lies.<br>
<br>
</span>>From reading Norbert's Web blog, it appears that that's also an issue for<br>
Debian packaging of TeX-related software.  Debian has a formal requirement<br>
for everything that can possibly be built from source, to be built from<br>
source, and it's not practical to do that automatically with many<br>
TeX-related documentation files.  My own horoscop LaTeX package, whose<br>
documentation requires many megabytes of astrological software (free, but<br>
not typically packaged by Linux distributions) to compile properly, is<br>
only one example.  I think there are other packages that exist<br>
specifically to support expensive commercial products and require those<br>
products in order to compile, notwithstanding that the results of<br>
compilation are free to distribute.  This kind of thing is definitely a<br>
problem; I'm not sure it is TeX's problem.<br>
<br>
As for arXiv, what bothers me is that in the case of XeLaTeX, they will<br>
accept neither the source code *nor* the compiled PDF.  All an author can<br>
do is circumvent the rules by lying in the document metadata, or else go<br>
through contortions to compile a special arXiv-only version with some<br>
other software.  I found this page helpful in my efforts to do that:<br>
   <a href="http://member.ipmu.jp/yuji.tachikawa/cjk-on-arxiv/" target="_blank">http://member.ipmu.jp/yuji.tachikawa/cjk-on-arxiv/</a><br>
<span class="im HOEnZb"><br>
--<br>
Matthew Skala<br>
<a href="mailto:mskala@ansuz.sooke.bc.ca">mskala@ansuz.sooke.bc.ca</a>                 People before principles.<br>
<a href="http://ansuz.sooke.bc.ca/" target="_blank">http://ansuz.sooke.bc.ca/</a><br>
<br>
<br>
</span><div class="HOEnZb"><div class="h5">--------------------------------------------------<br>
Subscriptions, Archive, and List information, etc.:<br>
  <a href="http://tug.org/mailman/listinfo/xetex" target="_blank">http://tug.org/mailman/listinfo/xetex</a><br>
</div></div></blockquote></div><br></div>