<div dir="ltr"><div>No, neither make4ht nor Acrobat Pro helps. The reason is that generated PDF contains glyphs but both copy&paste, save as text, save as word, or sace as whatever requires characters and this information is lost. Moreover, the order of glyphs does not follow the order of characters in the word. It can only be solved by asking XeTeX to add /ActualText as a Unicode string to each word and, of course, use a PDF viewer that does not ignore it. Adobe Reader is sufficient. The extracted string then contains Unicode characters and conversion to glyphs is then done by MS Word shaping engine (Uniscribe).<br><br></div>Note: see the well known name Siddhartha where dependent vowel (matra) I is visually at the very beginning and R is visually at the very end.<br><div><br></div></div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature" data-smartmail="gmail_signature">Zdeněk Wagner<br><a href="http://ttsm.icpf.cas.cz/team/wagner.shtml" target="_blank">http://ttsm.icpf.cas.cz/team/wagner.shtml</a><br><a href="http://icebearsoft.euweb.cz" target="_blank">http://icebearsoft.euweb.cz</a></div></div>
<br><div class="gmail_quote">2018-01-31 1:49 GMT+01:00 Ross Moore <span dir="ltr"><<a href="mailto:ross.moore@mq.edu.au" target="_blank">ross.moore@mq.edu.au</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">



<div style="word-wrap:break-word">
Hi Robert and Michal,
<div><span class=""><br>
<blockquote type="cite">On Jan 31, 2018, at 8:29 AM, Michal Hoftich <<a href="mailto:michal.h21@gmail.com" target="_blank">michal.h21@gmail.com</a>> wrote:<br>
<br>
Hi Bob,<br>
<br>
On Tue, Jan 30, 2018 at 6:57 PM, Hueckstedt, Robert A. (rah2k)<br>
<<a href="mailto:rah2k@virginia.edu" target="_blank">rah2k@virginia.edu</a>> wrote:<br>
<blockquote type="cite">With a publisher’s permission I used xelatex to provide them copy, not<br>
camera-ready copy, for a long book that has Sanskrit in Devanagari  and an<br>
English translation. Of course, the files I provided the publisher are pdfs.<br>
Now, the publisher wants them in doc. When they try to cut and paste from<br>
the pdf to doc, none of the conjunct consonants are recognized in the doc<br>
file. I used the velthuis-sanskrit mapping, and I am wondering if using the<br>
RomDev mapping would make a difference. I somehow doubt it. Suggestions?<br>
</blockquote>
<br>
You can try to compile your TeX file to HTML using tex4ht. The HTML<br>
code can be then pasted to Word. Basic command to compile XeTeX file<br>
to HTML is<br>
<br>
  make4ht -ux filename.tex<br>
</blockquote>
<div><br>
</div>
</span><div>This might work, but first I’d try using Acrobat Pro to save the PDF</div>
<div>directly into a Word document.</div>
<div><br>
</div>
<div>This *can* work really well, especially when the PDF is enriched with</div>
<div>some tagging and the correct ToUnicode CMap resources for the fonts.</div>
<div>Try it and see if the result is reasonable.</div>
<div><br>
</div>
<div>Alternatively, you can Export to HTML from Acrobat Pro; though I’d</div>
<div>expect that if the .doc export is no good, then the HTML export would</div>
<div>suffer from similar issues.</div>
<div><br>
</div>
<div>It may even be that Adobe Reader can do these exports now,</div>
<div>as it is the same code-base.</div><span class="">
<br>
<blockquote type="cite"><br>
Development version of make4ht can compile also to the ODT format,<br>
which can be opened directly in Word:<br>
<br>
  make4ht -ux -f odt filename.tex<br>
<br>
It is possible that you will need some additional configurations for<br>
the correct compilation. It depends on used packages or custom macros<br>
in the document.<br>
<br>
Best regards,<br>
Michal<br>
</blockquote>
<div><br>
</div>
<div><br>
</div>
</span><div>Hope this helps.</div>
<div><br>
</div>
<div><span class="m_3332837174578861607Apple-tab-span" style="white-space:pre-wrap"></span>Ross</div>
<div><br>
</div>
<div><br>
</div>
<div>PS. if you don’t have access to Acrobat Pro to try this,</div>
<div>can you send me a few pages. I’ll then try it for you.</div>
<div>If the result is good, that may be sufficient reason for you </div>
<div>to consider investing in a license. </div>
<br>
<div><br>
Dr Ross Moore<br>
Mathematics Dept | 12 Wally’s Walk, 734<br>
Macquarie University, NSW 2109, Australia<br>
T: <a href="tel:+61%202%209850%208955" value="+61298508955" target="_blank">+61 2 9850 8955</a>  |  F: <a href="tel:+61%202%209850%208114" value="+61298508114" target="_blank">+61 2 9850 8114</a><br>
M:<a href="tel:+61%20407%20288%20255" value="+61407288255" target="_blank">+61 407 288 255</a>  |  E: <a href="mailto:ross.moore@mq.edu.au" target="_blank">ross.moore@mq.edu.au</a><br>
<br>
<a href="http://www.maths.mq.edu.au" target="_blank">http://www.maths.mq.edu.au</a><br>
<br>
<span style="font-size:12px;line-height:normal"><a href="http://mq.edu.au/" style="font-size:12px;line-height:normal" target="_blank"><span><br class="m_3332837174578861607Apple-interchange-newline">
<span><img id="m_333283717457886160797AA87C6-2850-4DFF-BE2A-E4BB1AF56D01" src="cid:image001.png@01D030BE.D37A46F0" width="260" height="58"></span></span></a></span><br>
<br>
<br>
CRICOS Provider Number 00002J. Think before you print. <br>
Please consider the environment before printing this email.<br>
<br>
This message is intended for the addressee named and may <br>
contain confidential information. If you are not the intended <br>
recipient, please delete it and notify the sender. Views expressed <br>
in this message are those of the individual sender, and are not <br>
necessarily the views of Macquarie University.<br>
</div>
<br>
</div>
</div>

<br><br>
<br>
------------------------------<wbr>--------------------<br>
Subscriptions, Archive, and List information, etc.:<br>
  <a href="http://tug.org/mailman/listinfo/xetex" rel="noreferrer" target="_blank">http://tug.org/mailman/<wbr>listinfo/xetex</a><br>
<br></blockquote></div><br></div>