<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">2014-05-06 11:57 GMT+02:00 David Carlisle <span dir="ltr"><<a href="mailto:d.p.carlisle@gmail.com" target="_blank">d.p.carlisle@gmail.com</a>></span>:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><br><div class="gmail_extra"><br><br><div class="gmail_quote"><div class="">On 6 May 2014 10:05, Lars Madsen <span dir="ltr"><<a href="mailto:daleif@imf.au.dk" target="_blank">daleif@imf.au.dk</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi<br>
<br>
I was wondering, is any work being done on making xindy/texindy work with latex and utf8?<br>
<br>
This question highlights the problem and in an answer there is a good workaround.<br>
<br>
<a href="http://tex.stackexchange.com/q/153858/3929" target="_blank">http://tex.stackexchange.com/q/153858/3929</a><br>
<br>
If a xindy fix is too far in the future, would it make sense to provide the ie2utf script from <a href="https://github.com/michal-h21/iec2utf" target="_blank">https://github.com/michal-h21/iec2utf</a> as a part of TL, and perhaps even make some perl wrapper for it, making it easier to use for the casual user?<br>


<br>
(is piping available on all platforms?)<br>
<span><font color="#888888"></font></span><br></blockquote><div><br></div></div><div>Rather than make xindy understand LaTeX's somewhat idiosyncratic character representation it would probably be better to have an option in inputenc to write index files in utf8. As discussed recently on latex-l there  have been "modest" (hello Karl:-) changes in this area in the 2014/05/01 latex release and plans to better support inputenc on xetex/luatex in the near future.  A requirement for better support would be translation between the traditional LICR and utf8 characters, so that could probably be also used here with pdftex auxiliary files.  </div>
</div></div></div></blockquote><div><br></div><div>I am not sure whether all this can be achieved at the expand processor level where inputenc works but I know that it is already implemented in encTeX. I use it regularly for Czech specifying "-I omega" with texindy (because the input markup is now the same as in omega). I am not sure whether utf8-t1.tex contains characters needed for Swedish, Norvegian, Danish (and other European languages) but it will be simple to do that. The file was prepared by Petr Olšák for Czech and Slovak, so non-Latin characters are not present but adding complete Unicode (or preparation of other tables) should not be a problem.<br>
<br></div><div>I am aware only of two problems:<br></div><div>1. url.sty contains some definitions using the ^^ convention which then looks as illegal UTF-8 character (encxvlna documentation shows how to solve it)<br></div>
<div>2. conflict with microtype.sty if protrusion is used (no conflict with font expansion), solution would require a hook in microtype.<br></div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote"><div>We have some internal tests although the lack of \Uchar in xetex and existing bugs in xetex ^^^^ parsing make supporting xetex tricky at the moment as you can generate the unicode number but you can not generate a character of that number in xetex (writing the utf8 from pdftex from latex's internal form wouldn't be hard)<br>

<br></div><div>That's not to say the script shouldn't be added to TL (can't comment on that) more than one way to do something is always useful, but a bug/feature request in the latex-bug database to address that stackexchange question would be useful, so we don't forget:-)<span class="HOEnZb"><font color="#888888"><br>

<br></font></span></div><span class="HOEnZb"><font color="#888888"><div>David<br><br></div></font></span></div></div></div>
</blockquote></div><br><br clear="all"><br>-- <br>Zdeněk Wagner<br><a href="http://hroch486.icpf.cas.cz/wagner/" target="_blank">http://hroch486.icpf.cas.cz/wagner/</a><br><a href="http://icebearsoft.euweb.cz" target="_blank">http://icebearsoft.euweb.cz</a>
</div></div>