<div dir="ltr">Thanks. Just reported to <a href="https://github.com/hyphenation/tex-hyphen/issues/15">https://github.com/hyphenation/tex-hyphen/issues/15</a>.</div><div class="gmail_extra"><br><div class="gmail_quote">On Fri, Jun 9, 2017 at 1:41 PM, Arthur Reutenauer <span dir="ltr"><<a href="mailto:arthur.reutenauer@normalesup.org" target="_blank">arthur.reutenauer@normalesup.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">        Hi Roozbeh,<br>
<span class=""><br>
> First post to the list, reporting a bug. Please point me to the bug tracker<br>
> if there is one.<br>
<br>
</span>  The hyphenation patterns are now hosted on GitHub, and you can open an<br>
issue there (<a href="https://github.com/hyphenation/tex-hyphen" rel="noreferrer" target="_blank">https://github.com/<wbr>hyphenation/tex-hyphen</a>), but I’m happy<br>
to reply here:<br>
<span class=""><br>
> Debugging an Android user report, I found that Android was hyphenating the<br>
> words "democrat" and "democrats" incorrectly, as:<br>
><br>
> de-mo-c-rat<br>
> de-moc-rats<br>
<br>
</span>  Thank for the bug report.  That does look bad :-)<br>
<span class=""><br>
> Digging deeper, the source of the problem seems to be the following pattern<br>
> in hyph-en-us.pat.txt:<br>
><br>
> 5moc1ra1t<br>
><br>
> That pattern seems to not exist in Plain TeX's pattern file for US English.<br>
> The other patterns applying to those words, all existing in Plain TeX, are:<br>
><br>
> 1mo<br>
> 4mocr<br>
> 5crat.<br>
><br>
> I think the source of the problem is that the authors of the extended<br>
> pattern file derived the modified patterns based on TUGboat's exception<br>
> list, they created that "5moc1ra1t" pattern based on the word<br>
> "de-moc-ra-tism" and didn't notice that adding it would cause "democrat"<br>
> and "democrats" to be hyphenated incorrectly.<br>
<br>
</span>  I agree with that analysis, that’s indeed a common problem when adding<br>
patterns to a list generated by patgen, as the en-US patterns have.<br>
<span class=""><br>
> I believe as a temporary solution, the US English hyphenation patterns<br>
> should be restored to the Plain TeX version, and the exception list should<br>
> get extended to include everything in<br>
> <a href="http://mirror.ctan.org/info/digests/tugboat/hyphenex/ushyphex.tex" rel="noreferrer" target="_blank">http://mirror.ctan.org/info/<wbr>digests/tugboat/hyphenex/<wbr>ushyphex.tex</a>.<br>
<br>
</span>  I don’t think we’d like to do that, but we’ll think of a solution, and<br>
thank you again for reporting the issue.<br>
<br>
        Best,<br>
<br>
                Arthur<br>
</blockquote></div><br></div>