<div dir="ltr"><div>Hi David,</div><div><br></div><div>when trying to explain it in a greater detail I found that the situation is even more complex. As I wrote, I follow Elena Yerevan on youtube and facebook so all what I know, I know from her videos, from her name written in both alphabets, from Wikipedia and from <a href="https://omniglot.com/writing/armenian.htm">https://omniglot.com/writing/armenian.htm</a> which means that I know generally nothing. We need clarification from people who know Armenian (հայերէն and/or հայերեն), therefore I am sending Cc to Arthur and the authors of te ArmTeX project (hopefully at least one of the addresses still exists).</div><div><br></div><div>I will start with the typical use case. The title of a chapter in the book class is written in lowercase and displayed that way in the chapter title as well as in the table of contents but appears in uppercase in the running head. This is why it should work.</div><div><br></div><div>The case of ligatures is different. My fonts have not only ff, fl, and fi ligatures but even ffi and ffl. If I find a word "difficult" on a web using a serif font, I see the ffi ligature but the source shows that it has the individual characters f, f, i and the ligature was created by the shaping engine. If I copy it and paste into a text editor such as vim or notepad, I will get the three characters. If I use it as a TeX source and typeset it withComputer Modern or Latin Modern, I will get the ffi ligature and \uppercase will work. If I copy U+0587 from a web page and copy it to a text editor, I will get U+0587. I tried both U+0565 U+0582 (եւ) and U+0565 U+057E (եվ) but non of them form the U+0587 (և) ligature in XeLaTeX. I did not understand why the ligature is considered ECH and YIWN but it seems that it is more historical and bound to the shape. If I understand it well, sun is pronounced in Armenian as "arew" but արև (U+0561 U+0580 U+0587) is the Eastern spelling but արեւ (U+0561 U+0580 U+0565 U+0582) is the classical spelling (as given in Wictionary) and probably also in the Western variant. As you can see on Omniglot, the Armenian names of Eastern/Western Armenian start with "arew" with these two spellings. Even "hayeren" (Armenian) has different spelling in the Eastern/Western variants (I have included both at the beginning of this mail). Having found the informatin on variants I saw that polyglossia supports variant=western. I tried to specify variant=eastern but it did not help. If you look at ot6enc.def, it defines uppercase variants at the end of the file where the uppercase version of \armew is \Arm@yechvev which is \Armyech\Armvev. I cannot try because I do not know the transliteration but just from the names of the characters it seems to me that it works correctly while \text_uppercase:n does not. It should know that U+0587 shiould be decomposed to U+0565 U+057E (not U+0582) and then uppercase it to U+0535 U+054E (not U+0552), at least for the Eastern variant. I am not sure whether there are other issues and where exactly to fix it.</div><div><br></div><div><div><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr">Zdeněk Wagner<br><a href="http://ttsm.icpf.cas.cz/team/wagner.shtml" target="_blank">http://ttsm.icpf.cas.cz/team/wagner.shtml</a></div></div></div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">ne 1. 5. 2022 v 8:08 odesílatel David Carlisle <<a href="mailto:d.p.carlisle@gmail.com">d.p.carlisle@gmail.com</a>> napsal:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div>the input uses a ligature character which has no corresponding uppercase, you need to decompose the ligature before uppercasing, which \uppercase can't do, you see the same in Latin script ff ligature</div><div><br></div><div>\uppercase{diff diff}</div><div><br></div><div>looks like DIFF DIff as the second one uses U+FB00 which has no uppercase.<br></div><div><br></div><div>
<pre id="gmail-m_-5111316652578477397gmail-result"> U+0587 ARMENIAN SMALL LIGATURE ECH YIWN</pre>

</div><div>would be better input as  U+0565 U+0582 <br></div><div><br></div><div>David<br></div><div><br></div><div><br></div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sun, 1 May 2022 at 00:09, Zdenek Wagner <<a href="mailto:zdenek.wagner@gmail.com" target="_blank">zdenek.wagner@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div>Yes, it looks better but the uppercase version should contain ԵՎ, not ԵՒ. Վ is capital vew (U+54E) while Ւ is capital yiwn (U+552).<br></div><div><br></div><div><div><div dir="ltr"><div dir="ltr">Zdeněk Wagner<br><a href="http://ttsm.icpf.cas.cz/team/wagner.shtml" target="_blank">http://ttsm.icpf.cas.cz/team/wagner.shtml</a></div></div></div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">ne 1. 5. 2022 v 0:53 odesílatel David Carlisle <<a href="mailto:d.p.carlisle@gmail.com" target="_blank">d.p.carlisle@gmail.com</a>> napsal:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div>Something like this, I think.</div><div><br></div><div><img src="cid:ii_l2mglarh0" alt="image.png" width="563" height="154"><br></div><div><br></div><div>\documentclass{article}<br>\usepackage{polyglossia}<br><br>\setdefaultlanguage{armenian}<br>\setmainfont{DejaVu Sans}<br>\ExplSyntaxOn<br>\let\tuppercase\text_uppercase:n<br>\ExplSyntaxOff<br>\pagestyle{empty}<br>\begin{document}<br>Երևան $\rightarrow$ \uppercase{Երևան}<br><br>Երևան $\rightarrow$ \tuppercase{Երևան}<br><br>\end{document}</div><div><br></div><div>David</div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sat, 30 Apr 2022 at 22:15, Zdenek Wagner <<a href="mailto:zdenek.wagner@gmail.com" target="_blank">zdenek.wagner@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Hi all,<br>
<br>
first I should mention that I do not know Armenian at all and can just<br>
recognize a few characters. Anyway I came across a problem which<br>
probably cannot be solved by the standard \lccode / \uccode method.<br>
What I mean is Yerevan which is written as Երևան but YEREVAN (all<br>
caps) is ԵՐԵՎԱՆ because և has no uppercase variant and must be<br>
replaced by two characters ԵՎ. At least, it is visible in Elena<br>
Yerevan's songs shot in the city of Yerevan. The following file<br>
<br>
\documentclass{article}<br>
\usepackage{polyglossia}<br>
\setdefaultlanguage{armenian}<br>
\setmainfont{DejaVu Sans}<br>
\pagestyle{empty}<br>
\begin{document}<br>
Երևան $\rightarrow$ \uppercase{Երևան}<br>
\end{document}<br>
<br>
shows that all characters are converted correctly to uppercase but և<br>
remains in lovercase. Is there a solution?<br>
<br>
Zdeněk Wagner<br>
<a href="http://ttsm.icpf.cas.cz/team/wagner.shtml" rel="noreferrer" target="_blank">http://ttsm.icpf.cas.cz/team/wagner.shtml</a><br>
<br>
</blockquote></div>
</blockquote></div>
</blockquote></div>
</blockquote></div>