<div dir="ltr">2016-02-19 16:26 GMT+01:00 Kamal Abdali <span dir="ltr"><<a href="mailto:k.abdali@acm.org" target="_blank">k.abdali@acm.org</a>></span>:<br><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0.8ex;border-left:1px solid rgb(204,204,204);border-right:1px solid rgb(204,204,204);padding-left:1ex;padding-right:1ex"><div>Hi Zdeněk,<br><br>Kudos! You figured one out correctly, and got only close on the second one because I gave you the wrong clue! Sorry. The two word-separated parsings of the second text are:<br>جمالو   ہار   گیا۔ </div></blockquote><blockquote class="gmail_quote" style="margin:0px 0.8ex;border-left:1px solid rgb(204,204,204);border-right:1px solid rgb(204,204,204);padding-left:1ex;padding-right:1ex"><div dir="ltr">جما   لوہار   گیا۔<br></div></blockquote><div><br></div><div>Thank you, now it is clear.<br> <br></div><blockquote class="gmail_quote" style="margin:0px 0.8ex;border-left:1px solid rgb(204,204,204);border-right:1px solid rgb(204,204,204);padding-left:1ex;padding-right:1ex"><div dir="ltr">meaning: " Jamaloo was defeated" and "The ironsmith Jumma has left". While we are on fun and games, it's worth mentioning an embarrassment related to the same Nastaleeq ambiguity that a Pakistani TV channel suffered recently.  An announcer pronounced the Urdu transliteration of the English phrase "motor vehicle" as "MoTroo Haikal", most likely thinking of it as a proper noun.<span class=""><font color="#888888"><br></font></span></div></blockquote><div><br></div><div>Yes, it is the problem of و and its four types of pronunciation. I know another funny transliteration from Czech. Under socialism we had Socialist Youth Union. Union is "svaz" in Czech and the member of this union was usually called "svazák" (the first vowel is short, the second vowel is long). And if you transliterate "svazák" into Urdu without vocalization, you get سوزاک <br></div><blockquote class="gmail_quote" style="margin:0px 0.8ex;border-left:1px solid rgb(204,204,204);border-right:1px solid rgb(204,204,204);padding-left:1ex;padding-right:1ex"><div dir="ltr"><span class=""><font color="#888888"><br>Kamal Abdali</font></span></div></blockquote><div><br><br><br clear="all"><div><div class="gmail_signature">Zdeněk Wagner<br><a href="http://ttsm.icpf.cas.cz/team/wagner.shtml" target="_blank">http://ttsm.icpf.cas.cz/team/wagner.shtml</a><br><a href="http://icebearsoft.euweb.cz" target="_blank">http://icebearsoft.euweb.cz</a></div></div>
<br> </div><blockquote class="gmail_quote" style="margin:0px 0.8ex;border-left:1px solid rgb(204,204,204);border-right:1px solid rgb(204,204,204);padding-left:1ex;padding-right:1ex"><div class=""><div class="h5"><div class="gmail_extra"><br><div class="gmail_quote">On Fri, Feb 19, 2016 at 5:18 AM, Zdenek Wagner <span dir="ltr"><<a href="mailto:zdenek.wagner@gmail.com" target="_blank">zdenek.wagner@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0.8ex;border-left:1px solid rgb(204,204,204);border-right:1px solid rgb(204,204,204);padding-left:1ex;padding-right:1ex"><div dir="ltr"><div><div>2016-02-19 4:25 GMT+01:00 Kamal Abdali <span dir="ltr"><<a href="mailto:k.abdali@acm.org" target="_blank">k.abdali@acm.org</a>></span>:<br></div></div><div class="gmail_extra"><div class="gmail_quote"><div><div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div class="gmail_extra"><span><br><div class="gmail_quote">On Thu, Feb 18, 2016 at 7:38 PM, Zdenek Wagner <span dir="ltr"><<a href="mailto:zdenek.wagner@gmail.com" target="_blank">zdenek.wagner@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div>I have compared both and personally I like Jonathan's version. Of course, I am not an expert. I do not have any collection of high quality Urdu documents. I have only seen Mirza Ghalib's manuscript in his museum in New Delhi and some Urdu documents in the museum in LaL Qila. My knowledge of Urdu is very weak. Spoken Urdu is basically the same language as Hindi so that I can listen to BBC Urdu and understand almost everything but reading is difficult for me and I know nothing about calligraphy. It will take me hours to read the sample text, I can only recognize from the title that it is the Universal Declaration of Human Rights. Anyway, the larger interword spaces do not help me toread the text.<br><br></div>As an example I am attaching the text from the Jama Masjid in New Delhi. Look at the beginning of the first line. There is a considerable space between آ and پ although آپ is a single word. The interword space between آپ and جامع is smalle that the space in the middle of جامع and there is almost no space between جامع and مسجد. There is no space between پر and زیارت but I still can see the words. In the third line the largest space is in the middle of پرکشش. Of course, it helped me to see the same text in Devanagari, I would probably be unable to read the Urdu text without it.</blockquote></div><br><br></span><div style="font-family:arial,helvetica,sans-serif;font-size:small">​<span>Zdeněk,<br><br>If each word in Urdu (or in any language written using Arabic characters) formed a connected figure, then any amount of interword space (including zero) would be OK. But since some letters connect with the next letter and some do not, words often consist of two or more separate figures. Having interword spaces then helps to delimit each word. Stringing words together without any space between them is an incessant source of ambiguities and problems. That's why all scripts for the Arabic alphabet other than Nastaleeq now use interword spaces. This forum is not a place to go into more details, so I'll just give you two examples in the form of entertaining puzzles. Without interword spaces, you can read a certain Urdu text (word string) as:<br><br>EITHER "He is eighty-four years old." <br>OR "That thief is eighty years old."<br><br>Another one can be read<br><br>EITHER "Jamaloo was defeated."<br>OR "Jumma went to Lahore."<br><br>(Jamaloo and Jumma are both common nicknames.) New learners are constantly frustrated because the printed shapes in front of them provide no visual help in separating the words. Basically, the script assumes that you already know what you're trying to learn by reading!<br><br>Again, I am not calling for a ban on tight kerning, but I am asking Jonathan to be flexible about interword spaces for anyone who wants it. At present most Urdu word processors make it very difficult to overcome interword space suppression in Nastaleeq fonts.  <br><span><font color="#888888"><br></font></span></span></div><span><font color="#888888"><div style="font-family:arial,helvetica,sans-serif;font-size:small"><span>Kamal Abdali<br></span></div></font></span></div></div></blockquote><div><br></div></div></div><div>Hi Kamal,<br><br></div><div>thank you for examples, I see the problem of چوراسی and چور اسی without and with the interword space. The spaces will be needed especially in textbooks of Urdu and in dictionaries.<br><br></div><div>Could you, please, send me the second example in Urdu? It is interesting to me. I can guess that the second sentece ends with حلاحور گیا  and by similarity with Hindi I could imagine verb حارنا but then the first sentence would end with حار گیا<br></div><div>The ending is thus different (حار versus حور) but as I wrote, I may be mistaken.<br><br></div><div>I hope the first example in full is:<br></div><div dir="rtl">وہ چوراسی سال کا ہے،<br></div><div dir="rtl">وہ چور اسی سال کا ہے۔<br><br clear="all"></div><span><div><div><div>Zdeněk Wagner<br><a href="http://ttsm.icpf.cas.cz/team/wagner.shtml" target="_blank">http://ttsm.icpf.cas.cz/team/wagner.shtml</a><br><a href="http://icebearsoft.euweb.cz" target="_blank">http://icebearsoft.euweb.cz</a></div></div>
<br> </div></span><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div class="gmail_extra"><span><font color="#888888"><div style="font-family:arial,helvetica,sans-serif;font-size:small"><span></span></div><div style="font-family:arial,helvetica,sans-serif;font-size:small">​</div></font></span></div></div>
<br><br>
<br><span>
--------------------------------------------------<br>
Subscriptions, Archive, and List information, etc.:<br>
  <a href="http://tug.org/mailman/listinfo/xetex" rel="noreferrer" target="_blank">http://tug.org/mailman/listinfo/xetex</a><br>
<br></span></blockquote></div><br></div></div>
<br><br>
<br>
--------------------------------------------------<br>
Subscriptions, Archive, and List information, etc.:<br>
  <a href="http://tug.org/mailman/listinfo/xetex" rel="noreferrer" target="_blank">http://tug.org/mailman/listinfo/xetex</a><br>
<br></blockquote></div><br></div>
</div></div><br><br>
<br>
--------------------------------------------------<br>
Subscriptions, Archive, and List information, etc.:<br>
  <a href="http://tug.org/mailman/listinfo/xetex" rel="noreferrer" target="_blank">http://tug.org/mailman/listinfo/xetex</a><br>
<br></blockquote></div><br></div></div>