Open-Tamil v0.8

Last release of Open-Tamil was v0.71 from March 2018. Since then a lot of work has gone into making software with additional features, bug fixes, web interface for Tamilpesu.us

Today, I’m posting the combined efforts of Open-Tamil developers as an update/packaged release v0.8 for Open-Tamil here.

Please try the software in your development environment as:

$ pip install –upgrade open-tamil

and report any problems via email to ezhillang@gmail.com

இந்த நேரத்தில், ஓபன் தமிழ் கணினி தொகுப்பு சிறப்பாகவும் மேம்படுத்தப்பட்டும், பிழைகள் திருத்தப்பட்டும் வருவதற்கு ஒத்துழைப்பும், பங்களிப்பும் அளித்துவரும் நண்பர்கள், பொறியாளர்களுக்கும் மிக்க நன்றிகளை தெறிவித்துக்கொள்கிறேன்.

தொடர்ந்து அடுத்த ஆண்டும் செயல்படுவோமாக. நன்றி. வாழ்க வளமுடன்!

பொற்பாலம்

பெசிபிக் பெருங்கடல் விரிகுடாவில் நுழைய,

அமெரிக்க கண்டத்தின் எல்லை, 

மேற்கே மரையும் ஞாயிறு,

சமுத்திரத்தின் உறவை அங்கீகர்க்கும் பாலம்,

யாதும் ஊரே, என்றது நீதானா?

Apple apotheosis

Today, I had a chance to go to the Apple store. Trying the Apple stylus is a great tool for graphic artist.

iPhone XS [or XR?] with beautiful rendering of tamilpesu.us
Tangram game with App-based and interactive setup

I think Apple has elevated engineering to a high water-mark. Wow. Engineers can make magic when we all work together driving other professional designers, artists, marketers, manufacturers to synthesize beautiful experience. Technology, is magic.

Artful Arisuvadi – Tamil Alphabet Nomograms

Some weeks ago I started playing with and made a bunch of alphabet nomogram style pictures with Easel JS. Its interesting to think of possibilities.

Canonical Tamil has 12 + 1 vowels [உயிர்], 18 consonants [மெய்] and 12×18 = 216 [உயிர்மெய்] conjugate letters. Together the can be arranged in a Table of named column [12 for vowels] and named rows [18 for consonants] and cells of row-column at the conjugate letters.

I posted several images on Twitter; first one based on 3 concentric circles arrangement of the letters.

Arisuvadi – (C) 2018 Muthu Annamalai

Another image based on sunflower-spiral:

Arisuvadi – (C) 2018 Muthu Annamalai

The other based on a logarithmic spiral: 

Arisuvadi – (C) 2018 Muthu Annamalai

Another image looks to illustrate vowels and consonants as an interactive widget where you select uyir and mei letters from the outer + inner circles to form the uyirmei conjugate letter in the center.

Arisuvadi – (c) 2018 Muthu Annamalai

வான்பசு – மொழியியல் மரப மரபணு

சென்ற வாரம் எங்களது வீட்டிற்கு மனைவியின் பக்கத்து சகோதரர் மற்றும் குடும்பத்தினர் வருகை. அண்ணன் மகன் சிறுவன் -தாய்ப்பாலுடன் தமிழையும் அறவே அருந்தியவன் போலும்.

Wild_turkey_eastern_us
வான்கோழி [Turkey]. படம் உரிமம்: விக்கிப்பீடியா

சிறுவன் அவனது அம்மாவுடன், விலங்குகளின் பணியாளர்களின் பெயர்களையும் ஒரு விளையாட்டாக தனக்கு தெரிந்த சொல்வளத்தினில் சொல்லிக்கொண்டு முறை மாற்றி மாற்றி விளையாடுவது அவன் பழக்கம்.

அவனது பெற்றோர் இதனை சிறிது நேரம் அவன் சலிப்பை நீக்கவும், அடம், பிடிவாதங்களில் இருந்து அவன் கவணத்தை திசை திருப்பவும் முயற்சி செய்வார்கள். ‘அடுத்த விலங்கு’ அல்லது ‘அடுத்த பணியாளர்’ போன்ற விளையாட்டுகளில் நாங்களும் பங்கேற்போம்.

ஒரு முறை, இப்படி விளையாடிக்கொண்டிருக்கையில், ஆட்டம் 15-20 விலங்குகளின் பெயர்களைத்தாண்டி போனது; அவனது சொல் வளத்தின் எல்லை என்றும் சொல்லாம். சிறுவனிடம், நான் ‘வான்கோழி’ என்று எனது பங்கிற்கு சொன்னேன். அவனும் எற்கனவே ‘நெருப்புக்கோழி’ என்றும் சொல்லியிருந்தான்.  தற்போது, அவன் ஆட்டம். என்ன சொல்லப்போகிறான்?

“வான்பசு,” என்று புன்சிரிப்புடன் வெற்றியை கைபிடித்தவன் போல சொன்னான். “தம்பி அப்படி ஒரு பசு கிடையாதே!”, என்று சொல்லி அவனை சமாதானப்படுத்துவது ஒரு காரியமானது.

ஆனால் என்ன ஒரு கவனிப்பு, மொழியியல் கூர்மை. ஆகா – வியந்தேன். அவனுக்கும் பகுதி, விகுதி, இதெல்லாம் தெரிந்திருக்குமோ? மொழியியல் வல்லுனர்களின் கணிப்பில், இருக்கலாம். நாலுவயசானாலும் என்ன, தமிழை பிரித்து மேயும் மூளை; தமிழ் தாய் வாழ்த்தும் பாடுவான் கிரிதிக்.

p.s: பிழைத்திருத்தங்களுக்கு நன்றி – திரு. ரவிராஜ் ஸ்புட்னிக்.

செல்வா

வருங்காலத்தில் ஒரு தமிழ் செயற்கை நுண்ணறிவு உருவாக்கப்படும். உடனுக்குடன் ‘இன்ஸ்டண்டா’ ஆங்கிலத்தில் இனையான தமிழ் சொற்களை தேடி அல்லது உருவாக்கி சொல்லும். ஆமாம் எந்திரம் சொல்லாடலில் எப்படியும் உள்ளே வரப்போகிரது. நமக்கும் உதவட்டுமே!

தமிழ் மரபுகளுடன், மொழி பழக்கவழக்கங்களுடன் சரிவர, முடிந்த அளவு வட மொழி சொற்கள் சேற்காமல், மேலும் ஒரு படி அதிகமாக ஆங்கிலம் கலப்பின்றி [முற்றிலும் ஒழிக்கமுடியுமா? தெரியவில்லை; கணினிதானே, இலக்கைவைத்தால் முடியாதா என்ன ?]

R2-D2 மற்றும் C-3PO Star Wars திரைபடத்தின் கதாப்பாதிர ரோபோக்கள்.
R2-D2 மற்றும் C-3PO Star Wars திரைபடத்தின் கதாப்பாதிர ரோபோக்கள். (c) Lucas Films, Inc. and Star Wars franchise

இத்தகைய செயற்கை நுண்ணறிவு உருவாக்கினால், அதற்கு செல்வா என்று செல்லமாக பெயரிடுவோம். அரிமா ரோபோ C-3PO, R2D2 மாதிரியான, புவியில் இல்லாத தமிழ் அறிவு கொண்ட ஒரு ஓரகில் [Oracle]-ஆக அமையுமோ என்னவோ. ஐயா கலாம் சொன்னது கனவுகள் நினைவாக விழித்திடு; தூக்கத்தை கலைத்திடு.

 

ஆமவடை

ஏற்கணவே பதிவு செய்த  இடத்தில் இருந்து தொடருவோம்:

ஆமவடை
படம் 1: ஆமவடை

Corollary 2 of  Theorem 3: ஒரே சொல்லில் எழுத்து இரடிக்கப்பட்டால் அந்த சொல் டோரசில் ஒரு சுழலுடன் [loop] கொண்டபடி அமையும்.

Lemma 2:  படுக்கவசமாகவும், நிமிர்ந்துவசமாகவும் அமைகப்பட்ட சொர்கள் மொழியில் இல்லாதவை.

Corollary 3 or Theorem 3: டோரசில் படுக்கவசமாகவும், நிமிர்ந்துவசமாகவும் பாதைகள்/எழுத்துக்கள் இல்லாதவை.

Theorem 4: ஒரு அகராதியில் உள்ள சொர்கள் அனைத்தையும் டோரசில் பிரதிபலித்தால் அந்த குறுக்கிடும் இடங்களின் [intersecting points] ஒன்று அல்லது மெர்பட்ட சொற்களை] எண்ணிக்கை அளவை மிக குறைவாக்கும் வண்ணம் அமைக்க முடியாது. அதாவது ஒரு அகராதியின் சொற்கள் அனைத்து எவ்வித அமைப்பில் உள்ள டோரசானாலும் சரி அதன் குறுக்கிடும் இடங்களின் எண்ணிக்கை மாராது. இது ஒரு மாறிலி [invariant].

Corollary 1 of Theorem 4: மேர்கண்ட டோரசில் [அதன் ஒரு பிரதிபலிப்பில் – ‘அ,ஆ,இ,ஈ, … ,ஒ,ஓ,ஔ‘ என்றும் ‘கசடதபரயரலவழள – ….’  என்றும் வரிசையிலோ, அல்லது வேறு பரிமாணங்களில்  அடுக்கியிருந்தால்] ஒவ்வொரு அகராதிக்கும் ஒரு சிரப்பான குறுக்கிடும் இடங்களின் எண்ணிக்கை கிடைக்கும். இந்த எண் அகராதியின் கையொப்பம் [signature] என்றும் சொல்லாம்.

Theorem 5: டோரசில் உள்ள ஓவ்வொரு அகராதி சொல்லும் ஒரு பாதை என்று கொள்ளலாம். சொல்லின் தொடக்க எழுத்து  பாதையின் தொடக்கத்தையும், சொல்லின் கடைசி எழுத்து பாதையின் முடிவையும் குறிக்கும்; பாதை திசைகொண்ட பாதையாக இருக்கும் – ஒரு அம்பு தொடக்கத்தில் இருந்து முடிவின் திசையில் வழி காட்டும். ஆகையால் அகராதியில் இல்லாத பாதைகள் பிழையாக எழுதப்பட்ட  அகராதி சொற்களுக்கு சமம், அல்லது அகராதியில் இல்லாத புதிய சொற்களுக்கு சமம்.

வாதம் [ஆதாரத்தின் தொடக்கமாக கருத்ப்படலாம்]:  டோரசில்ஒவ்வொரு சொல்லும் [அதன் பாதையும்] அகராதியில் உள்ள சொற்களாகவே இருக்கவேண்டும். Coding-theory / error correction codes theory படி இவ்வகை சரியான எழுத்துக்கள் உள்ள பாதைகள், சரியான சொற்களாகவும், தவான சொற்கள் [இல்லாத சொற்கள்] பிழையானவை என்வும் அமையும். இவ்வாரான சொற்கள் சரியானவையையின் சொற்பிழை எனவும் கருதப்பாடும்.

Corollary 1 of Theorem 5: மேர்கண்ட டோரசில் முழு அகராதி பிரதிபலிக்கப்பட்டதால், இதனைக்க்கொண்டு ஒரு சொற்பிழை திருத்தி செய்யலாம். பிழையான் சொல்லின் திருத்தம், அதன் நெருங்கிய தொலைவில் உள்ள சரியான் சொல் என்பதை நடைமுரைவிதியாகக்கொண்டு இதனை அமல்படுத்தலாம்.

Theorem 6: Tries எனப்படும் சொல்மரங்களைக்கொண்ட தரவமைப்பை டோரசில் குறியிட்டால், அது தொடர்பாதையாக ஒரே தொடக்கமும், பல பாதைமுடிவுகளையும் கொண்டதாக அமையும். இவற்றில் சில பாதைகள் சேரும் வகையில் முடிவுபெரும் வகையிலும் அமையலாம்.

படம் 2: Trie மரம் என்ற தரவமைப்பு. இதில் ‘to’, ‘tea’, ‘ted’, ‘ten’, ‘A’, ‘in’, மற்றும் ‘inn’ ஆகிய சொற்கள் இடம் பெற்றுள்ளன.

உதாரணத்திற்கு, படம் 2-இல் முடியும் நிலை நுனிகள் ‘n’ என்பவை டோரசில் வரும்பொழுது சேரும் வகையில் முடிவுபெரும் வகையில் அமையும்.

-முத்து.

தமிழ் ஒரு வடை [அதாங்க – டோரஸ்]

Lemma 1:

தமிழ் ஒரு வடை [அதாங்க – டோரஸ்]. வடை என்றால் சராசரி உளுந்து வடைதாங்க [படம்: இடது]. Donut. Torus [படம்: வலது].

.hqdefault2000px-Simple_Torus.svg.png

இதை எப்படி நம்ம சொல்லுரது ? அதாங்க வடையின் இரு திசைகளில், உயிர் எழுதுக்களை தரை மட்டம் அளவிலும், குறுக்கே மெய்யெழுதுக்களும் அமைத்தும், இவ்விரண்டு வரிகளின் குறுக்குச் சந்திப்பு இடங்களில் அந்தந்த உயிர்மெய் எழுதுக்கள் வரும் படி அமைத்தால் தமிழும் ஒரு வடை.

ஆகயால், எவ்வித ‘அபுகிடா’ [abugida] மொழிகளையும் ஒரு வடையில் எழுதலாம்.

Theorem 1: சொற்களை வடையில் பிரதிபலிக்கலாம்.

சொற்களில் எழுதுக்கள் உள்ளன. லெம்மா 1, படி எழுதுக்கள் வடையில் பிரதிபலிக்கலாம். அடுதடுத்து வரும் சொல்லின் எழுதுக்களை அம்பின் வாயிலாக கோர்த்து அமைத்தால் அது ஒரு வடையில் பிரதிபலிக்கும் ஒரு வகையாகும்.

Theorem 2: மேற்கண்ட படைப்பின் விதி படி விகடகவி – சொற்கள் [anagram] சுழல்-வட்டமாக அமையும்

விகடகவி சொற்கள் முன் பின் திசைக்கு வேற்றுமையில்லாமல் வசிக்கும் தன்மையுடயவை. அதனால் இவை சரியாக தொடங்கும் சொல்லில் முடியவெண்டும். எனவே இவற்றின் பிரதிபலிப்பு சுழல்-வட்டமாக அமயும்.

Theorem 3: Two words that don’t intersect in torus don’t share common letters

Corollary of Theorem 3: Two words that share letters will intersect.

-Muthu

 

‘காலம் மாரிப் போச்சு, கண்ணீர் மாரிப் போச்சு’

பாலியல் தாக்குதல், வால்லுரவு, அத்துமீரல் பற்றி மார்சு 2018-இல் பாடகி சின்மயி வெளியிட்ட கானொளி. #MeTooIndia என்பாது பாரதி காண்ட பெண்ணியத்தை முதன்மையாக்குமோ ?

நானும் பாலியல் துன்புறுத்தலுக்கு ஆளானேன் பாடகி சின்மயி திடீர் என வெளியிட்ட வீடியோ! Chinmayi Sripada

Latha vs Bamini – 1

Tamil billboard; credits - masanori_jpn via Flickr.

Well, this blog post is not about any famous cat-fight: ‘sabaash – sariyaane potTi!’

80535-epqqqdhsmh-1517237957
Frame grab from the song ‘Kannum Kannum’ from movie ‘Vanjikottai Vaaliban’ with danseuse rivals Padmini and Vaijayanthimala.

but about the more mundane issue of resolution of Tamil letters that maybe affecting visual acuity and usage in practical things like billboards. Yes, we know Latha (is Tamil font from Microsoft) and Bamini famous storied font created in 1980s. Bamini font is also used in the Chennai Metro, Colombo railway station among other places; creator of Bamini was recently felicitated with 2017 Tamil Computing award for the pioneering efforts in the dawn of digital era.

Back to resolution; ‘kannu theriyithaa ?’ is the usual expression but it really asks the question are you able to see the object/thing/place/person – and not literally ‘do you have vision?’

In optical science, it is well known that free-space – distance – acts as a filter introducing blurs into the image. This is the mechanism behind why we don’t see details of far-away billboards and they grow in detail as one may approach them.

Tamil billboard; credits - masanori_jpn via Flickr.
Tamil billboard; credits – masanori_jpn via Flickr.

So if you are advertising in large billboards, obviously you want to be visible to audiences as far as laws of physics [Rayleigh resolution limit] will allow.

We can gather from simple considerations the following:

  1. Larger the letters farther away they maybe visible
  2. Longer wavelengths of light [Red (longer) – Violet (shorter)] farther they are visible without being scattered

So you can ask, if all the billboards are painted in large bold Tamil letters ‘adikkira maathiri’, will be visible for very long distances ? Yes. And they will also be boring.

This knowledge does not help us to choose between two fonts, since we can draw/write/pain letters in their character in any size and color – just the shape remains fixed.

Now to properly analyze the two fonts for best visual acuity, we may consider the following criteria:

  1. All letters compared need to be same in both fonts
  2. Viewer is considered to observe the projected font/printed text/billboard from progressively farther and farther distances.
  3. Essentially font corresponding to the billboard which is visible from farthest distance is the winner/better font in this criteria

Before we start drawing conclusions you also want the test subjects to have 20/20 vision or wear corrective prescription eye glasses for the same level of vision.

Now, regardless of the color and size of the fonts we can use the criteria to compare the acuity of the fonts.

But wait, can we do this by computer modeling without paint, labor and 20/20 vision subjects? You betcha! This will be subject of next blog post.

Until then…. Vaazhga Valamudan.

-Muthu