Transliteration scheme used by Varamozhi is called Mozhi. It uses a unique English character sequence for each Malayalam letter.
Example : ഉദാഹരണം
thannathilla paranuLLukaattuvaan_
onnumE naranupaayameeSwaran_
innu bhaashayathapoor_NNamingahO,
vannupOm pizhayumar_ththhaSankayaal.
naLini:kumaaranaaSaan_
|
തന്നതില്ല പരനുള്ളുകാട്ടുവാന്
ഒന്നുമേ നരനുപായമീശ്വരന്
ഇന്നു ഭാഷയതപൂര്ണ്ണമിന്നഹോ,
വന്നുപോം പിഴയുമര്ത്ഥശങ്കയാല്.
നളിനി:കുമാരനാശാന്
|
Most confused conjuncts
ങ്ക
| ngka
| nka
|
ഞ്ച
| njcha
| ncha
|
ണ്ട
| NTa
|
|
മ്പ
| mpa
|
|
Using ~ for chandrakkala
A tilde ('~') after the letters n, l, L, N, r, R and m avoids a
ചില്ല് (or അനുസ്വാരം) and forces the letter followed by a
chandrakkala. You need not put "~" after other letters, or any
കൂട്ടക്ഷരം ending in these letters; but putting it doesn't harm.
Examples:
വാക്കുകള്ക്കിടയില് ചില്ലക്ഷരമെഴുതുവാന്...
ഒരു വാക്കിനിടയ്ക്ക് ചില്ലക്ഷരം എഴുതേണ്ടിവരുമ്പോഴാണ് '_' ഉപയോഗിക്കാറുള്ളത്.
'പിന്നിലാവ്'
എന്ന വാക്കു ശ്രദ്ധിക്കൂ. മംഗ്ലീഷില് pinnilaav~ എന്നാണെഴുതേണ്ടത്
എന്നാവും ആദ്യം തോന്നുക. പക്ഷെ, കമ്പ്യൂട്ടറിനൊരു സംശയമുണ്ടാവും; അതിനെ
'പിന്നിലാവ്' എന്ന് വായിച്ചാലെന്തെന്ന്. സംശയം ന്യായമാണ്. ഈയൊരു
ആശയക്കുഴപ്പത്തിനിടയാക്കാത്ത വിധം പ്രശ്നം തീര്ക്കുന്നതിനാണ് '_'
(underscore) എന്ന Zero Width Space (ZWS) - വലിപ്പമില്ലാ ചിഹ്നം.
ശ്രദ്ധിച്ചു
നോക്കിയാല് ഒരു കാര്യം മനസ്സിലാവും - 'ന്ന' എന്നുള്ള ഉച്ചാരണമല്ല 'ന്ന'
എന്നതിന്റെ. 'ന്ന' എന്നതിന് 'ന്'-ഉം 'ന'-ക്കും ഇടയ്ക്ക് സൂക്ഷ്മമായൊരു
നിറുത്തുണ്ട്. ആ നിറുത്താണ് Zero Width Space അഥവാ '-' കൊണ്ട്
കാണിക്കുന്നത്.
ഈ ചിഹ്നം ഉപയോഗിക്കേണ്ടി വരുന്നതിന് കുറച്ചുദാഹരണങ്ങളിതാ:
കണ്വെട്ടം = kaN_vettam
കല്വിളക്ക് = kal_viLakk~
പൊന്നാളം = pon_naaLam
'-' ഉപയോഗിക്കാതെ, തെറ്റായരീതിയില് എഴുതിയാലുണ്ടാവുന്ന വാക്കുകള് നോക്കുക:
കണ്വെട്ടം = kaNveTTam
കല്വിളക്ക് = kalviLakk~
പൊന്നാളം = ponnaaLam
വിസര്ഗം
When using വിസര്ഗം, use 'H', and not ':'. For example, "നാരായണായ നമഃ" = "
naaraayaNaaya namaH". We use ":" also to denote a colon, so it is necessary to distinguish the two.
Keeping some words in English itself
Put those words in curly braces - {}. Then Varamozhi will not do any
transliteration on the text inside the curly braces and will remove
those curly braces. So if the input is
ente {school} the output will be
എന്റെ school.
Use of '@' character
An at character ('@') can be used where you need an "empty
consonant". Like, when you need to show the symbol of a vowel instead
of the vowel itself. Example : 'ാ' ദീര്ഘത്തിന്റെ ചിഹ്നം =
"@aa deerghatthinte chihnam".
ദീര്ഘസ്വരം
The long forms of swarams "a", "i" and "u" can be created by either
capitalizing (A, I, U) or by doubling (aa, ii, uu). For "e" and "o",
only capitalization will work (E and O). "ee" and "oo" are equivalent
to "I" and "U" respectively, due to our historical usage of these
combinations.
Old style of chillus in Unicode
Use two underscores after the letter. For example, 'n__' gets 'ന്' in old representation using ZWJ.
Escaping advanced conversion rules by '#'
Varamozhi has got advanced conversion rules along with basic
transliteration key sequences. They help to write common English words
like 'school' or 'bus' as it is, rather than writting them as 'skooL'
or 'bas'. These rules are also used to define more than one key
sequence for one character. Example 'ngka' = 'nka'.
But sometimes this rules will prevent you from writting some rare words the
way you want. A pound (sharp/hash) character ('#') at the end of a word
(or part of word) will tell Varamozhi not to be too smart for
translating the previous word - means, it turns off all the "special
rules".
For example, 'van' = 'vaan' = വാന് in Varamozhi. But, say in a poem stanza, you need വന്. Then write it as 'van#'.
Note that this will turn off all rules - Not only English/Malayalam conversion. To see what I mean, try the following:
thanguka thanguka# thangnguka#
samyamam samyamam# sam_yamam#
patti patti#
Rationale behind Mozhi scheme
My primary principle behind the scheme is this: The most intuitive
scheme for Malayalees. As you can see this principle is different from
phonetically accurate scheme. Traditionally our transliteration habits
are different from that of North. For example, consider the characters
ത, റ്റ & ച.
To simplify the things, Mozhi uses the rule was to append 'h' after the letters for ഖരം and മൃദു to get അതിഖരം and ഘോഷം.
Also, I didn't want to give different sequence for conjunct letters
other than their component letters. So, if 'Ta' is ട then 'TTa' should
be 'ട്ട'. This simplifies what the user needs to remember.
With
these rules in mind, we have following Malayalam letters: ട, ഡ, ത, ദ,
റ്റ and just two English letters: d, t to spare (I am not considering
അതിഖരം and ഘോഷം now, because they can be produced by the 'h' rule).
Since malayalees are very adamant about 'ത = tha', we cannot use 't'
for 'ട', because, then 'th' will become 'ഠ' by the h-rule. So, 't' was
given to 'റ്റ' which does not have aspiration.
'ത വര്ഗ്ഗം'
letters are more used in the language than the 'ട വര്ഗ്ഗം'. So 'ട
വര്ഗ്ഗം' had to be compromised with uppercase letters which was the
only available choice left.
If you look at the scheme there is
one more symmetry. That is, 'ത വര്ഗ്ഗം' is all small case and 'ട
വര്ഗ്ഗം' is just the corresponding uppercase. This also help people to
memorize the scheme.