Tuesday, August 15, 2006

യുണീക്കോഡ് വിവാദം: ചായക്കോപ്പയിലെ കൊടുങ്കാറ്റ്

യുണീക്കോഡിനെ പറ്റി വിവാദം എന്ന്‌ കഴിഞ്ഞ ആഴ്ച്ചയിലെ പത്രങ്ങളില്‍ എല്ലാവരും കണ്ടുകാണും. എന്താണ് എന്ന്‌ എനിക്കും ആദ്യം മനസ്സിലായില്ല. ഇതുവരെ മനസ്സിലായത്‌ എല്ലാവരുടേയും അറിവിലേയ്ക്കായി ഒരു FAQ ആയി ഇട്ടിരിക്കുന്നു.

254 comments:

1 – 200 of 254   Newer›   Newest»
പെരിങ്ങോടന്‍ said...

സിബു ഈ വാര്‍ത്ത രചനയ്ക്കു് അനുകൂലമായ സെന്റിമെന്റ്സ് സൃഷ്ടിച്ചെടുക്കുവാന്‍ മനഃപ്പൂര്‍വ്വം ഫാബ്രിക്കേറ്റ് ചെയ്തതല്ലേ എന്നു ഞാന്‍ സംശയിക്കുന്നു. കൂട്ടക്ഷരങ്ങള്‍ പിരിച്ചെഴുതുന്ന രീതിയില്‍ എന്‍‌കോഡ് ചെയ്യുവാന്‍ യൂണികോഡ് മണ്ടന്മാരല്ല എന്നറിയാവുന്നവര്‍ ചുരുക്കമായിരിക്കും. ലിപിയെ അതിന്റെ സംശുദ്ധ രൂപത്തിലേയ്ക്കു സംരക്ഷിച്ചെടുക്കുക എന്നതാണു യൂണികോഡിന്റെ പ്രഖ്യാപിത ലക്ഷ്യം. 1970 -നു മുമ്പ് അച്ചടിച്ച ഏതെങ്കിലും ഗ്രന്ഥത്തിലെ കൂട്ടക്ഷരങ്ങള്‍ യൂണികോഡിനു അയച്ചുകൊടുത്താല്‍ ഒരു ചര്‍ച്ചപോലും ആവശ്യമില്ലാതെ തീരുമാനിക്കപ്പെടേണ്ടതാണു്, കൂട്ടക്ഷരങ്ങളുടെ കാര്യം. എന്തു തന്നെയായാലും അങ്ങിനെയൊരു ഇഷ്യൂ ഉണ്ടായില്ല, എന്നാല്‍ പത്രം പ്രചരിപ്പിക്കുന്നതാകട്ടെ സീ-ഡാക്കിന്റെ ഉദ്ദേശം ഇപ്രകാരം അക്ഷരങ്ങളെ പിരിച്ചെഴുതുന്നതില്‍ യൂണികോഡിനെ സ്വാധിക്കുക എന്നത്രെ. വളരെ തെറ്റായ വാര്‍ത്തയാവണമതു്, അപ്രകാരമൊരു എന്‍‌കോഡിങ് ഒരിക്കലും നടക്കുവാന്‍ പോകുന്നില്ലെന്നു തിരിച്ചറിയുവാന്‍ അതിബുദ്ധിയൊന്നും ആവശ്യമില്ല. പത്രവാര്‍ത്തയുടെ ഉദ്ദേശം മറ്റൊന്നാവണം, പ്രായേണ ആര്‍ക്കും തെറ്റുന്നു തോന്നാവുന്ന ഒരു തീരുമാനം, സീ-ഡാക്കിന്റെയും മറ്റുള്ളവരുടേതുമായി പ്രചരിപ്പിച്ചു രചനയ്ക്കു് ഒരു ‘രക്ഷകന്റെ’ പരിവേഷം നല്‍കുകയെന്നുള്ളതു്.

മലയാളം യൂണികോഡിനു ഇപ്പോഴുള്ള എന്‍‌കോഡിങ്ങില്‍ മാറ്റങ്ങള്‍ ആഗ്രഹിക്കാത്തവര്‍ ഇപ്പോഴുള്ള എന്‍‌കോഡിങ്ങില്‍ സോഫ്റ്റ്‌വെയറുകളും ടെക്സ്റ്റുകളും തയ്യാറാക്കി വിപണത്തിനു വച്ചിരിക്കുന്നവരാണു്. മറ്റൊന്നു ബ്ലോഗന്മാരാണു് ;) ബ്ലോഗന്മാര്‍ക്കു വാണിജ്യതാല്പര്യങ്ങള്‍ ഇല്ലെന്നും മലയാളത്തിന്റെ നന്മയ്ക്കായി മാറ്റങ്ങള്‍ ഉള്‍ക്കൊള്ളുവാന്‍ തയ്യാറാണെന്നും അനുഭവങ്ങള്‍ തെളിയിക്കുന്നു. ആര്‍ക്കാണു മലയാളത്തില്‍ വാണിജ്യതാല്പര്യമെന്നു് എല്ലാവര്‍ക്കും അറിയാം, ദുഷിച്ച ഇടയന്മാരെ തിരിച്ചറിയുവാന്‍ ജനം വിവേകം കാണിക്കുമെന്നു നമുക്കു പ്രത്യാശിക്കാം.

സന്തോഷ് said...

"ചില്ലക്ഷരങ്ങളുളുടെ പ്രശ്നമുള്‍പ്പെടെ” പ്രശ്നത്തിങ്ങളില്‍ ഒരു തീരുമാനം ഉണ്ടാവുന്നതു വരെ ഇക്കാര്യങ്ങളില്‍ മുന്നോട്ടു നീങ്ങരുതെന്ന് കേരള ഗവണ്മന്‍റ് യൂണികോഡ് കണ്‍സോര്‍ഷ്യത്തിനെ അറിയിച്ചതായി അറിയാന്‍ കഴിഞ്ഞു. രചനയാണ് ഇതിന് പിന്നിലെങ്കില്‍ ഇത്തരം കള്ളനാണയങ്ങളെ വെളിച്ചത്ത് കൊണ്ടുവരേണ്ടേ? മാതൃഭൂമിയിലെ ശ്രീ എന്‍. പി. ആറിനോ മറ്റാര്‍ക്കെങ്കിലുമോ ഇക്കാര്യത്തില്‍ സഹായിക്കാന്‍ കഴിയുമോ?

അഗ്രജന്‍ said...

'..ഫോണ്ടാണ്‌ ഈ ടെക്സ്റ്റിനെ പുതിയലിപിയിലാണോ പഴയലിപിയിലാണോ കാണിക്കേണ്ടതെന്ന്‌ തീരുമാനിക്കുന്നത്‌. എല്ലാ കൂട്ടക്ഷരങ്ങളുള്ള ഫോണ്ട്‌ പഴയലിപിയില്‍ ഒരുവാക്കിനെ കാണിക്കും. അതുപോലെ അധികം കൂട്ടക്ഷരങ്ങളില്ലാത്ത ഫോണ്ട്‌ അതേ വാക്കിനെ തന്നെ പുതിയലിപിയിലും വായനക്കാരനെ കാണിക്കും. അതായത്‌, എഴുത്തുകാരനല്ല, വായനക്കാരനാണ്‌ ഒരു കൃതി ഏത്‌ ലിപിയിലാണ്‌ കാണേണ്ടത്‌ എന്നു തീരുമാനിക്കുന്നത്‌..'
എന്‍റെ ഒരു കണ്‍ഫ്യൂഷന്‍ മാറിക്കിട്ടി.
ഇതേ കുറിച്ച് എന്തെങ്കിലും പറയാനുള്ള അറിവില്ല.
എന്താണ് ‘യൂണികോഡ് വിവാദ’ ത്തിനു പിന്നിലെ ‘വാണിജ്യതാല്പര്യങ്ങള്‍‘ എന്നറിയാന്‍ ആകാംക്ഷയുണ്ട്.

Anonymous said...

തീര്‍ച്ചയായും ആ ആര്‍ട്ടിക്ക്‌ള്‍ വായിച്ചു ഒരുപാട് കാര്യങ്ങള്‍ അറിയാതിരുന്നത്‌ അറിയാന്‍ കഴിഞ്ഞു. സിബു ഇക്കാര്യം ഇവിടെ പറഞ്ഞത്‌ എന്തായാലും വളരെ നന്നായി. കൂടാതെ, അതു വായിച്ചു കഴിഞ്ഞാല്‍ തന്നെ മനസ്സിലാവുമല്ലൊ സംഗതി ചായക്കോപ്പയിലെ കൊടുങ്കാറ്റ്‌ തന്നെയാണെന്ന്‌. ഇക്കാര്യം ഇവിടെ ചര്‍ച്ചക്കായി ഇട്ടതില്‍ ഒരുപാട്‌ നന്ദി ഉണ്ട്‌ സിബൂ...

viswaprabha വിശ്വപ്രഭ said...

പ്രിയപ്പെട്ട കൂട്ടുകാരേ,
രചനയുമായി ഒരു മനംതുറന്ന ചര്‍ച്ച ആവശ്യമുണ്ട്.
ഒരു പക്ഷേ നാം ഉദ്ദേശിക്കുന്ന വാണിജ്യതാല്പര്യങ്ങള്‍ ഒന്നും രചനക്കെങ്കിലും ഇല്ലെന്നു കരുതണം തല്‍ക്കാലം.
ഞാന്‍ യാത്രയിലാണ്. ഇതേക്കുറിച്ച് വിശദമായി പിന്നെ എഴുതാം. തല്‍ക്കാലം മുന്‍‌വിധികളൊക്കെ മാറ്റിവെക്കണം ദയവായി.

പെരിങ്ങോടന്‍ said...

യൂണികോഡ് മെയിലിങ് ലിസ്റ്റില്‍ ചില്ലുകള്‍ക്കെതി അവര്‍ സമര്‍പ്പിച്ച ഡോക്യുമെന്റ് വിമര്‍ശകരെ ഭയന്നെന്ന പോലെ മറച്ചുവയ്ക്കുവാന്‍ ശ്രമിച്ചും, ഡിസ്കഷനുകളില്‍ നിന്നൊഴിഞ്ഞു നില്‍ക്കുന്നതുമെല്ലാം രചനയെ അവിശ്വസിക്കുവാന്‍ എന്നെ പ്രേരിപ്പിച്ചിരുന്നു. ഇപ്പോള്‍ സി-ഡാക്ക് കൂട്ടക്ഷരങ്ങള്‍ പിരിച്ചെഴുതുവാന്‍ നിര്‍ദ്ദേശിക്കുന്നു (അസാദ്ധ്യമായ വസ്തുത, അപ്രകാരമല്ല മലയാളം എന്നു തെളിയിക്കുവാന്‍ ലിംഗ്വിസ്റ്റ് -ന്റെ സഹായം പോലും തേടേണ്ടി വരില്ല, ഇത്രയും ദുര്‍ബലമായ ഒരു ആര്‍ഗ്വുമെന്റ് യൂണികോഡ് സ്വീകരിക്കുമോ എന്നു തന്നെ ഉറപ്പില്ല) എന്നെല്ലാം പത്രങ്ങള്‍ എഴുതിക്കാണുമ്പോള്‍ ന്യായമായും ഒരു ഫൌള്‍ പ്ലേ (ആരെയോ കരിവാരിത്തേയ്ക്കാന്‍ ശ്രമിക്കുന്നതുപോലെ) നടന്നിട്ടുണ്ടെന്നു തോന്നുന്നു. ചില്ലുകള്‍ എന്‍‌കോഡ് ചെയ്യുവാന്‍ ശിപാര്‍ശചെയ്യുന്ന എറിക് മുള്ളറുടെ പേപ്പര്‍ യൂണികോഡ് കണ്‍സോര്‍ഷ്യം അംഗീകരിച്ചതോടെ തുടങ്ങിയതല്ലേ ഈ വിഭ്രാന്തി എന്നായിരുന്നു എന്റെ സംശയം. മുഖ്യമന്ത്രിവരെ ഇടപെടുന്ന സ്ഥിതിയിലായിട്ടുണ്ടു കാര്യങ്ങള്‍.

വിശ്വം പറഞ്ഞ സ്ഥിതിയ്ക്കു് ഇനി വാഗ്വാദങ്ങള്‍ക്കും ആരോപണങ്ങള്‍ക്കും ഞാനില്ല, കാര്യങ്ങളുടെ നിജസ്ഥിതി വെളിപ്പെടുത്തുവാന്‍ വിശ്വം തന്നെ മുന്‍‌കൈയെടുക്കുക.

മന്‍ജിത്‌ | Manjith said...

രചനയുടെ താല്പര്യങ്ങള്‍ വാണിജ്യപരമാണോ എന്നറിയില്ല. പക്ഷേ ചില താല്പര്യങ്ങള്‍ എന്തായാലുമുണ്ടെന്ന് അവര്‍ നടത്തുന്ന പി ആര്‍ പ്രകടനങ്ങള്‍ കാണുമ്പോള്‍ തോന്നും. മനോരമയില്‍ വന്ന ഏറ്റവുമൊടുവിലത്തെ റിപ്പോര്‍ട്ടും അതു വെളിവാക്കുന്നു. യുണിക്കോഡിനെപ്പറ്റിയോ ഫോണ്ടുകളേപ്പറ്റിയോ ഒരു പിണ്ണാക്കുമറിയാത്ത ലേഖകനെ ബ്രെയിന്‍ വാഷ് ചെയ്തെഴുതിച്ച റിപ്പോര്‍ട്ടാണതെന്ന് ആര്‍ക്കാണു മനസിലാകാത്തതു്. ഏതാനും മാസം മുന്‍‌പ് മലയാളം വാരികയില്‍ മനോജ് പുതിയവിളയെഴുതിയ രചനാ സ്തുതിയിലും ഇത്തരമൊരു വിലകുറഞ്ഞ കൈകടത്തല്‍ പ്രകടമായിരുന്നു. യുണികോഡ് തന്നെ രചനയുടെ കണ്ടെത്തെലാണെന്നായിരുന്നു അതിലെ സൂചനകള്‍! രചന സംശയത്തിന്റെ മുള്‍മുനയിലാകുന്നുണ്ടെങ്കില്‍ അതിനുത്തരവാദി അവര്‍തന്നെ.

പെരിങ്ങോടന്‍ said...

C-DAC strongly deny this allegation. As the representative of Govt. of India, Department of Information Technology, we have interfaced very closely with the State government in finalizing the issues to be taken up with Unicode Consortium (the major one being encoding of chillus), in 100% conformance with Govt. of Kerala’s directives. The IT Secretary, Govt. of Kerala, directly passed on the final report to DIT. That report doesn’t recommend removal of even a single character from the Unicode chart, but recommend addition of certain characters instead. We once again stress that the alleged mutilation of the Malayalam language by removing many characters is completely baseless and we haven’t passed on any such documents to DIT with or without the knowledge of Kerala state IT department.

K.G.Sulochana
Head, Language Technology Section
C-DAC, Thiruvananthapuram

സീ-ഡാകിലെ ഭാ‍ഷാടെക്നോളജി ഹെഡ് കെ.ജി.സുലോചനയുടെ വിശദീകരണം. തെറ്റായ വാര്‍ത്ത എഴുതുന്ന റിപ്പോര്‍ട്ടര്‍മാരെയും പ്രസിദ്ധീകരിക്കുന്ന പത്രത്തേയും കൊല്ലണോ വളര്‍ത്തണോ എന്നാണു് ഇനി തീരുമാനിക്കാനുള്ളതു്.

Hussain Rachana said...

പ്രിയ വിശ്വം, സുഹൃത്തുക്കളേ

പല കാരണങ്ങളാല്‍ വയനാട്ടില്‍ വരാനും നിങ്ങളോടൊത്തു സംഗമിക്കാനും കഴിഞ്ഞില്ല. ബ്ലോഗുകളെ കുറിച്ചു ഞാന്‍ പഠിച്ചു വരുന്നതേയുള്ളൂ. നിങ്ങളോടൊപ്പം ഉണ്ടായിരുന്നെങ്കില്‍ കാര്യങ്ങള്‍ എളുപ്പത്തില്‍ പഠിക്കാമായിരുന്നു. അടുത്തുതന്നെ ഒരെണ്ണം തുടങ്ങണം. നല്ലൊരു ആശയം മനസ്സില്‍ തോന്നിയിട്ടുണ്ട്‌. അതിനുമുമ്പേ നിലവിലുള്ള മലയാളം ബ്ലോഗുകളൊക്കെ കാണണം, അറിയണം.

രചനയെക്കുറിച്ച്‌ താങ്കളുടെ കുറിപ്പ്‌ സന്ദര്‍ഭോചിതമായി. സുഹൃത്തുക്കള്‍ക്ക്‌ തെറ്റിദ്ധാരണകളുണ്ട്‌. രചനയുടെ വാണിജ്യതാല്‍പര്യങ്ങളെക്കുറിച്ചോര്‍ത്തപ്പോള്‍ തമാശ തോന്നി. ജോജി എന്നൊരു സുഹൃത്ത്‌ രചന എഡിറ്റര്‍ വിറ്റു നടപ്പുണ്ട്‌. 200 രൂപയ്ക്ക്‌. അദ്ദേഹത്തിനു ഞാനതു വെറുതെ കൊടുത്തതാണ്‌. മൂന്നുവര്‍ഷം മുമ്പ്‌. രണ്ടായിരം ഇന്‍സ്റ്റല്ലേഷന്‍ കിട്ടിയിട്ടുണ്ടാകണം. കണക്കുകള്‍ രചന ചോദിച്ചിട്ടില്ല. അങ്ങനെയൊരു കരാറും ഉണ്ടായിരുന്നില്ല. ഞങ്ങളില്‍ പെടാത്ത ഒരാള്‍ അങ്ങനെ മാര്‍ക്കറ്റ്‌ ചെയ്തതുകൊണ്ടു അത്രയ്ക്കും കേരളീയര്‍ നഷ്ടപ്പെട്ടു പോയ അക്ഷരങ്ങള്‍ ഉപയോഗിക്കാനിടയായി.

ഈയിടെ നല്ലൊരു വാര്‍ത്തയുണ്ട്‌. ബൈബിള്‍ (സത്യവേദപുസ്തകം) അതിന്റെ എല്ലാ തനിമയും നിലനിര്‍ത്തി ടൈപ്പ്സെറ്റ്‌ ചെയ്തു പ്രസിദ്ധീകരിച്ചിരിക്കുന്നു. തിരുവല്ലയില്‍ നിന്നാണു്‌. ഗംഭീരമായിരിക്കുന്നു. 1920 ലാണു്‌ അത്‌ അവസാനമായി അച്ചുനിരത്തിയത്‌ എന്നാണു അറിയാന്‍ കഴിഞ്ഞത്‌. ഇപ്പോഴത്തെ ഈ സംരംഭത്തിനുവേണ്ടി ഞാന്‍ രചനയിലില്ലാത്ത അമ്പതിലേറെ കൂട്ടക്ഷരങ്ങള്‍ ഉണ്ടാക്കികൊടുത്തു. ഈ ശ്രമങ്ങള്‍ക്കും പ്രതിഫലമൊന്നും ചോദിച്ചില്ല, കൈപ്പറ്റിയില്ല. ഇതൊക്കെ നിങ്ങള്‍ കുട്ടികള്‍ വിശ്വസിക്കുമോ എന്തോ! കുറച്ചൊക്കെ കൊമ്മേര്‍ഷ്യല്‍ ആയിരുന്നെങ്കില്‍ എന്നിപ്പോള്‍ തോന്നുന്നു. അന്നു വിശ്വത്തോടു പറഞ്ഞതുപോലെ പണമുണ്ടായിരുന്നെങ്കില്‍ പ്രഗത്ഭരായ കലാകാരന്‍മാര്‍ക്ക്‌ ചെറിയ പ്രതിഫലമൊക്കെകൊടുത്തു എണ്ണം പറഞ്ഞ കുറച്ചു ഫോണ്ടുകള്‍ വരപ്പിച്ചെടുപ്പിക്കാമായിരുന്നു.

2005 ല്‍ രചനയുടെ ഓപ്പണ്‍ ടൈപ്‌ ഫോണ്ട്‌ ഗ്നു ജിപി എല്‍ ആയി ഇറങ്ങിയ വിവരവും കൂട്ടുകാര്‍ അറിഞ്ഞുകാണുമല്ലോ.

രചനയോടുള്ള അപ്രിയത്തിനു കാരണം സിബുവിന്റെ ചില്ലുവാദങ്ങളെ ചിത്രജന്‍ എതിര്‍ത്തതാണ്‌ എന്നതായിരിക്കാം. സിബുവിന്റെ ഭാഷാസ്നേഹവും സേവനവും ആദരിച്ചുകൊണ്ടു പറയട്ടെ: ഈ പ്രശ്നത്തില്‍ അവസാന്‍ വാക്കു എന്റേതാണു എന്നുള്ള നിലപാടും വാശിയും വൈകാരികതയും ആശാസ്യമല്ല. ഇപ്പറഞ്ഞത്‌ ഹുസൈനും ചിത്രജനും ബാധകമാണു്‌.

നമ്മുടെ ഡിജിറ്റല്‍ ചര്‍ച്ചകളില്‍ പരിഗണിക്കപ്പെടാതെ പോകുന്ന ഒരു യാഥാര്‍ത്ഥ്യമുണ്ട്‌. മലയാളത്തിലെ ഭാഷാപണ്ഡിതന്‍മാരുടേയും രചയിതാക്കളുടേയും ചെറിയൊരു ശതമാനം പോലും വരുന്നില്ല യൂണികോഡ്‌ മലയാളം ഡിസ്കഷന്‍ ഗ്രൂപ്പില്‍ ഇപ്പോള്‍ പങ്കെടുക്കുന്ന്വര്‍. വലിയൊരു ഭൂരിപക്ഷത്തെ, അവര്‍ കമ്പ്യൂട്ടറിന്റേയും നെറ്റിന്റേയും വരേണ്യലോകത്തിലില്ല എന്ന ഒറ്റ കാരണകൊണ്ടു ഭാഷാകമ്പ്യുട്ടിങ്ങിന്റെ എല്ലാ ആധികാരികതയും നാം സ്വയം സൂത്രത്തില്‍ എറ്റെടുക്കുകയാണു്‌. നാം വിചാരിച്ചാലേ കാര്യങ്ങല്‍ നേരെയാകൂ എന്നൊരു മെഗല്ലോമാനിയ നമ്മെ പിടികൂടിയിരിക്കുന്നു. നമ്മുടെ പണ്ഡിതരും സാഹിത്യകാരുമൊക്കെ ബൂലോഗന്‍മാരുടെ തള്ളിച്ചയില്‍ പാര്‍ശ്വവല്‍ക്കരിക്കപ്പെട്ടുപോയിരിക്കുന്നു. വാളെടുത്തവരൊക്കെ വെളിച്ചപ്പാടുകള്‍. ലോഹടൈപ്പുകളുടെ കാലത്ത്‌ അച്ചുനിരത്തിയവരും ലോഹം ഉരുക്കിയൊഴിച്ചവരും നമ്മുടെ അക്ഷരമാലയെ ക്രമീകരിക്കുന്ന ഭാരങ്ങളൊന്നും ഏറ്റെടുത്തിരുന്നില്ല. എന്നാല്‍ ഇന്നത്തെ ഐടി മെറ്റലര്‍ജിക്കാരുടെ അവസ്ഥ എന്താണ്‌?

ചില്ലിന്റെ കാര്യത്തില്‍ ഒരു അന്തിമ തീരുമാനം ഡിജിറ്റല്‍ ഭാഗ്യവാന്‍മാര്‍ മാത്രം തീരുമാനിക്കുന്നത്‌ ഭാഷയൊടും ജനതയോടും ചെയ്യുന്ന അനീതിയായിരിക്കും. നമ്മുടെ ഠ വട്ടത്തെ നമുക്കു അതിവര്‍ത്തിക്കാന്‍ കഴിയണം. സിബുവിന്റേയും ചിത്രജന്റേയും വാദങ്ങളെ നല്ല തുടക്കമായിമാത്രം പരിഗണിക്കാനുള്ള സന്നദ്ധത നാം കാണിക്കണം. നമ്മുടെ സൌഹൃദങ്ങള്‍ നമുക്കു വിലപ്പെട്ടതാണു്‌; നമ്മുടേതുമാത്രമായതു ഒതുക്കണം. ഭാഷ നമ്മുടേതു മാത്രമല്ല.

ചില്ലിന്റെ കര്യത്തില്‍ വിപുലമായ ഒരു ചര്‍ച്ച ഇനിയും ആവശ്യമുണ്ട്‌ എന്നാണ്‌ എന്റെ വ്യക്തിപരമായ അഭിപ്രായം. സായ്പന്‍മാര്‍ തീര്‍ച്ചയാക്കിയത്‌ അവസാന തീര്‍പ്പാണോ? ബെയ്ലിയുടേയും ഗുണ്ടര്‍ട്ടിന്റേയും ലെഗസി ഇവര്‍ക്ക്‌ എത്രമാത്രം അവകാശപ്പെടാനാകും? അതൊരു ഫാക്കുകൊണ്ട്‌ തീരുമാനിക്കേണ്ട ഒന്നല്ല. പതിനായിരം മെയിലുകലുടെ ശബ്ദവൊട്ടെടുപ്പല്ല അതിനു വേണ്ടത്‌. സര്‍ക്കാരിന്റെ മുദ്രയൊ ഭാഷാ
ഉദ്യ്ഗസ്ഥന്‍മാരുടെ കസേരവലിപ്പമോ കൊണ്ടല്ല അതു തീരുമാനിക്കപ്പെടേണ്ടത്‌. ഇ-ജീവികള്‍ക്കും ബൂലോകന്‍മാര്‍ക്കും ഫോണ്ടന്‍മാര്‍ക്കും അപ്പുറം പേന ഉന്തികളുടെ വിശാലമായ ഒരു ലോകം ഭൂമി മലയാളത്തിലുണ്ട്‌. ആ പാവങ്ങള്‍ യൂണികോഡും പബ്ലിക്‌ ഹിയറിങ്ങും രചനയും വരമൊഴിയുമൊന്നും കേട്ടിട്ടില്ല. മലയാള സാഹിത്യകാരന്‍മാരുടേയും ഭാഷാപണ്ഡിതന്‍മാരുടേയും പത്രപ്രവര്‍ത്തകരുടേയും കേരളത്തിലെ ഐടി വിദഗ്ദ്ധന്‍മാരുടേയുമൊക്കെ വിശാലമായ ഒരു വേദിയില്‍ വെച്ച്‌ ചില്ലും കൂട്ടക്ഷരവുമൊക്കെ ചര്‍ച്ചാവിഷയമാകണം. കേരള സര്‍ക്കാര്‍ തന്നെ ഇതിനു മുന്‍കൈയെടുക്കണം. നിലവിലുള്ള 'മലയാളം സ്റ്റാന്‍ഡേര്‍ഡൈസേഷന്‍ ആന്റ്‌ കാരക്ടര്‍ എന്‍കോഡിംഗ്‌ കമ്മിറ്റി' യ്ക്ക്‌ ഇത്തരം കാര്യങ്ങള്‍ തീരുമാനിക്കാന്‍ യതൊരു അര്‍ഹതയുമില്ല. സഖാവ്‌ പി ഗോവിന്ദപിള്ളയാണ്‍ ഇപ്പോഴും ഈ കമ്മിറ്റിയുടെ ചെയര്‍മാന്‍. 1999 ല്‍ മലയാളത്തിന്റെ സമഗ്ര ലിപി സഞ്ചയം രചന അവതരിപ്പിച്ചപ്പോള്‍'തലമുടി നരച്ച വൃദ്ധരുടേയും തലച്ചോറു നരച്ച യുവാക്കളുടേയും പണിയാണ്‌ രചന' എന്നു പറഞ്ഞത്‌ ആരാണ്‌?. ഋകാരങ്ങളും റകാരങ്ങളും ഭാഷയ്ക്കു അധികപ്പറ്റാണെന്നു കണ്ടെത്തിയ 'മലയാള തനിമക്കാര്‍' ഇപ്പോഴും ഈ കമ്മിറ്റിയിലുണ്ട്‌. പ്രബോധബാധയേറുന്ന ക്ലിക്കുകള്‍ സിഡിറ്റിന്റെ അകത്തളങ്ങളില്‍ കറങ്ങിനടക്കുന്നു . 'സ്ത' കൂട്ടഷരമായി പരിഗണിക്കാം, എന്നാല്‍ 'സ്ന' ചന്ദ്രക്കലയിട്ടുതന്നെ പിരിച്ചെഴുതണം എന്ന്‌ ഈ കമ്മിറ്റി നിര്‍ദ്ദേശിച്ചിട്ട്‌ അധികം വര്‍ഷങ്ങളായില്ല. ഈ നിര്‍ദ്ദേശങ്ങള്‍ വരുമ്പോള്‍ ലോകത്ത്‌ യൂണിക്കോഡ്‌ ഉണ്ടായിരുന്നു, ഓപ്പണ്‍ടൈപ്പിന്റെ പ്രയോഗസാദ്ധ്യതകള്‍ അനാവരണം ചെയ്യപ്പെട്ടുകഴിഞ്ഞിരുന്നു. എന്നിട്ടും കമ്മിറ്റിക്കാര്‍ ടൈപ്‌ റൈറ്റര്‍ യുഗത്തില്‍ തന്നെയായിരുന്നു. ഭാഷയായിരുന്നില്ല അവരുടെ പ്രശ്നം, ഭാഷയുടെ മാനകീകരണമായിരുന്നു അവരുടെ പ്രശ്നം. നൂറ്റിയെഴുപത്തഞ്ചു വര്‍ഷം കൊണ്ട്‌ എഴുത്തിലും അച്ചടിയിലും സ്വയമേവ മാനകീകരിക്കപ്പെട്ട, എന്നാല്‍ എഴുപതുകളിലെ ലിപിപരിഷ്കരണം കൊണ്ട്‌ അപമാനകീകരിക്കപ്പെട്ട നമ്മുടെ ഭാഷയെ 'പ്‌റബോധ ചന്‌ ദ്‌ രന്‌ മാ' രാക്കാനായിരുന്നു ഈ കമ്മിറ്റിക്കാരുടെ ആദ്യകാല ശ്രമങ്ങള്‍. ഈ കമ്മിറ്റിക്കാര്‍ ഇക്കഴിഞ്ഞ നാലഞ്ചു വര്‍ഷത്തിനിടയില്‍ എത്രമാത്രം നവീകരിക്കപ്പെട്ടിട്ടുണ്ട്‌? ഇവരുടെ കയ്യില്‍ ഭാഷയുടെ സാങ്കേതിക ചിന്തകള്‍ എത്ര സുരക്ഷിതമാണ്‌? ശ്രീമതി സുലോചന ദേവി ആദരിക്കപ്പെടേണ്ട വലിയ ഭാഷാ ഉദ്യോഗസ്ഥയാകാം. ചില്ലിന്റേയും മറ്റും കാര്യത്തില്‍ തീര്‍പ്പു കല്‍പിക്കാന്‍ അവര്‍ക്ക്‌ ഭാഷാ പണ്ഡിത്യവും അനുഭവങ്ങളും എത്രത്തോളമുണ്ട്‌? മലയാളഭാഷ എഴുതുകയും വായിക്കുകയും ചെയ്യുന്ന കേവലം ഒരു മലയാളി എന്നതിലുപരി ഭാഷ പരിജ്ഞാനത്തിന്റെ ആഴങ്ങള്‍ കണ്ടറിഞ്ഞവരുടെ അഭിപ്രായങ്ങള്‍ സ്വരൂപിക്കുകതന്നെവേണം ഇക്കാര്യത്തില്‍.

എറിക്‌ മുള്ളറുടെ ലേഖനത്തിലൂടെ കടന്നുപോകുമ്പോല്‍ മനസ്സിലാകുന്ന വിചിത്രമായ വസ്തുത യൂണികോഡ്‌ എന്‍കോഡിങ്ങിനേക്കാള്‍ അവസാനവാക്കായി എടുക്കേണ്ടത്‌ ഐ.ഡി.എന്‍ എങ്ങനെ പെരുമാറുന്നു എന്നുള്ളതാണ്‌ എന്നാണ്‌. മുപ്പത്‌ വര്‍ഷങ്ങള്‍ക്കുമുന്‍പ്‌ റ്റൈപ്‌ റൈറ്ററിലെ 90 കട്ടകള്‍ എങ്ങനെ പെരുമാറും എന്നതിനെ ആസ്പദിച്ചുണ്ടായ രീതിശാസ്ത്രത്തില്‍നിന്നും ഐടി യുഗവും മെച്ചപ്പെട്ടിട്ടില്ലെന്നാണൊ ഇതു സൂചിപ്പിക്കുന്നത്‌? വന്‍യവനിക പോലെയുള്ള വാക്കുകള്‍ കാണുമ്പോള്‍ ആറേഴു വര്‍ഷം മുമ്പത്തെ ഒരു സംഭവം ഓര്‍ക്കുന്നു. രചനയുടെ കാരക്റ്റര്‍ സെറ്റ്‌ കണ്ടതിനു ശേഷം ഒരു സുഹൃത്ത്‌ അതു സമഗ്രമല്ലെന്നു വാദിച്ചു. ഴ യുടെ ഋകാരം എവിടെ എന്നാണു്‌ അദ്ദേഹം ചോദിച്ചത്‌. സംവൃതോകാരത്തിന്റെ പ്രശ്നങ്ങളും വിസ്മരിച്ച മട്ടാണു്‌. കേരളപാണിനീയത്തൊടൊപ്പം റഫറന്‍സില്‍ ചില്ലിന്റെ ആ മരവിപ്പിച്ചുകൊല്ലുന്ന സാധനവുമുണ്ട്‌. ജനങ്ങള്‍ക്കിടയില്‍ ചൂടുപിടിച്ച വാദപ്രതിവാദങ്ങള്‍ക്കുശേഷമാണു ഇതൊക്ക തീരുമാനിക്കപ്പെട്ടത്‌ എന്നു സിബു പറയുമ്പോള്‍, ആരാണീ ജനങ്ങള്‍? മലയാളത്തിലെ എത്ര എഴുത്തുകാര്‍, എത്ര മലയാളം അദ്ധ്യാപകര്‍, എത്ര മലയാളം ഗവേഷകര്‍, മലയാളക്കരയിലെ എത്ര ഐടി വിദഗ്ദ്ധര്‍ .... ഈ ജനങ്ങളിലുണ്ട്‌?

സര്‍ക്കാര്‍ തീരുമാനിച്ചാല്‍ വിശാലമായ ഒരു ചര്‍ച്ചാ വേദി എത്രയും പെട്ടെന്നു വിളിച്ചുകൂ‍ട്ടാവുന്നതേയുള്ളൂ. മലയാളം കമ്പ്യുട്ടിങ്ങിന്റെ യഥാര്‍ത്ഥ പബ്ലിക്‌ ഹിയറിംഗ്‌ അതായിരിക്കണം. ഇതിനായി മലയാളീ ബ്ലോഗര്‍മാരില്‍നിന്നും ശബ്ദമുയരണം.

എല്ലാവര്‍ക്കും നന്‍മകള്‍ നേരുന്നു.
ഹുസൈന്‍, രചന

സിബു::cibu said...

ഹുസൈന്സാറും ഇവിടെ എത്തിപ്പെട്ടതില് വലിയ സന്തോഷം... ടെക്നിക്കലായുള്ള ചോദ്യങ്ങള്ക്ക് മറുപടി പറയാം. (ആര് എന്തിന്` അങ്ങനെ ചെയ്തു എന്നിങ്ങനെയുള്ള ചോദ്യങ്ങളിലേയ്ക്ക് ഇതെല്ലാം കഴിഞ്ഞ്‌ കടക്കാം :)

ഇപ്പോഴത്തെ ഈ സംരംഭത്തിനുവേണ്ടി ഞാന് രചനയിലില്ലാത്ത അമ്പതിലേറെ കൂട്ടക്ഷരങ്ങള് ഉണ്ടാക്കികൊടുത്തു.

അവ രചന ഫോണ്ടിലുള്പ്പെടുത്തി പ്രസിദ്ധീകരിക്കാമോ?


എറിക് മുള്ളറുടെ ലേഖനത്തിലൂടെ കടന്നുപോകുമ്പോല് മനസ്സിലാകുന്ന വിചിത്രമായ വസ്തുത യൂണികോഡ് എന്കോഡിങ്ങിനേക്കാള് അവസാനവാക്കായി എടുക്കേണ്ടത് ഐ.ഡി.എന് എങ്ങനെ പെരുമാറുന്നു എന്നുള്ളതാണ് എന്നാണ്. മുപ്പത് വര്ഷങ്ങള്ക്കുമുന്പ് റ്റൈപ് റൈറ്ററിലെ 90 കട്ടകള് എങ്ങനെ പെരുമാറും എന്നതിനെ ആസ്പദിച്ചുണ്ടായ രീതിശാസ്ത്രത്തില്നിന്നും ഐടി യുഗവും മെച്ചപ്പെട്ടിട്ടില്ലെന്നാണൊ ഇതു സൂചിപ്പിക്കുന്നത്?


എന്കോഡിങ് യന്ത്രത്തിനു വേണ്ടിയാണ്. കമ്പ്യൂട്ടറും ടൈപ്രൈറ്ററും യന്ത്രങ്ങളാണ് - മനുഷ്യരേക്കാള് ബുദ്ധികുറഞ്ഞവ. അതുകൊണ്ട് തന്നെ, ഒരു വാക്ക് കാണുമ്പോള് മലയാളിയേപ്പോലെ അതില് ചില്ല് ര-ആണോ റ-ആണോ എന്ന് word context-ഇല് നിന്നും തീരുമാനിക്കാന് യുണീക്കോഡിനാവില്ല. തുടര്ന്നുള്ള സന്ധികളും അങ്ങനെ തന്നെ. സ്ക്രീനിലെ Rendering ആണ് മനുഷ്യന് വേണ്ടിയുള്ളത്. അത് ശരിയാം വണ്ണം ഒരു എന്കോഡിങ് കൊണ്ട് സാധ്യമാന്നുണ്ടോ എന്ന് തീരുമാനിക്കലാണ് ഇന്ഡിക് ലിസ്റ്റിലെ ചര്ച്ചകളുടേയും മറ്റും ഉദ്ദേശം.

വന്യവനിക പോലെയുള്ള വാക്കുകള് കാണുമ്പോള് ആറേഴു വര്ഷം മുമ്പത്തെ ഒരു സംഭവം ഓര്ക്കുന്നു. രചനയുടെ കാരക്റ്റര് സെറ്റ് കണ്ടതിനു ശേഷം ഒരു സുഹൃത്ത് അതു സമഗ്രമല്ലെന്നു വാദിച്ചു. ഴ യുടെ ഋകാരം എവിടെ എന്നാണു് അദ്ദേഹം ചോദിച്ചത്.

രചന ഒരു ഫോണ്ടാണ്; ഒരു സ്റ്റാന്റേഡല്ല. രചനയില് ‘ഴൃ‘ എന്ന കൂട്ടക്ഷരം കണ്ടില്ലെങ്കില്, ആവശ്യക്കാരന് അങ്ങനെ ഒന്നുണ്ടാക്കാവുന്നതേ ഉള്ളൂ. എന്നാല് യുണീക്കോഡില് ഒരു വാക്കിന് കൃത്യതയില്ലെങ്കില് അതുണ്ടാക്കാന് മറ്റൊരു മാര്ഗമില്ല. Soundness, completeness, precision എന്നിവയാണ് എന്കോഡിങ് സിസ്റ്റത്തിന് അവശ്യം വേണ്ടഗുണങ്ങള്. ബാക്കിയുള്ളവ ഉണ്ടായാല് നന്ന്; നിര്‍ബന്ധമില്ല. വന്യവനിക/വന്‍യവനിക, എന്തലമുറ/എന്‍തലമുറ, പിന്നിലാവും/പിന്‍നിലാവും എന്നീ പെയറുകളില്‍ എഴുത്തിലൂടെ കാണിക്കുന്ന അര്‍ഥവ്യത്യാസം എന്‍‌കോഡിങ്ങില്‍ ഇല്ല. precision അഥവാ security എന്ന ഗുണമാണ് ഈ ambiguity-ഇല് നഷ്ടപ്പെട്ട് പോകുന്നത്. 'അവന്‍/അവന്' എന്നീ ഉദാഹരണങ്ങള് ഉണ്ടെന്നറിയാഞ്ഞിട്ടല്ല; അവയെടുത്താല് ചര്ച്ച സംവൃതോകാരത്തെ പറ്റിയായിപ്പോവും എന്നതുകൊണ്ടാണ് കരുതിക്കൂട്ടി അവയെ ഒഴിവാക്കിയത്.

[കൂടുതലിവിടെ]

viswaprabha വിശ്വപ്രഭ said...

മലയാളം കമ്പ്യൂട്ടിങ്ങിന് ഇന്നൊരു മഹത്തായ ദിവസമാണ്! എനിക്കും!

ഏഴു വര്‍ഷമായി ഞാന്‍ കാത്തിരിക്കുകയാണ് ഈ രണ്ടു പ്രതിഭകളും ഒരൊറ്റ താളില്‍ വന്ന്‌ ഇക്കാര്യം ചര്‍ച്ച ചെയ്യാന്‍ വേണ്ടി. വരമൊഴി യാഹൂഗ്രൂപ്പില്‍ ആദ്യമായി കമ്പ്യൂട്ടറിലെ മലയാളലിപി മാനനീകരണത്തെപ്പറ്റിയും, പിന്നെ യുണികോഡിനെപ്പറ്റിയും എഴുതിയ അന്നു മുതല്‍ രചനയെ കാത്തിരിക്കുകയായിരുന്നു.

ഈയിടെ ഹുസ്സൈനെ നേരിട്ടു കണ്ടപ്പോള്‍ ഒരു കാര്യം വ്യക്തമായി. നാടോടികളായി അലഞ്ഞുതിരിയാന്‍ വിധിക്കപ്പെട്ട സിബുവിനേയും ഞങ്ങള്‍ മറ്റു കൂട്ടുകാരേയും പോലെത്തന്നെ ഒഴുക്കിനെതിരെ അവരുടേതായ നിലയില്‍ യുദ്ധം ചെയ്യുന്നവരാണ് ഹുസ്സൈനും ചിത്രജനും കൂട്ടരും എന്ന്. ആ കൂടിക്കാഴ്ചയെ പറ്റി ഒരു നീണ്ട റിപ്പോര്‍ട്ടു തന്നെ എഴുതിയുണ്ടാക്കിയിട്ടുണ്ട് ഞാന്‍. എങ്കിലും ഹുസ്സൈന്‍ കൂടി വായിച്ച് സമ്മതം അറിയിച്ചതിനുശേഷമേ അതു വെളിച്ചത്താക്കൂ എന്നു വിചാരിച്ചു.

തിരിച്ചുവന്നതിനുശേഷം വരമൊഴിയില്‍ തുടക്കം തൊട്ട് ഇക്കാര്യത്തില്‍ നടത്തിയിട്ടുള്ള ചര്‍ച്ചകള്‍ വായിച്ചു പഠിക്കുകയായിരുന്നു ഞാന്‍. ചിലേടത്തൊക്കെ രചനയെത്തന്നെ നിര്‍ദയം വിമര്‍ശിച്ചിട്ടുണ്ട് ഞാനടക്കമുള്ള അവിടത്തെ അംഗങ്ങള്‍. തുറന്നൊരു ചര്‍ച്ചയ്ക്ക് തയ്യാറാവാതെ രചന പിന്‍‌വലിഞ്ഞു നിന്നതുകൊണ്ടാകാം പക്വത വരാത്ത, ചെറുപ്പക്കാരായ ഞങ്ങളുടെ സ്വരങ്ങളില്‍ കാര്‍ക്കശ്യമേറിയത്. എന്നിരുന്നാലും സ്വന്തം അമ്മമൊഴിയോടുള്ള ഞങ്ങളുടെ നിസ്വാര്‍ത്ഥമായ പ്രതിബദ്ധത ആ ചര്‍ച്ചകളിലാകമാനം കാണാം.

പരമ്പരാഗതമായ നമ്മുടെ മലയാളലിപിസഞ്ചയത്തിനെ രചന അത്യദ്ധ്വാനം ചെയ്തുകൊണ്ടു തന്നെ കണ്ടെടുക്കുകയും പുനരാവിഷ്കരിക്കുകയുമുണ്ടായി എന്നു ഞങ്ങള്‍ പത്രങ്ങളിലൂടെയും മറ്റും വായിച്ചറിഞ്ഞിരുന്നു. ഇതിനെ തുടര്‍ന്ന് സിബുവും മറ്റുള്ളവരും രചനയുമായി ബന്ധപ്പെടുവാനും ശ്രമിച്ചിരുന്നു. അന്നു ബാംഗ്ലൂരില്‍ ജോലി ചെയ്തിരുന്ന സിബു ഹുസ്സൈന്‍ സാറിന് രണ്ടു പ്രാവശ്യമെങ്കിലും മെയിലയക്കുകയും ചെയ്തു. പക്ഷേ നിര്‍ഭാഗ്യവശാല്‍ വ്യക്തമായ ഒരു മറുപടി ആ സമയത്ത് ലഭിച്ചില്ലെന്നാണറിവ്.

99 ആഗസ്റ്റ് 27 ന് ഡോ.അച്യുത്ശങ്കര്‍ വരമൊഴിയിലേക്ക് സ്വയം പരിചയപ്പെടുത്തിക്കൊണ്ട് ഒരു പ്രധാനപ്പെട്ട മെയില്‍ അയക്കുകയുണ്ടായി. ഗ്ലിഫുകളും എന്‍‌കോഡിങ്ങും തമ്മിലുള്ള വ്യത്യാസത്തെപ്പറ്റിയും രചനയുടെയും മലയാളത്തനിമയുടേയും യുണികോഡിന്റെയും (വ്യവിധോദ്ദേശ്യങ്ങളായ)ലക്‌ഷ്യങ്ങളെപ്പറ്റിയും ആദ്യമായി ആ മെയിലില്‍ ആണ് പരാമര്‍ശിക്കപ്പെട്ടത്. അതേത്തുടര്‍ന്നാണ് ഈയിടെ വീണ്ടും ചൂടുപിടിച്ചിട്ടുള്ള ‘ര’-‘റ’-ര്‍-ചില്ല്-കൊളേഷന്‍ ‍ചര്‍ച്ചയും ആദ്യമായി അവിടെ വന്നത്. ഒരു പക്ഷേ രചന കൂടി അന്ന് ആ ചര്‍ച്ചയില്‍ പങ്കെടുത്തിരുന്നെങ്കില്‍ മലയാളം യുണികോഡ് (സര്‍ക്കാരിന്റെയും ഭാഷാഇന്‍സ്റ്റിവിഷത്തിന്റേയും ഒന്നും സഹായമില്ലാതെതന്നെ) വര്‍ഷങ്ങളുടെ കുതിച്ചുചാട്ടം നടത്തിയേനെ!

വേണ്ടത്ര അറിവുള്ള ഭാഷാശാസ്ത്രജ്ഞന്മാരുടെ അഭാവം കൊണ്ട്, ഭാഷയില്‍ മുറിവൈദ്യം മാത്രം അറിയാവുന്ന, എന്നാല്‍ യന്ത്രസാങ്കേതികതയില്‍ കുറച്ചൊക്കെ നൈപുണ്യമുള്ള ഒരു പിടി ആളുകള്‍ മാത്രം വരമൊഴി ഗ്രൂപ്പില്‍ ബാക്കിവന്നു. അതുകൊണ്ടു തന്നെ ലിപി/എന്‍‌കോഡിങ്ങ് രംഗത്ത് (വേറേ ഉത്തരവാദിത്തമുള്ള ആരും തിരിഞ്ഞുനോക്കാതിരിക്കുമ്പോള്‍) വരമൊഴിഗ്രൂപ്പിനെങ്കിലും സജീവമായി ഒരു ചര്‍ച്ച തുടര്‍ന്നുകൊണ്ടുപോവാന്‍ സാധിച്ചില്ല.

എങ്കിലും ഒരു പ്രത്യേക ലിപിയുടെ രൂപത്തിലും കോഡ്മാപ്പിലും നേരിട്ട് ബന്ധമില്ലാത്തതാണെങ്കില്‍ പോലും ഒരു transliteration പദ്ധതിയുടെ മാത്രം വക്താവായി മാറിനില്‍ക്കാതെ സിബുവും വരമൊഴിഗ്രൂപ്പും ലിപിമാനനീകരണത്തിനുവേണ്ടിയും യുണികോഡ് അംഗീകാരത്തിനുവേണ്ടിയും ശ്രമിച്ചുകൊണ്ടിരുന്നു.

ഒരു ഘട്ടത്തില്‍ വരമൊഴി പ്രോഗ്രാം സിബു യുണികോഡിലേക്കു കൂടി വ്യാപിപ്പിച്ചു. ഉപയോഗയുക്തമായ ഒരു യുണികോഡ് ലിപി അപ്പോഴും മലയാളത്തിലുണ്ടായിക്കഴിഞ്ഞിരുന്നില്ല. ഏറെക്കുറെ ആര്‍ക്കും വേണ്ടാത്ത ആ ഫീച്ചര്‍ മലയാളം വിക്കി വന്നപ്പോളാണ് ആളുകള്‍ ശ്രദ്ധിച്ചുതുടങ്ങിയതു തന്നെ. അങ്ങനെയാണ് കെവിന്‍ വെറുതെ ഒരു രസത്തിനെന്ന പോലെ അഞ്ജലി യുണികോഡ് വരച്ചുണ്ടാക്കാന്‍ തുടങ്ങിയത്.

രചനയെ എതിരിടാന്‍ വേണ്ടിയല്ല രചന കണ്ടെത്തിയ ലിപിരൂപങ്ങള്‍ കെവിന്‍ അഞ്ജലിയില്‍ ചേര്‍ത്തുവെച്ചത്. കുറഞ്ഞ പ്രയത്നം, ചക്രം വീണ്ടും കണ്ടുപിടിക്കേണ്ടല്ലോ എന്നൊക്കെയേ അയാള്‍ വിചാരിച്ചിരുന്നുള്ളൂ. മാത്രമല്ല, അറിഞ്ഞിടത്തോളം ഒരു സ്വതന്ത്ര സോഫ്റ്റ്വെയര്‍ ആയിരുന്നു ലിപി ആ സമയത്ത്.

ഒരു പക്ഷേ മലയാളത്തിലെ പഴയ ലിപിയെ ഉയിര്‍ത്തെഴുന്നേല്‍പ്പിച്ചതില്‍ രചന വഹിച്ച പങ്കിനോടൊപ്പം തന്നെ ഒപ്പം വെച്ചുകാണണം കെവിന്‍ അയാളുടെ യുണികോഡ് ഫോണ്ട് പഴയ ലിപിയില്‍ സൃഷ്ടിക്കാന്‍ തീരുമാനിച്ച അസാധാരണമായ ചങ്കൂറ്റവും എന്നാണെനിക്കിപ്പോള്‍ തോന്നിയിട്ടുള്ളത്. ഇക്കഴിഞ്ഞ രണ്ടു വര്‍ഷങ്ങളില്‍ അഞ്ജലി ആര്‍ജ്ജിച്ച പ്രചാരം തന്നെ ഗൌരവമായി കാണേണ്ടതാണ്. എങ്കില്‍ പോലും ഹുസ്സൈനിന്റെ അത്ര തന്നെ സൌമ്യപ്രകൃതിയായി എനിക്കു തോന്നിയിട്ടുള്ള കെവിന്‍ ഇപ്പോഴും അങ്ങനെ ഒരു ക്രെഡിറ്റു ചോദിച്ചുവാങ്ങുവാന്‍ ആഗ്രഹിക്കുന്നു എന്നുതോന്നുന്നില്ല.ഇടയ്ക്കൊരിക്കല്‍ രചനയില്‍ നിന്നും എടുത്തിട്ടുള്ള ഭാഗങ്ങള്‍ അഞ്ജലിയില്‍ നിന്നും നീക്കം ചെയ്യണമെന്ന് ആവശ്യപ്പെട്ടപ്പോള്‍ ഖിന്നതയോടെ, എന്നാല്‍ മറിച്ചൊരക്ഷരം ഉരിയാടാതെ കെവിന്‍ അതനുസരിക്കുകയും ചെയ്തു.


ഇത്രയും കാര്യങ്ങള്‍ ദീര്‍ഘമായി ഇവിടെ എഴുതിയത് ഒരു പ്രത്യാശയോടു കൂടിയാണ്. കഴിഞ്ഞുപോയ ഈ സംഭവങ്ങളില്‍ നാം പരസ്പരം അറിയാതെ ചെറിയ തെറ്റിദ്ധാരണകളൊക്കെ ഉണ്ടായിട്ടുണ്ടാവാം.പക്ഷേ ഇനിയും നമുക്കതൊക്കെ മറന്നുകളയാമെന്നു ഞാന്‍ അഭ്യര്‍ത്ഥിക്കുന്നു.

ഇത്തവണ നാട്ടില്‍ വന്നപ്പോഴത്തെ ഏറ്റവും വലിയ നേട്ടമായി ഞാന്‍ കാണുന്ന രണ്ടോ മൂന്നോ കാര്യങ്ങളില്‍ ഒന്ന് ഹുസ്സൈനെ കണ്ടുമുട്ടിയതാണ്. നേരിട്ടുകണ്ടപ്പോള്‍ എന്റെ ധാരണകളില്‍ എത്ര മാത്രം അബദ്ധങ്ങളുണ്ടായിരുന്നു എന്ന് എനിക്കു തിരിച്ചറിയാനായി. പരസ്പരം അറിയാതെ നാം നമ്മുടെ ശക്തിയും ഊര്‍ജ്ജവും ഇനി ദുര്‍വ്യയം ചെയ്തുകൂടാ. ഡോക്റ്റര്‍ മഹേഷ്, രാമചന്ദ്രന്‍ മാസ്റ്റര്‍, ഹുസ്സൈന്‍ തുടങ്ങി കേരളത്തില്‍ തന്നെയുള്ള ഭാഷാവിദഗ്ദരായ തലമുതിര്‍ന്ന ചേട്ടന്മാരും കടലുകള്‍ക്കക്കരെ, സാങ്കേതികമായി ദീര്‍ഘവീക്ഷണവും എന്നാല്‍ മറ്റുള്ള കാര്യങ്ങളില്‍ പരിമിതികളും ഉള്ള സിബുവിനേയും കെവിനേയും ബെന്നിയെപ്പോലെയും ഉള്ള കുഞ്ഞനിയന്മാരും ഒത്തൊരുമിച്ചാല്‍ മഹത്തായിരിക്കും ആ സൈന്യം!

പ്‌രബോധചന്‌ദ്‌രിക ഇനിയും ഉദിച്ചുവന്നിട്ടില്ലാത്ത നമ്മുടെ നാട്ടിലെ തന്നെ വേരെടുത്ത കസേരകളും ‘പാഷാണഇന്‍സ്റ്റിവിഷങ്ങളും’ നോക്കിനില്‍ക്കേ തന്നെ നമുക്കൊരുമിച്ച് ഐക്യദാര്‍ഢ്യത്തോടെ ജനങ്ങളിലേക്കും നമ്മുടെ മലയാളഭാഷയിലേക്കും ഇറങ്ങിച്ചെല്ലാം!

അസ്തപ്രജ്ഞയായിക്കിടക്കുന്ന തുഞ്ചന്റെ കിളിപ്പെണ്ണിന് ഒരു തുള്ളി വെള്ളമെങ്കിലും വായിലിറ്റിച്ചുകൊടുക്കാം ഇനി നമുക്കൊത്തൊരുമിച്ച്!

യുണികോഡടക്കമുള്ള കാര്യങ്ങളില്‍ മുന്‍‌വിധികളും വാശികളും എല്ലാം മാറ്റിവെച്ച് നമുക്കൊന്നിക്കാനാവും. അന്നു ഞാന്‍ പറഞ്ഞതുപോലെ യന്ത്രങ്ങളുടെ യുക്തിഭദ്രതയ്ക്ക് തെറ്റായ പല വഴികളും ഉണ്ടാവാം. പക്ഷേ ശരിയായ ഒരൊറ്റ വഴിയേ കാണൂ.ആ വഴി ഏതായാലും നമുക്കൊരുമിച്ചു കണ്ടുപിടിക്കാം.

അതെത്ര വേഗം ചെയ്യുന്നുവോ അത്രയ്ക്കും ആരോഗ്യം കൂടും നമ്മുടെയൊക്കെ അമ്മമലയാളത്തിന്.

ഗ്ലിഫുകളുടേയും എന്‍‌കോഡിങ്ങിന്റേയും പ്രശ്നങ്ങള്‍ വേര്‍തിരിച്ച് കണ്ട് ഒറ്റയ്ക്കൊറ്റായി നമുക്ക് ചര്‍ച്ച ചെയ്യാം. അവയില്‍ തന്നെ സംവൃതോകാരം, ലഘുവിരാമം, ചില്ലുകള്‍ എന്നിവയെക്കുറിച്ചും 1970-ലെ കൊലപാതകത്തിനെക്കുറിച്ചും നമുക്കു പിന്നെയും ഇഴപിരിച്ച് ചെറിയ ചെറിയ പ്രശ്നങ്ങളാക്കി മാറ്റാം.
ആ തലത്തില്‍ വേറെ പാണ്ഡിത്യമുള്ള പുതിയ ആളുകളെയും നമുക്കു തേടിപ്പിടിക്കാം!

input ചെയ്യുമ്പോഴും output ചെയ്യുമ്പോഴും ഉഭയദിശകളിലും‍ മാറ്റം വരാത്ത ഒരു ലിപിസഞ്ചാലനവ്യവസ്ഥയും എല്ലാര്‍ക്കും സ്വീകാര്യമായ ഒരു അക്ഷരക്രമീകരണരീതിയും അന്‍പതു-നൂറു വര്‍ഷത്തിന്റെയെങ്കിലും ചരിത്രപരമായ പിന്‍ബലമുള്ള അക്ഷരരൂപങ്ങളുമാവട്ടെ ഏറ്റവും അടിസ്ഥാനപരമായി നമ്മുടെ കൂട്ടായ മൂന്നു ലക്‌ഷ്യങ്ങള്‍!
ആ ലക്ഷ്യങ്ങളെക്കുറിച്ചുതന്നെ ഒരു മാര്‍ഗ്ഗരേഖയുണ്ടാക്കാം ആദ്യം.

പെരിങ്ങോടന്‍ said...

ഹുസൈന്‍,

സര്‍ക്കാര്‍ തീരുമാനിച്ചാല്‍ വിശാലമായ ഒരു ചര്‍ച്ചാ വേദി എത്രയും പെട്ടെന്നു വിളിച്ചുകൂ‍ട്ടാവുന്നതേയുള്ളൂ. മലയാളം കമ്പ്യുട്ടിങ്ങിന്റെ യഥാര്‍ത്ഥ പബ്ലിക്‌ ഹിയറിംഗ്‌ അതായിരിക്കണം. ഇതിനായി മലയാളീ ബ്ലോഗര്‍മാരില്‍നിന്നും ശബ്ദമുയരണം.


താങ്കളെപ്പോലെ ഒരാള്‍ കുറേനേരത്തെ തന്നെ പറയേണ്ടിയിരുന്ന വാക്കുകളായിരുന്നു ഇവ; അച്ചുനിരത്തുന്നവരോടുള്ള അവജ്ഞയാകാം ഒരു പക്ഷെ പറയാതിരിക്കുവാനുള്ള കാരണം. ഇപ്പോഴെങ്കിലും താങ്കള്‍ തന്നെ പറഞ്ഞ മെഗലൊമാനിയ ‘ധാര്‍ഷ്ട്യം’ മാറ്റിവച്ചു ചര്‍ച്ചവേണമെന്നു് ആവശ്യപ്പെടുന്നതില്‍ വളരെ സന്തോഷം. എത്രയും പെട്ടെന്നു കാര്യങ്ങള്‍ക്കൊരു തീര്‍പ്പുണ്ടാകുവാനാണു് ഐ.ടി വിദഗ്ദര്‍ കാത്തിരിക്കുന്നതു്, അനേകം പേര്‍ ഇപ്പോള്‍ തന്നെ യൂണികോഡ് ഉപയോഗിക്കുന്നു, തെറ്റുകള്‍ കുമിഞ്ഞുകൂടും മുമ്പ് തിരുത്തലുകള്‍ നടന്നിരിക്കേണ്ടതുണ്ടു്. ഇന്റര്‍നെറ്റ് ഉപയോഗിക്കാനില്ലാത്ത-വരേണ്യരല്ലാത്തവര്‍ ഞങ്ങളെന്നു വിലപിക്കുന്നതുകൊണ്ടു വലിയ പ്രയോജനമൊന്നുമില്ല, കേരള ഐ-ടി മിഷന്‍ ലക്ഷങ്ങള്‍ പാഴാക്കുന്ന വേളയില്‍, ഭാഷാകമ്പ്യൂട്ടിങ് പ്രവര്‍ത്തകര്‍ക്കു ചര്‍ച്ച ചെയ്യുവാന്‍ ഒരു ചെറുവേദിയെങ്കിലും നേടിയെടുക്കാനാവണമായിരുന്നു സ്വാധീനവും അധികാരവും വാക്കുകളും എല്ലാവരും ഉപയോഗിക്കേണ്ടിയിരുന്നതു്.

എല്ലാവിധ ആശംസകളും രചന അക്ഷരവേദിക്കു നേര്‍ന്നുകൊണ്ടു്,

സ്നേഹാദരവുകളോടെ

കണ്ണൂസ്‌ said...

ഈ ചര്‍ച്ചകള്‍ വായിക്കാന്‍ കഴിയുന്നത്‌ തന്നെ മഹാഭാഗ്യം!! എല്ലാ ചര്‍ച്ചകളും ഇങ്ങനെ പരസ്യവേദിയിലാക്കാന്‍ കഴിയില്ലെന്നറിയാം, എന്നാലും പറ്റുന്നിടത്തോളം, നിങ്ങളുടെ വിജ്ഞാനം ഞങ്ങള്‍ക്കും പകര്‍ന്നു തരിക.

സുനില്‍ said...

ഹുസ്സൈന്‍ സാറിന് നമസ്കാരം!
പല രാഷ്ട്രീയമാനങളുള്ള ഈ സംഭവത്തെ പുതിയ വെളിച്ചത്തില്‍ കാണാനും പഠിക്കാനും ഹുസ്സൈന്‍ സാറും മഹേഷുമൊക്കെയുമായുള്ള സംവാദങള്‍ സഹായിച്ചു. ഇനിയും തുറന്ന മനസ്സോടേ മുന്‍‌ധാരണകളില്ലാതെ രചനയുമായി സഹകരിച്ച്‌ ,സംവദിച്ച്‌ സര്‍ക്കാറിനെ നേരാംവഴിയില്‍ കൊണ്ട്നടത്താന്‍ നമുക്ക് ശ്രമിക്കാം.
വേണ്ടത്‌ ചെയ്യാന്‍ വിശ്വം മുന്‍‌കൈ എടുക്കുമെന്ന്‌ കരുതുന്നു.-സു-

സുനില്‍ said...

കൂട്ടരെ, മലയാളലിപികളെ വെട്ടിമുറിച്ച്‌ എണ്ണം കുറച്ച്‌ യൂണിക്കോടില്‍ കൊണ്ടുവരുന്നതിന് കാരണമായി പറയുന്നത്‌ യൂണിക്കോട്‌ ഫസ്റ്റ് ലെവല്‍ ഇമ്പ്ലിമെന്റേഷന്‍, അക്ഷരങളുടെ എണ്ണം കുറച്ചാല്‍ സാധ്യമാണെന്നും അതുവഴി ചെറിയ ഉപകരണങളില്‍കൂടി മലയാളം സാധ്യമാകുമെന്നും ആണ്. തമിഴില്‍ 22 അക്ഷരങളാക്കി കുറച്ച്‌ ഒരു എങ്കോഡിങ് രീതി കൊണ്ട് വന്നു, അവിടുത്തെ ഐ.ടി വ്ദഗ്‌ദ്ധര്‍ എന്നൊക്കെ കേട്ടു. ബെന്നിയാണ് ഇക്കാര്യത്തില്‍ കുറച്ചുകൂടെ വിശദമായി പറയാന്‍ കഴിവുള്ള ആള്‍. ഫസ്റ്റ് ലെവല്‍ ഓഫ് ഇമ്പ്ലിമെന്റേഷന്‍ എന്താണ് എന്നൊക്കെ പഠിക്കേണ്ടിയിരിക്കുന്നു എനിക്ക്‌!
ചില്ലക്ഷരങളെക്കുറിച്ച്‌ അഭിപ്രായവ്യത്യാസമുണ്ടെങ്കിലും രചനയുമായി സഹകരിച്ച്‌ പോകണമെന്നുതന്നെയാണ് എനിക്ക്‌ തോന്നിയത്‌. ഹുസ്സൈന്‍ സാറെ കാണുകയും പലപ്രാവശ്യമായി ധാരാളം വര്‍ത്തമാനം പറയുകയും ചെയ്തപ്പോഴാണ് വിവിധ വശങളെക്കുറിച്ച്‌ കൂടുതല്‍ അറിയാന്‍ കഴിഞത്‌.ബെന്നിയും കെവിനുംകൂടെ ഈ ചര്‍ച്ചയില്‍ പങ്കേറ്റുക്കട്ടെ.-സു-

കെവിന്‍ & സിജി said...

ഹുസൈന്‍ മാഷിനു് ബ്ലോഗുലകത്തേയ്ക്കു സ്വാഗതം.

മാഷിന്റ ചില അഭിപ്രായങ്ങള്‍ക്കുള്ള മറുപടികള്‍.

മലയാളത്തിലെ പ്രഗത്ഭരെ മുഴുവനും പങ്കെടുപ്പിച്ചു കൊണ്ടു് യുണീക്കോഡു് കണ്‍സോഷ്യത്തിനു് അതിന്റെ പ്രവര്‍ത്തനങ്ങള്‍ മുന്നോട്ടുകൊണ്ടുപോകാന്‍ കഴിയില്ല. അതൊരു അന്താരാഷ്ട്രസംഘടനയാണു്. അതിനു് ലോകത്തിലെ ജീവിച്ചിരിക്കുന്നതും മൃതമായതുമായ എല്ലാ ഭാഷകളുടെയും എഴുത്തുരൂപങ്ങള്‍ എന്‍കോഡുചെയ്യേണ്ടതായിട്ടുണ്ടു്. അങ്ങിനെ ജോലിഭാരമുള്ള അവര്‍ കേരളത്തില്‍ വന്നു് എല്ലാ പണ്ഡിതന്മാരേയും ഒരുമിച്ചു വിളിച്ചു ചേര്‍ത്തു് ചില്ലുകളെക്കുറിച്ചും സംവൃതോകാരത്തെക്കുറിച്ചും ചര്‍ച്ച ചെയ്യുകയെന്നതു് നടപ്പുള്ള കാര്യമല്ല. എന്നാലവര്‍ ലോകം മുഴുവനുമായി ചിതറിക്കിടക്കുന്ന എല്ലാ ഭാഷക്കാരുമായും ചര്‍ച്ചകള്‍ നടത്തുകയും ചെയ്യുന്നുണ്ടു്. ലോകം മുഴുവനുമുള്ള ജനങ്ങളുമായി ചര്‍ച്ച ചെയ്യാനായി അവര്‍ തിരഞ്ഞെടുത്ത മാര്‍ഗ്ഗം ഇമെയിലാണു്. പിന്നെ ഞങ്ങളെപ്പോലെ വിദൂരദേശങ്ങളില്‍ കിടക്കുന്നവര്‍ നാട്ടിലൊരു യോഗം വിളിച്ചുചേര്‍ത്തു ചര്‍ച്ചകള്‍ നടത്തുന്നതിനെക്കുറിച്ചു ചിന്തിക്കാന്‍ തന്നെ നേരമില്ല. ജോലിക്കിടയില്‍ ജോലിതന്നെ റിസ്കെടുത്താണു് ഇന്‍ഡിക് ലിസ്റ്റിലെ ചര്‍ച്ചകളില്‍ പങ്കെടുക്കുന്നതു്.

ഇനി ഹുസൈന്‍ മാഷും എത്തിചേര്‍ന്നനിലയ്ക്കു് കൂടുതല്‍ പ്രഗത്ഭരെ ഈ ചര്‍ച്ചകളിലേയ്ക്കു് ആനയിയ്ക്കാന്‍ ബുദ്ധിമുട്ടുണ്ടാവില്ല. നാട്ടിലെവിടെയെങ്കിലും യോഗംചേര്‍ന്നു് അടിച്ചുപിരിഞ്ഞതു കൊണ്ടു ഗുണമൊന്നുമുണ്ടാകാന്‍ പോകുന്നില്ല. യുണീക്കോഡ് ഒരിക്കലും വോട്ടെടുപ്പിലൂടെയല്ല കാര്യങ്ങള്‍ തീരുമാനിക്കുന്നതു്, വാദങ്ങളുടെയും തെളിവുകളുടെയും അടിസ്ഥാനത്തിലാണു്. യുണീക്കോഡിനെക്കുറിച്ചു വ്യക്തമായ ധാരണയോടു കൂടി അതിനെ സമീപിച്ചാലേ, അതുകൊണ്ടു് ഗുണമുണ്ടാവുകയുള്ളൂ. അല്ലെങ്കില്‍ കൈയിലുള്ള പശുവില്‍ നിന്നു് കറന്നെടുക്കാവുന്ന പാലിനെക്കുറിച്ചറിയാതെ, ഇതിനെക്കൊണ്ടു് ഭാരവണ്ടിവലിക്കാനൊക്കില്ലെന്നു് പറഞ്ഞു് ദൂരെക്കളയുന്ന പോലെയാകും.

സസ്നേഹം കെവി

മയ്യഴി said...

മലയാളത്തിന്റെ യൂനിക്കോഡ്‌ കോഡുകളുടെ കാര്യത്തില്‍ സര്‍ക്കാര്‍ ഭാഗത്തു നിന്നും അപകടകരമായ ഇടപെടലുകളുണ്ടായി എന്ന പത്രവാര്‍ത്ത ആകാവുന്നവത്ര ആളുകളിലേക്ക്‌ എത്തിക്കുക എന്ന ഉദ്ദേശ്യത്തോടെ മെയിലുകള്‍ അയച്ച ഒരാളാണ്‌ ഞാന്‍. ഒരു പക്ഷേ, കാള പെറ്റെന്നു കേട്ട്‌ കയറെടുത്തതു പോലെ, നേരിട്ട്‌ അറിവില്ലാത്ത കാര്യങ്ങള്‍ വായിച്ച്‌ കമ്പം പിടിച്ചതുപോലെയാണ്‌ എന്റെ ഇടപെടല്‍ എന്ന്‌ തോന്നാവുന്നതാണ്‌. മലയാളക്കരയില്‍ മലയാളം കമ്പ്യൂട്ടിങ്ങിനെക്കുറിച്ച്‌ മനസ്സിലാക്കാന്‍ ശ്രമിക്കുന്ന ഭാഷാദ്ധ്യാപകന്‍ എന്ന നിലയിലും ഈ രംഗത്തു പ്രവര്‍ത്തിക്കുന്ന കേരളത്തിലും പുറത്തുമുള്ളവരുമായി ആശയവിനിമയം നടത്താനുള്ള ഒരു അവസരവും പാഴാക്കാതിരിക്കുകയും ചെയ്യുന്നയാള്‍ എന്ന നിലയിലും ഇക്കാര്യത്തില്‍ സര്‍ക്കാര്‍ ഭാഗത്തു നിന്നും ഉണ്ടാകാവുന്ന ഇടപെടല്‍ ഏതു വിധത്തിലായിരിക്കുമെന്ന്‌ എനിക്ക്‌ ഊഹിക്കാവുന്നതാണ്‌.
ശരാശരിയില്‍ താഴ്ന്ന ബുദ്ധിനിലവാരവും അതിലും കുറഞ്ഞ സത്യസന്ധതയും മാത്രം കൈമുതലായുള്ള സര്‍ക്കാര്‍ കമ്മിറ്റിയംഗങ്ങള്‍ മുമ്പ്‌ പറഞ്ഞ കാര്യങ്ങള്‍ പലര്‍ക്കും അറിവില്ലാത്തതായിരിക്കുമെന്നതിനാല്‍ ഇവിടെ പറയട്ടെ.
1.മലയാളഭാഷയിലെ അക്ഷരങ്ങളുടെ എണ്ണം കമ്പ്യൂട്ടറില്‍ മലയാളം ഫലപ്രദമായി ഉപയോഗിക്കുന്നതിന്‌ തടസ്സമാണ്‌.
2ളിപിപരിഷ്കരണത്തിലൂടെ ലിപിചിഹ്നങ്ങളുടെ എണ്ണത്തില്‍ വളരെയധികം കുറവ്‌ വരുത്താനായിട്ടുണ്ട്‌. പുതിയ പരിഷ്കാരത്തിലൂടെ എണ്ണം 90 ആയി ചുരുക്കാം.
3.മലയാളത്തിലെ സ്വരങ്ങളില്‍ നാലെണ്ണം (ഞാന്‍ ഉപയോഗിക്കുന്ന സോഫ്റ്റ്‌ വേറിന്റെ പരിമിതി കാരണം അവ ഇവിടെ ടൈപ്പ്‌ ചെയ്യാന്‍ സാധിക്കുന്നില്ല) ഉപേക്ഷിക്കേണ്ടതാണ്‌.
4. ലിപിപരിഷ്കരണത്തിനു ശേഷം പഴയലിപിയിലേക്ക്‌ തിരിച്ചുപോകാനുള്ള ശ്രമം പിന്തിരിപ്പനാണ്‌.

ഇത്തരം വാദമുഖങ്ങള്‍ അവതരിപ്പിക്കുന്നതിനിടയില്‍ കുറേ വിചിത്രവാദങ്ങളും അവര്‍ അവതരിപ്പിക്കുന്നുണ്ട്‌. രചന എന്നു കേള്‍ക്കുന്നതു തന്നെ അരോചകമായി കണക്കാക്കിയ ഇവര്‍ യൂനിക്കോഡില്‍ മലയാളലിപികള്‍ക്കുള്ള കോഡുകള്‍ നിര്‍ണ്ണയിക്കുന്ന പ്രവര്‍ത്തനത്തില്‍ രചന അവതരിപ്പിച്ച വാദങ്ങളെ സര്‍ക്കാര്‍ നിലപാട്‌ എന്ന നിലയില്‍ ഒരു രേഖ അയച്ചുകൊടുത്ത്‌ തകര്‍ക്കാന്‍ മുതിര്‍ന്നു. മലയാളലിപികളില്‍ ആവശ്യമില്ലാത്തവ ഏതൊക്കെയെന്ന്‌ അറിയിക്കുന്ന പ്രസ്തുത രേഖ എക്കാലത്തെയും വലിയ തമാശയായിരുന്നു. യൂനിക്കോഡ്‌ ഈ രേഖയെന്തുചെയ്തുവെന്നു പറയേണ്ടതില്ലല്ലോ.
1971 ല്‍ പുറത്തിറക്കിയ ലിപി പരിഷ്കരണത്തെക്കുറിച്ചുള്ള ഒരു രേഖ ഇപ്പോള്‍ സര്‍ക്കാര്‍ പങ്കാളിത്തമുള്ള ഒരു വെബ്ബ്‌ സൈറ്റില്‍ പ്രസിദ്ധീകരിച്ചിട്ടുണ്ട്‌. മലയാളം കീബോര്‍ഡ്‌ ലേഔട്ട്‌ നിശ്ചയിക്കാനുള്ള ഒരു കമ്മിറ്റിയുടെ റിപ്പോര്‍ട്ടാണത്‌. ഇത്‌ ഒരു വ്യാജരേഖയാണ്‌ എന്നാണ്‌ എനിക്കു തോന്നിയിട്ടുള്ളത്‌. കാരണങ്ങള്‍ പലതാണ്‌. ടൈപ്പ്‌ റൈറ്റര്‍ കീബോര്‍ഡിനെക്കുറിച്ചുള്ള ഒരു തീര്‍പ്പല്ലാതെ അക്കാലത്ത്‌ കമ്പ്യൂട്ടര്‍ ടൈപ്പ്‌ സെറ്റിങ്ങിനെക്കുറിച്ച്‌ ഇങ്ങനെ ഒരു ആലോചന വരാനിടയില്ലാത്ത വിധത്തില്‍ കൊണ്ടുപിടിച്ച ടൈപ്പ്‌ റൈറ്റര്‍ കച്ചവടം നടക്കുന്ന കാലമാണത്‌. മാത്രമല്ല കമ്മിറ്റിയംഗങ്ങള്‍ 1971 നു ശേഷം പ്രകടിപ്പിച്ച അഭിപ്രായങ്ങളാണ്‌ നേരത്തെ പറഞ്ഞത്‌. അങ്ങനെയാണെങ്കില്‍ പ്രസ്തുതരേഖയില്‍ ഇന്നു നമ്മള്‍ വായിക്കുന്ന അഭിപ്രായങ്ങള്‍ വരാനിടയില്ല.
ലിപി സംബന്ധമായ കാര്യങ്ങള്‍ അവനവന്‍ വഹിക്കുന്ന സര്‍ക്കാര്‍ ലാവണങ്ങള്‍ നല്‍കുന്ന പിന്‍ബലത്തോടെ തീര്‍പ്പാക്കാന്‍ സാധിക്കാത്തവയാണെന്നും ഗള്‍ഫിലും അമേരിക്കയിലുമുള്ള ഭാഷാസ്നേഹികളായ നിരവധി യുവാക്കള്‍ പരപ്രേരണയോ വിശേഷാല്‍ അധികാരങ്ങളോ ഇല്ലാതെ ഇക്കാര്യത്തില്‍ സന്നദ്ധസേവനം നടത്തുമെന്നും രചനയുടേയോ അതിന്റെ പിന്നില്‍ പ്രവര്‍ത്തിച്ചവരുടേയോ സ്വാര്‍ത്ഥമല്ല തനതുലിപിസഞ്ചയം കമ്പ്യൂട്ടറില്‍ സാദ്ധ്യമാക്കലെന്നും സര്‍ക്കാര്‍ കമ്മിറ്റി ഇനിയെങ്കിലും മനസ്സിലാക്കട്ടെ.

സര്‍ക്കാര്‍ ഇടപെടലിനെക്കുറിച്ചുള്ള വാര്‍ത്തകള്‍ പുറത്തു വന്നപ്പോള്‍ അതിനെക്കുറിച്ച്‌ ബ്ലോഗുകളില്‍ വന്ന പ്രതികരണങ്ങളില്‍ രചനയെക്കുറിച്ച്‌ തെറ്റിദ്ധാരണാജന്യമായ നിരീക്ഷണങ്ങള്‍ കാണാനിടയായി. രചന എന്ന ടെക്സ്റ്റ്‌ എഡിറ്റര്‍ കേരളത്തില്‍ വ്യാപകമായ നിലയില്‍ വാണിജ്യപരമായി ഉപയോഗിക്കപ്പെടുന്നില്ല എന്ന വസ്തുത ആദ്യമേ പറയട്ടെ. മലയാളത്തിന്റെ തനതുലിപിയില്‍ പുസ്തകം അച്ചടിച്ചു കാണണം എന്ന വാശി കേരളത്തില്‍ വളരെക്കുറച്ചു പേര്‍ക്കു മാത്രമേ ഉള്ളൂ. അക്കാരണത്താല്‍ ഇതുവരെ രചന ഉപയോഗിച്ച്‌ ടൈപ്പ്സെറ്റുചെയ്ത പുസ്തകങ്ങളുടെ എണ്ണം വളരെ എളുപ്പത്തില്‍ തയ്യാറാക്കാവുന്നതാണ്‌. ആസ്കി കോഡിലുള്ള രചനയില്‍ നിന്ന്‌ യൂനികോഡിലേക്ക്‌ മാറുമ്പോള്‍, ഇക്കാരത്താല്‍ത്തന്നെ വലിയ നഷ്ടമൊന്നും ആര്‍ക്കും ഉണ്ടാവുകയില്ല.

യൂനികോഡിനു മുന്നില്‍ രചന അക്ഷരവേദിയിലെ ആര്‍.ചിത്രജകുമാറും,ഗംഗാധരനും അവതരിപ്പിച്ച അഭിപ്രായങ്ങള്‍ സിബു ജോണി അവതരിപ്പിച്ചവപോലെ വിഷയാധിഷ്ഠിതമാണ്‌. അവ ഏതൊരു പണ്ഡിതസദസ്സിനു മുമ്പിലും അവതരിപ്പിക്കാവുന്നവയാണ്‌. എന്നാല്‍ എക്കാലത്തും സര്‍ക്കാര്‍ ഇടപെടല്‍ നിഷേധാത്മകമാണ്‌. പി.ഗോവിന്ദപ്പിള്ളയാണ്‌ ഇത്തരം കാര്യങ്ങള്‍ നിശ്ചയിക്കുന്ന കമ്മിറ്റിയുടെ അദ്ധ്യക്ഷന്‍ എന്നതു
തന്നെ ഇക്കാര്യം വ്യക്തമാക്കുന്നു. നേരത്തെ പറഞ്ഞ വിചിത്രവാദങ്ങള്‍ അവതരിപ്പിച്ച പ്രൊഫസ്സര്‍സംഘം കൂടെയുമുണ്ട്‌. അവരോട്‌ തര്‍ക്കിച്ചിട്ടു കാര്യമില്ല. പക്ഷെ ഒരു ജനതയുടെ ഭാഷയെ തങ്ങളുടെ ഉച്ചക്കിറുക്കുകള്‍കൊണ്ട്‌ വികലമാക്കാനുള്ള അവരുടെ ശ്രമങ്ങള്‍ക്കെതിരെ ജാഗ്രത പുലര്‍ത്തേണ്ടതുണ്ട്‌.
ബ്ലോഗിങ്ങിലൂടെ യൂനിക്കോഡ്‌ മലയാളലിപി പ്രചാരത്തില്‍ വന്നു കഴിഞ്ഞു, ഇപ്പോഴും പലവിധം പ്രശ്നങ്ങളോടെയാണ്‌ നാമേവരും ഈ ലിപികള്‍ ഉപയോഗിക്കുന്നത്‌.പ്രശ്നങ്ങളില്ലാത്ത കുറ്റമറ്റ എന്‍കോഡിംഗ്‌ എത്രയും വേഗം പൂര്‍ത്തികരിക്കുകയാവണം നമ്മുടെ ലക്ഷ്യം. അതിനിടയില്‍ പ്രസക്തമല്ലാത്ത വൈകാരികവിഷയങ്ങള്‍ സമചിത്തതയോടെ നമ്മുക്ക്‌ കൈകാര്യം ചെയ്യാന്‍ സാധിക്കണം.

ഉമേഷ്::Umesh said...

മയ്യഴീ,

ഈ കമന്റ് സ്വന്തം ബ്ലോഗിലെ ഒരു പോസ്റ്റ് ആയി ഇടൂ. ഒരു ബ്ലോഗ് കമന്റായി (അതും ബൂലോഗക്ലബ്ബിലെ മലവെള്ളപ്പാച്ചില്‍ പോലെയുള്ള പോസ്റ്റുകളിലെ ഒരു കമന്റായി) മാത്രം കിടക്കാനുള്ളതല്ല ഇതു്.

പത്തുവരിയില്‍ കൂടുതലുള്ള കാമ്പുള്ള എല്ലാ കമന്റുകളും ഇങ്ങനെ വേണമെന്നാണു് എന്റെ അഭിപ്രായം. (സിബുവും കെ. പി. യും ഇതു മുമ്പു പറഞ്ഞിട്ടുണ്ടു്.) പോസ്റ്റിട്ടിട്ടു് അതിന്റെ ഒരു ലിങ്ക് കമന്റായി കൊടുക്കാമല്ലോ.

സുറുമ || suruma said...

ഇതുവരെ വായിച്ചതില്‍ നിന്നും രണ്ടുകൂട്ടരും തമ്മിലുള്ള പ്രധാന ഉടക്ക് ചില്ലിനെച്ചൊല്ലിയാണെന്നു തോന്നുന്നു.പിന്നെ one-upmanship ഉം.വെബ് ലോകത്തില്‍ സിബുവും പ്രിന്റിങ്ങ്/ടൈപ്‌സെറ്റിങ്ങ് രംഗത്ത് രചനയും ചെയ്ത സംഭാവനകള്‍ നിസ്തുലമാണ്.
ഒരു ഫോണ്ട് ഉണ്ടാക്കിയതിന്റെ പരിമിതമായ അറിവുവെച്ച് ചില കാര്യങ്ങള്‍ കുറിക്കുന്നു.
ചില്ലുകള്‍ക്ക് code point നല്‍കുന്നതു തന്നെയാണ് നല്ലത്.കാരണം സ്ക്രിപ്റ്റ് എന്‍ജിന്‍ ലളിതമാക്കുന്നതിനും effective ആക്കുന്നതിനും അതുപകരിക്കും.
അതോടൊപ്പം യ,ര/റ,വ എന്നിവയുടെ അര്‍ദ്ധരൂപങ്ങളും വന്നാല്‍ നന്നായിരിക്കും.
ഇവയുടെ സ്ഥാനം അതാതു base characters ന്റ സമീപത്തു നിഘണ്ടുവിലെ ക്രമത്തില്‍ ആവുകയും വേണം.

വക്കാരിമഷ്‌ടാ said...

ഈ പോസ്റ്റും ഇതിലെ കമന്റുകളും എല്ലാം ചേര്‍ത്ത് ഉമേഷ്‌ജി പറഞ്ഞതുപോലെ ഒരു പോസ്റ്റാക്കുകയോ, അല്ലെങ്കില്‍ ഈ ചര്‍ച്ചയിലെ കാര്യങ്ങള്‍ നഷ്ടപ്പെട്ടു പോകാത്തവണ്ണം എന്തെങ്കിലും പരിപാടി ചെയ്യാനോ മറ്റോ പറ്റുമോ?

viswaprabha വിശ്വപ്രഭ said...

ഉമേഷേ,

മൊത്തം ഈ പോസ്റ്റും എല്ലാ കമന്റുകളും മുഴുവനായിത്തന്നെ സുസ്ഥിരമായ മറ്റൊരു സ്ഥലത്തേക്ക് മാറ്റിയിടുകയോ പകര്‍ത്തുകയോ തന്നെ വേണം.


എന്നിരുന്നാലും അതോടൊപ്പം തന്നെ, പരസ്യമായി ഈ ചര്‍ച്ച ഇതേ പേജില്‍ തുടരട്ടെ എന്നാണെനിക്കു തോന്നുന്നത്.

മാത്രമല്ല, ഗൌരവമായി ഈ വിഷയത്തില്‍ പങ്കെടുക്കാന്‍ കഴിയുന്ന എല്ലാവരും ഇതു വായിക്കുകയും അഭിപ്രായങ്ങള്‍ ചേര്‍ത്തുവെക്കുകയും കൂടി വേണം.

സാം (malayalam.ttf), സന്തോഷ്, ബെന്നി എന്നിവര്‍ ഈ താള്‍ ദത്തശ്രദ്ധരായി വായിക്കുന്നുണ്ടെന്നു പ്രതീക്ഷിക്കുന്നു.


രാജീവ് (വരമൊഴി യാഹൂഗ്രൂപ്പ് അംഗം),അനീഷ്(മായ), സജിത്കുമാര്‍ (VC++ ActiveX), ബിനു മേലേടം, സോജി, അച്ചായന്‍, റെഡ്ഡി തുടങ്ങിയ ലാത്തി/മാധുരി സ്രഷ്ടാക്കള്‍ എന്നിവര്‍ക്കു വേണ്ടിയുള്ള തിരച്ചില്‍ ശക്തമാക്കുന്നുണ്ട്.

Inji Pennu said...

എനിക്കൊന്നും മനസ്സിലാവുന്നില്ലെങ്കില്‍ പോലും ഞാന്‍ പറ്റാവുന്ന വിധത്തില്‍ ശ്രദ്ധിച്ച് വായിക്കുന്നുണ്ട്..

ഈ പോസ്റ്റില്‍ തന്നെ ചര്‍ച്ച തുടര്‍ന്നാല്‍ ഈ പോസ്റ്റ് മാത്രം നോക്കിയാല്‍ മതിയല്ലൊ.ബാക്കി കുറേ ലിങ്കുകള്‍ ക്ലിക്ക് ചെയ്യണ്ടല്ലൊ.അത് ഇതിന്റെ കണ്ടിന്യുവിറ്റി കളയും...എന്ന് എനിക്ക് തോന്നുന്നു..

റിയലി സോറി....ഫോര്‍ ദ ഓഫ്...

viswaprabha വിശ്വപ്രഭ said...

സിബു വിക്കിയയില്‍ (വിക്കിപീഡിയയില്‍ അല്ല,)
ഇങ്ങനെ ഒരു പേജ് തുടങ്ങിയിട്ടുണ്ട്. ഈ ചര്‍ച്ചയിലെ കാതലായ കാര്യങ്ങള്‍ പിന്നീട് അവിടേക്കു മാറ്റുന്നത് യുക്തമാണോ എന്ന് സിബു പറയട്ടെ.

സന്തോഷ് said...

വിശ്വം എന്നെയാണ് ഉദ്ദേശിച്ചതെങ്കില്‍, അതെ, ഞാന്‍ വായിക്കുന്നുണ്ട്. പലയാവര്‍ത്തി.

ശരിയായ ധാരണയുടെ അഭാവത്തില്‍, ‘കള്ളനാണയം’ തുടങ്ങിയ ഉത്തരവാദിത്ത രഹിതമായ പ്രയോഗങ്ങളുള്‍ക്കൊള്ളിച്ചുള്ള എന്‍റെ മുന്നഭിപ്രായത്തിന് ക്ഷമ ചോദിക്കുന്നു.

സിബു::cibu said...

ആദ്യമേ പറയട്ടെ, ചര്‍ച്ചകളുടെ ഊന്നല്‍ ഇന്നലെ എന്തു സംഭവിച്ചു എന്നതിനേക്കാള്‍ നാളെ നമുക്കെന്തു ചെയ്യാമെന്നതിനെ പറ്റിയാകണം.


ആശയസംഘട്ടനം ആവശ്യമാണ്‌.

ഉമേഷും ഞാനും തമ്മില്‍ പലകാര്യങ്ങളിലും അഭിപ്രായവ്യത്യാസമുണ്ട്‌. കെവിനും ഞാനും ബിന്ദു-രേഫത്തിന്റെ അടികഴിഞ്ഞ്‌ കയ്യും കാലും ഉഴിഞ്ഞുകൊണ്ടിര്‍ക്കുന്നേ ഉള്ളൂ. സംവൃതോകാരത്തിന്റെ കാര്യത്തില്‍ പെരിങ്ങോടരും ഞാനും നസീറും ബാലങ്കന്‍നായരും പോലെയാണ്‌. ബ്ലോഗില്‍ കിടന്നടി, വിക്കിയില്‍ ചെന്നടി, ഇന്‍ഡിക്‌ ലിസ്റ്റിലടി. തിരിഞ്ഞുനോക്കിയാല്‍, അതൊക്കെയും ആ വിഷയം കുറച്ചുകൂടി ആഴത്തില്‍ അപഗ്രഥിക്കാനാണ്‌ സഹായിച്ചിട്ടുള്ളത്‌.

ഈ സംവാദങ്ങള്‍ പോലുള്ള ഒന്നാണ്‌ ഞാന്‍ ചില്ലുകളുടെ കാര്യത്തില്‍ രചനയുമായും പ്രതീക്ഷിക്കുന്നത്‌. പിന്നെ, പഴയ/പുതിയ ലിപി പോലെ ഒരു രാഷ്ട്രീയവല്‍ക്കരിക്കപ്പെടേണ്ട വിഷയമല്ല ചില്ലുകള്‍. അത്‌ ഒ-യുടെ ചിഹ്നം പോലെയുള്ള അനേകം ചെറിയ ചെറിയ പ്രശ്നങ്ങളില്‍ ഒന്ന്‌ മാത്രമാണ്‌. ചില്ലിനെ പറ്റിയുള്ള തീരുമാനം എന്തായാലും മലയാളം യുണീക്കോഡ്‌ ഉപയോഗിക്കുന്ന ആളെ സംബന്ധിച്ചിടത്തോളം വളരെ ചെറിയ ഇമ്പാക്റ്റേ ഉള്ളൂ.

യുണീക്കോഡിന്റെ ആവിര്‍ഭാവത്തോടെ ലിപി വിവാദത്തിന്റെ സ്കോപ്പ്‌ ഗണ്യമായി കുറഞ്ഞു. കാരണം, കടലാസ്സില്‍ നിന്നും തീര്‍ത്തും വ്യത്യസ്തമായി യുണീക്കോഡില്‍ വായനക്കാരനാണ്‌ ലിപി ഏതുതരം വേണം എന്ന്‌ തീരുമാനിക്കുന്നത്‌. കടലാസ്സില്‍ അത്‌ എഴുത്തുകാരനോ പ്രസാധകനോ ആയിരുന്നു. അതുകൊണ്ട്‌ തന്നെ, സ്കൂള്‍ വിദ്യാഭ്യാസം കഴിഞ്ഞവരെ സംബന്ധിച്ചിടത്തോളം, വരമൊഴി ഉപയോഗിക്കണോ ഇന്‍സ്ക്രിപ്റ്റ്‌ കീബോര്‍ഡ്‌ ഉപയോഗിക്കണോ എന്നുള്ള ചര്‍ച്ചപോലെയാണീ സംഗതി - തികച്ചും വ്യക്തിപരമായ തെരഞ്ഞെടുപ്പ്‌. എന്നാല്‍, കുട്ടികളെ സ്കൂളില്‍ ഏത്‌ രീതി പഠിപ്പിക്കണം എന്നത്‌ ഒരു രാഷ്ട്രീയവിഷയം തന്നെ ആണെന്നത്‌ വിസ്മരിക്കുന്നില്ല. പക്ഷെ, ആ രാഷ്ട്രീയം യുണീക്കോഡില്‍ കടന്നുവരേണ്ട കാര്യമില്ല എന്ന്‌ മാത്രം.

കെവിനെഴുതിയപോലെ എല്ലാ മലയാളികളും കൂടി ഒരു വട്ടമേശക്ക്‌ ചുറ്റുമിരുന്ന്‌ ചര്‍ച്ച ചെയ്യാന്‍ പ്രായോഗിക ബുദ്ധിമുട്ടുകളുണ്ട്‌. മാത്രവുമല്ല, അങ്ങനെയുള്ള ഒരു ചര്‍ച്ച കൊണ്ട്‌ തീരുന്നതല്ല മലയാളം യുണീക്കോഡിലെ കുഞ്ഞിക്കുഞ്ഞി പ്രശ്നങ്ങള്‍. ഓരോ വാദമുഖങ്ങളും അതുന്നയിക്കുന്നവര്‍ സാവധാനം സമയമെടുത്ത്‌ റിഫൈന്‍ ചെയ്തുകൊണ്ടിരിക്കണം. അതിന്നുള്ള വളരെ നല്ല ഉപാധിയാണ്‌ ഇമെയിലും ബ്ലോഗിങ്ങും വിക്കിയും. അതിന്‌ സാധ്യമല്ലാത്തവരുണ്ടെങ്കില്‍ അവര്‍ക്ക്‌ ഈ ഡിജിറ്റല്‍ വേള്‍ഡില്‍ എത്താനുള്ള ഒരു ബ്രിഡ്ജ്‌ ഉണ്ടാക്കണം. അല്ലാതെ ഡിജിറ്റലിള്ളവര്‍ക്ക്‌ മലയാളത്തില്‍ വിവരമില്ല എന്ന്‌ ദ്യോതിപ്പിച്ചിട്ടൊന്നും നേടാനില്ല. യുണീക്കോഡ്‌ ഡിജിറ്റല്‍ ലോകത്തിനുള്ളതാണ്‌. ഡിജിറ്റല്‍ ലോകവുമായി പരോക്ഷമായിട്ടെങ്കിലും ഇന്റര്‍ഫേസ്‌ ചെയ്യാത്തവര്‍ക്ക്‌ യുണീക്കോഡുകൊണ്ടൊരു ഉപകാരവുമില്ല. മലയാളത്തില്‍ പത്താം ക്ലാസ്സോ അതിനു് മേലേയോ വിദ്യാഭ്യാസവും അതിലുപരി താത്പര്യവും ഉള്ളവരാണ്‌ ഇവിടെ ചര്‍ച്ചയില്‍ പങ്കെടുക്കുന്നവര്‍. അതുകൊണ്ട്‌ യുണീക്കോഡ്‌ ചര്‍ച്ചകള്‍ക്കാവശ്യമായ മലയാളത്തിലുള്ള പ്രാവീണ്യം എല്ലാവര്‍ക്കുമുണ്ട്‌. എന്നാല്‍ എന്താണ്‌ എന്‍കോഡിംഗ്‌, യുണീക്കോഡതില്‍ ചെയ്യുന്നതെന്താണ്‌ എന്നതിലുള്ള അവബോധത്തിന്റെ കുറവാണ്‌ കൂടുതല്‍ പ്രശ്നമായി ഞാന്‍ കാണുന്നത്‌. ചര്‍ച്ചകളില്‍ പങ്കെടുത്ത്‌ സംശയം ചോദിച്ച്‌ ഉണ്ടാക്കാവുന്ന വിവരമേ ഉള്ളൂ അതും. പക്ഷെ, അതിനുള്ള ക്ഷമകാണിക്കണം എന്നുമാത്രം.

സിബു::cibu said...

സുറുമാ, ഈ പറഞ്ഞ കാരണങ്ങള്‍ ഒരു ഫോണ്ടില്‍ എന്തുകൊണ്ട്‌ ആ ചിഹ്നങ്ങള്‍ വേണം എന്നതിനുള്ള വാദമാണ്‌. സൗകര്യം (convienence) എന്‍കോഡ്‌ ചെയ്യപ്പെടുന്നതിന്‌ മതിയായ കാരണമല്ല. ഞാന്‍ നേരത്തേ പറഞ്ഞ 3 കാര്യങ്ങള്‍ ലംഘിക്കപ്പെട്ടാലേ അതിനു വകുപ്പുള്ളൂ:

completeness violation: മലയാളം എഴുത്തിലുള്ള എന്തെങ്കിലും യുണീക്കോഡുവച്ച്‌ എഴുതാന്‍ പറ്റാതിരിക്കുക. തല്‍ക്കാലം എനിക്ക്‌ ഇങ്ങനെയൊന്നും ഉള്ളതായി അറിവില്ല. നിര്‍ബന്ധമാണെങ്കില്‍ ഗുണ്ടര്‍ട്ടിന്റെ നിഘണ്ടുവിലുള്ള യ-യുടെ ചില്ല്‌ പൊക്കിക്കൊണ്ടുവരേണ്ടി വരും.

soundness violation: തെറ്റായി എന്‍കോഡ്‌ ചെയ്യപെടുക. ഇതിന്‌ ഉദാഹരണങ്ങളുണ്ട്‌ എന്നാണെന്റെ പക്ഷം. 'ഞായര്‍' എന്ന വാക്കിലെ ചില്ലെഴുതുന്നത്‌ 'ര' വച്ചാണിപ്പോള്‍. അത്‌ തെറ്റാണ്‌.

ambiguity: എഴുത്തിലുള്ള വേര്‍തിരിവ്‌ എന്‍കോഡിങ്ങില്‍ ഇല്ലാതിരിക്കുക. അതുപോലെ തിരിച്ചും. അതിനുദാഹരണമായാണ്‌: വന്‍യവനികയും വന്യവനികയും പറഞ്ഞിരുന്നത്‌. എഴുത്തിലെ വേര്‍തിരിവ്‌ എന്‍കോഡിങ്ങിലില്ല. പിന്നെ എങ്ങനെ അവ കാഴ്ചയ്ക്ക്‌ വ്യത്യാസപ്പെടുന്നു എന്നല്ലേ. 'വന്‍യവനികയില്‍' ചില്ലുണ്ടാക്കാന്‍ ഉപയോഗിക്കുന്നത്‌ zero width joiner എന്ന ഒരു ഫോര്‍മാറ്റ്‌ കണ്ട്രോള്‍ അക്ഷരമാണ്‌. ഫോര്‍മാറ്റ്‌ എന്നാല്‍ ബോള്‍ഡാക്കുക, ഇറ്റാലിക്സ്‌ ആക്കുക എന്നിങ്ങനെയുള്ള കാര്യങ്ങളെ പറയുന്നതാണ്‌.

Hussain Rachana said...

ടൈപ്പിംഗ്‌ ഇപ്പോഴും ബാലികേറാ മലയാണ്‌. എല്ലാ സുഹൃത്തുക്കളുമായും നിരന്തരം സംവദിക്കണമെന്നുണ്ട്‌. കയ്യെഴുത്തിലായിരുന്നെങ്കിലെന്ന്‌ ആശിച്ചുപോകുന്നു. ചിലതെല്ലാം കുത്തിക്കുറിക്കുന്നുണ്ട്‌. ദിവസങ്ങളെടുക്കും അതൊക്കെ ഈ പരുവത്തിലാക്കാന്‍. എന്നില്‍ നിന്നും വലുതായൊന്നും പ്രതീക്ഷിക്കരുത്‌. ഞാനൊരു ഭാഷാവിദഗ്ദ്ധ്നല്ല. കമ്പ്യുട്ടര്‍ വിദഗ്ദ്ധനുമല്ല. എന്നാല്‍ ആവുംവിധം പ്രതികരിക്കാന്‍ ശ്രമിക്കാം.

ബൈബിളിനു വേണ്ടിയുണ്ടാക്കിയ പ്രത്യേക ഗ്ലിഫുകള്‍ വേര്‍തിരിച്ച്‌ ഒരു ഫയലാക്കി ഞാന്‍ സിബുവിന്‌ അയച്ചുതരാം. അവ രചനയുടെ ഇപ്പോഴത്തെ ഫോണ്ടില്‍ ഉള്‍പ്പെടുത്താന്‍ ഉദ്ദേശമില്ല. പലതും ലുബ്ധപ്രചാരമായിപ്പോയി. അതുകൊണ്ട്‌ ചരിത്രപരമായ പ്രാധാന്യമേ അവയ്ക്കുള്ളു. ചില കൂട്ടക്ഷരങ്ങല്‍ ഞാന്‍ ഡിസൈന്‍ ചെയ്യാനേ തുനിഞ്ഞില്ല (ഉദാ: എല്‍ ന്റെ അടിയില്‍ ച, ദ യോട്‌ ചേര്‍ന്ന്‌ എഴുതുന്ന ഗ). ചില്ല്‌ പ്രത്യേകം എന്‍ക്കോഡ്‌ ചെയ്യുകയാണെങ്കില്‍ ഒന്നുകൂടി എല്ലാം റീകംപൈല്‍ ചെയ്യേണ്ടിവരും. അപ്പോഴാകാം ഇവയുടെ ഉള്‍പ്പെടുത്തല്‍. ലെഫ്റ്റ്‌ രേഫത്തിന്റെ (കുത്തക്ഷരങ്ങളുടെ) ഫീച്ചേഴ്സിനെ കുറിച്ച്‌ ഞാന്‍ ഇനിയും പഠിക്കേണ്ടതുണ്ട്‌.

ചര്‍ച്ചകള്‍ അനേകരിലേക്കു വ്യാപിക്കുന്നതില്‍, വിപുലീകരിക്കപ്പെടുന്നതില്‍ സന്തോഷം. അനേകം ബ്ലോഗുകളിലല്ലാതെ ഇവിടെ ഒരൊറ്റയിടത്ത്‌ ചര്‍ച്ചകള്‍ സമാഹരിക്കപ്പെടുന്നതാണ്‌ എന്തുകൊണ്ടും നല്ലത്‌.

പെട്ടെന്ന്‌ ഒരു പത്തുപേരുടെ പേര്‍ കുറിക്കട്ടെ.

എംടി
സുകുമാര്‍ അഴീക്കോട്‌
എം എന്‍ വിജയന്‍
ടി പദ്മനാഭന്‍
സക്കറിയ
സച്ചിദാനന്ദന്‍
ജി ശങ്കരപ്പിള്ള
സുഗതകുമാരി
അടൂര്‍ഗോപാലകൃഷ്ണണ്‍
വേണുഗോപാലപ്പണിക്കര്‍
.......

ചിന്തകള്‍കൊണ്ടും എഴുത്തുകള്‍ കൊണ്ടും നമ്മുടെകാലത്തെ, നമ്മുടെ ആശയപ്രപഞ്ചത്തെ നിര്‍മ്മിച്ചവര്‍, സമ്പന്നരാക്കിയവര്‍. ഇങ്ങനെ ഒരു അഞ്ഞൂറു പേരെങ്കിലും ജീവിച്ചിരിക്കുന്നു. എനിക്കുറപ്പുണ്ട്‌ മുകളിലത്തെ ലിസ്റ്റില്‍ പെട്ട ഒരു വ്യക്തിയെങ്കിലും ഇപ്പോഴത്തെ ഈ ചര്‍ച്ചയെക്കുറിച്ച്‌ ഒരറിവും ഇല്ലാത്തവരാണെന്ന്‌. നമുക്ക്‌ പുച്ഛിക്കാം ഇവരൊക്കെ കേവലം ഇ-കഴുതകളാണെന്ന്‌. ഇവരെക്കൂടി ഈ ചര്‍ച്ചയുടെ ഉള്ളടക്കം എത്തിക്കുന്നതില്‍ എന്താണ്‌ തെറ്റ്‌? എന്താണതിനൊരു വഴി? വിശാലമായ ഒരു വേദിയെക്കുറിച്ചുപറയുമ്പോള്‍ എന്തിനാണിത്ര അസഹിഷ്‌ണുത?

സസ്നേഹം
ഹുസൈന്‍, രചന

viswaprabha വിശ്വപ്രഭ said...

ഹുസ്സൈന്‍ സാര്‍,

വീണ്ടും ഇവിടെ വന്നു പോകുന്നതു കാണുമ്പോള്‍ അളവറ്റ സന്തോഷം, നന്ദി!

നാട്ടിലെ ഇന്റര്‍നെറ്റ് / കമ്പ്യൂട്ടര്‍ പരിമിതികളെക്കുറിച്ച് ഒരിക്കല്‍കൂടി വളരെ ബോദ്ധ്യമായി ഇപ്പോള്‍ എനിക്കും. അതുകൊണ്ട് അങ്ങയുടെ മറുപടികള്‍ എണ്ണത്തില്‍ കുറഞ്ഞും അളവില്‍ ചുരുങ്ങിയും ആയിരിക്കുമെന്ന് അറിയുകയും ചെയ്യാം. അറിയാതെ വന്നുപോകുന്ന അക്ഷരത്തെറ്റുകളും ഒരു പ്രശ്നമായി ഞങ്ങള്‍ പരിഗണിക്കുകയില്ല അങ്ങയുടെ കാര്യത്തില്‍.

താങ്കളെഴുതിയ പത്തുപേര്‍ മാത്രമല്ല, ആയിരക്കണക്കിന് മഹത്തുക്കള്‍ ഞങ്ങളൊക്കെ ഇട്ടുപേക്ഷിച്ചുപോന്ന ആ അമ്മവീട്ടില്‍ ഉണ്ടെന്നറിയാം. അവരെ ഞങ്ങള്‍ കാണുന്നത് താഴെയായല്ല, വളരെ വളരെ ഉയരങ്ങളിലിരിക്കുന്ന അക്ഷരദേവതകളായാണ്.

പ്രായമേറിയിട്ടും സ്വന്തം അദ്ധ്വാനവും ഒരു മുഴുവന്‍ ജീവിതത്തിന്റേയും പരിശീലനവും വെച്ചുകൊണ്ട് മലയാളഗ്രന്ഥമഹാസൂചികയുണ്ടാക്കാന്‍ കച്ചകെട്ടിയിറങ്ങിയ കേ.എം. ഗോവിസാറിന്റെ അത്ര തന്നെ അടുക്കും ചിട്ടയുമുള്ള ഒരു ചിന്താപ്രപഞ്ചം, ആ ഡാറ്റാബേസ് വിഷന്‍, ഒരു പക്ഷേ ഞങ്ങള്‍ ഈ-ജീവികളില്‍ ആയിരത്തിനൊന്നേ ഉണ്ടാവൂ. കൈവിരലുകള്‍കൊണ്ട് അക്ഷരം തപ്പടിക്കുന്ന എന്റെ കൂട്ടരില്‍ എല്ലാവരും organized thought-ന്റെ മൂര്‍ത്തിഭാവങ്ങളൊന്നുമല്ല. ഞങ്ങള്‍ക്ക് ശീലം കൊണ്ടുള്ള മിടുക്കുണ്ടാകുമായിരിക്കും, പക്ഷേ അനുഭവം കൊണ്ടുള്ള തിളക്കവും മുന്നറിവുകൊണ്ടുള്ള മികവും മേല്‍പ്പറഞ്ഞ സാഹിത്യനായകന്മാര്‍ക്കൊക്കെയും ഗോവിസാറിനും വാസുപ്രദീപിനും അങ്ങയേപ്പോലുള്ള മറ്റു ചേട്ടന്മാര്ക്കും തന്നെ കൂടുതല്‍. ഇക്കാര്യം സമ്മതിച്ചുതരാന്‍ ആര്‍ക്കും ഇവിടെ മടിയുണ്ടാവുമെന്നു തോന്നുന്നില്ല.

നമുക്കു വേണ്ടത് അവരെക്കൂടി ഈ ചര്‍ച്ചയില്‍ പങ്കെടുപ്പിക്കുകയാണ്. പക്ഷേ അതെങ്ങനെ നടക്കും എന്നു വേണം ഇനി ചിന്തിക്കാന്‍. നാട്ടില്‍ തന്നെയുള്ള സൌകര്യങ്ങള്‍ അവര്‍ക്കും ഞങ്ങള്‍ക്കും ഇടയിലൊരു പാലമാക്കി വെക്കാന്‍ നാം ഒരുമിച്ച് എന്തു ചെയ്യണം?

കമ്പ്യൂട്ടറിലൂടെയോ അച്ചടിച്ച പകര്‍പ്പുകളിലൂടെയോ, അല്ലെങ്കില്‍ നേരിട്ടുള്ള മുഖാമുഖങ്ങളിലൂടെയോ നമുക്ക് അവരുമായി എങ്ങനെ ആശയവിനിമയം നടത്താം?

അക്കരെയക്കരെ കിടക്കുന്ന ഞങ്ങളെക്കാള്‍ ഇക്കാര്യങ്ങളില്‍ ഫലോന്മുഖമായി പ്രവര്‍ത്തിക്കാന്‍ സാധിക്കുക നാട്ടിലുള്ള നമ്മുടെ തന്നെ പ്രതിരൂപങ്ങള്‍ക്കാണ്. അവരെ എങ്ങനെ കൂടുതലായി ഇവിടേക്ക് വിളിച്ചുവരുത്താം?

ആത്മസംയമനത്തോടെ നമുക്കു കൂട്ടായി ആലോചിക്കാം.

സിബു::cibu said...

ഹുസൈന്‍ മാഷ്‌ പറഞ്ഞ ലിസ്റ്റിലെ ഏതെങ്കിലും ഒരു പുപ്പുലിയെ പിടിക്കാം നമുക്കാദ്യം. ഹുസൈന്‍ മാഷ്ക്ക്‌ ഏറ്റവും അറിയാവുന്ന ഒരാളെ. ഇവിടെ നടക്കുന്ന ചര്‍ച്ചകളുടെ പ്രസക്ത ഭാഗങ്ങള്‍ പ്രിന്റൗട്ട്‌ ആയോ സ്ക്രീനില്‍ തന്നേയോ കാണിച്ചു കൊടുക്കാം. അവരെഴുതുന്ന മറുപടി ആരെങ്കിലും സ്കാന്‍ ചെയ്തോ ടൈപ്പ്‌ ചെയ്തോ പോസ്റ്റണം. ഓഡിയോ ഫയലായാലും പ്രശ്നമില്ല.

Thiramozhi said...

സുഹൃത്തുക്കളേ,

ആഗോളീകരണത്തിന്റെ ഫലമായി വംശനാശഭീഷണി നേരിട്ടുകൊണ്ടിരിക്കുന്ന അനേകം പ്രാദേശികഭാഷകളിലൊന്നുമാത്രമാണ്‌ മലയാളം. പുതിയ കാലത്തിന്റെ വേഗതയോ അനുഭവസങ്കീര്‍ണ്ണതകളോ സമര്‍ത്ഥമായി ആവിഷ്കരിക്കാനുതകുംവിധം അത്‌ കാലങ്ങളായി പുതുക്കപ്പെട്ടുപോന്നിട്ടില്ല. പുതിയ കമ്പോളവ്യവസ്ഥയില്‍ വില്‍പനച്ചരക്കാക്കി മാറ്റാവുന്ന വലിയ വിജ്ഞാനനിക്ഷേപങ്ങളോ സാഹിത്യസമ്പത്തോ താരതമ്യേന ഈ ഭാഷയിലില്ല. ഉള്ളത്‌ ഭൂപ്രകൃതി, കാലാവസ്ഥ, ആചാരാനുഷ്ഠാനങ്ങള്‍ എന്നിവയോടൊട്ടിനില്‍ക്കുന്ന ചില സംസ്കാരവിശേഷങ്ങള്‍ മാത്രമാണ്‌. അതും അനുദിനം ക്ഷയിച്ചുകൊണ്ടിരിക്കുന്നു.

ഇത്തരമൊരു വിശാലപശ്ചാത്തലത്തില്‍വേണം വിവരസാങ്കേതികവിദ്യയെ പ്രയോജനപ്പെടുത്തിക്കൊണ്ട്‌ നമ്മുടെ ഭാഷയെ അതിന്റെ തനിമകളോടെ നവീകരിക്കാനുള്ള ഉദ്യമങ്ങളെ വിലയിരുത്തേണ്ടത്‌ എന്നു തോന്നുന്നു. അധികാരവും സമ്പത്തും കൈയ്യാളുന്നവരുടെ ഭാഷ അതിര്‍ത്തികള്‍ മായ്ച്ചു മുന്നേറുമ്പോള്‍, ഓരങ്ങളിലേയ്ക്ക്‌ ഒതുക്കപ്പെടുന്ന ജനത നിശ്ശബ്ദരാവുന്നു. അവര്‍ക്ക്‌ സ്വന്തം ഭാഷയോടുതന്നെ നിന്ദ തോന്നുന്നു.അങ്ങനെയാണ്‌ മാതൃഭാഷ മറക്കുന്നതില്‍ അഭിമാനിക്കുന്ന മലയാളിയുണ്ടാവുന്നത്‌.

അതിനാല്‍ ഭാഷാനവീകരണശ്രമങ്ങള്‍ കേവലമായ അതിജീവനതന്ത്രമെന്നതിനപ്പുറം സ്വത്വസാക്ഷാത്കാരത്തിന്റെ രാഷ്ട്രീയംകൂടി ഉള്‍ക്കൊള്ളുന്നുണ്ട്‌. അപ്രകാരം പ്രത്യയശാസ്ത്രപരമായ ഒരടിത്തറയുണ്ടാകുമ്പോഴാണ്‌ ഈ ചര്‍ച്ചകള്‍ക്ക്‌ മുഴക്കമുണ്ടാവുകയുള്ളു എന്നും ഞാന്‍ കരുതുന്നു. കോളനിവിരുദ്ധ സമരങ്ങളാണ്‌ ഇന്ത്യന്‍ പ്രാദേശികഭാഷകളില്‍ നവോത്ഥാനത്തിന്റെ വിത്തുപാകിയതെന്ന ചരിത്രപാഠം നമോര്‍ക്കുക.

ഇനി ചര്‍ച്ചയിലേക്കു വരാം. തീര്‍ച്ചയായും എന്‍കോഡിങ്ങിലും റെന്‍ഡറിങ്ങിലും സന്ദിഗ്ദ്ധതകളില്ലാത്ത ഒരു സംവിധാനം നമ്മുടെ ഭാഷയ്ക്കുണ്ടായേ മതിയാവൂ. യൂണിക്കോഡ്‌ സര്‍ക്കാര്‍തലത്തിലും സാമൂഹ്യതലത്തിലും സ്വീകരിക്കപ്പെടുകയുംവേണം. എന്തുകൊണ്ട്‌? ലിപിവിന്യാസത്തിലെ ഏകീകരണമെന്നത്‌ ഒരു ജനതയുടെ ഒരുമയും പെരുമയും പ്രതിരോധവുമാണെന്ന തിരിച്ചറിവുകൊണ്ട്‌.

ഒന്നാമത്തെ പ്രശ്നം സാങ്കേതികമാണ്‌. സിബുവിനേയും ഹുസൈനേയും പോലെ പരിചയസമ്പന്നന്മാരായവര്‍ കൈകോര്‍ത്തുനിന്നാല്‍ നിസ്സാരമായി പരിഹരിക്കാവുന്നതല്ലേയുള്ളൂ ഇത്‌? വരമൊഴിയും രചനയുമെല്ലാം ഈ സംഗമത്തിലേയ്ക്കുള്ള പല കൈവഴികളായിരുന്നുവെന്ന്‌ ചരിത്രം രേഖപ്പെടുത്താതിരിക്കില്ല. രണ്ടാമത്തേത്‌ സാമൂഹ്യസ്വീകാര്യതയുടെ പ്രശ്നമാണ്‌. ഏറ്റവും എളുപ്പവും ലഭ്യതയുമുള്ളത്‌ തിരഞ്ഞെടുക്കുക എന്നതിലായിരിക്കും പൊതുസമ്മതി. ഒരു മാധ്യമത്തിന്റെ വ്യാപനത്തിന്‌ അതിനേക്കാള്‍ മികച്ച മുന്നുപാധികളാവശ്യമില്ല. യൂണിക്കോഡ്‌ മലയാളം അങ്ങനെയായിരിക്കുമെന്ന്‌ തെളിയിച്ചു കാണിക്കേണ്ടതുണ്ട്‌.

നിര്‍ഭാഗ്യവശാല്‍ മലയാളത്തില്‍ ഭാഷാപണ്ഡിതന്മാരും സാങ്കേതികവിദഗ്ദ്ധരും രണ്ടറ്റത്തു നില്‍ക്കുന്നു. സരസ്വതിയും ലക്ഷ്മിയും ഒരിടത്തു വാഴാത്തതുപോലെ. പണ്ഡിതന്മാര്‍ ഇക്കരെയും വിദഗ്ദ്ധര്‍ അക്കരെയും. കേരളക്കരയിലെ എഴുത്തുകാരും സാംസ്കാരികനായകന്മാരും ഇന്നും അച്ചടികൌതുകം വിട്ടുമാറാത്ത പ്രകൃതത്തിലാണ്‌. കംപ്യൂട്ടര്‍ ഉള്ളവര്‍പോലും അതിനെ ഒരു പരിഷ്കരിച്ച ടൈപ്‌റൈറ്ററായി മാത്രമേ ഉപയോഗിച്ചുകാണുന്നുള്ളു. അച്ചടി പ്രധാനമായതുകൊണ്ടാകണം, തനതുലിപിയെ സ്നേഹിക്കുന്നവര്‍, രചനയെ സ്വാഗതം ചെയ്തത്‌. എന്റെ കാര്യംതന്നെ എടുക്കാം. ഹുസൈനാണ്‌ എന്നെ മലയാളത്തില്‍ 'ടൈപ്പിനിരുത്തിയത്‌'. എന്റെ രണ്ടു കവിതാസമാഹാരങ്ങളും രചനയില്‍ ഞാന്‍ സ്വയം കംപോസ്‌ ചെയ്ത്‌ പ്രസിദ്ധീകരിച്ചതാണ്‌.

എന്നാല്‍ ഇന്റര്‍നെറ്റിന്റെ സാദ്ധ്യതകള്‍ ഭാഷയ്ക്കുവേണ്ടി പ്രയോജനപ്പെടുത്തുന്നതില്‍ പ്രവാസികളായ മലയാളികളാണ്‌ മുന്‍കൈയ്യെടുത്തത്‌. അത്‌ സ്വാഭാവികവുമായിരുന്നു. അഞ്ജലിയും വരമൊഴിയും മറ്റും അങ്ങനെ ലഭിച്ചു. ചിന്തയിലൂടെയാണ്‌ ഞാന്‍ അഞ്ജലി ആദ്യം കണ്ടത്‌. മനോഹരമായ ആ ഫോണ്ട്‌, ചില വൈകല്യങ്ങളുണ്ടെങ്കില്‍പ്പോലും ഇന്നും ഞാനുപയോഗിക്കുന്നു. ഇന്നിപ്പോള്‍ കേരളത്തിലും മിക്കവാറും എല്ലായിടത്തും ബ്രോഡ്ബാന്റ്‌ ഇന്റര്‍നെറ്റ്‌ ലഭ്യമാണ്‌. അക്ഷയ പദ്ധതിയും ഐ.ടി അറ്റ്‌ സ്കൂളും വ്യാപിച്ചതോടെ നെറ്റുപയോഗം അനുദിനം വര്‍ദ്ധിച്ചുവരുന്നുമുണ്ട്‌. ഈ സാഹചര്യത്തില്‍ ഇന്റര്‍നെറ്റിലെ മലയാളത്തിന്റെ സാന്നിദ്ധ്യവും പ്രശ്നങ്ങളും തീര്‍ച്ചയായും ഇനിയുള്ള ദിവസങ്ങളില്‍ ചര്‍ച്ചാവിഷയമായിരിക്കും.

എന്നാല്‍ അച്ചടിച്ചുകണ്ടതുമാത്രം പ്രമാണമായി കരുതുന്ന ഭൂരിപക്ഷം മലയാളികളുടെ ഇടയിലേക്കുകൂടി ഈ ചര്‍ച്ച വ്യാപിക്കണമെന്നുണ്ടെങ്കില്‍ ഇത്‌ ഈ ബ്ലോഗില്‍ മാത്രം ഒതുങ്ങിയാല്‍ മതിയാവില്ല. ബ്ലോഗുകളെക്കുറിച്ച്‌ ഈയ്യിടെ മാദ്ധ്യമങ്ങളില്‍വന്ന വാര്‍ത്തകള്‍ ഇക്കാര്യത്തില്‍ ആയിരക്കണക്കിന്‌ അന്വേഷണങ്ങള്‍ ഉണ്ടാക്കിയിട്ടുണ്ടെന്നു ഞാന്‍ കരുതുന്നു. സുനില്‍ മാദ്ധ്യമത്തിലെഴുതിയതിന്‌ നല്ല പ്രതികരണമായിരുന്നു. ഈയ്യിടെ കോഴിക്കോട്‌ മലബാര്‍ ക്രിസ്റ്റ്യന്‍ കോളേജില്‍ ഇക്കാര്യത്തെക്കുറിച്ചു നടന്ന ഓറിയെന്റേഷന്‍ സെമിനാറില്‍ മഹേഷിനൊപ്പം ഞാനും പങ്കെടുത്തിരുന്നു.


ഈ വരുന്ന കേരളപ്പിറവിദിനത്തോടെ യൂണിക്കോഡ്‌ എന്‍കോഡിങ്‌ സംബന്ധിച്ച പ്രശ്നം സമയബന്ധിതമായി പരിഹരിക്കാന്‍ നമുക്കു കഴിയുമോ?

( ഇത്രയും എഴുതിക്കഴിഞ്ഞപ്പോള്‍ ചില നെറ്റികള്‍ ചുളിയുന്നത്‌ ഞാന്‍ കാണുന്നു. എന്തുകൊണ്ട്‌ 'ഹരിതകം' യൂണിക്കോഡിലേക്കു മാറിയില്ല? തീര്‍ച്ചയായും മാറും, വൈകാതെ.)

സിബു::cibu said...

ലിപിവിന്യാസത്തിലെ ഏകീകരണമെന്നത്‌ ഒരു ജനതയുടെ ഒരുമയും പെരുമയും പ്രതിരോധവുമാണെന്ന തിരിച്ചറിവുകൊണ്ട്‌.

ഇന്റര്‍നെറ്റിലെ മലയാളം എന്നാല്‍ യുണീക്കോഡ് മാത്രമല്ല. ഫോണ്ടുകള്‍ ജനങ്ങള്‍ ഭാഷ ഉപയോഗിക്കുന്ന രീതി എല്ലാം അതിനു പുറത്താണ്. പഴയലിപിവേണമോ പുതിയതുവേണമോ എന്നതില്‍ യുണീക്കോഡൊന്നും പറയില്ല. ഏതൊക്കെ രീതിയില്‍ മലയാളം എഴുതപ്പെടുന്നുണ്ടോ അതൊക്കെയും അവതരിപ്പിക്കാന്‍ യുണീക്കോഡ് ബദ്ധശ്രദ്ധമാണ്. അതുകൊണ്ട്‌ തന്നെ പഴയലിപി/പുതിയലിപി സാംസ്കാരികസംവാദവും അതിന്റെ രാഷ്ട്രീയവും യുണീക്കോഡിന് പുറത്താണ് സംഭവിക്കേണ്ടത്‌.

ഒന്നാമത്തെ പ്രശ്നം സാങ്കേതികമാണ്‌. സിബുവിനേയും ഹുസൈനേയും പോലെ പരിചയസമ്പന്നന്മാരായവര്‍ കൈകോര്‍ത്തുനിന്നാല്‍ നിസ്സാരമായി പരിഹരിക്കാവുന്നതല്ലേയുള്ളൂ ഇത്‌?

ആദ്യമേ ഓര്‍ത്തിരിക്കേണ്ട കാര്യം ഞാന്‍ നേരത്തേ പറഞ്ഞത്‌ തന്നെയാണ്. ഒരു മലയാളിക്ക് വളരെ പ്രത്യക്ഷമായി കാണുന്ന ഒരു പ്രശ്നവും യുണീക്കോഡിലില്ല. ഉള്ളതൊക്കെയും വളരെ ഉള്ളിലുള്ള ചെറിയ പ്രശ്നങ്ങളാണ്. ഉദാഹരണങ്ങള്‍: യ-യുടെ ചില്ല് യുണീക്കോഡിലില്ല; ‘നന്‍‌മ‘യും ‘നന്മ’യും രണ്ട്‌ വെവ്വേറെ സ്പെല്ലിംഗ് വച്ചാണ് അവതരിപ്പിക്കുക (ചില്ല് എന്‍‌കോഡിങിന് ശേഷം). കുത്തിട്ടുള്ള രേഫത്തിന്റെ പുതിയ ലിപിയിലെ അവതരണം; etc. ഓരോ പ്രശ്നവും പരിഹരിക്കാനുള്ള കൃത്യമായ വഴി യുണിക്കോഡ് കണ്‍സോര്‍ഷ്യം പറഞ്ഞിട്ടുണ്ട്‌. പ്രശ്നത്തിന്റെ രണ്ട്‌ ഭാഗവും പറയുന്ന ടെക്നിക്കല്‍ ഡൊക്യുമെന്റുകള്‍ അവര്‍ക്കയച്ചുകൊടുക്കുക. അവരുടെ കമ്മറ്റി (ഇപ്പോള്‍ ഏകദേശം 10 പേരുടെ) കൂടി വോട്ടിനിട്ട്‌ തീരുമാനിക്കും. (ഈ പത്തില്‍ ഒരാള്‍ ഇന്ത്യാ ഗവണ്മെന്റ് പ്രതിനിധിയാണ്.) ഇത്രയൊക്കെത്തന്നെയെ ഇനിയും ചെയ്യാനുള്ളൂ. ഈ പ്രശ്നങ്ങള്‍ ഇന്ഡിക് ലിസ്റ്റില്‍ എന്നപോലെ ഇവിടേയും ചര്‍ച്ച ചെയ്യപ്പെടേണ്ടത്‌ ആവശ്യമാണെന്ന്‌ ഞാന്‍ സമ്മതിക്കുന്നു. ഇനി മുതല്‍ കഴിയാവുന്നതും ഞാനതിന് ശ്രമിക്കാം.

മയ്യഴി said...

യൂനിക്കോഡില്‍ എന്താണ്‌ സംഭവിക്കുന്നത്‌ എന്ന്‌ അറിയാത്തവരാണ്‌ തല്‍പരരായ മലയാളികളില്‍ ഭൂരിഭാഗവും. അവരില്‍ ചിലര്‍ മൌലികമായ ഉള്‍ക്കാഴ്ചയോടെ നിര്‍ദ്ദേശങ്ങള്‍ നല്‍കാന്‍ പ്രാപ്തരായവരുമാണ്‌.ഉദാഹരണം ഡോ.എം.ആരൃാഘവവാര്യര്‍. കമ്പ്യൂട്ടറും ഇന്റര്‍നെറ്റ്‌ സംവിധാനവുമുള്ള ഡോ.എം.ആരൃാഘവവാര്യര്‍ എന്ന എപിഗ്രാഫിസ്റ്റ്‌ ഞാന്‍ പറയുമ്പോഴാണ്‌ ഇക്കാര്യം അറിയുന്നത്‌.കാരണം ഈ വിവരങ്ങള്‍ സാധാരണനിലയില്‍ നെറ്റില്‍ കയറുന്ന ഒരാള്‍ കാണണമെന്നില്ല എന്നതു തന്നെ.

എന്റെ പോയിന്റ്‌ ഇതാണ്‌: മലയാളികളുടെ പൊതുശ്രദ്ധയില്‍ ഈ ചര്‍ച്ചയുടെ പ്രസക്തഭാഗങ്ങളെങ്കിലും എത്തേണ്ടേ? അതിന്‌ നമുക്കു ചെയ്യാന്‍ സാധിക്കുന്നതെന്താണ്‌?
എവിടെയെങ്കിലും സമ്മേളനം വിളിച്ചുകൂട്ടുന്നതല്ലാത്ത നിര്‍ദ്ദേശത്തിന്‌ കാത്തിരിക്കുന്നു.

പൊതുശ്രദ്ധയില്‍ വന്നാല്‍ ഉണ്ടാകാവുന്ന ചര്‍ച്ചാഘോഷങ്ങളെക്കൂടി കണക്കിലെടുക്കുക

സിബു::cibu said...

രാഘവവാര്യര്‍ സാറിനെ ആദ്യം ഇവിടേയ്ക്കും അതുകഴിഞ്ഞ്‌ ഇന്‍ഡിക് ലിസ്റ്റിലേയ്ക്കും നമുക്ക്‌ കൂട്ടിക്കൊണ്ടുപോകാം.

ഒരു തുടക്കമായി, രാഘവവാര്യര്‍ സാറിനും ബാക്കിയുള്ളവര്‍ക്കുമായി ഇന്‍ഡിക് ലിസ്റ്റിലെ ഇന്നത്തെ ഒരു ചോദ്യം തരാം. മൈക്രോസോഫ്റ്റില്‍ ഈ കാര്യങ്ങള്‍ കൈകാര്യം ചെയ്യുന്ന പീറ്റര്‍ ആണ് ഇത്‌ ചോദിച്ചത്‌. ‘സ്ക്ര‘ എന്ന കൂട്ടക്ഷരത്തിന് ഏതൊക്കെ രൂപങ്ങള്‍ ഉണ്ട്‌ എന്നായിരുന്നു ചോദ്യം. എനിക്കറിയാവുന്ന നാലഞ്ച്‌ രൂപങ്ങള്‍ ഞാന്‍ വരച്ചുകൊടുത്തു. അപ്പോള്‍ ഗണേശന്‍ എന്ന തമിഴ്‌ ഗ്രന്ഥലിപിയില്‍ ഗവേഷണം ചെയ്യുന്നവന്‍ പറയുന്നു; ‘സ’യ്ക്കും പഴയമലയാളത്തില്‍ ചില്ലുണ്ടായിരുന്നു. അതുകൊണ്ട്‌ സ-ചില്ല്‌ ക്ര എന്നും എഴുതാം എന്ന്‌. ഇത്‌ ശരിയാണോ? എനിക്ക്‌ ഒരു പിടിയും ഇല്ലാത്ത കാര്യമാണ്. തമിഴ് ഗ്രന്ഥലിപിയും മലയാളവും തമ്മിലുള്ള വേര്‍തിരിവ്‌ എഴുത്ത്‌ വച്ച്‌ നോക്കിയാല്‍ എവിടെയാണ്. (ഗണേശന്‍ എവിടെ നോക്കിയാലും ഗ്രന്ഥലിപിയേ കാണൂ എന്നതുകൊണ്ടാണ് കക്ഷിയെ സംശയിക്കുന്നത്‌) മറുപടി ഇവിടെ എഴുതിയാലും, ഇന്‍ഡിക് ലിസ്റ്റില്‍ നേരെ എഴുതിയാലും ഒരു കുഴപ്പവുമില്ല.

ഇത്‌ യുണീക്കോഡിലെ കുഴക്കുന്ന പ്രശ്നങ്ങളില്‍ ഒന്നുമല്ല. എന്നാലും അവിടത്തെ ഡിസ്കഷനില്‍ നിന്നും ഒരു സാമ്പിള്‍ ഇവിടെ ഇട്ടു എന്ന്‌ മാത്രം.

സുനില്‍ said...

അഭിവന്ദ്യരേ, എന്റെ ചെറിയ ഒരു നിര്‍ദ്ദേശം. ഇത്തരമൊരു സംവാദം ചിന്തയുടെ സംവാദം ഫോറത്തില്‍ നടന്നാല്‍ തീര്‍ച്ചയായും ഞാന്‍ അവ പ്രിന്റ് എടുത്ത്‌ അഡ്ഡ്രസ്സ് കൈവശമുള്ള നാട്റ്റിലെ എല്ലാവര്‍ക്കും അയച്ചുകൊടുക്കാം.മഹേഷ്/പി.പി.ആര്‍/ഹുസ്സൈന്‍ എന്നിവര്‍ നാട്ടിലാണല്ലോ. അവര്‍ക്കതു ചര്‍ച്ച ചെയ്യുകയും തിരിച്ച്‌ ഫോറത്തിലെക്ക്‌ വിവരങള്‍ സമാഹരിക്കുകയും ആകാം. ബൂലോകക്ലബില്‍, പോസ്റ്റുകള്‍ താം തിരിച്ച്‌ ലിസ്റ്റ് ചെയ്യുന്നില്ല. അതിനാല്‍ തന്നെ ഈ ബ്ലോഗിലെ ഈ സംവാദത്തിലേക്ക്‌ എത്തിപ്പെടാന്‍ വളരെ വിഷമം.ഇപ്പോള്‍ തന്നെ ഈ പോസ്റ്റിന്റെ ലിന്‍ക് ഞാന്‍ പ്രത്യ്ഏകം സൊക്ഷിച്ചിരിക്കുകയാണ്. എല്ലാവരും സമ്മതിച്ചാല്‍ ചിന്ത ഫോറത്തിലേക്ക്‌ ഇത്രയും ഭാഗങള്‍ മാറ്റുകയും പ്രിന്റ്‌ ചെയ്ത്‌ ഏവര്‍ക്കും അയച്ചുകൊടുക്കുകയും ചെയ്യ്ം. മേല്വിലാസങള്‍ ദയവായി അയച്ചുതരിക.-സു-

പെരിങ്ങോടന്‍ said...

സിബു,
തമിഴ്‌ദേശങ്ങളില്‍ സംസ്കൃതം എഴുതാനായി ഗ്രന്ഥലിപിയാണു് ഉപയോഗിച്ചിരുന്നതു്. സംസ്കൃതത്തിന്റെ സ്വാധീനം ഏറെയുണ്ടായിരുന്ന തമിഴ്‌ദേശമായ മലനാട്ടില്‍ അതുകൊണ്ടു തന്നെ ഗ്രന്ഥലിപി (തമിഴ് മൂലമായുള്ള വാക്കുകള്‍ വട്ടെഴുത്തിലും സംസ്കൃതം ഗ്രന്ഥത്തിലും) വ്യാപകമായി ഉപയോഗിച്ചിരുന്നു. മണിപ്രവാളം കൃതികള്‍ (മലയാളം-സംസ്കൃതം) മിക്കവയും ഇത്തരം ഹൈബ്രിഡ് ലിപിയിലാണു് പത്തൊന്‍‌പതാം നൂറ്റാണ്ടുവരെയും എഴുതിക്കൊണ്ടിരുന്നതു് . രണ്ടു തരത്തിലുള്ള ഗ്രന്ഥലിപിയില്‍ പല്ലവഗ്രന്ഥമായിരുന്നു മലയാളത്തിനു് ഉപയോഗിച്ചിരുന്നതെന്നും തെളിവുകളുണ്ടു് (ഇത്രയും ബ്രിട്ടാനിക്ക തരുന്ന വിവരം).

വിക്കിയിലെ Malayalam Script, Grantha, Malayalam Language എന്നീ ലേഖനങ്ങള്‍ കാണുക, വട്ടെഴുത്തും ഗ്രന്ഥലിപിയും ഉപയോഗിച്ചിരുന്ന കാലത്തെപറ്റി പരാമര്‍ശങ്ങളുണ്ടു്. ഈ ചിത്രവും കാണുക. സ-യുടെ ചില്ലിനു ഗണേശനോടു് തെളിവുകള്‍ ചോദിക്കൂ :)

സുറുമ || suruma said...

ചില്ല് എന്‍കോഡിങില്‍ ശരിയായ സ്ഥാനം നിര്‍ണ്ണയിച്ചില്ലെങ്കില്‍ index ചെയ്യുമ്പോള്‍ കൃത്യത നഷ്ടപ്പെട്ടേക്കാം.ഉദാഹരണത്തിന് കാര്‍,കാര്,കാറ്‍ ഇവയുടെ ക്രമം എന്തായിരിക്കും?
പുതിയലിപി ഉപയോഗിക്കുന്ന ഒരാള്‍ക്ക് കൂട്ടക്ഷരം prevent ചെയ്യാന്‍ ZWNJ ഉപയോഗിക്കാന്‍ തോന്നില്ല.'ലോക്‌സഭ' എന്നത് പഴയലിപിയില്‍ 'ലോക്സഭ' എന്നാകും.

ബെന്നി::benny said...

സിബുവിന്‍റെ ഈ പോസ്റ്റ് വിശദമായി വായിച്ചു, ഒപ്പം കമന്‍റുകളും. പത്തു ദിവസമായി ഇന്‍ഡിക് ഡിസ്കഷന്‍ ലിസ്റ്റിലെ മെയിലുകളും വായിക്കുന്നു.


ഡിജിറ്റല്‍ ഡിവൈസുകളും ഭാഷയും

“ഭൂരിപക്ഷത്തെ, അവര്‍ കമ്പ്യൂട്ടറിന്റേയും നെറ്റിന്റേയും വരേണ്യലോകത്തിലില്ല എന്ന ഒറ്റ കാരണം കൊണ്ടു ഭാഷാകമ്പ്യുട്ടിങ്ങിന്‍റെ എല്ലാ ആധികാരികതയും നാം സ്വയം സൂത്രത്തില്‍ എറ്റെടുക്കുകയാണു്‌” എന്ന് ഹുസ്സൈന്‍ എഴുതിയത് വായിച്ചു. പ്രഭാകരവാര്യര്‍മാരല്ല സിബുവും ഉമേഷുമെന്ന് ഞാനും സമ്മതിക്കുന്നു.

ഭാഷാ കമ്പ്യൂട്ടിംഗിന്‍റെ ആധികാരികത സിബുവടങ്ങുന്ന ചെറിയൊരു ന്യൂനപക്ഷം ഏറ്റെടുത്തിരിക്കുന്നതിന് (അവര്‍ ഏറ്റെടുത്തതാണോ അതോ സാഹചര്യം അവരെ ഏറ്റെടുക്കാന്‍ നിര്‍ബന്ധിച്ചതാണോ എന്ന ചര്‍ച്ച വേറെ നടത്താം.) വേണ്ടത്ര ന്യായീകരണമുണ്ട് - ഭാഷയുടെ നിലനില്‍പ്പ് ഇനിമുതല്‍ ഡിജിറ്റല്‍ ഡിവൈസുകളുമായി ബന്ധപ്പെട്ടാണുള്ളതെന്ന അപ്രിയസത്യം (ഈ അറിവ് ചിലര്‍ക്കെങ്കിലും അപ്രിയമാണെന്ന് എനിക്ക് നേരിട്ട് അനുഭവമുണ്ട്!) അവര്‍ക്കറിയാം.

ഡിജിറ്റല്‍ ഡിവൈസുകളില്‍ സെര്‍ച്ചിംഗിനും സോര്‍ട്ടിംഗിനും വഴങ്ങാത്ത ഒരു ഭാഷയ്ക്കും ഇനി നിലനില്‍ക്കാന്‍ പറ്റില്ല എന്ന കാര്യം മനസ്സിരുത്തി മനസ്സിലാക്കി വേണം നമുക്ക് മുന്നോട്ട് പോവാന്‍. ഹുസ്സൈന്‍റെ “പത്തുപേര്‍” ലിസ്റ്റില്‍ സച്ചിദാനന്ദന് ഒഴികെ മറ്റാര്‍ക്കും - വേണുഗോപാലപ്പണിക്കര്‍ ആരാണ്? - ഇവിടെ പറയുന്നതൊന്നും മനസ്സിലാവില്ല എന്ന് തോന്നുന്നു. പരിതാപകരമായ അവസ്ഥയാണത്. (പ്രഭാകരവാര്യരെ ഈ ലിസ്റ്റില്‍ ഉള്‍പ്പെടുത്താമായിരുന്നു.)

എഴുപതുകളിലെ കൊലപാതകം

എഴുപതുകളിലെ കൊലപാതകം നടന്നില്ലായിരുന്നുവെങ്കില്‍ വലിയൊരു കുതിച്ചുചാട്ടം മലയാളഭാഷയ്ക്ക് സാധിക്കില്ലായിരുന്നു. തമിഴിലും ഈ രീതിയിലൊരു “ലിപി പരിഷ്കരണം” അറുപതുകളില്‍ നടന്നിരുന്നു, തന്തൈ പെരിയാറിന്‍റെ നേതൃത്വത്തില്‍. “The Tamil Alphabet looks primitive! How many loops! How many dashes! How many upward turns? How many downward turns! Such cumbersome orthography in the present day! Do we need so many letters today? Why do we need 216 letters?” എന്നാണ് പെരിയാര്‍ ചോദിച്ചത്.

പ്രിന്‍റിംഗ് സാങ്കേതികതയെ സഹായിക്കുന്ന രീതിയില്‍ പെരിയാര്‍ പരിഷ്കരിച്ചെടുത്ത ലിപിയാണ് ഇന്ന് തമിഴ്‌നാട് മുഴുവന്‍ ഉപയോഗിക്കുന്നത്. “The glory and excellence of a language and its script depend on how easily they can be understood or learnt and on nothing else” എന്നായിരുന്നു പെരിയാറിന്‍റെ മുദ്രാവാക്യം. സംസ്കൃതത്തേക്കാളും പഴമ അവകാശപ്പെടാവുന്ന തമിഴിന് പെരിയാറിന്‍റെ ഈ ലിപി പരിഷ്കരണം കൊണ്ട് എന്തെങ്കിലും പ്രശ്നമുണ്ടായതായി ഞാന്‍ കേട്ടിട്ടില്ല.

ലിപിയെ വീണ്ടും ലളിതമാക്കണമെന്നും യൂണിക്കോഡ് കണ്‍‌സോര്‍ഷ്യം, തമിഴിനെ “ലളിത ഭാഷ”യായി അംഗീകരിക്കണമെന്നുമാണ് ചില തമിഴ് ഭാഷാപ്രേമികള്‍ ഇപ്പോള്‍ ആവശ്യപ്പെടുന്നത്.

ഭൂരിപക്ഷവും സാങ്കേതികതയും

“ചില്ലിന്റെ കാര്യത്തില്‍ ഒരു അന്തിമ തീരുമാനം ഡിജിറ്റല്‍ ഭാഗ്യവാന്‍മാര്‍ മാത്രം തീരുമാനിക്കുന്നത്‌ ഭാഷയോടും ജനതയോടും ചെയ്യുന്ന അനീതിയായിരിക്കും” എന്ന് ഹുസ്സൈന്‍ എഴുതിക്കണ്ടു. പ്രിന്‍റിംഗ് സാങ്കേതികത കേരളത്തില്‍ എത്തിയപ്പോഴും ഭാഗ്യചെയ്ത ചിലര്‍ മാത്രമാണ് തീരുമാനങ്ങള്‍ എടുത്തിരുന്നത്. പിന്നീടീ തീരുമാനങ്ങള്‍ ഭൂരിപക്ഷത്തിന് മുമ്പിലെത്തുകയും അവര്‍ തള്ളേണ്ടത് തള്ളുകയും കൊള്ളേണ്ടത് കൊള്ളുകയും ചെയ്യുകയായിരുന്നു.

സാങ്കേതികതയുടെ പിന്നണിക്കഥകളെല്ലാം സകലരോടും പറഞ്ഞതിനുശേഷം മാത്രം മതി തീരുമാനമെന്നത് ഒരു ഐഡിയല്‍ സങ്കല്‍പ്പമാണ്, എന്നാല്‍ നടക്കാത്ത കാര്യം. ഭാഷാ കമ്പ്യൂട്ടിംഗിന്‍റെ കാര്യത്തിലും ഇങ്ങനെത്തന്നെ.

പ്രശ്നം, പ്രശ്നം സര്‍വത്ര

ഡിജിറ്റല്‍ കണ്ടന്‍റിന്‍റെ കാര്യത്തില്‍ മലയാളം വളരെ മുന്നിലാണ്. നെറ്റില്‍, ഹിന്ദിയും തമിഴും കഴിഞ്ഞാല്‍ ഏറ്റവും കൂടുതല്‍ കണ്ടന്‍റ് ഉള്ളത് മലയാളത്തിലാണ്. ഈ കണ്ടന്‍റാവട്ടെ, വിവിധ ഫോണ്ടുകളിലും യൂണിക്കോഡിലുമാണ്. ബ്ലോഗുകളുടെ പ്രചാരമേറിയതോടെയാണ് മലയാളത്തില്‍ യൂണിക്കോഡ് കണ്ടന്‍റ് വര്‍ദ്ധിക്കാന്‍ തുടങ്ങിയത്. വിവിധതരത്തിലുള്ള ഗവേഷണാ‍വശ്യങ്ങള്‍ക്ക് ഉപയോഗിക്കാന്‍ പാകത്തിലുള്ളൊരു കോര്‍പസ് ഉണ്ടാക്കാന്‍ ആവശ്യമായ യൂണിക്കോഡ് കണ്ടന്‍റ് ഇപ്പോള്‍ നെറ്റിലുണ്ട്. നിര്‍ഭാഗ്യകരമെന്നു പറയട്ടെ, മലയാളത്തില്‍ ഇപ്പോഴുള്ള യൂണിക്കോഡ് കണ്ടന്‍റ് ഉപയോഗിച്ച് ഒരു ഗവേഷണ പ്രവര്‍ത്തനവും നടത്താന്‍ പറ്റില്ല.

സോര്‍ട്ടിംഗും സെര്‍ച്ചിംഗും ഫൈന്‍ഡ് ആന്‍ഡ് റീപ്ലേസിംഗുമൊന്നും വേണ്ട രീതിയില്‍ നടത്താന്‍ ഇപ്പോഴത്തെ യൂണിക്കോഡ് കണ്ടന്‍റ് ഉപയോഗിച്ച് സാധ്യമല്ല. ഇപ്പോഴുള്ള യൂണിക്കോഡ് മലയാളത്തില്‍ “ഡെസ്ക്ടോപ്പ്” എന്ന വാക്ക് മൂന്നോ നാലോ രീതിയില്‍ ടൈപ്പ് ചെയ്തിരിക്കുന്നത് ഞാന്‍ ശ്രദ്ധിച്ചിട്ടുണ്ട്. ഈയവസ്ഥയില്‍ അങ്ങനെയാണ് സോര്‍ട്ടിംഗും സെര്‍ച്ചിംഗും ഫൈന്‍ഡ് ആന്‍ഡ് റീപ്ലേസിംഗുമൊക്കെ നടക്കുക. ഇതിന് പുറമെ ചില്ലക്ഷര, സംവൃതോകാര പ്രശ്നങ്ങള്‍ വേറെയും.

കാരക്റ്റര്‍ മാപ്പിംഗും ഗ്ലിഫ് സൃഷ്ടിയും

“ഡെസ്ക്ടോപ്പ്” പ്രശ്നം യൂണിക്കോഡിന്‍റേതല്ല, ഫോണ്ടിന്‍റേതാണെന്ന് സിബു വാദിച്ചേക്കും. സമ്മതിക്കുന്നു. മൈക്രോ‍സോഫ്റ്റിന്‍റെ ഓഫീസ് ലിപ്പ് പുറത്തിറങ്ങിക്കഴിഞ്ഞു. അവരതില്‍ ഉപയോഗിച്ചിരിക്കുന്നത് കാര്‍ത്തിക ഫോണ്ടാണ്. അതായത് ഓഫീസ് ലിപ്പില്‍ മലയാളം പുതിയ ലിപിയുടെ ഗ്ലിഫുകളാണ് ഉപയോഗിക്കുന്നത്. നമ്മുടെ മെഷീനിലുള്ള രചന, അഞ്ജലി ഫോണ്ടുകള്‍ ഉപയോഗിച്ച് നമുക്കിത് പഴയ ലിപിയിലാക്കാന്‍ പറ്റില്ലെന്നും മനസ്സിലാക്കുക. നാളെ അഡോബിയും അവരുടെ ഉല്‍പ്പന്നങ്ങള്‍ ലോക്കലൈസ് ചെയ്തേക്കും. അവരതില്‍ രചന ഉപയോഗിക്കുകയാണെങ്കിലോ?

യൂണിക്കോഡ് സംവാദങ്ങളില്‍ നമ്മള്‍ എപ്പോഴും ലിപിയുടെ ആന്തരിക പ്രതിനിധീകരണത്തെ പറ്റി മാത്രമാണ് ചര്‍ച്ച ചെയ്യുന്നത്. ആന്തരിക പ്രതിനിധീകരണത്തെ ഡിസ്പ്ലേയില്‍ കാണിക്കുന്ന ഗ്ലിഫുകളെപ്പറ്റിയും നമ്മള്‍ ചര്‍ച്ച ചെയ്യണം. ഗ്ലിഫ് സൃഷ്ടിയിലെ മാനകീകരണത്തെ പറ്റി എപ്പോഴാണ് നാം ചര്‍ച്ച ചെയ്യുക?

ആരാണ് ശരി?

രചനയെയും ഹുസ്സൈനെയും പരിചയപ്പെടുത്തുമ്പോള്‍ “തല്‍ക്കാലം” രചനയെ വിശ്വസിക്കാന്‍ വിശ്വം ആവശ്യപ്പെട്ടത് ശ്രദ്ധിച്ചു. “പ്‌രബോധചന്‌ദ്‌രിക” എന്നെഴുതി, ഹുസ്സൈന്‍ പരിഹസിക്കുന്ന പ്രബോധചന്ദ്രന്‍ മാഷുടെ കേസിലും നമുക്കീ “താല്‍ക്കാലിക” ക്ലോസ് ചേര്‍ക്കാം. മലയാളത്തിലെന്നല്ല, എല്ലാ ഭാഷകളിലും ചില അക്ഷരങ്ങള്‍ അന്യം നിന്ന് പോയിട്ടുണ്ട്, പോയിക്കൊണ്ടിരിക്കുന്നുമുണ്ട്. ഏറ്റവും ലളിതമാക്കുകയാണ് ഭാഷയെ പ്രചരിപ്പിക്കാനുള്ള മികച്ച വഴി. ഇങ്ങനെ മലയാളത്തെ ലളിതമാക്കാനുള്ള മാഷിന്‍റെ അമിതാവേശമാവാം അദ്ദേഹത്തെ പലര്‍ക്കും അപ്രിയനാക്കിയത്.

“അതിനു് ലോകത്തിലെ ജീവിച്ചിരിക്കുന്നതും മൃതമായതുമായ എല്ലാ ഭാഷകളുടെയും എഴുത്തുരൂപങ്ങള്‍ എന്‍കോഡുചെയ്യേണ്ടതായിട്ടുണ്ടു്” എന്ന് കെവിന്‍ എഴുതിക്കണ്ടു. തീര്‍ച്ചയായും ഇത് വേണ്ടതാണ്. എന്നാല്‍ എല്ലാ എഴുത്തുരൂപങ്ങളും (ഗ്ലിഫുകളും) പുരരുജ്ജീവിപ്പിച്ച് പ്രായോഗികഭാഷയില്‍ ഉപയോഗിക്കണം എന്ന് പറയുന്നത് ശരിയാണോ? അങ്ങനെ ചെയ്യുക വഴി ഭാഷ സങ്കീര്‍ണ്ണമാവുകയല്ലേ ചെയ്യുന്നത്?

ചില സംശയങ്ങള്‍

സ്പീച്ച് റെക്കഗ്നൈസേഷന്‍റെയും ഗ്രാമര്‍ ചെക്കിംഗിന്‍റെയും കാലഘട്ടമാണിത്. ദ്രാവിഡഭാഷകളിലെ സന്ധികള്‍ കൈകാര്യം ചെയ്യുന്നതിനുള്ള സംവിധാനം (മിനിമല്‍ ലെവലിലെങ്കിലും) യൂണിക്കോഡില്‍ ഉണ്ടെന്നു തോന്നുന്നു. എന്‍റെ സംശയം ഇതാണ് - ഈ സംവിധാനം മെച്ചപ്പെടുത്തുന്നതിനു വേണ്ട ഔട്ട്‌പുട്ടുകള്‍ ആരാണ് കൊടുക്കുന്നത്?

ഏതൊക്കെ അക്ഷരങ്ങള്‍ കൂടിച്ചേരണമെന്നും ഏതൊക്കെ ചേരരുതെന്നുമുള്ള ഏകദേശ ധാരണ യൂണിക്കോഡില്‍ ഇപ്പോഴുണ്ട്. ഈ സംവിധാനത്തിന് എത്രത്തോളം ആഴത്തില്‍ പോവാന്‍ കഴിയും? മിനിമല്‍ ലെവലിലുള്ള സന്ധി നിയമങ്ങള്‍ മാത്രമാണോ യൂണിക്കോഡിന് നിര്‍ദ്ദേശിക്കാന്‍ കഴിയുക? എന്ത് അടിസ്ഥാനത്തിലാണ് യൂണിക്കോഡ് ഇത്തരം നിയമങ്ങള്‍ ചേര്‍ക്കുന്നത്?

Hussain Rachana said...

ലിസ്റ്റില്‍ 'ജി ശങ്കരപ്പിള്ള' എന്നത്‌ 'കെ ജി ശങ്കരപ്പിള്ള' എന്ന് തിരുത്തണം. - ഹുസ്സൈന്‍

viswaprabha വിശ്വപ്രഭ said...

പ്രിയ സുഹൃത്തുക്കളേ,

ഉള്ളടക്കം കൊണ്ടും പങ്കെടുക്കുന്നവരുടെ പ്രാമുഖ്യം കൊണ്ടും ഈ ചര്‍ച്ചയുടെ പ്രാധാന്യം അനുദിനം ഏറിവരുകയാണ്.

ബൂലോഗക്ലബ്ബ് എന്ന തിരക്കേറിയ, പലര്‍ക്കും സര്‍വ്വതന്ത്ര നിയന്ത്രണമുള്ള ഒരു ബ്ലോഗില്‍ ഈ ചര്‍ച്ച തുടരുന്നതില്‍ ചിലരൊക്കെ ആശങ്ക പ്രകടിപ്പിച്ചിട്ടുണ്ട്. എന്തുവേണമെന്ന് കൂട്ടായി തന്നെ തീരുമാനിക്കാം.

എന്റെ അഭിപ്രായത്തില്‍ ഇവിടെതന്നെ തുടരുകയാണ് നല്ലത്. blogspot.com എന്ന ഒരൊറ്റ ഏജന്‍സിക്കു മാത്രമേ ഈ ഇടത്തില്‍ പരമാധികാരമുള്ളൂ. ബൂലോഗക്ലബ്ബിലെ നമ്മുടെ മറ്റു കൂട്ടുകാരൊക്കെ ഈ പോസ്റ്റിനും കമന്റുകള്‍ക്കും തല്‍ക്കാലം ഉപദ്രവമൊന്നും ചെയ്യില്ലെന്നും പ്രതീക്ഷിക്കാം.
ഇതോടൊപ്പം തന്നെ ഈ പേജിന്റെ പകര്‍പ്പുകള്‍ മറ്റിടങ്ങളിലായി സൂക്ഷിക്കുവാനും ശ്രമിക്കുന്നുണ്ട്.
കൂടാതെ ഇതു മൊത്തമായി, പതിവായി പുന:പ്രസിദ്ധീകരിക്കുന്ന ഒരു PDF തുടര്‍പ്പുസ്തകമാക്കാമെന്നും ആലോചിക്കുന്നു.ഉള്ളടക്കം ഏറുന്ന മുറയ്ക്ക് രണ്ടോ മൂന്നോ ദിവസത്തിലൊരിക്കല്‍ എന്ന നിലയ്ക്ക് ഈ PDF ശൃംഖല ഈ-മെയിലിലോ അച്ചടിച്ചോ താല്‍പ്പര്യമുള്ള ആളുകള്‍ക്ക് എത്തിക്കാവുന്നതാണ്.

ദയവുചെയ്ത് നിങ്ങളുടെ അഭിപ്രായങ്ങള്‍ അറിയിക്കുക.

ചന്ത്രക്കാറന്‍ said...

ആദ്യമേ പറയട്ടെ, നാജൊരു ഭാഷാപരിജ്ഞാനിയോ യൂണീകോഡിനെക്കുറിച്ചറിവുള്ള സാങ്കേതികവിദഗ്ദ്ധനോ അല്ല. unicode.orgല്‍നിന്നും കിട്ടിയ കുറെ വിവരങ്ങളും സിബുവിന്റെ വിക്കി ലേഖനവും ബെന്നിയോടു കുറച്ചു സംസാരിച്ചതുംവച്ചാണ്‌ ഇതെഴുതുന്നത്‌.

മാറിയ സാഹചര്യങ്ങളില്‍ ഭാഷയുടെ നിലനില്‍പ്പ്‌ വിനിമയോപാധി എന്ന നിലയില്‍നിന്നും വളരെയധികം മാറിയിട്ടുണ്ട്‌. ചിന്തിക്കാന്‍വേണ്ട അടിസ്ഥാനോപാധിയാണ്‌ ഇന്നു ഭാഷ. വിനിമയത്തിന്‌ മറ്റു പല രീതികളും സാധ്യമാണെങ്കിലും ചിന്തിക്കാനും ചിന്തയെ index ചെയ്യാനും പകര്‍ത്താനും പിന്നീടാവശ്യമുള്ളപ്പോള്‍ തിരഞ്ഞെടുത്തുപയോഗിക്കാനും ഭാഷ അനിവാര്യ്മാണ്‌. ഇതേ പ്രക്രിയയില്‍നിന്നും manual labourനെ ഒഴിവാക്കി മനുഷ്യന്റെ ക്രിയേറ്റിവിറ്റിക്ക്‌ പരമാവധി സാദ്ധ്യതകള്‍ തുറന്നുകൊടുക്കുകയാണ്‌, അല്ലെങ്കില്‍ ആയിരിക്കണം, ഭാഷകമ്പ്യുട്ടിങ്ങിന്റെ ലക്ഷ്യം.

ബെന്നിയും സിബുവും(വിക്കിയില്‍) സൂചിപ്പിച്ചതുപോലെ ഡിജിറ്റല്‍ ലോകത്തെ ഭാഷകളുടെ പ്രസക്തിതന്നെ അതിന്റെ സെര്‍ച്ചബിലിറ്റിയിലാണ്‌. ഒരു വേര്‍ഡ്പ്രോസസ്സരിനകത്ത്നട്ത്തുന്ന സെര്‍ച്ചും റീപ്ലേസുമല്ല, സെര്‍ച്ച്‌എന്‍ജിനുകള്‍ക്കും വെബ്സ്പൈഡറുകള്‍ക്കും എളുപ്പത്തില്‍ വിവരങ്ങള്‍ ലഭ്യമാക്കാനും അവയെ നിമിഷനേരംകൊണ്ട്‌ ഇന്‍ഡക്സ്‌ ചെയ്യാനും കഴിയുന്നരീതിയിലുള്ള സെര്‍ച്ചബിലിറ്റി.(പി.ഭാസ്കരനുണ്ണിയുടെ രണ്ടു പുസ്തകങ്ങള്‍, പത്തൊമ്പതാം നൂറ്റാണ്ടിന്റേയും ഇരുപതാം നൂറ്റാണ്ടിന്റെയും കേരളചരിത്രം, searchable ആയ ഒരു ഫോര്‍മാറ്റിലായിരുന്നെങ്കില്‍ എന്നാശിച്ചിട്ടുണ്ട്‌. അമൂല്യമായ ചരിത്രരേഖകള്‍, പക്ഷേ ഒരു വാക്ക്‌ അന്വേഷിച്ചുകണ്ടുപിടിക്കണമെങ്കില്‍ കഷ്ടപ്പെട്ടുപോകും) അത്തരമൊരു ഭാഷകമ്പ്യൂട്ടിങ്ങിനുമാത്രമേ അറിവിന്റെ ഉല്‍പ്പാദകര്‍ക്ക്‌ ആവശ്യമായ വിവരങ്ങല്‍ സമയത്തെത്തിക്കന്‍ കഴിയൂ. ആ വിവരങ്ങളാണ്‌ നാളത്തെ അറിവുകള്‍, തര്‍ജ്ജമചെയ്യപ്പെട്ട സെകന്‍ഡ്‌ഹാന്‍ഡ്‌ വിവരങ്ങളല്ല, ആ ഭാഷയില്‍ ചിന്തിക്കുകയും അതില്‍ത്തന്നെ ഉല്‍പ്പാദിക്കപ്പെടുകയും ചെയ്ത മൗലികമായ അറിവുകള്‍. ഒരു ഭാഷ വളരുന്നത്‌ കുറെപ്പേര്‍ അതുപയോഗിക്കുമ്പോളല്ല, കുറച്ചുപേര്‍ ആ ഭാഷയില്‍ ചിന്തിക്കുമ്പോളാണ്‌.

മലയാളം യൂണീകോഡില്‍ ഇപ്പോഴുള്ള പ്രശ്നം ഭാഷാപരമെന്നതിനേക്കാള്‍ സാങ്കേതികമാണെന്നാണ്‌ ഞാന്‍ മനസ്സിലാക്കുന്നത്‌. ആരുംതന്നെ ഉപയോഗിച്ചുകണ്ടിട്ടില്ലാത്ത മലയാളം അക്കങ്ങള്‍ക്കുവരെ യൂണീകോഡ്‌ എന്‍കോഡിങ്ങുണ്ടായിരിക്കെ വ്യാപകമായി ഉപയോഗിക്കുന്ന ചില്ലക്ഷരങ്ങള്‍ക്കതുവേണ്ടെന്ന്‌ പറയുന്നത്‌ അതിശയമായിത്തോന്നുന്നു. ഹുസ്സൈന്‍ നയിക്കുന്ന രചനയാണ്‌ ഇത്തരമൊരു നീക്കത്തിന്‌ മുന്‍കൈയെടുത്തതെങ്കില്‍ എന്തായിരുന്നു അത്തരമൊരു തീരുമാനത്തിനുപിന്നിലെന്ന് വിശദമാക്കിയാല്‍ നന്നായിരുന്നു. അദ്ദേഹത്തിന്റെ വെര്‍ഷനുംകൂടി പരിഗണിക്കാതെ ഈ ചര്‍ച്ച പൂര്‍ണ്ണമാകില്ലല്ലോ.

ഹുസ്സൈന്‍ പറയുന്ന ഭാഷാവിദഗ്ദരുടെ ലിസ്റ്റ്‌ ചിരിപ്പിക്കുന്നതാണെന്നുപറയാതിരിക്കാന്‍ വയ്യ. ഇവരില്‍ ഏതെങ്കിലും നാലുപേരെ (ബെന്നി പറഞ്ഞപോലെ സച്ചിദാനന്ദനെ ഒഴിവാക്കാം, വേണുഗോപാലപ്പണിക്കര്‍ ആരാണെന്നെനിക്കറിയുകയുമില്ല) ഒരു കമ്മറ്റിയിലിട്ടാല്‍ അടുത്ത നൂറുവര്‍ഷത്തേക്ക്‌ മലയാളത്തില്‍ യൂണികോഡ്‌ പ്രശ്നങ്ങള്‍ തീരില്ല. ഒരു ഹൈസ്കൂള്‍ മലയാളം അധ്യാപകനു കൈകാര്യം ചെയ്യാന്‍ കഴിയുന്നതിലുംകൂടുതല്‍ ഭാഷാപ്രശ്നങ്ങളുണ്ടൊ ഇതില്‍?


ഒരു ഭാഷ ഉപയോഗിക്കപ്പെടുന്നത്‌ ചിന്തിക്കാന്‍ അതു നകുന്ന സാധ്യതകളുടെയും ചിന്തക്കാവശ്യമായ വിവരങ്ങള്‍ നല്‍കാനുള്ള ശേഷിയുടെയും അടിസ്ഥാനത്തിലായിരിക്കും.. knowledge ഉപയോഗിക്കുന്ന ഒരു സമൂഹം എന്ന നിലയില്‍നിന്നും അതു സൃഷ്ടിക്കുന്ന സമൂഹം എന്ന നിലയിലേക്കൂള്ള പരിവര്‍ത്തനത്തില്‍ ഭാാഷ ഒരു വലിയ പങ്കുവഹിക്കേണ്ടതുണ്ട്‌. സാഹിത്യ്കാരന്റെയും അവന്റെ വായനക്കരന്റെയും നൊസ്റ്റാള്‍ജിയക്ക്‌ ഭാഷയുടെ വീഴ്ചയില്‍ ഒന്നും ചെയ്യാനാകില്ല. അതിലും ഭേദം തീര്‍ച്ചയായും ഹുസ്സൈന്‍ പരിഹസിച്ച ഐ.ടി.മെറ്റലര്‍ജിക്കാരാണ്‌.

മയ്യഴി said...

ബെന്നി,
പ്രമുഖ ഭാഷാശാസ്ത്ര പണ്ഡിതനായ ഡോ.ടി.ബി.വേണുഗോപാലപ്പണിക്കര്‍ കാലിക്കറ്റ്‌ യൂനിവേഴ്സിറ്റിയില്‍ മലയാളവിഭാഗം മേധാവിയായിരിന്നു.
വ്യാകരണമല്ല ഭാഷാശാസ്ത്രമെന്നും ഭാഷാശാസ്ത്രമല്ല ലാങ്ഗ്വിജ്‌ ടെക്നോളജിയെന്നും മനസ്സിലാക്കാനോ അംഗീകരിക്കാനോ പലപ്പോഴും നമ്മുടെ പണ്ഡിതന്മാര്‍ കൂട്ടാക്കാറില്ലെങ്കിലും ഈ ചര്‍ച്ചകളില്‍ അവര്‍ക്കു കാര്യമില്ലെന്ന നിലപാട്‌ ശരിയല്ല.ചര്‍ച്ചകളുടെ ഉള്ളടക്കം പരമാവധി ആളുകളില്‍ എത്തിക്കുകയല്ലേ നല്ലത്‌?

കണ്ണൂസ്‌ said...

മൂന്ന് ദിവസത്തെ ഗ്യാപ്പിന്‌ ശേഷം നെറ്റില്‍ കയറിയപ്പോള്‍ ആദ്യം വന്ന് നോക്കിയത്‌ ഇവിടെയാണ്‌. നിറഞ്ഞ സന്തോഷം.

എല്ലാ ഭാഷാ പണ്ഡിതരേയും നേരിട്ട്‌ ഇത്തരം ചര്‍ച്ചകളില്‍ ഉള്‍ക്കൊള്ളിക്കാനുള്ള പ്രായോഗിക പ്രയാസങ്ങള്‍ കണക്കിലെടുക്കണ്ടേ? അതു നോക്കുമ്പോള്‍ പരിഹരിക്കപ്പെടാത്ത / ചര്‍ച്ചയിലുള്ള വിഷയങ്ങളുടെ ഒരു ലിസ്റ്റ്‌ ഉണ്ടാക്കി പ്രസിദ്ധീകരിക്കുന്നത്‌ നന്നായിരിക്കും എന്ന് തോന്നുന്നു. നമുക്ക്‌ ഈ കാര്യത്തില്‍ പോസിറ്റിവ്‌ ആയി സംഭാവന ചെയ്യാന്‍ കഴിയും എന്ന വിശ്വാസമുള്ള ഓരോരുത്തരുടേയും അഭിപ്രായം, ലിസ്റ്റില്‍ ഉന്നയിച്ചിട്ടുള്ള ഓരോ വിഷയത്തിലും രേഖപ്പെടുത്തി, ക്രോഡീകരിക്കാമല്ലോ. മാധ്യമലോകത്തുള്ള നമ്മുടെ ബൂലോഗ സുഹൃത്തുക്കള്‍ക്ക്‌ ഇക്കാര്യത്തില്‍ സഹായിക്കാന്‍ കഴിയില്ലേ?

മയ്യഴി said...

മലയാളം അക്കങ്ങള്‍ ടൈപ്പ്‌ ചെയ്യാന്‍ രചനയിലും വരമൊഴിയുടെ പുതിയ വേര്‍ഷനിലും സൌകര്യമുണ്ട്‌. ഇക്കാര്യത്തെക്കുറിച്ച്‌ ഡോ.എം.ആര്‍. രാഘവവാര്യര്‍ മുമ്പൊരിക്കല്‍ പറഞ്ഞ കാര്യം രേഖപ്പെടുത്തട്ടെ. ഇത്‌ വളരെ പ്രസക്തവും പ്രയോജനപ്രദവുമാണ്‌. എന്നാല്‍ മലയാളം അക്കങ്ങളെ ദശാംശസ്ഥാനത്തിന്റെ ക്രമത്തിലാണ്‌ ഈ ടെക്സ്റ്റ്‌ എഡിറ്ററുകള്‍ നമ്മുക്ക്‌ നല്‍കുന്നത്‌. അതിന്റെ തനതു രൂപത്തിലല്ല.

അക്കങ്ങളുടെ തനത്‌ ആലേഖനരീതി തിരിച്ചു കൊണ്ടു വരേണ്ടതല്ലേ?

സിബു::cibu said...

സുറുമ: ചില്ല് എന്കോഡിങില് ശരിയായ സ്ഥാനം നിര്ണ്ണയിച്ചില്ലെങ്കില് index ചെയ്യുമ്പോള് കൃത്യത നഷ്ടപ്പെട്ടേക്കാം.ഉദാഹരണത്തിന് കാര്,കാര്,കാറ് ഇവയുടെ ക്രമം എന്തായിരിക്കും?


ഡിക്ഷ്ണറിയിലെ സോര്ട്ടിങ് ക്രമത്തിനെ കൊലേഷന് എന്നാണ് വിളിക്കുക. കൊലേഷനില് ഒരക്ഷരത്തിനും വ്യത്യസ്ത സംഖ്യകൊടുത്ത് അവയുടെ ഓഡറില് ആണ് സോര്ട്ടിങ് എന്നാണ് പൊതുവെ നമ്മള് ഡിക്ഷ്ണറികളില് കണ്ടുവരാറ്. യുണീക്കോഡ് കൊലേഷനില്, ഒരു അക്ഷരത്തിന് 3 (കൂടുതലും ആവാം) ലെവല് സംഖ്യകള് കൊടുക്കുന്നു. ഉദാ: അ = (4, 20, 2), ആ = (5, 20, 2) . സോര്ട്ട് ചെയ്യുമ്പോള് ആദ്യലെവല് സംഖ്യകള് വച്ചാദ്യം സോര്ട്ട് ചെയ്യുന്നു. പിന്നെ, രണ്ടാം ലെവല് വച്ച് അതിനു ശേഷം മൂന്ന് എന്നിങ്ങനെ. അക്ഷരത്തിന്റെ ഏറ്റവും പ്രധാനപ്പെട്ട ഗുണങ്ങളാണ് ആദ്യത്തെ ലെവലില് വേര്ത്തിരിക്കപ്പെടുന്നത്`. രണ്ടാമത്തെ ലെവലില് അത്രതന്നെ പ്രധാനമില്ലാത്തവ; ഉദാ: കാപ്പിറ്റല് ലെറ്റര് സ്മോള് ലെറ്റര്.

http://www.unicode.org/reports/tr10/ എന്ന ഡോക്യുമെന്റ് ഇതിനെ പറ്റി വളരെ നന്നായി വിവരിക്കുന്നുണ്ട്. ഈ കൊലേഷന് വിലകള്ക്ക് യുണിക്കോഡ് ചാര്ട്ടിലെ വിലകളുമായി (encoded values) ബന്ധമില്ല. ഓരോ അക്ഷരത്തിന്റേയും ഡിഫാള്ട്ട് കൊലേഷന് വില എന്തെന്ന് ഇവിടെ പറയുന്നു: http://www.unicode.org/Public/UCA/latest/allkeys.txt ഇതാണ് ഒട്ടുമിക്ക പ്രോഗ്രാമുകളും ഉപയോഗിക്കുന്നത്. ഒരപ്ലിക്കെഷന് സ്വന്തം കൊലേഷന് വിലകള് നിശ്ചയിക്കുന്നതിനും ഒരു വിരോധവുമില്ല.

മലയാളം കൊലേഷനില് ചില്ല്, സംവൃതോകാരം ചന്ദ്രക്കല എന്നിവ ചെറിയ പ്രശ്നങ്ങള് ഉണ്ടാക്കുന്നുണ്ട്. അതെങ്ങനെയാവാം എന്ന് നമുക്കിവിടെ ആലോചിക്കാവുന്ന ഒന്നാണ്.

സുറുമ: പുതിയലിപി ഉപയോഗിക്കുന്ന ഒരാള്ക്ക് കൂട്ടക്ഷരം prevent ചെയ്യാന് ZWNJ ഉപയോഗിക്കാന് തോന്നില്ല.'ലോക്സഭ' എന്നത് പഴയലിപിയില് 'ലോക്സഭ' എന്നാകും.

ഇതൊരു വലിയ പ്രശ്നമാണ്; എന്റെ കയ്യില്‍ ഒരുത്തരവും ഇതിനില്ല. യുണീക്കോഡ്, രണ്ടുലിപിയും കൂടി ഒറ്റ എന്കോഡിങ് കൊണ്ട് റെപ്രസെന്റ് ചെയ്യാന് തീരുമാനിച്ചതിന്റെ സൈഡ് ഇഫക്റ്റാണിത്. ഇത് പഴയലിപിക്ക് ഒരു അഡ്വാന്റേജ് തരുന്നുണ്ട്. അതായത്, പഴയലിപിയിലെഴുതിയത് പുതിയ ലിപിക്കാരന് ഒരു പ്രശ്നവുമില്ലാതെ വായിക്കാം; എന്നാല് പുതിയലിപിയിലെഴുതിയത് പഴയലിപിക്കാരന് 'ലോക്സഭ', 'ദൃക്സാക്ഷി' പ്രശ്നങ്ങളില്ലാതെ വായിക്കാനാവില്ല. അതായത്‌, മലയാളം തെറ്റുകൂടാതെ എഴുതണമെങ്കില്‍ പഴയലിപി തന്നെ ഉപയോഗിക്കണം എന്ന്‌. ഈ പ്രശ്നത്തെ പറ്റി കൂടുതല് ഇവിടെ: http://varamozhi.blogspot.com/2005/07/unicode-issues-with-visible-virama.html

ബെന്നി: എഴുപതുകളിലെ കൊലപാതകം നടന്നില്ലായിരുന്നുവെങ്കില്‍ വലിയൊരു കുതിച്ചുചാട്ടം മലയാളഭാഷയ്ക്ക് സാധിക്കില്ലായിരുന്നു...ഗ്ലിഫ് സൃഷ്ടിയിലെ മാനകീകരണത്തെ പറ്റി എപ്പോഴാണ് നാം ചര്‍ച്ച ചെയ്യുക?

എന്തു് കുതിച്ചു ചാട്ടം? 1980-കള്‍ വരെ പഴയലിപി തന്നെയാണ് അച്ചടിയില്‍. ടൈപ്രൈറ്ററിന് വേണ്ടിയാണ് ലിപിയെ മുറിച്ചത്‌. അതല്ലാതെ വേറേ വഴിയില്ലായിരുന്നു. 1980-ന് ശേഷം, കമ്പ്യൂട്ടറ് ടൈപ്പ്സെറ്റിങ് (അച്ചുനിരത്തിയല്ലാതെ) വന്നപ്പോഴാണ് പ്രസാധകരും ടെക്സ്റ്റ് ബുക്കുകളും ആവഴി പോയത്‌. 1980-ന് ശേഷം 2000-വരെ എന്തെങ്കിലും കുതിച്ചു ചാട്ടം നടന്നുവോ? 2000-ഇല്‍ ആറ്‌ ഫോണ്ട്‌ ഫയലുകള്‍ വച്ച്‌ കമ്പ്യൂട്ടര്‍ ടൈപ്പ്സെറ്റിങിലും പഴയലിപി ആവാം എന്ന്‌ രചന കാണിച്ചു തന്നു. അപ്പോഴേയ്ക്കും യുണീക്കോഡിന്റെ കാലമായി. പഴയലിപി പുതിയലിപി എന്നിവയല്ലാതായി വിനിമയരീതി; പകരം അത്‌ കൂടുതല്‍ ഗോപ്യമായ എന്‍‌കോഡിംഗ് ആയിമാറി. ഇന്ന്‌, സ്കൂളുകളില്‍ ഏത്‌ ലിപി പഠിക്കണം എന്നത്‌ മാത്രമാണ് ചോദ്യം. അതിന്റെ ഉത്തരമായാല്‍ ബാക്കിയെല്ലാത്തിന്റേയും ഉത്തരം എളുപ്പത്തില്‍ കിട്ടും.

ബെന്നി: സാങ്കേതികതയുടെ പിന്നണിക്കഥകളെല്ലാം സകലരോടും പറഞ്ഞതിനുശേഷം മാത്രം മതി തീരുമാനമെന്നത് ഒരു ഐഡിയല്‍ സങ്കല്‍പ്പമാണ്, എന്നാല്‍ നടക്കാത്ത കാര്യം. ഭാഷാ കമ്പ്യൂട്ടിംഗിന്‍റെ കാര്യത്തിലും ഇങ്ങനെത്തന്നെ.

സത്യം.

ബെന്നി: സോര്‍ട്ടിംഗും സെര്‍ച്ചിംഗും ഫൈന്‍ഡ് ആന്‍ഡ് റീപ്ലേസിംഗുമൊന്നും വേണ്ട രീതിയില്‍ നടത്താന്‍ ഇപ്പോഴത്തെ യൂണിക്കോഡ് കണ്ടന്‍റ് ഉപയോഗിച്ച് സാധ്യമല്ല.

എന്തുകൊണ്ട്‌ പറ്റില്ല?

ബെന്നി: ഇപ്പോഴുള്ള യൂണിക്കോഡ് മലയാളത്തില്‍ “ഡെസ്ക്ടോപ്പ്” എന്ന വാക്ക് മൂന്നോ നാലോ രീതിയില്‍ ടൈപ്പ് ചെയ്തിരിക്കുന്നത് ഞാന്‍ ശ്രദ്ധിച്ചിട്ടുണ്ട്.

യുണീക്കോഡ് സ്പെല്ലിംഗില്‍ ആണോ വ്യത്യാസം; അതോ ഫോണ്ട്‌ കാണിക്കുന്നതിലുള്ളതോ?. യുണീക്കോഡ് സ്പെല്ലിംഗിലുള്ള വേരിയേഷന്‍സ് ആണെങ്കില്‍ പ്രശ്നമാണ്. അത്‌ മിക്കവാറും യുണിക്കോഡല്ല, ഭാഷ പരിഹരിക്കേണ്ട കാര്യങ്ങളാവും. അതായത്‌ ‘ഡെസ്ക്‍ടോപ്’ എന്നാണോ ‘ഡെസ്ക്‍ടോപ്പ്’ എന്നാണോ എന്നത്‌ ഭാഷ തീരുമാനിക്കേണ്ടതാണ് എന്നര്‍ഥം.

ബെന്നി: അവരതില്‍ ഉപയോഗിച്ചിരിക്കുന്നത് കാര്‍ത്തിക ഫോണ്ടാണ്. അതായത് ഓഫീസ് ലിപ്പില്‍ മലയാളം പുതിയ ലിപിയുടെ ഗ്ലിഫുകളാണ് ഉപയോഗിക്കുന്നത്.നാളെ അഡോബിയും അവരുടെ ഉല്‍പ്പന്നങ്ങള്‍ ലോക്കലൈസ് ചെയ്തേക്കും. അവരതില്‍ രചന ഉപയോഗിക്കുകയാണെങ്കിലോ?

ഡിഫാള്‍ട്ട് ഫോണ്ട്‌ മാറ്റാനുള്ള സൌകര്യം ഓപ്പറേറ്റിങ് സിസ്റ്റം ചെയ്തുകൊടുക്കേണ്ടതാണ്. അതായത്‌ ഈ പ്രശ്നം മൈക്രോസോഫ്റ്റിന്റേതാണ്.

ബെന്നി: രചനയെയും ഹുസ്സൈനെയും പരിചയപ്പെടുത്തുമ്പോള്‍ “തല്‍ക്കാലം” രചനയെ വിശ്വസിക്കാന്‍ വിശ്വം ആവശ്യപ്പെട്ടത് ശ്രദ്ധിച്ചു. “പ്‌രബോധചന്‌ദ്‌രിക” എന്നെഴുതി, ഹുസ്സൈന്‍ പരിഹസിക്കുന്ന പ്രബോധചന്ദ്രന്‍ മാഷുടെ ...

ഇവിടെ വിശ്വാസത്തിന്റെ പ്രശ്നമൊന്നുമില്ല. ആരേയും കളിയാക്കേണ്ട കാര്യവുമില്ല. ഇവിടെ ചര്‍ച്ച ചെയ്യുന്നത്‌ ആശയപരമായ വ്യത്യാസങ്ങളാണ്. അത്‌ വ്യക്തിപരമാക്കേണ്ടകാര്യം ഒട്ടും തന്നെയില്ല. എല്ലാവരും അത്‌ ശ്രദ്ധിച്ചാല്‍ നന്ന്‌.

ബെന്നി: ഏതൊക്കെ അക്ഷരങ്ങള്‍ കൂടിച്ചേരണമെന്നും ഏതൊക്കെ ചേരരുതെന്നുമുള്ള ഏകദേശ ധാരണ യൂണിക്കോഡില്‍ ഇപ്പോഴുണ്ട്. ഈ സംവിധാനത്തിന് എത്രത്തോളം ആഴത്തില്‍ പോവാന്‍ കഴിയും?
അധികം ആഴത്തിലൊന്നും പറ്റില്ല. രണ്ടുരീതിയില്‍ എഴുതിയാലും എപ്പോഴും അര്‍ഥം ഒരുപോലുള്ളവയെ മാത്രം യുണീക്കോഡിന് ഒരുപോലെ കാണാനാവും. എന്നാല്‍ വാക്കിന്റെ context മനസ്സിലാക്കാന്‍ അതിന് പറ്റില്ല. അത്‌ ചെയ്യേണ്ടത്‌ യുണീക്കോഡിനെ ഉപജീവിക്കുന്ന higher അപ്ലിക്കേഷന്‍സ് ആണ്. അവയാണ് സന്ധികളും മറ്റും കൈകാര്യം ചെയ്യേണ്ടത്.


ചന്ത്രക്കാരന്‍: ആരുംതന്നെ ഉപയോഗിച്ചുകണ്ടിട്ടില്ലാത്ത മലയാളം അക്കങ്ങള്‍ക്കുവരെ യൂണീകോഡ്‌ എന്‍കോഡിങ്ങുണ്ടായിരിക്കെ വ്യാപകമായി ഉപയോഗിക്കുന്ന ചില്ലക്ഷരങ്ങള്‍ക്കതുവേണ്ടെന്ന്‌ പറയുന്നത്‌ അതിശയമായിത്തോന്നുന്നു.

ചില്ലക്ഷരം പ്രത്യേകം എന്‍‌കോഡ് ചെയ്യാതെ തന്നെ ചില്ലുകള്‍ എഴുതാന്‍ വഴിയുണ്ടാക്കണം എന്നതാണ് രചനയുടെ വാദം. പ്രത്യക്ഷത്തില്‍ ആ വാദത്തില്‍‍ തെറ്റില്ല. കാരണം ‘നന്മ’ എന്നും ‘നന്‍‌മ’ എന്നും എഴുതിയാല്‍ അര്‍ഥം ഒന്നാണല്ലോ. അര്‍ഥവും അടിസ്ഥാന അക്ഷരങ്ങളും ഒന്നാണെന്നില്‍‍ ആ രണ്ടുവാക്കുകളുടേയും സ്പെല്ലിംഗും ഒന്നായിരിക്കേണ്ടേ. എഴുത്ത്‌ രീതിയിലുള്ള വ്യത്യാസം (അത്‌ ‘ശബ്‌ ദം’ ‘ശബ്ദം’ എന്നിവ പോലെ) മാത്രമേ അവ തമ്മിലുള്ളൂ... ഇത്രയുമാണ് ചുരുക്കത്തില്‍.

യുണീക്കോഡ് എഴുത്തിനുപയോഗിക്കുന്ന എല്ലാ ചിഹ്നങ്ങളും എന്‍‌കോഡ് ചെയ്യാന്‍ ശ്രമിക്കുന്നില്ല. പകരം എഴുത്തിന്റെ Deep structure‍-ല്‍ ആണ് യുണീക്കോഡിന്റെ ശ്രദ്ധ‌. ‘ന്‍‌ ‘-ന്റേയും ‘ന്’-യുടേയും അടിസ്ഥന അക്ഷരം ‘ന’ തന്നെയാണല്ലോ. ആ Deep structure-ന്റെ എന്‍‌കോഡിങില്‍ നിന്നും എല്ലാ ചിഹ്നങ്ങളും എഴുത്തുരീതികളും ഉണ്ടാക്കാന്‍ ഫോണ്ടിന് സാധിക്കണം.

‘നന്മ’/‘നന്‍‌മ’ എന്നിവ ‘colour/color' പോലെ ആണെന്നും, ചില്ലുകള്‍ വേറേ വാക്കുകളില്‍ അര്‍ഥവ്യത്യാസം ഉണ്ടക്കുന്നുണ്ടെന്നും ആണ് ഞാനടങ്ങുന്ന സംഘത്തിന്റെ മറുവാദം. കൂടുതല്‍ ഇവിടെ: http://varamozhi.blogspot.com/2005/06/unicode-malayalam-chillu-discussion.html

മയ്യഴി: എന്നാല് മലയാളം അക്കങ്ങളെ ദശാംശസ്ഥാനത്തിന്റെ ക്രമത്തിലാണ് ഈ ടെക്സ്റ്റ് എഡിറ്ററുകള് നമ്മുക്ക് നല്കുന്നത്. അതിന്റെ തനതു രൂപത്തിലല്ല.

അവയുടെ 'തനത് രൂപം' എന്താണെന്ന്‌ പറഞ്ഞുതരാമോ?

മയ്യഴി: അക്കങ്ങളുടെ തനത്‌ ആലേഖനരീതി തിരിച്ചു കൊണ്ടു വരേണ്ടതല്ലേ?

തിരിച്ചുകൊണ്ടുവരിക എന്നാല്‍ എന്താണര്‍ഥം? സാധാരണപ്രയോഗത്തില്‍ വരുത്തുക എന്നതാണോ? അതിനോടെനിക്ക്‌ യോജിപ്പില്ല. എന്നാല്‍ സോഫ്റ്റ്വെയറിലും യുണിക്കോഡിലും അങ്ങനേയും എഴുതാന്‍ വഴിയുണ്ടാക്കുക എന്നതാണെങ്കില്‍, അത്‌ തീര്‍ച്ചയായും വേണ്ടതാണ്.


കണ്ണൂസ്: അതു നോക്കുമ്പോള്‍ പരിഹരിക്കപ്പെടാത്ത / ചര്‍ച്ചയിലുള്ള വിഷയങ്ങളുടെ ഒരു ലിസ്റ്റ്‌ ഉണ്ടാക്കി പ്രസിദ്ധീകരിക്കുന്നത്‌ നന്നായിരിക്കും എന്ന് തോന്നുന്നു.

അങ്ങനെ ഒരു ശ്രമം ഇവിടെ ഉണ്ടായിരുന്നു: http://varamozhi.blogspot.com/2005/07/unicode-suggestions-proposals.html
ഇപ്പോഴത്‌ http://unicode.wikia.com/wiki/Malayalam എന്ന സൈറ്റിലേയ്ക്ക്‌ പറിച്ചു നട്ടുകൊണ്ടിരിക്കയാണ്.

---
ഈ മറുപടി മൊത്തം എഴുതിയപ്പോഴേക്കും ഒന്നൊന്നര മണിക്കൂറിലധികം എടുത്തു. സമയം തന്നെയാണ് ഏറ്റവും വലിയ പ്രതിബന്ധം. :(

Thiramozhi said...

മലയാളം യൂണിക്കോഡ്‌ സംബന്ധിച്ച്‌ നിലവിലുള്ള അവസ്ഥ, പ്രശ്നങ്ങള്‍, തര്‍ക്കങ്ങള്‍, ന്യായീകരണങ്ങള്‍, നിര്‍ദ്ദേശങ്ങള്‍ ഇവ അക്കമിട്ടു നിരത്തുന്ന ഒരു സംക്ഷിപ്തരേഖ ആര്‍ക്കെങ്കിലും തയ്യാറാക്കിത്തരാമോ? ഏതെങ്കിലും ശ്രദ്ധേയമായ അച്ചടിമാദ്ധ്യമത്തില്‍ പൊതുചര്‍ച്ചയ്ക്കായി പ്രസിദ്ധീകരിക്കാനാണ്‌.

കെവിന്‍ & സിജി said...

തിരമൊഴീ, സിബൂന്റെ വിക്കിയെ തന്നെ ശരണം പ്രാപിയ്ക്കണം. ഇവിടെ http://unicode.wikia.com/wiki/Malayalam

Hussain Rachana said...

സുഹൃത്തുകളെ,

ഞാനല്ല രചനയെ നയിക്കുന്നത്‌, തുടക്കം മുതലേ, ഇന്നും, ചിത്രജകുമാര്‍ ആണ്‌.

ഫോണ്ട്‌ ഡ്സൈനിംഗ്‌ ആയിരുന്നു എന്റെ പണി. ഡോ. വിജയകുമാരന്‍ നായരുമൊത്ത്‌ രചന എഡിറ്ററിന്റെ കോഡിങ്ങില്‍ പങ്കുചേരുകയുണ്ടായി. കാലിഗ്രാഫിയിലെ പല പ്രശ്നങ്ങളും പറഞ്ഞുതന്നത്‌ സുബാഷ്‌ കുര്യാക്കോസും നാരായണ ഭട്ടതിരിയുമാണ്‍. രചനയുടെ ഓപ്പണ്‍ ടൈപ്‌ നിര്‍മ്മിതിയില്‍ അന്‍വര്‍, മുത്തുകൃഷ്ണന്‍ എന്നിവര്‍ പങ്കുചേര്‍ന്നിട്ടുണ്ട്‌. യതിചരിതം, രാമായണം, ബൈബിള്‍ തുടങ്ങിയ ഗ്രന്ഥങ്ങളുടെ ടൈപ്സെറ്റിങ്ങില്‍ ഞാന്‍ സഹകരിക്കുകയുണ്ടായി . 1999 തുടക്കം മുതല്‍ 2005 മാര്‍ച്ചുവരെ Project Co-ordinator എന്ന നിലക്കായിരുന്നു എന്റെ പ്രവര്‍ത്തനങ്ങള്‍. കഴിഞ്ഞ ഒരു വര്‍ഷമായി രചനയുടെ ഡെവലപ്മെന്റില്‍ എനിക്കു പങ്കാളിയാകാന്‍ കഴിയുന്നില്ല. പ്രധാന കാരണം ലിനക്സിലുള്ള എന്റെ അജ്ഞതയാണ്‌. രാജീവ്‌ സെബാസ്റ്റ്യന്‍ ആണ്‌ ലിനക്സിന്റെ കോഡിംഗ്‌ നിര്‍വ്വഹിക്കുന്നത്‌. ഭാഷാപരമായ പ്രശ്നങ്ങള്‍ ചിത്രജനും ഗംഗാധരനും കൈകാര്യംചെയ്യുന്നു.

ചിത്രജന്‍ തന്നെയാണ്‌ രചനയെ ഇപ്പോഴും നയിക്കുന്നത്‌.

- ഹുസൈന്‍, രചന

സന്തോഷ് said...

LIP-ല്‍ ഉപയോഗിച്ചിരിക്കുന്ന ഫോണ്ട് മാറ്റാന്‍ ഒരുപാധി ഉണ്ടാവേണ്ടതാണ്. Malayalam LIP-ലെ default font ആയ കാര്‍ത്തിക മാറ്റാന്‍ സാധിക്കും. ഓഫീസ് LIP ഞാന്‍ ശ്രമിച്ചിട്ടില്ലെങ്കിലും ഇത് സാധ്യമാകുമെന്ന് തന്നെയാണ് വിശ്വാസം. ഇല്ലെങ്കില്‍, സിബു പറഞ്ഞതു പോലെ, അത് മൈക്രോസോഫ്റ്റിന്‍റെ പ്രശ്നമായി മാറുന്നു.

അതുപോലെ format control characters aware അല്ലാത്ത ടെക്സ്റ്റ് എഡിറ്ററുകളില്‍ വിവിധ രീതിയില്‍ എഴുതപ്പെടുന്ന (ഡെസ്ക്ടോപ്പ് പോലുള്ള) വാക്കുകള്‍ സേര്‍ച് ചെയ്യുന്നത് ഉദ്ദേശിച്ച ഫലം നല്‍കണമെന്നില്ല.

seeyes said...

ഫലപ്രദമായ ഒരു ചര്‍ച്ച Skype (www.skype.com) വഴി നടത്താവുന്നതേ ഉള്ളൂ. ഒരേ സമയം 5 കമ്പ്യൂട്ടറുകള്‍ക്ക് വരെ ഇതില്‍ പങ്കെടുക്കാം. ഒരു കമ്പ്യൂട്ടറിനു മുന്‍പില്‍ ഒന്നിലധികം ആള്‍ക്കാരെ വിളിച്ചു വരുത്താന്‍ പറ്റുമെങ്കില്‍ ധാരാളം പേര്‍ക്കിതില്‍ പങ്കെടുക്കാം. ഉദാ: ദക്ഷിണകേരളത്തിലെ വിദഗ്ധര്‍ തിരുവനന്തപുരത്തും, ഉത്തരകേരളത്തിലെ വിദഗ്ധര്‍ തൃശ്ശൂരും. DSL സംവിധാനം എങ്കിലും വേണ്ടിവരും എന്നേ ഉള്ളൂ. Skypecast ഉപയോഗിച്ച് 100 പേര്‍ക്ക് വരെ പറ്റുമെന്ന് പറയുന്നു, പരീക്ഷിച്ച് നോക്കിയിട്ടില്ല. ആറ് മാസം കൊണ്ട് എഴുത്ത്‌കുത്തിലൂടെ പരിഹരിക്കുന്ന കാര്യങ്ങള്‍ ഒരു മണിക്കൂറിലെ നേരിട്ടുള്ള ചര്‍ച്ചയിലൂടെ പരിഹരിക്കാം.

Anonymous said...

ഇതുകാണൂ “http://mallu-ungle.blogspot.com/2006/09/blog-post.html“
-സു-

Hussain Rachana said...

"ഹുസൈന്‍ പറയുന്ന ഭാഷാവിദഗ്ദ്ധരുടെ ലിസ്റ്റ്‌ ചിരിപ്പിക്കുന്നതാണെന്ന്‌ പറയാതിരിക്കാന്‍ വയ്യ." - ചന്ദ്രക്കാരന്‍

ചിരിയുടേയും (കരച്ചിലിന്റേയും) നാനാര്‍ത്ഥങ്ങള്‍ നമ്മെ പഠിപ്പിച്ച കോമാളികളുടെ പട്ടിക കാണുമ്പോള്‍ മറ്റെന്തു ചെയ്യാന്‍? അവന്‍മാര്‍ക്ക്‌ ഭാഷയുടേയും അക്ഷരമാലയുടേയും കാര്യങ്ങള്‍ അല്‍പം ഐടി ചേര്‍ത്ത്‌ വിളമ്പിയാല്‍, ഭേഷായി! ഇനിയൊരു നൂറുവര്‍ഷത്തേക്ക്‌ മണ്ണുകപ്പാന്‍ മറ്റൊന്നും തേടേണ്ടിവരില്ല.

പിരിയുന്ന സന്ധ്യയില്‍ നീ പറഞ്ഞു
ചിരിയായിരുന്നു നമുക്കു ഭാഷ
നമുക്കു പാത.
(കെ.ജി. ശങ്കരപ്പിള്ള: അയ്യപ്പപണിക്കര്‍ക്ക്‌)

കെവി said...

ഹുസൈന്‍ മാഷേ, രചനയുടെ ഒരു ഓപ്പറേറ്റിങ് സിസ്റ്റത്തെക്കുറിച്ചു് പത്രങ്ങളിലൂടെ കേട്ടു, പക്ഷേ എവിടെയും കാണാന്‍ പോലും കിട്ടിയില്ല. മാഷുക്കതിനെക്കുറിച്ചന്തെങ്കിലും വിവരമുണ്ടോ? മലയാളത്തെ എടുത്തമ്മാനമാടുന്ന ആദ്യത്തെ ഓപ്പറേറ്റിങ് സിസ്റ്റമെന്നൊക്കെയാണു് കേട്ടതു്. ഇപ്പോഴെന്റെ കൈയിലുള്ള ഉബുന്ദുവിനു് മലയാളം കൈകാര്യം ചെയ്യുന്നതില്‍ അത്ര ശുഷ്കാന്തി പോര, അതാണു് രചനയുടേതെന്നു് കേട്ടപ്പോള്‍ എനിയ്ക്കൊരിളക്കം. മാഷേ, അപ്പോ ഉബുന്ദു ഇപ്പോള്‍ ചെയ്യുന്നതിനേക്കാള്‍ എത്രത്തോളം മെച്ചമുണ്ടാകും രചനയുടെ ഓപ്പറേറ്റിങ് സിസ്റ്റം ഉപയോഗിച്ചാലു്? മറുപടിയ്ക്കു വേണ്ടി കാത്തിരിയ്ക്കുന്നു. ഞാന്‍ മാത്രമല്ല, പലരും.

സുറുമ || suruma said...

കെവീ,
ഉബുണ്ടുവില്‍ മലയാളം നന്നാക്കാന്‍ ഞാന്‍ ഒരു ഫോണ്ടും കുറച്ച് പാച്ചുകളും ഉണ്ടാക്കിയിട്ടുണ്ട്(സാധനം ഇവിടെ).

കെവീ പറഞ്ഞപോലെ രചനയുടെ മലയാളം ലിനക്സിനെപ്പറ്റി കൂടുതല്‍ അറിയാന്‍ ആഗ്രഹിക്കുന്നു.

viswaprabha വിശ്വപ്രഭ said...

അതുശരിയാണു മാഷേ!

ആവശ്യമെങ്കില്‍ ഇവിടെയുള്ള കൂട്ടുകാര്‍ക്കും രചനയുടെ മലയാളം OS-ല്‍ എന്തെങ്കിലും സഹായം ചെയ്യാന്‍ പറ്റിയാലോ!

ചര്‍ച്ചയുടെ അടുത്ത ഭാഗമായി നമുക്കൊരു കര്‍മ്മപരിപാടി വരച്ചെടുക്കണ്ടേ? അതില്‍ ഇതും ചേര്‍ക്കണം.

(പിന്നെ അന്നു ഹുസ്സൈന്മാഷുമായി സംസാരിച്ചതുപോലെ,)
1. നിലവിലുള്ള എന്‍‌കോഡിങ്ങ് പ്രശ്നങ്ങളില്‍, വസ്തുനിഷ്ടമായ ചര്‍ച്ച, വിശകലം, സമരഞ്ജനം, ശുപാര്‍ശകള്‍.

2. നിലവിലുള്ള യുണികോഡ് ഫോണ്ടുകളിലെ പ്രശ്നങ്ങള്‍ (സാങ്കേതികം, ലിഗേറ്റ് കോണ്‍ജുഗേറ്റ് സ്ഥാനനിര്‍ണ്ണയം, അച്ചടി/സ്ക്രീന്‍ അനുയുക്തത):വസ്തുനിഷ്ടമായ ചര്‍ച്ച, വിശകലം, സമരഞ്ജനം, ശുപാര്‍ശകള്‍.

സമരഞ്ജനത്തില്‍ ഉരുത്തിരിഞ്ഞുവരുന്ന ആശയങ്ങള്‍ കണക്കിലെടുത്ത് ഈ ഫോണ്ടുകള്‍ ഓരോന്നും അവ ആദ്യം ഉണ്ടാക്കിയവര്‍ തന്നെ മെച്ചപ്പെടുത്തി പുതിയ വേര്‍ഷനുകള്‍ ഉണ്ടാക്കട്ടെ.

3. യുണികോഡ് പ്രചാരണത്തിന് സാദ്ധ്യമായ മുന്നണികള്‍ കണ്ടെത്തലും പ്രേരിപ്പിക്കലും.

ഇവയ്ക്കു പുറമേ ആകാവുന്ന മറ്റു വിഷയങ്ങള്‍:

4.പരസ്പരം സമ്മതമാണെങ്കില്‍ മാത്രം, മേല്‍പ്പറഞ്ഞപോലെയുള്ള ഒറ്റയ്ക്കല്ലാതെ കൂട്ടായ OS വികസനം തുടങ്ങിയവ.

5.ഗോവിസാറിന്റെ ഗ്രന്ഥസൂചിക അടക്കം സാദ്ധ്യമായ ഭാഷാസമ്പത്തുകളൊക്കെ ഡിജിറ്റൈസ് ചെയ്ത് പൊതു ഉപയോഗത്തിന് തയ്യാറാക്കല്‍ തുടങ്ങിയവ.

ഈ ഇനങ്ങളില്‍ ഊന്നി ഈ കര്‍മ്മപരിപാടി ഒന്നു വൃത്തിയായി ചട്ടപ്പെടുത്താം നമുക്കിനി?

ആര്‍ക്കൊക്കെ എങ്ങനെയൊക്കെ പങ്കെടുക്കാം?
ഏതേതു സമയാവധികള്‍?

ദയവുചെയ്ത് നമുക്കെല്ലാം ചര്‍ച്ച ഇവിടെ തന്നെ തുടരാം.

സാങ്കേതികമായി ഇനി വിശദവിവരങ്ങളിലേക്കു കടക്കുന്നതുകൊണ്ട് വിരോധമില്ലെന്നു കരുതുന്നു.

സൌകര്യത്തിനു വേണ്ടി ഇംഗ്ലീഷിലും എഴുതുകയോ ഉദ്ധരിക്കുകയോ ചെയ്യാം.

കലേഷ്‌ കുമാര്‍ said...

ഹുസൈന്‍ മാഷേ, ഈ രചന ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തെക്കുറിച്ച് ഞാനും കേട്ടു. അതെക്കുറിച്ച് കേരളകൌമുദിയിലും സമകാലീന മലയാളത്തിലും ഒക്കെ വന്ന ഗംഭീരന്‍ റിപ്പോര്‍ട്ടുകളും വായിച്ചു. പക്ഷെ അത് എവിടെ കിട്ടുമെന്നോ എങ്ങനെ കിട്ടുമെന്നോ ഒന്നും ആരും എവിടെയും എഴുതി കണ്ടില്ല. ഈ വിഷയത്തെക്കുറിച്ച് താങ്കള്‍ക്ക് ഞാ‍നൊരു ഈ-മെയിലും അയച്ചിരുന്നു (ചിന്ത.കോം‌‌ല്‍ കൊടുത്തിരിക്കുന്ന വിലാസത്തിലേക്ക്). അതിനും മറുപടി കണ്ടില്ല. ചിന്തയിലെ പോളിനോടും ഞാനീ‍ വിഷയം സൂചിപ്പിച്ചിരുന്നു.
രചനയുടെ ഓ/എസ് എന്താണെന്നും അത് എവിടെ കിട്ടുമെന്നും ഒക്കെ ഒന്ന് വിശദീകരിച്ചാല്‍ കൊള്ളാമായിരുന്നു.

Hussain Rachana said...

Dear Friends

From Chintha sites I have for the fist time seen the that old news in Hindu. It is full of factual errors.

First of all, as I explained, I'm not the 'leader' of Rachana. R. Chitrajakumar is the project leader from the very beginning.

I'm totally away from the linux development mainly because of my ignorance in Linux.

I have participated in the Rachana meeting in February but I haven't given any interview or press release to any news paper including the Hindu.

Rajeev Sebastian is the man behind all linux coding and it is learnt that it will be released soon.

Hussain Rachana said...

ബെന്നിയുടെ അഭിപ്രായങ്ങളെകുറിച്ച്‌:

1998 ല്‍ ഡോ. പ്രബോധചന്ദ്രന്‍ നായരുടെ നേതൃത്വത്തിലുള്ള 'മലയാളത്തനിമ' പരിഷ്കരണപ്രകാരം 'പ്രകൃതി' എന്നതില്‍ ഋകാരം ഉണ്ടായിരുന്നില്ല! കേരള ഭാഷാ ഇന്‍സ്റ്റിറ്റ്യൂറ്റ്‌ അതിനെ ശക്തമായി പിന്താങ്ങിയിരുന്നു. എതിരായ ഒരഭിപ്രായം പൊന്തിയില്ലായിരുന്നുവെങ്കില്‍ അത്‌ സര്‍ക്കാര്‍ അംഗീകരിച്ചേനേ. ഈ ദുരന്തം നടക്കാതെ പോയത്‌ 1999ല്‍ രചനയുടെ സജീവമായ ഇടപെടല്‍ മൂലമായിരുന്നു. 1973ല്‍ സംഭവിച്ചതുപോലെ, ആരുമറിയാതെ ഈ 'റ'കാര ലിപി പാഠപുസ്തകങ്ങളില്‍ പ്രത്യക്ഷപ്പെട്ടേനെ. എങ്കില്‍ എന്താകുമായിരുന്നു ഭാഷാകമ്പ്യുട്ടിങ്ങിന്റെ ഇന്നത്തെ അവസ്ഥ? 'പ്രകൃതി'യുടെ Unicode rendering ഇന്ന്‌ എങ്ങനെയാകുമായിരുന്നു?


ലിപിയുടെ എണ്ണം കുറക്കലും വെട്ടിച്ചുരുക്കലും അത്ര ലളിതമായി കാണാന്‍ വയ്യ. അതൊരു വലിയ സാംസ്കാരിക പ്രശ്നമായാണ്‌ രചന കാണുന്നത്‌. നിത്യചൈതന്യ യതിയെപ്പോലുള്ളവര്‍ ഈ വിഷയത്തില്‍ ആഴത്തില്‍ ചിന്തിച്ചിരുന്നു.

'ഒരു ഭാഷയെ കൊല്ലാനുള്ള എളുപ്പ വഴി ലിപി മാറ്റലാണ്‍'എന്ന്‌ എം.ടി. എഴുതി.

അതുകൊണ്ട്‌ പ്രബോധചന്ദ്രന്‍ നായരുടെ ലിപിപരിഷ്കരണ അമിതാവേശം അത്ര നിര്‍ദ്ദോക്ഷമായി കാണാന്‍ കഴിയുന്നില്ല. പ്രത്യേകിച്ച്‌, ഇന്നും അദ്ദേഹവും ശിഷ്യരും സുഹൃത്തുക്കളും character encoding കമ്മിറ്റിയില്‍ സജീവസാന്നിദ്ധ്യമായുള്ളപ്പോള്‍.

ലിപി പരിഷ്കാരംകൊണ്ട്‌ ഭാഷയ്ക്ക്‌ നേട്ടമുണ്ടായി എന്ന ബെന്നിയുടെ പ്രസ്താവന അദ്ഭുതകരമായി തോന്നുന്നു. എന്തൊക്കെയാണ്‌ ആ നേട്ടങ്ങള്‍?

എണ്ണം കുറക്കുന്നതിനും ലളിതവല്‍ക്കരിക്കുന്നതിനും വേണ്ടി വാദിച്ച പെരിയോര്‍ എന്തു കൊണ്ട്‌ 'തമിഴ്പുലവര്‍ കൊണ്ടുവന്ന പതിനെട്ടുമെയ്യും പന്ത്രണ്ടുയിരുംചേര്‍ന്ന മുപ്പത്‌ ലിപികളുള്ള ലിപിമാല' അംഗീകരിച്ചില്ല?

മലയാളലിപിവ്യന്യാസത്തെ ലളിതവല്‍ക്കരിക്കാനുള്ള ഏറ്റവും 'നല്ല' നിര്‍ദ്ദേശം വന്നത്‌ 1930കളിലായിരുന്നു: 'മലയാളലിപിയെ റോമനൈസ്‌ ചെയ്യുക!' അതോടെ നമ്മുടെ ഭാഷ അന്തര്‍ദേശീയമായിത്തീരുകയും പഠിക്കാന്‍ എളുപ്പമുള്ളതായിത്തീരുകയും ചെയ്യുമായിരുന്നു! ഇതിനെതിരെ ഉയര്‍ന്ന സഞ്ജയന്റെ കൂര്‍ത്തപരിഹാസം എല്ലാ ലിപിലാളിത്യവാദങ്ങള്‍ക്കും എതിരെ എക്കാലവും പ്രസക്തമാണ്‌.

സുഹ്രുത്തുക്കള്‍ പറയുന്നതുപോലെ പഴയ-പുതിയ ലിപിപ്രശ്നങ്ങള്‍ രചന ഇറങ്ങിയ 1999 ലുള്ളതുപോലെ ഇന്ന്‌ പ്രസക്തമല്ല. തിരമൊഴിയില്‍ യൂണികോഡിന്റെ വ്യാപനം മലയാളത്തിന്റെ തനതുലിപിയുടെ ആഘോഷമായി മാറും എന്ന്‌ ഞാന്‍ കരുതുന്നു. പരിഷ്കരിച്ച ലിപി പഠിച്ച പുതിയ തലമുറയിലുള്ള കുട്ടികള്‍ പോലും പഴയലിപിയെ സഹര്‍ഷം സ്വാഗതം ചെയ്യുന്ന കാഴ്ചയാണ്‍ എങ്ങും കാണുന്നത്‌. തനതിന്റെ എണ്ണം പറഞ്ഞ കുറച്ച്‌ ഫോണ്ടുകളും Unicode compliant DTP packages, പ്രത്യേകിച്ച്‌ Pagemaker ഉം വന്നാല്‍ പത്രങ്ങളടക്കം മലയാളത്തിലെ ഭൂരിപക്ഷം പ്രസിദ്ധീകരണങ്ങളും തനതു ലിപിയിലാകാന്‍ അധിക വര്‍ഷം എടുക്കില്ല.

അതുകൊണ്ട്‌ ഇത്തരം വ്യാപകമായ ഷിഫ്റ്റ്‌ സംഭവിക്കും മുമ്പേ, ബെന്നി സൂചിപ്പിക്കും പോലെ, ജീവല്‍പ്രധാനമായ കാര്യം Unicode Encoding എന്നന്നേക്കുമായി fix ചെയ്യുക എന്നതുതന്നെയാണ്‌. ലോഹടൈപ്പുകളുടെ കാലത്ത്‌ തെറ്റുകള്‍ സംഭവിച്ചാല്‍ തിരുത്താന്‍ സാവകാശങ്ങളുണ്ടായിരുന്നു. നിലവിലുള്ള encoding പ്രശ്നങ്ങളില്‍ Unicode Consortium അപക്വമായ തീരുമാനങ്ങളെടുത്താല്‍ പിന്നീട്‌ ഇഷ്ടാനുസരണം തള്ളാനും കൊള്ളാനും നമുക്ക്‌ കഴിയാതെ വരും.

ഗ്ലിഫുകളുടെ ഏകീകരണത്തെകുറിച്ചുള്ള ബെന്നിയുടെ നിര്‍ദ്ദേശം ശ്രദ്ധേയമാണ്‌. ഇക്കാര്യത്തില്‍ ചില ചിന്തകള്‍ എനിക്കുണ്ട്‌. വിശദമായി പിന്നീടാകാം.


പിന്‍കുറിപ്പ്‌:

ലിപിപരിഷ്കരണത്തിന്‌ ചുക്കാന്‍പിടിച്ച എന്‍.വി.കൃഷ്ണവാരിയര്‍ക്ക്‌ മലയാളത്തെ കൂടുതല്‍ ലളിതവല്‍ക്കരിക്കാനും സുഗമമാക്കാനും ശാസ്ത്രീയമായ വേറെയും ചിന്തകള്‍ ഉണ്ടായിരുന്നതായി മാങ്ങാട്‌ രത്നാകരന്‍ ഒരിക്കല്‍ എഴുതികണ്ടു.

ഈ=അീ‍
ഊ=അൂ‍,....

എന്നിങ്ങനെ!!

പെരിങ്ങോടന്‍ said...

ഹുസൈന്‍ മാഷേ ഈ ചര്‍ച്ചയില്‍ ആരും ‘യന്ത്രത്തിനു വേണ്ടിയുള്ള ലിപി പരിഷ്കരണത്തിനെ’ പിന്‍‌താങ്ങുന്നുവെന്നു കരുതുന്നില്ല. എന്നാല്‍ യന്ത്രത്തിനു പൂര്‍ണ്ണമായും ഭാഷയെ മനസ്സിലാക്കുവാന്‍ ചില്ലുകള്‍, രേഫം എന്നിവ എന്‍‌കോഡ് ചെയ്യേണ്ട ആവശ്യകതയെ കുറിച്ചെല്ലാം പലരും അനുബന്ധ വേദികളില്‍ എഴുതിയിട്ടുള്ളതാണു്. ഈ കാര്യങ്ങളിലാണല്ലോ നമ്മള്‍ എത്രയും പെട്ടെന്നു തീരുമാനങ്ങള്‍ എടുക്കേണ്ടതും. പത്രത്തില്‍ വന്ന വാര്‍ത്ത തെറ്റാണെന്നു ഏറെക്കുറെ എല്ലാവര്‍ക്കും ബോധ്യമായിക്കാണും, യൂണികോഡില്‍ മലയാളം ലിപി വെട്ടിമുറിക്കുവാന്‍ നീക്കങ്ങളൊന്നും നടക്കുന്നില്ലെന്നാണു ബോധ്യമായിരിക്കുന്നതു്.

മലയാളത്തിനെ റോമനൈസ് ചെയ്യാമെന്ന 1930 -ലെ വാദം കേട്ടപ്പോള്‍ നെഞ്ചുവേദനിച്ചു പോയി :(

കെവി said...

എന്റമ്മോ, മലയാളത്തെ ചതുരത്തിലെഴുതേണ്ടി വരുമായിരുന്ന അവസ്ഥ കേട്ടു് ഞാനും ഞെട്ടുന്നു. ആലോചിയ്ക്കാന് വയ്യ.

Hussain Rachana said...

പെരിങ്ങോടന്‍,

ലിപിയുടെ വെട്ടിമുറിക്കല്‍ എന്ന സങ്കല്‍പം താത്വികമായിത്തന്നെ യൂണികോഡിലില്ല. ഭാഷയിലെ അടിസ്ഥാന അക്ഷരങ്ങളേയും അവയില്‍നിന്നും നിഷ്പദിച്ചുണ്ടാകുന്ന സംയുക്തങ്ങളേയും (ligatures) ഉള്‍ക്കൊള്ളുന്ന സമഗ്രലിപിസഞ്ചയത്തേയും ഒപ്പം ലോകഭാഷകളേയും സംരക്ഷിക്കുകയും പ്രയോഗക്ഷമമാക്കുകയും ചെയ്യുക എന്ന യൂണികോഡിന്റെ ലക്ഷ്യം സങ്കേതികം മാത്രമല്ല സാംസ്കാരികം കൂടിയാണ്‌. യൂണികോഡിന്റെയും ഓപ്പണ്‍ ടൈപ്പിന്റെയും വ്യാപനവും പ്രവര്‍ത്തകങ്ങളിലുള്ള സമന്വയീകരണങ്ങളും (embedding) നമ്മുടെ ഭാഷാ ഇന്‍സ്റ്റിറ്റ്യുട്ടിന്റേയും 'മലയാളതനിമ'ക്കാരുടേയും ക്ലിക്കിന്റേയും സ്വപ്നങ്ങളെ എന്നന്നേക്കുമായി കൊന്നിരിക്കുന്നു. ലിപി വിഷയത്തില്‍ അവരുടെ വെളിപാടുകള്‍ക്ക്‌ ഇനി യാതൊരു പ്രസക്തിയുമില്ല. തനതുലിപിയുടെ കാര്യത്തില്‍ രചനയുടെ 'കുത്തക'യും തകര്‍ന്നിരിക്കുന്നു. അഞ്ജലിയെപ്പോലെ ഒരു നൂറുപുഷ്പങ്ങള്‍ വിരിയട്ടെ

എന്‍കോഡിങ്ങില്‍ നിലനില്‍ക്കുന്ന ചില അവ്യക്തത്കള്‍ മാത്രമാണ്‌ ശേഷിക്കുന്ന പ്രധാന പ്രശ്നം. എത്രയും വേഗം അവയ്ക്ക്‌ പരിഹാരം കാണ്ടെത്തുമെന്ന്‌ നമുക്ക്‌ പ്രത്യശിക്കാം. ആസ്ഥാന കമ്മറ്റികളില്‍ ഉപവിഷ്ഠരായിരിക്കുന്ന വെട്ടിമുറിയന്‍മാര്‍ക്കുനേരെ പക്ഷേ നമുക്കൊരു കണ്ണുവേണം.

ഹുസൈന്‍, രചന

Hussain Rachana said...

പെരിങ്ങോടന്‍,

ലിപിയുടെ വെട്ടിമുറിക്കല്‍ എന്ന സങ്കല്‍പം താത്വികമായിത്തന്നെ യൂണികോഡിലില്ല. ഭാഷയിലെ അടിസ്ഥാന അക്ഷരങ്ങളേയും അവയില്‍നിന്നും നിഷ്പദിച്ചുണ്ടാകുന്ന സംയുക്തങ്ങളേയും (ligatures) ഉള്‍ക്കൊള്ളുന്ന സമഗ്രലിപിസഞ്ചയത്തേയും ഒപ്പം ലോകഭാഷകളേയും സംരക്ഷിക്കുകയും പ്രയോഗക്ഷമമാക്കുകയും ചെയ്യുക എന്ന യൂണികോഡിന്റെ ലക്ഷ്യം സങ്കേതികം മാത്രമല്ല സാംസ്കാരികം കൂടിയാണ്‌. യൂണികോഡിന്റെയും ഓപ്പണ്‍ ടൈപ്പിന്റെയും വ്യാപനവും പ്രവര്‍ത്തകങ്ങളിലുള്ള സമന്വയീകരണങ്ങളും (embedding) നമ്മുടെ ഭാഷാ ഇന്‍സ്റ്റിറ്റ്യുട്ടിന്റേയും 'മലയാളതനിമ'ക്കാരുടേയും 'ക്ലിക്കി'ന്റേയും സ്വപ്നങ്ങളെ എന്നന്നേക്കുമായി കൊന്നിരിക്കുന്നു. ലിപി വിഷയത്തില്‍ അവരുടെ വെളിപാടുകളുടെ അപഹാസ്യത അവരില്‍ ചിലര്‍ക്കെങ്കിലും ഇപ്പോള്‍ ബോദ്ധ്യമായിക്കാണും. തനതുലിപിയുടെ പുനരുദ്ധാരണവും വ്യാപനവും സ്വീകാര്യതയും 99ലെ രചനയുടെ സ്വപ്നത്തേക്കാള്‍ വേഗത്തില്‍ ഇന്ന്‌ സംഭവിച്ചുകൊണ്ടിരിക്കുന്നു. അഞ്ജലിയെപ്പോലെ നൂറുപുഷ്പങ്ങള്‍ വിരിയട്ടെ

എന്‍കോഡിങ്ങില്‍ നിലനില്‍ക്കുന്ന ചില അവ്യക്തത്കള്‍ മാത്രമാണ്‌ ശേഷിക്കുന്ന പ്രധാന പ്രശ്നം. എത്രയും വേഗം അവയ്ക്ക്‌ പരിഹാരം കാണ്ടെത്തുമെന്ന്‌ നമുക്ക്‌ പ്രത്യാശിക്കാം. ആസ്ഥാന കമ്മറ്റികളില്‍ ഉപവിഷ്ഠരായിരിക്കുന്ന വെട്ടിമുറിയന്‍മാര്‍ക്കുനേരെ പക്ഷേ നമുക്കൊരു കണ്ണുവേണം.

ഹുസൈന്‍, രചന

ബെന്നി::benny said...

ഹുസ്സൈന്‍, ആരെയാണ് തമിഴ് പുലവര്‍ എന്ന് ഉദ്ദേശിച്ചത്? തമിഴില്‍ ബിരുദം എടുത്തവരെയൊക്കെ തമിഴ് പുലവര്‍ എന്നാണ് വിളിച്ചുകാണുന്നത്. “പതിനെട്ടുമെയ്യും പന്ത്രണ്ടുയിരുംചേര്‍ന്ന മുപ്പത്‌ ലിപികളുള്ള ലിപിമാല” കൊണ്ടുവന്നത് ആരാണ്?

(ഹുസ്സൈന്‍റെ മറ്റുള്ള വാദങ്ങള്‍ വായിച്ചു, തികച്ചും ന്യായം.)

Ralminov said...

യൂണിക്കോഡില്‍ ചില്ലിനേക്കുറിച്ച് ഒരു ചര്‍ച്ചയുണ്ടായിരുന്നല്ലോ..
ര്‍ കിട്ടാന്‍ ര ആണോ, റ ആണോ ബേസ് വേണ്ടതെന്ന്....
ക്ര എന്നെഴുതാന്‍ ക ്ര മതിയെങ്കില്‍ കര്‍ എഴുതാനും കര് zwj പോരേ...
അതായത് ര തന്നെ ബേസായി ഉപയോഗിച്ചുകൂടേ....

സിബു::cibu said...

നല്ല ചോദ്യം. ഇതിനുള്ള ഉത്തരം വിശദമായി എറിക് മുള്ളര് ഇവിടെ എഴുതിയിരിക്കുന്നു. ചുരുക്കത്തില്‍ ഇങ്ങനെ പറയാം:

* ഉച്ചാരണം നോക്കിയല്ല എഴുത്തിനുപയോഗിക്കുന്ന അടിസ്ഥാനഅക്ഷരം എന്താണെന്ന്` തീരുമാനിക്കുന്നത്‌. അതുകൊണ്ട് തന്നെ, ‘ക്ര’യും ‘കര്‍’ഉം തമ്മിലുള്ള റാല്‍മിനോവ് ഉദ്ദേശിച്ച സാമ്യം ഇല്ലാതെയാവുന്നു.
* അടിസ്ഥാന അക്ഷരം ഏതാണെന്ന്` തീരുമാനിക്കാന്‍ ഭാഷാശാസ്ത്രപരമായ പ്രത്യേകതകളാണ് കണക്കിലെടുക്കാറ്‌ പലപ്പോഴും പറഞ്ഞ ഉദാഹരണം: അവര്‍ + അല്ല > അവരല്ല. അതില്‍ നിന്നും ‘ര്‍’ എന്നത് ‘ര’യുടെ മറ്റൊരു രൂപം ആണെന്ന്` തെളിയുന്നു. അതുപോലെ, ‘ഞായര്‍’ + ‘അല്ല’ > ഞായറല്ല എന്നതില്‍ നിന്നും ‘ര്‍’ എന്നത്‌ ‘റ’യുടെ രൂപവും ആണെന്ന്‌ വരുന്നു.

Ralminov said...

ഞാനുദ്ദേശിച്ചത് ഒരു consensus ലേക്ക് എത്തുന്നതിലേക്കുള്ള സാദ്ധ്യതയേയാണ്. ഈ പ്രശ്നം അനന്തമായി തുടരുന്നതില്‍ അര്‍ത്ഥമില്ല. മാത്രമല്ല ബെന്നിയാണെന്ന് തോന്നുന്നു, മുമ്പ് സൂചിപ്പിച്ചത് പോലെ മറ്റ് ദ്രാവിഡ ഭാഷകളിലും ര തന്നെയാണ് ബേസ്..
അല്ലെങ്കില്‍ ചില്ലുകള്‍ വേറെ എന്‍കോഡ് ചെയ്യണം. അതില്‍ എന്താ ഇത്ര തര്‍ക്കം!!!

Ralminov said...

എന്ത് കൊണ്ട് ചില്ല് എന്‍കോഡ് ചെയ്യുന്നില്ല...

അവന്‍ അല്ല -> അവനല്ല ആയതു കൊണ്ടാണോ.....
അങ്ങനെയെങ്കില്‍ ...
കരി ഇല്ല -> കരിയില്ല ആവുന്നതോ...

മത്സരം, മത്സ്യം, ഭീഭത്സം = മല്‍സരം, മല്‍സ്യം, ഭീഭല്‍സം !!!
ത = ല !!!

പിന്നെ അര്‍ത്ഥവ്യത്യാസങ്ങള്‍!!!..
നല്ലതാളി, കാതിലോല !!! കേട്ടിട്ടില്ലേ...

കരിയില്ല എന്നെഴുതിയാല്‍ കരി(ആന, കാര്‍ബണ്‍) ഇല്ലെന്നാണോ കരിയുകയില്ലെന്നാണോ?
അര്‍ത്ഥം സാന്ദര്‍ഭികമാണ്.

അത് കൊണ്ടുതന്നെ ഭാഷയുടെ മുകളില്‍ അധികം കെട്ടിമറിയാതെ ചില്ല് എന്‍കോഡ് ചെയ്യുന്നതാവും ഉചിതം...

സിബു::cibu said...

എന്ത് കൊണ്ട് ചില്ല് എന്കോഡ് ചെയ്യുന്നില്ല...
അവന് അല്ല -> അവനല്ല ആയതു കൊണ്ടാണോ.....
അങ്ങനെയെങ്കില് ...
കരി ഇല്ല -> കരിയില്ല ആവുന്നതോ...

ഇവിടെ രണ്ട് സ്വരങ്ങള്‍ തമ്മില്‍ ചേരുന്നുണ്ട്‌. പക്ഷെ, എന്താണ് തെളിയിക്കാന്‍ ശ്രമിക്കുന്നത്‌? അതിനുമുമ്പുള്ള ഉദാഹരണത്തില്‍ സ്വരമില്ലാത്ത ഒരു വ്യഞ്ജനവും ‘അ’യും തമ്മില്‍ ചേരുമ്പോള്‍ ആ വ്യഞ്ജനം അതിന്റെ ‘അ’ ചേര്‍ന്ന സ്വാഭാവികരൂപത്തില്‍ ആവുന്നു. അതില്‍ നിന്ന്‌ സ്വരമില്ലാത്ത രൂപത്തിന്റെ സ്വാഭാവികരൂപം ഏതാണെന്നും വെളിപ്പെടുന്നു.

മത്സരം, മത്സ്യം, ഭീഭത്സം = മല്സരം, മല്സ്യം, ഭീഭല്സം !!!

ഉവ്വ്‌. ‘ല’യുടേയും ‘ത’യുടേയും ചിലായി ‘ല്‍’ മലയാളികള്‍ ഉപയോഗിക്കുന്നുണ്ട്‌.


പിന്നെ അര്ത്ഥവ്യത്യാസങ്ങള്!!!..
നല്ലതാളി, കാതിലോല !!! കേട്ടിട്ടില്ലേ...
കരിയില്ല എന്നെഴുതിയാല് കരി(ആന, കാര്ബണ്) ഇല്ലെന്നാണോ കരിയുകയില്ലെന്നാണോ?

ഒരു വാക്കിന് വിവിധ അര്‍ഥങ്ങള്‍ ഉണ്ടാവാം; അത്‌ പലരീതിയില്‍ വായിക്കപ്പെടാം (eg: read). എന്നാല്‍ അതൊന്നും യുണീക്കോഡിന് വിഷയമല്ല. ഇവിടെ എഴുത്തിലുള്ള വ്യത്യാസങ്ങള്‍ മാത്രമേ പഠിക്കുന്നുള്ളൂ.

Ralminov said...

അതാണു് റൂള്‍ എന്നറിയാതെ എഴുതിയതാണ്.


ചില്ല് ചില്ലായി എന്‍കോഡ് ചെയ്താല്‍ എന്ത് പറ്റും?
(അതാണ് സിബുവിന്റെ നിലപാട് എന്ന് തോന്നുന്നു)

ഓ.ടോ സിബു എന്റെ കമന്റ് ക്വോട്ട് ചെയ്തപ്പോള്‍ ZWJ എവിടെപ്പോയി? മാത്രമല്ല സിബുവിന്റെ സൈറ്റുകള്‍ ചില്ലുകള്‍ കാണുന്നില്ല..(Windows XP SP2, FireFox 1.5) It is okay in IE. But my sites and many other sites are showing properly in both..

Also I had put a comment regarding reph in cibu's blog.. May be another foolishness.

Hussain Rachana said...

ബെന്നി,

തമിഴ്‌ പുലവരുടെ ലിപിമാലയെക്കുറിച്ചുള്ള പരാമര്‍ശം ഡോ. പുതുശ്ശേരി രാമചന്ദ്രനെ ഉദ്ധരിച്ചതാണ്‌. ദ്രാവിഡ ലിപികളില്‍ അദ്ദേഹം ആഴത്തില്‍ ഗവേഷണം ചെയ്തിട്ടുണ്ട്‌.

Ralminov said...

ഞാനിപ്പഴും ഒരു കുട്ടിയാണെന്നാണ് എന്റെ വിചാരം.. അത്കൊണ്ടു് തന്നെ എന്റെ സംശയവും തീരില്ല...

ദയവായി ഇവിടെ കാണൂ

സിബു::cibu said...

റാല്‍മിനോവ് പറഞ്ഞത്‌ കാര്യം. ZWJ, ZWNJ എന്നിവ ഫോര്‍മാറ്റ് കണ്ട്രോള്‍ ചെയ്യുന്നവയുടെ ഗണത്തിലാണ് പെടുക. ഫോര്‍മാറ്റ് എന്നാല്‍ ബോള്‍ഡ്, ഇറ്റാലിക്സ് എന്നിവ. ഇത്തരം ക്യാരക്റ്റേഴ്സ് എടുത്തുവയ്ക്കണോ വേണ്ടയോ എന്ന്‌ എവിടേയ്ക്കാണോ കോപ്പി ചെയ്യുന്നത്‌ ആ അപ്ലിക്കേഷന്‍ തീരുമാനിക്കും. വേഡില്‍ നിന്നും നോട്ട്പാഡിലേയ്ക്ക്‌ കോപ്പി ചെയ്യുമ്പോള്‍ അത്‌ ഫോര്‍മാറ്റ് കണ്ട്രോള്‍ ഒക്കെ എടുത്തുകളയുമായിരിക്കണം.

ചില്ലുകള്‍ എന്‍‌കോഡ് ചെയ്യപ്പെടുവാന്‍ ഈ ഒരു പ്രശ്നം ഒരു വലിയ കാരണമാണ്. ചില്ലുകള്‍ സ്റ്റാന്റേഡിലെത്താനുള്ള ഒരു കടമ്പ(വോട്ടിങ്)കൂടി വിജയകരമായി പൂര്‍ത്തിയാക്കുന്നു എന്ന മെയില്‍ കഴിഞ്ഞ ദിവസം ഇന്‍ഡിക് ലിസ്റ്റില്‍ ഉണ്ടായിരുന്നു.

ഓഫ്: കമന്റില്‍ എഴുതുന്നവരുടെ ഫോട്ടോ ഡിസ്പ്ലേ ചെയ്യാനുള്ള ഓപ്ഷന്‍ എടുത്തു കളയാമോ. അത്‌ പേജ് ലോഡ് ചെയ്യാന്‍ വല്ലാതെ താമസമുണ്ടാക്കുന്നു.

സുറുമ || suruma said...

സിബു:
ZWJ, ZWNJ എന്നിവ ഫോര്‍മാറ്റ് കണ്ട്രോള്‍ ചെയ്യുന്നവയുടെ ഗണത്തിലാണ് പെടുക

ZWNJ എന്നത് ബോള്‍ഡ്, ഇറ്റാലിക്സ് എന്നിവ പോലെയാണോ?.syllable പിരിക്കുവാന്‍ ആണ് ZWNJ പ്രയോജനപ്പെടുന്നത്.അപ്ലിക്കേഷനുകള്‍ ഇതിനെ അവഗണിക്കുകയാണെങ്കില്‍ പിന്നെ ഇതിന്റെ ആവശ്യമെന്താണ്?.അപ്ലിക്കേഷനുകള്‍ ആണ് തിരുത്തപ്പെടേണ്ടത്.ഇത്തരം control charactersനെ റെന്‍ഡറിങ്ങിനു മാത്രമായി പരിമിതപ്പെടുത്തുന്നത് ശരിയാണോ? എന്റെ അഭിപ്രായത്തില്‍ space എപ്രകാരം വാക്കുകളെ പിരിക്കുന്നുവോ ഏതാണ്ട് അതുപോലെയാണ് ZWNJ syllableനെ പിരിക്കുന്നത്.ഇങ്ങനെ പിരിക്കുന്നത് ഒഴിവാക്കാനാകാത്ത പല സന്ദര്‍ഭങ്ങളുമുണ്ട്(ഉദാ: അറബിയിലുള്ള ചില വാക്കുകള്‍ മലയാളത്തില്‍ എഴുതുമ്പോള്‍).

ഞാന്‍ നേരത്തെ സൂചിപ്പിച്ച പോലെ ചില്ല് എന്‍കോഡ് ചെയ്യുന്നത്(unicode philosophyക്ക് എതിരാണെങ്കിലും) ഒരു സൌകര്യം ആണ്(sorting പ്രശ്നമാകില്ലെങ്കില്‍).അതേസമയം ZWNJ ഒരു ആവശ്യകത ആണെങ്കില്‍ ZWJ കൂടി ആകാവുന്നതാണ്.അങ്ങനെ വരുമ്പോള്‍ ചില്ല് എന്‍കോഡ് ചെയ്യുന്നത് redundant ആകും.

അതുകൊണ്ട് ZWJ,ZWNJ എന്നിവയ്ക്ക് മറ്റു control charactersല്‍ നിന്ന് ഭിന്നമായി, പ്രത്യേക പരിഗണന നല്‍കേണ്ടതുണ്ട്.

കെവി said...

http://www.unicode.org/charts/PDF/U2000.pdf
ഈ രേഖയിലെ മൂന്നാംപേജില്‍ zwj & zwnj-കള്‍ format characters എന്നാണു് യുണിക്കോഡ് നിര്‍വ്വചിച്ചിരിക്കുന്നതു്. അവകളുടെ സ്വഭാവം മാറ്റാന്‍ വയ്യാത്തതുകൊണ്ടാണു് യുണിക്കോഡ് ചില്ലുകള്‍ എന്‍കോഡു ചെയ്യാന്‍ തീരുമാനിച്ചതു്.

സിബു::cibu said...

സുറുമ, ZW(N)J ഒരു ഫോര്‍മാറ്റ് കാരക്റ്ററാണെന്നുള്ളത്‌ കെവിന്‍ കാണിച്ചു തന്നുവല്ലോ.

സുറുമ ചിന്തിച്ച പോലെ ചിന്തിച്ച്‌ ഗണേശന്‍ (ഒരു തമിഴന്‍) ഒരു പ്രപ്പോസല്‍ കണ്‍സോര്‍ഷ്യത്തിനു മുന്നില്‍ വച്ചിരുന്നു. ZW(N)J ഫോര്‍മാറ്റിങ് അല്ലാത്ത കാര്യങ്ങള്‍ക്ക്‌ stable അല്ലാത്തതിനാല്‍ (ആ ഓപ്പറേഷനുകളില്‍ എടുത്ത്‌ കളയപ്പെടുമോ ഇല്ലയോ എന്ന്‌ ഉറപ്പില്ലാത്തതിനാല്‍), CHILLU SIGN എന്ന ഒരു പുതിയ അക്ഷരം കൊണ്ടുവന്ന്‌ ചില്ലുകളുടെ പ്രശ്നം സോള്‍വ് ചെയ്യാം എന്ന്‌. അതിനെ പറ്റിയുള്ള എന്റെ പരാതികള്‍ ഇവിടെ.

ഓട്ടോ: ആരെങ്കിലും ബൂലോഗക്ലബ്ബില്‍ കമന്റിന്റെ കൂടെ ഫോട്ടോ ഡിസ്പ്ലേ ചെയ്യുന്നത്‌ എടുത്തുമാറ്റിയാല്‍ വലിയ ഉപകാരം.

വിശ്വപ്രഭ viswaprabha said...

Cibu:"ഓട്ടോ: ആരെങ്കിലും ബൂലോഗക്ലബ്ബില്‍ കമന്റിന്റെ കൂടെ ഫോട്ടോ ഡിസ്പ്ലേ ചെയ്യുന്നത്‌ എടുത്തുമാറ്റിയാല്‍ വലിയ ഉപകാരം. "

ഇതില്‍ എവിടെയാണ് സിബൂ ഫോട്ടോകള്‍ വരുന്നത്? ഇന്നാളും എഴുതിയതു കണ്ട് ഞാന്‍ അരിച്ചുപെറുക്കി നോക്കിയിരുന്നു.
ഇപ്പോഴത്തെ settings വെച്ച് profile images കമന്റുകളുടെ കൂടെ വരില്ലല്ലോ!

:(?

സിബു::cibu said...

എന്തത്ഭുതം! ഇപ്പോള്‍ ഫോട്ടോകളില്ല. പെരിങ്ങോടരുടെ മുഖത്തിനു തൊട്ടടുത്താണ് ഞാനാകമന്റിട്ടതെന്നുറപ്പാണ്. എന്തായാലും ഇപ്പോള്‍ പ്രശ്നങ്ങളില്ല. നന്നായി.

സുറുമ || suruma said...

സിബൂ,
സിബു പറയുന്ന പോലെയെങ്കില്‍, 'ര','റ' എന്നവ, ചില്ലിന്റെ കാര്യത്തിലെന്നപോലെ, post base ആയി വരുമ്പോഴും പ്രശ്നങ്ങള്‍ ഉണ്ടാകുന്നില്ലേ?അതുപോലെ 'ല', 'ള' എന്നിവയും.ligature formationല്‍ 'ക്‌ലബ്ബ്' ആണോ 'ക്ളബ്ബ്' ആണോ ശരി?ഇതോക്കെ കാണിക്കുന്നത് യൂണികോഡിന്റെ പരിമിതികളെയാണ്.

സിലബ്ള്‍ പിരിക്കുന്ന കാര്യത്തെപ്പറ്റി സിബുവിന്റെ അഭിപ്രായം അറിഞ്ഞില്ല.

സിബു::cibu said...

സുറുമ, സിലബിള്‍ ഒരു ഫൊണറ്റിക് പ്രോപര്‍ട്ടി ആണ്. എഴുത്തില്‍ അതിന് സമാനമായ കാര്യമാണ് ക്ലസ്റ്റര്‍ (രണ്ടും ഒന്നല്ല). ഒരു ക്ലസ്റ്ററിന്റെ തന്നെ, അര്‍ഥവ്യത്യാസമില്ലാത്ത രണ്ട്‌ രൂപങ്ങളെ കാണിക്കാന്‍ ഫോര്‍മാറ്റ് ക്യാരക്റ്റേഴ്സ് ഉപയോഗിക്കാം.

എല്ലാ അപ്ലിക്കേഷനുകള്‍നും ഫോര്‍മാറ്റ് പ്രിസര്‍വ് ചെയേണ്ട ആവശ്യമില്ല. ഉദാഹരണത്തിന് ഗൂഗിളിന്റെ സേര്‍ച്ച് ഡാറ്റാബേസ്. മലയാളത്തിലൊരുദാഹരണമായി ‘ശബ്ദം’ ‘ശബ്‌‌ദം’ എന്നീ രണ്ട്‌ രൂപങ്ങളെ എടുക്കാം. ഇവിടെ അര്‍ഥവ്യത്യാസമില്ല; രൂപവ്യത്യാസമേ ഉള്ളൂ. അതിനാല്‍ ഇവ തമ്മില്‍ വേര്‍തിരിക്കുന്നത്‌ ഫോര്‍മാറ്റിംഗ് ആവണം - ‘aflame'-ഉം ‘aflame'-ഉം പോലെ.

ഇത്‌ സ്പേസ് വാക്കുകളെ പിരിക്കും പോലെ അല്ല - സ്പേസില്‍ മാത്രം വ്യത്യാസമുള്ള ‘a flame'-ഉം 'aflame'-ഉം തമ്മില്‍ അര്‍ഥവ്യത്യാസമുണ്ടാവുന്നുണ്ടല്ലോ.

ZW(N)J ഉപയോഗിച്ചാല്‍ അര്‍ഥവ്യത്യാസം ഒരിക്കലും ഉണ്ടാവാന്‍ പാടില്ലാത്തതാണ്. അര്‍ഥവ്യത്യാസമുണ്ടാക്കുന്ന അറബി ഉദാഹരണങ്ങള്‍ എഴുതാമോ...

‘പ്ല’-യില്‍ ‘ള’ ആണോ ‘ല’ ആണോ എന്നത്‌ ഒരു ചോദ്യമാണ്. ഇപ്പോള്‍ യുണിക്കോഡില്‍ അത്‌ ‘ല’ തന്നെയാണ്; ‘ള’ അല്ല. മറിച്ചാണ് എന്ന് ഉച്ചാരണം വച്ച്‌ തോന്നുമെങ്കിലും ഉച്ചാരണം എഴുത്തിന്റെ കാര്യങ്ങള്‍ തെളിയിക്കാന്‍ ഉപയോഗിക്കാവുന്ന ഒന്നല്ല. അതുകൊണ്ട്‌, ഉച്ചാരണം ഉപയോഗിക്കാതെ അതില്‍ ഏതാണെന്ന്‌ തെളിയിക്കാന്‍ നോക്കണം.

‘പ്ലാവ്’ എന്നവാക്ക്‌ ‘പിലാവ്’ എന്നതില്‍ നിന്നായതുകൊണ്ട്‌, അവിടെ ‘ല’ ആണ് എന്ന്‌ സമര്‍ഥിക്കാന്‍ എളുപ്പമാണ്. തിരിച്ച്‌ പറയാന്‍ ഞാന്‍ ഉദാഹരണമൊന്നും കണ്ടില്ല. കൂടാതെ, മദ്ധ്യമങ്ങള്‍ക്ക്‌ ചിഹ്നങ്ങള്‍ ഉപയോഗിക്കുന്നത്‌ ഗ്രന്ഥലിപി രീതിയാണ്. അതുകൊണ്ടുതന്നെ, (പിലാവ്, പ്ലാവ്) പോലെ, ‘ള’ ഉപയോഗിച്ചുള്ള ജോഡികള്‍ കണ്ടെത്തുക ദുഷ്ക്കരമായിട്ടാണനുഭവം. കിട്ടിയാല്‍ അറിയാന്‍ വളരെ താത്പര്യമുണ്ട്‌.

സുനില്‍ said...

മറ്റൊരു കര്‍മ്മയോഗിയുടെ കമന്റുകള്‍ ഇവിടെ വായിക്കാം.
http://paivakil.blogspot.com/2006/10/chillu-encoding.html
-സു-

ലോനപ്പന്‍ (Devadas) said...
This comment has been removed by the author.
കെവിന്‍ & സിജി said...

കുളംകലക്കല്‍ നടത്തുന്നത് ആദ്യമാറ്റിട്ടൊന്നുമല്ല

ലോനപ്പേട്ടന്‍ എന്താ ഉദ്ദേശിച്ചതു്? ഇവിടെ ആരു കുളം കലക്കിയെന്നാ?

ഷിജു അലക്സ്‌‌: :Shiju Alex said...

ലോനപ്പേട്ടന്‍ കഥയറിയാതെ ആട്ടം കണ്ട് അഭിപ്രായം പറഞ്ഞതാണെന്ന് തോന്നുന്നു.

സുറുമ || suruma said...

സിബൂ,
കൂട്ടക്ഷരം പിരിച്ചെഴുതുന്ന കാര്യമല്ല ഉദ്ദേശിച്ചത്.അതുകൊണ്ട് ‘ശബ്ദം’, ‘ശബ്‌‌ദം’ എന്നീ ഉദാഹരണങ്ങള്‍ ഇവിടെ പ്രസക്തമാണെന്നു തോന്നുന്നില്ല.മറ്റു പല സന്ദര്‍ഭങ്ങളിലും കൂട്ടക്ഷരം ഉണ്ടാകുന്നത് ഒഴിവാക്കേണ്ടതുണ്ട്.

ഉദാഹരണത്തിന്,

1.പേരുകള്‍ എഴുതുമ്പോള്‍: സ്വന്തം പേര് എങ്ങിനെ എഴുതണമെന്നത് ഓരോ വ്യക്തിയുടെയും താല്പര്യമാണ്.'നിതീഷ്‌കുമാര്‍' എന്നത് 'നിതീഷ്കുമാര്‍' ആകുന്നത്, 'ശ്രേയാംസ്‌കുമാര്‍' 'ശ്രേയാംസ്കുമാര്‍' ആകുന്നത്, അല്ലെങ്കില്‍ 'ജോസ്‌തോമസ്' 'ജോസ്തോമസ്' ആകുന്നത് അതാതു വ്യക്തികള്‍ സഹിക്കുമോ? തന്റെ പേര് എങ്ങനെ കാണും/കാണിക്കും എന്ന് ഉറപ്പില്ലാത്ത ഒരു വ്യവസ്ഥയെ എത്രപേര്‍ ഉള്‍ക്കൊള്ളും?

2.അന്യഭാഷാ പദങ്ങള്‍ മലയാളത്തില്‍ എഴുതുമ്പോള്‍: അറബിഭാഷയുടെ ഉച്ചാരണരീതി ഉദ്ദേശിച്ചാണ് നേരത്തെ അതെപ്പറ്റി സൂചിപ്പിച്ചത്.അറബിഭാഷ അറിയാത്തതുകൊണ്ട് ഉദാഹരണങ്ങള്‍ പറയാന്‍ വിഷമം.('മഗ്‌രിബ്' എന്നൊക്കെ എഴുതിക്കണ്ടിട്ടുണ്ട്.)

3.ഡിക്ഷ്ണറികളില്‍ ഉച്ചാരണം എഴുതുമ്പോള്‍: അന്തരിച്ച എം. കൃഷ്ണന്‍നായരെ(സാഹിത്യ വാരഫലം)യും ഓര്‍ക്കാം.

4.കഥകളിലും മറ്റും പ്രാദേശിക വായ്മൊഴികള്‍ അവതരിപ്പിക്കേണ്ടി വരുമ്പോള്‍.

ഈ പറഞ്ഞതെല്ലാം പ്രധാനമായും rendering പ്രശ്നങ്ങളാണ്.ടൈപ്‌റൈറ്റര്‍ മലയാളം അരോചകം ആകുന്നതിനു കാരണം അത് കൂട്ടക്ഷരങ്ങളെ വെട്ടിമുറിക്കുന്നതുകൊണ്ടാണ്.അല്ലാതെ അര്‍ത്ഥവ്യത്യാസം കൊണ്ടല്ലല്ലോ.ഇതേ വിചാരമാണ് അനാവശ്യമായി കൂട്ടക്ഷരം കാണുമ്പോഴും ഉണ്ടാകുന്നത്.കാരണം വാക്കുകള്‍ക്ക് ഇമേജിന്റെ ഒരു തലം കൂടിയുണ്ട്.

ZW(N)J യെ എന്തുപേരുചൊല്ലി വിളിച്ചാലും വേണ്ടില്ല; അവയുടെ നിര്‍വ്വഹിക്കുന്ന ധര്‍മ്മമാണ് പ്രധാനം.

മലയാളം ഫോണ്ടുകള്‍ക്ക് സ്റ്റാന്‍ഡേര്‍ഡൈസേഷന്‍ ആവശ്യമാണ്.പല ഫോണ്ടുകളിലും ര/റ ല/ള എന്നിവ തെറ്റായ രീതിയിലാണ് കൂട്ടക്ഷരം ഉണ്ടാക്കാന്‍ ഉപയോഗിച്ചിരിക്കുന്നത്.സിബു പറഞ്ഞ 'ദൃക്‌സാക്ഷി' പ്രശ്നവും('ക'യുടെ ചില്ല്) ഇതുകൊണ്ട് പരിഹരിക്കാം.

(തുലാവര്‍ഷത്തിലെ മിന്നലാടിയ മദര്‍ബോര്‍ഡ് മാറ്റാന്‍ വൈകിയതുകൊണ്ട് കമന്റുകള്‍ കാണാനും മറുപടി എഴുതാനും വൈകി.ദയവായി പൊറുക്കുക.)

പെരിങ്ങോടന്‍ said...

ZW(N)J ഫോര്‍മാറ്റ് ക്യാരക്ടേഴ്സ് പ്രിസേര്‍വ് ചെയ്യണം എന്ന വാദത്തില്‍ എന്തെങ്കിലും ദോഷമുണ്ടോ സിബു?

evuraan said...

സുറുമയോട് ഒരു ചോദ്യം, ഏറെ നാളായി ചോദിക്കണമെന്നു കരുതിയതാണ്:

പാന്‍‌ഗോ പാച്ചുകള്‍ ഗ്നോമിന് സബ്മിറ്റ് ചെയ്തിട്ടുണ്ടോ? എങ്കില്‍, അവ അപസ്‌ട്രീം ആകാത്തത് എന്തേ ഇനിയും?

സുറുമ || suruma said...

ഏവൂരാന്‍,
പാന്‍‌ഗോ പാച്ചുകള്‍ സബ്മിറ്റ് ചെയ്തിട്ടില്ല.കാരണം, 'വ', 'യ' എന്നീ അക്ഷരങ്ങളുടെ അര്‍ദ്ധരൂപങ്ങള്‍ വ്യത്യസ്തരീതിയിലാണ് substitution ചെയ്തിരിക്കുന്നത്.
നിലവിലുള്ള രീതിയില്‍ 'വ' യുടെ പകുതി 'വ' + '്' എന്നാണ് ടേബിളില്‍.ഉദാഹരണത്തിന് 'ക്' + 'വ' എന്ന് അടിക്കുമ്പോള്‍ shaper engine അതിനെ 'ക' + 'വ്' എന്നാക്കുകയും 'വ്' -ന് പകരം നേരത്തെ പറഞ്ഞ 'വ' + '്' -ന്റെ ligature സ്ഥാപിക്കുകയും 'ക്വ' എന്ന് കാണുകയും ചെയ്യുന്നു.ഇത് കൂട്ടക്ഷരത്തില്‍ 'വ' രണ്ടാമതായി വരുമ്പോള്‍ മാത്രമേ സംഭവിക്കുുകയുള്ളൂ.

ഇതിനു വിപരീതമായി 'വ' യുടെ പകുതി post-base ആക്കാതെ '്' + 'വ' എന്ന് വെറും കൂട്ടക്ഷരം ആയി കൈകാര്യം ചെയ്യുന്ന രീതി ഉപയോഗിക്കുന്ന ഫോണ്ടുകള്‍ക്കു വേണ്ടിയാണ് പ്രധാനമായും പാച്ച് ഉണ്ടാക്കിയത്.'രചന'യുടെ പഴയ വേര്‍ഷന്‍, FreeSerif(ഉബൂണ്ടുവിലുള്ളത്) എന്നിവ ഈ രീതിയാണ് ഉപയോഗിക്കുന്നത്.

rendering-നു വേണ്ടി തട്ടിക്കൂട്ടിയതായതുകൊണ്ട് പാച്ചുകള്‍ സബ്മിറ്റ് ചെയ്യേണ്ട എന്നുവച്ചു.

evuraan said...

സുറുമ,

വ്യക്തമാക്കിയതിനു നന്ദി.

അല്പ സ്വല്പം അപൂര്‍ണ്ണമെങ്കിലും ഇവ സബ്മിറ്റ് ചെയ്യ‌പ്പെടുകയും അപ്‌സ്ട്രീം ആവുകയും ചെയ്തിരുന്നുവെങ്കില്‍ നന്നാീയിരുന്നു.
റ്

താങ്കള്‍ ചൂണ്ടിക്കാട്ടിയ പ്രശ്നം ഉണ്ടാവുമെങ്കിലും, ഉള്ളതിനക്കാള്‍ മെച്ചപ്പെട്ട് രീതിയില്‍ റെന്‍ഡറിംഗ് ലഭിക്കും എന്നതിനാലാുണു് . something is better than nothing എന്നല്ലേ? Of course, nothing is better than nonsense, പക്ഷെ ഇവിടെ അങ്ങിനെയല്ലല്ലോ കാര്യങ്ങള്‍.

മറ്റു പ്രശ്നങ്ങളെല്ലാം തീരുമ്പോള്‍ ഒരു റെവ് അപ്പ് ചെയ്താല്‍ മതിയല്ലോ...

64 ബിറ്റ് ലിനക്സിനെക്കൊണ്ട് നേരെ ചൊവ്വേ മലയാളം റെന്‍ഡര്‍ ചെയ്യിക്കാന്‍ ഒരു ദിവസം ശ്രമിച്ചിരുന്നു -- സിസ്റ്റം വേണമെന്നതിനാല്‍, 32-ലെക്ക് ഒതുങ്ങി.

em64t, amd64bit തുടങ്ങിയവയ്ക്കു വേണ്ടി .so ഫയല്‍ കമ്പയില്‍ ചെയ്യാന്‍ എനിക്കു സൌകര്യമുണ്ട്. താത്പര്യമുണ്ടെങ്കില്‍ സദയം അറിയിക്കുക.

സിബു::cibu said...

സുറുമ പറഞ്ഞ പ്രശ്നം ഇപ്പോഴത്തെ യുണിക്കോഡ് ഡിസൈനില്‍ സോള്‍വ് ചെയ്യാനാവാത്ത ഒന്നാണെന്ന്‌ ഞാന്‍ പറഞ്ഞിരുന്നുവല്ലോ... ZW(N)J പ്രിസര്‍വ് ചെയ്തതുകൊണ്ട്‌ മാത്രം സംഗതി രക്ഷപ്പെടില്ല. ഉദാഹരണത്തിന്‌ പുതിയലിപി ഫോണ്ടില്‍ എഴുതുന്ന എഴുത്തുകാരനേയും പഴയലിപിയുപയോഗിക്കുന്ന വായനക്കാരനേയും സങ്കല്പിക്കൂ. പുതിയലിപിക്കാരന്‍ ‘ജോസ്‌തോമാസ്/ദൃക്‌‌സാക്ഷി’ എഴുതുമ്പോള്‍ zwnj ഇടാതിരിക്കാനും മതി. അതിടാതെ തന്നെ, അയാല്‍ ടെക്സ്റ്റ് തെറ്റില്ലാതെയാണ് കാണുക. എന്നാല്‍ വായനക്കാരന്‍ ഇതിനെ സുറുമ പറഞ്ഞ പ്രശ്നങ്ങളോടെ തന്നെയാവും വായിക്കുക.

പഴയലിപിയും പുതിയലിപിയും വേര്‍പെടുത്തുക എന്നൊരു കടുംകയ്യല്ലാതെ വേറേ ഒന്നും എന്റെ മനസ്സിലൊരുപായമായി തെളിയുന്നില്ല.

മഹേഷ് മംഗലാട്ട് said...

പഴയലിപിയും പുതിയലിപിയും വേര്‍പെടുത്തുക എന്നൊരു കടുംകയ്യല്ലാതെ വേറേ ഒന്നും എന്റെ മനസ്സിലൊരുപായമായി തെളിയുന്നില്ല.

ഇവിടെ ഏത് പ്രശ്നമാണ് പുതിയലിപിയും പഴയലിപിയും വേര്‍പെടുത്തുന്നതിലൂടെ പരിഹരിക്കപ്പെടുന്നത്?

വേര്‍പെടുത്തല്‍ എന്നതു കൊണ്ട് അര്‍ത്ഥമാക്കുന്നത് പുതിയലിപിയുടെയും പരമ്പരാഗതലിപിയുടേയും എഴുത്തു സമ്പ്രദായങ്ങള്‍ നിലനിറുത്തണം എന്നോ ഇവ കലര്‍ത്തി ഉപയോഗിക്കണമെന്നോ എന്നത് വ്യക്തമാകുന്നില്ല.

പുതിയലിപിക്കായാലും പഴയലിപിക്കായാലും യൂനിക്കോഡിന്റെ കോഡ് പേജ് ഒന്നു തന്നെയല്ലേ. ഇതിന് വെവ്വേറെ കോഡ്‍പേജ് വേണമെന്നല്ല വാദം എന്നു വിശ്വസിക്കുന്നു. എന്നാല്‍ രണ്ട് റെണ്ടറിംഗ് എന്‍ജിനുകള്‍ വേണമെന്നാണോ?

ചില്ലുകള്‍ എന്‍കോഡ് ചെയ്യുന്നതിലൂടെ പരിഹരിക്കപ്പെടാവുന്നതല്ല മലയാളത്തിന്റെ പ്രശ്നങ്ങള്‍ എന്ന് ചിത്രജകുമാര്‍ ചൂണ്ടിക്കാണിച്ചത് ശരിയെന്നാണോ സിബു പറഞ്ഞു കൊണ്ടുവരുന്നത്?

സിബു::cibu said...

"പഴയലിപിയും പുതിയലിപിയും വേര്‍പെടുത്തുക എന്നൊരു കടുംകയ്യല്ലാതെ വേറേ ഒന്നും എന്റെ മനസ്സിലൊരുപായമായി തെളിയുന്നില്ല.

ഇവിടെ ഏത് പ്രശ്നമാണ് പുതിയലിപിയും പഴയലിപിയും വേര്‍പെടുത്തുന്നതിലൂടെ പരിഹരിക്കപ്പെടുന്നത്?"

തൊട്ടുമുമ്പ്‌ സുറുമ പറഞ്ഞ, ഞാന്‍ ‘ദൃക്‌സാക്ഷി’ പ്രശ്നം എന്ന്‌ വിളിച്ചുപോന്ന ആ പ്രശ്നം തന്നെ.

“വേര്‍പെടുത്തല്‍ എന്നതു കൊണ്ട് അര്‍ത്ഥമാക്കുന്നത് പുതിയലിപിയുടെയും പരമ്പരാഗതലിപിയുടേയും എഴുത്തു സമ്പ്രദായങ്ങള്‍ നിലനിറുത്തണം എന്നോ ഇവ കലര്‍ത്തി ഉപയോഗിക്കണമെന്നോ എന്നത് വ്യക്തമാകുന്നില്ല.

പുതിയലിപിക്കായാലും പഴയലിപിക്കായാലും യൂനിക്കോഡിന്റെ കോഡ് പേജ് ഒന്നു തന്നെയല്ലേ. ഇതിന് വെവ്വേറെ കോഡ്‍പേജ് വേണമെന്നല്ല വാദം എന്നു വിശ്വസിക്കുന്നു. എന്നാല്‍ രണ്ട് റെണ്ടറിംഗ് എന്‍ജിനുകള്‍ വേണമെന്നാണോ?“

അല്ല. എലിയെ കൊല്ലാന്‍ ഇല്ലം ചുടണമെന്നെനിക്കഭിപ്രായമില്ല. എന്നാല്‍ എലിയെകൊല്ലാന്‍ വേരെ വഴിയൊന്നും എനിക്കറിഞ്ഞും കൂടാ. ഇനി ഇല്ലം ചുടേണ്ടതിങ്ങനെയാണ്:

കൂട്ടക്ഷരം വേണം എന്ന്‌ എന്‍‌കോഡിംഗ് റിക്വസ്റ്റ് ചെയ്യുമ്പോള്‍ ഫോണ്ടില്‍ കൂട്ടക്ഷരമില്ലെങ്കില്‍ ഇപ്പോള്‍ ആകൂട്ടക്ഷരത്തിന്റെ ഘടകങ്ങള്‍ ചന്ദ്രക്കലയിട്ട്‌ പിരിച്ചെഴുതുകയാണ് ചെയ്യുന്നത്‌. അതിന് പകരം ‘glyph not available' ചിഹ്നം (സാധാരണ ഒരു ചതുരക്കട്ട) റെന്‍ഡറിംഗ് എഞ്ചിന്‍ കാണിക്കണം. വിരാമ കൂട്ടക്ഷരം ഉണ്ടാക്കാന്‍ ഉപയോഗിക്കുകയാണെങ്കില്‍, ചന്ദ്രക്കല വേറെയായി എന്‍‌കോഡ് ചെയ്യേണ്ടതുമുണ്ട്‌. ഉ-കാരം ചേര്‍ന്ന കൂട്ടക്ഷരം ഉണ്ടാക്കാനും വിരാമ ഉപയോഗിക്കേണ്ടി വരും.

“ചില്ലുകള്‍ എന്‍കോഡ് ചെയ്യുന്നതിലൂടെ പരിഹരിക്കപ്പെടാവുന്നതല്ല മലയാളത്തിന്റെ പ്രശ്നങ്ങള്‍ എന്ന് ചിത്രജകുമാര്‍ ചൂണ്ടിക്കാണിച്ചത് ശരിയെന്നാണോ സിബു പറഞ്ഞു കൊണ്ടുവരുന്നത്?“

ചിത്രജന്‍ കണ്ട പ്രശ്നങ്ങള്‍ ഏതൊക്കെയാണെന്നറിയാതെ ഇതിന് ഞാന്‍ അതിനെന്തു് പറയും..

മഹേഷ് മംഗലാട്ട് said...

സിബുവിന്റെ മറുപടി എനിക്ക് മുമ്പില്ലാതിരുന്ന കുറേ കണ്‍ഫ്യൂഷന്‍ ഉണ്ടാക്കുന്നു.

൧.ഇപ്പോള്‍ ആകൂട്ടക്ഷരത്തിന്റെ ഘടകങ്ങള്‍ ചന്ദ്രക്കലയിട്ട്‌ പിരിച്ചെഴുതുകയാണ് ചെയ്യുന്നത്‌ എന്നു പറയുന്നത് ശരിയോ?

വാസ്തവത്തില്‍ റെണ്ടറിംഗ് എന്‍ജിന്‍ പിരിക്കല്‍ നടത്തുന്നില്ലല്ലോ.ഫോണ്ടില്‍ ആവശ്യമായ ലിപിചിഹ്നം ഇല്ലാതെ വരുമ്പോള്‍ ലഭ്യമായത് കാണിക്കുകയല്ലേ ചെയ്യുന്നത്? പിരിക്കല്‍ വാദം തെറ്റായദിശയില്‍ കാര്യങ്ങള്‍ കാണുന്നതിനാലാണ്.

ഏരിയല്‍ യൂനിക്കോഡ്, കാര്‍ത്തിക, അഞ്ജലി, രചന എന്നിവ ഉദാഹരണമായി എടുത്ത് പരിശോധിച്ചാല്‍ ആര്‍ക്കും മനസ്സിലാക്കാവുന്ന ഇക്കാര്യത്തില്‍ സിബുവിന് കണ്‍ഫ്യൂഷന്‍ ഉണ്ടാവുന്നത് മനസ്സിലാക്കാനാകുന്നില്ല.

൨. അതിന് പകരം ‘glyph not available' ചിഹ്നം (സാധാരണ ഒരു ചതുരക്കട്ട) റെന്‍ഡറിംഗ് എഞ്ചിന്‍ കാണിക്കണം എന്നു പറയുന്നതിന്റെ യുക്തി മനസ്സിലായില്ല. എന്താണ് അത് കൊണ്ട് ഉണ്ടാകുന്ന ഗുണം?

കീ സീക്വന്‍സ് വെച്ച് പറയുകയാണെങ്കില്‍ ഒരാള്‍ ഒരു കൂട്ടക്ഷരമാണ് ഇന്‍പുട്ട് ചെയ്യുന്നത് എന്ന് പറയാവുന്നതാണോ? കൂട്ടക്ഷരം വേണമെന്നുള്ളവര്‍ അത് ലഭ്യമാക്കുന്ന ഫോണ്ട് ഉപയോഗിക്കണം. ഫോണ്ടിന്റെ കാര്യത്തില്‍ യൂനിക്കോഡ് നല്കുന്ന ഈ സ്വാതന്ത്ര്യം ഗ്ലിഫ് നോട്ട് എവൈലബ്ള്‍ എന്നു കാണിച്ച് നശിപ്പിക്കേണ്ടതുണ്ടോ.പുതിയ ലിപി വേണമെന്നും അത് ഇനിയും പുതുക്കണമെന്നും കരുതുന്ന പ്രബോധചന്ദ്രന്‍ നായരെപ്പോലെ ഉള്ളവര്‍ക്ക് വേണ്ടി ഈ സ്വാതന്ത്ര്യം നിലനിറുത്തണം.അവരും ഭാഷാഭിമാനികള്‍ തന്നെ. അവരുടെ താല്പര്യങ്ങളും സംരക്ഷിക്കപ്പെടണം.

൩.ചിത്രജന്‍ കണ്ട പ്രശ്നങ്ങള്‍ ഏതൊക്കെയാണെന്നറിയാതെ അതിന് എതിര്‍വാദം ഉന്നയിക്കാനാകില്ലെന്നു ഞാനും സമ്മതിക്കുന്നു.

സുറുമ || suruma said...

സിബൂ,

മലയാളം ഫോണ്ടുകള്‍ക്ക് സ്റ്റാന്‍ഡേര്‍ഡൈസേഷന്‍ വേണമെന്ന് പറഞ്ഞത് അതുകൊണ്ടാണ്.അപ്പോള്‍ ഫോണ്ടുകളില്‍ നിശ്ചയമായും ഉണ്ടായിരിക്കേണ്ട കൂട്ടക്ഷരരൂുപങ്ങള്‍ക്ക് ഒരു നിഷ്കര്‍ഷ ഉണ്ടാക്കാന്‍ കഴിയും.പുതിയ ലിപിയില്‍ കൂട്ടക്ഷരം പിരിഞ്ഞ് തന്നെ കാണണമെന്ന നിര്‍ബന്ധബുദ്ധികള്‍ zwnj ഉപയോഗിച്ചോട്ടെ.ഇതിനായി input method-ല്‍ ചന്ദ്രക്കലയോടോപ്പം zwnj കൂടിവരുന്ന ഒരു സംവിധാനം ഉണ്ടാക്കിയാല്‍ മതി.അതായത് പുതിയ ലിപിയുടെ ഉപയോഗം ഉ(ഊ)കാരങ്ങള്‍ക്ക് മാത്രമായി പരിമിതപ്പെടുത്തിയാല്‍ മതി.വര്‍ഷങ്ങളായി മാതൃഭൂമി പത്രം ഈ രീതിയല്ലേ ഉപയോഗിക്കുന്നത്?

ഗൌരവപരമായ മറ്റു പ്രശ്നങ്ങള്‍ കിടക്കുമ്പോള്‍ ചില്ല് എന്‍കോഡിങിന് ഇത്ര പ്രാധാന്യം നല്‍കേണമായിരുന്നോ?

സിബു::cibu said...

“ഇപ്പോള്‍ ആകൂട്ടക്ഷരത്തിന്റെ ഘടകങ്ങള്‍ ചന്ദ്രക്കലയിട്ട്‌ പിരിച്ചെഴുതുകയാണ് ചെയ്യുന്നത്‌ എന്നു പറയുന്നത് ശരിയോ?

വാസ്തവത്തില്‍ റെണ്ടറിംഗ് എന്‍ജിന്‍ പിരിക്കല്‍ നടത്തുന്നില്ലല്ലോ.ഫോണ്ടില്‍ ആവശ്യമായ ലിപിചിഹ്നം ഇല്ലാതെ വരുമ്പോള്‍ ലഭ്യമായത് കാണിക്കുകയല്ലേ ചെയ്യുന്നത്?“

മഹേഷേ, മുകളില്‍ പറഞ്ഞത്‌ രണ്ടും ഒന്നല്ലെ? യുണീക്കോഡില്‍ കൂട്ടക്ഷരം ‘ക്ക’ എഴുതുന്നത്‌ ‘ക + വിരാമ + ക’ എന്നാണെന്ന് ഓര്‍ക്കുമല്ലോ.

“അതിന് പകരം ‘glyph not available' ചിഹ്നം (സാധാരണ ഒരു ചതുരക്കട്ട) റെന്‍ഡറിംഗ് എഞ്ചിന്‍ കാണിക്കണം എന്നു പറയുന്നതിന്റെ യുക്തി മനസ്സിലായില്ല. എന്താണ് അത് കൊണ്ട് ഉണ്ടാകുന്ന ഗുണം?“

അപ്പോള്‍ ഒരാള്‍ക്ക്‌ അയാളുടെ ഫോണ്ടിലുള്ള കൂട്ടക്ഷരങ്ങളേ എഴുതനാവൂ. അതല്ലെങ്കില്‍ അയാള്‍ കാണുക ചതുരക്കട്ടയാവും. മാത്രവുമല്ല, ഇപ്പോഴുള്ള പിരിച്ചെഴുതുന്ന രൂപത്തിലേയ്ക്കുള്ള ഫാള്‍ ബാക്കില്ലാത്തതിനാല്‍ അയാളെഴുതിയത്‌ വായനക്കാരന്‌ കാണാനാവുന്നെങ്കില്‍ അത്‌ അയാളെഴുതിയ പോലെ തന്നെ ആയിരിക്കും. (ഒരു രഹസ്യം പറഞ്ഞു തരാം.. സത്യത്തില്‍ പഴയലിപി പ്രചരിപ്പിക്കാന്‍ ഇതിലും നല്ല മാര്‍ഗ്ഗമില്ല. ആലോചിച്ചു നോക്കൂ)

സുറുമ, യുണിക്കോഡ് ഫോണ്ട്‌ കഴിയാവുന്നത്ര ഫ്രീഡം നല്‍കുന്ന രീതിയിലാണ് ഉണ്ടാക്കിയിട്ടുള്ളത്‌. അല്ലെങ്കില്‍ അത്‌ ഇങ്ങനെ പറയാം: യുണീ‍കോഡിന് ഒരു ഫോണ്ടില്‍ ഇന്നതൊക്കെ ഉണ്ടായേ തീരൂ എന്ന്‌ നിഷ്കര്‍ഷിക്കുന്ന ഒന്നുമില്ല. ഒന്നു ചോദിക്കട്ടേ.. സുറുമ ഉണ്ടാക്കുന്ന സ്റ്റാന്റേഡില്‍ ‘ക്സ’ ഉണ്ടാവുമോ? ‘സ്ത’യോ? അല്ലെങ്കില്‍ ഏത്‌ കൂട്ടക്ഷരമാണ് സുറുമയുടെ സ്റ്റാന്റേഡില്‍ ഇല്ലാതിരിക്കുക? ഒരു കൂട്ടക്ഷരമെങ്കിലും ഇല്ലാതിരുന്നാല്‍ ആ കൂട്ടക്ഷരത്തിന് ‘ദൃക്സാക്ഷി’ പ്രശ്നമുണ്ടാവില്ലേ?

സുറുമ || suruma said...

സിബൂ,
മാനകീകരണം കൊണ്ട് ഞാന്‍ ഉദ്ദേശിച്ചത് unicode മലയാളം ഫോണ്ടുകള്‍ക്ക് സ്റ്റാന്‍ഡേര്‍ഡ് ഉണ്ടാക്കണം എന്നല്ല.ഒരു വ്യക്തി അതുണ്ടാക്കണം എന്നതുമല്ല.code point തന്നാല്‍ യൂണികോഡിന്റെ ജോലികഴിഞ്ഞു.എന്നാല്‍ കൂട്ടക്ഷരങ്ങളുടെ കാര്യത്തില്‍ മലയാളഭാഷ ഉപയോഗിക്കുന്ന എല്ലാവരും ചേര്‍ന്ന് ഒരു ഐക്യരൂപ്യം ഉണ്ടാക്കുക എന്നതാണ് സ്റ്റാന്‍ഡേര്‍ഡൈസേഷന്‍ കൊണ്ട് അര്‍ത്ഥമാക്കിയത്.അങ്ങനെയായാല്‍ വ്യത്യസ്ത ഫോണ്ടുകള്‍ ഒരേ ടെക്സ്റ്റിനെ വ്യത്യസ്തമായി കാണിക്കുന്നത് ഒഴിവാക്കാനാകും.'ദൃക്‌സാക്ഷി'പ്രശ്നവും ഒഴിവാകും.അതായത് കൂട്ടക്ഷരങ്ങള്‍ക്ക് ലിപി പഴയതോ പുതിയതോ എന്ന് തീരുമാനിക്കുന്നത് എഴുതുന്ന ആളാകണം,വായിക്കുന്ന ആളാകരുത് എന്നര്‍ത്ഥം.

മഹേഷ് മംഗലാട്ട് said...

സാങ്കേതികവിഷങ്ങള്‍ കൈകാര്യം ചെയ്യുമ്പോള്‍ ഉണ്ടാവേണ്ട വ്യക്തതയില്ലായ്മ അപകടകരമാണ്.മാത്രമല്ല വസ്തുതകള്‍ ശരിയായ രീതിയില്‍ പ്രതിപാദിക്കാതിരിക്കുന്നതും ശരിയല്ല.
റെണ്ടറിംഗ് എന്‍ജിന്‍ ഒരിക്കലും പിരിക്കുന്നില്ല.മറിച്ച് യോജിപ്പിക്കുകയേ ചെയ്യുന്നുള്ളൂ. സ്വരം ചേരുമ്പോള്‍ ചിഹ്നങ്ങള്‍ എവിടെയൊക്കെ നില്ക്കണം,ഏതൊക്കെ സന്ദര്‍ഭത്തില്‍ കൂട്ടക്ഷരത്തിന്‍റെ ഗ്ലിഫ് ലഭ്യമെങ്കില്‍ കാണിക്കണം എന്നൊക്കെ ചെയ്യുന്നുവെന്നല്ലാതെ പിരിക്കുന്നില്ല.വസ്തുത ഇതായിരിക്കെ പിരിക്കുന്നുവെന്നു പറയാവുന്നതല്ലല്ലോ.

ചതുരക്കട്ട പ്രശ്നം എനിക്ക് മനസ്സിലാക്കാനേ പറ്റുന്നില്ല. ഏരിയല്‍ യൂനിക്കോഡ്, കാര്‍ത്തിക, അഞ്ജലി, രചന എന്നീ ഫോണ്ടുകള്‍ മാറിമാറി ഉപയോഗിക്കേണ്ടി വരുന്നയാളാണ് ഞാന്‍.ചതുരക്കട്ട കിട്ടിയിട്ട് ഇത്തരം ഒരു ഉപയോക്താവിന് എന്താണ് പ്രയോജനം?
മാത്രമല്ല ഞാന്‍ ഉപയോഗിക്കുന്ന സിസ്റ്റത്തില്‍ ലഭ്യമായ ഗ്ളിഫുകള്‍ കാണിക്കുമെന്നല്ലാതെ ചതുരക്കട്ട കാണിക്കുന്നത് എങ്ങനെ,എന്തിന് എന്ന് മനസ്സിലാക്കാനാകുന്നില്ല.
പുതിയ ലിപിയോ പഴയലിപിയോ മറ്റെന്തിലും പ്രചരിപ്പിക്കാന്‍ കൌശലം പ്രയോഗിക്കണം എന്നതിനോട് ഒരു രീതിയിലും ഞാന്‍ യോജിക്കില്ല

Rajesh R Varma said...

യൂണി കോഡുമായി ബന്ധമില്ലാത്ത ഒരു സംശയം

Ralminov said...

എന്റെ ചില നിരീക്ഷണങ്ങൾ ഇവിടെ.

Ralminov said...

http://unicode.wikia.com/wiki/Malayalam/Problems_of_Chillu_Sign_Proposal
വായിച്ചു.

That article is really exposing the danger of encoding CHILLUs. No one will able able identify between na virama zwj and chillu-na, if chillus are encoded. Then spoofing of websites are easier.
അവൻ & അവന്‍ looks same, but are actually different.
I was a supporter of encoding chillus. Now I am not.

മഹേഷ് മംഗലാട്ട് said...

ചില്ല് എന്‍കോഡിംഗ് തീരുമാനത്തിന്റെ അനൌചിത്യം ഓരോ ദിവസം കഴിയും തോറും കൂടുതല്‍ ബോധ്യമായി വരികയാണ്.
ഇക്കാര്യത്തില്‍ ചിത്രജകുമാര്‍ ഇന്‍ഡിക്‍ മെയിലിംഗ് ലിസ്റ്റില്‍ കൊടുത്ത കുറിപ്പ് കാണുക.അതോടൊപ്പം ഈ ലിങ്കും:http://www.rachanamalayalam.org/docs/ChilluEncodingIsWrong.pdf
തര്‍ക്കമല്ല പ്രശ്നത്തിനു പരിഹാരമെന്ത് എന്ന ആലോചനയാണ് വേണ്ടത്.

Ralminov said...

ഞാന്‍ ഒന്നു് നന്നായി മലയാളം എഴുതാന്‍ പഠിച്ചു. സംവൃതോകാരം ഇട്ടു് എഴുതി ശീലിച്ചാല്‍ അര്‍ത്ഥം മാറിപ്പോവുമോയെന്ന ഭയവും വേണ്ട.
ചില്ലു് എന്‍കോഡ് ചെയ്യേണ്ട ആവശ്യമില്ല.

പക്ഷേ ന് ന്‍ ആണെന്നു് വന്നാല്‍ അതും ബുദ്ധിമുട്ടാണു്.

സിബു::cibu said...
This comment has been removed by a blog administrator.
സിബു::cibu said...

മഹേഷ്, ‘ദൃക്സാക്ഷി‘പ്രശ്നം പരിഹരിക്കാനുള്ള വിവിധമാര്‍ഗ്ഗങ്ങളെ കുറിച്ചാണല്ലോ നമ്മള്‍ സംസാരിക്കുന്നത്‌. ഞാന്‍ മുന്നോട്ടുവച്ച സൊല്യൂഷന്‍ സ്വീകരിച്ചാലേ ചതുരക്കട്ടകള്‍ പ്രത്യക്ഷപ്പെടൂ. ഈ ചതുരക്കട്ടകള്‍ ഇപ്പോഴത്തെ യുണിക്കോഡ് സ്റ്റാന്റേഡ് പ്രകാരം ഉണ്ടാവുന്നതല്ല.

ചതുരക്കട്ട കിട്ടിയാല്‍ അതിനര്‍ഥം പ്രസ്തുത എന്‍‌കോഡിങ് സീക്വന്‍സ് വരക്കാന്‍ കയ്യിലുള്ള ഫോണ്ട് അപര്യാപ്തമാണ് എന്നാണ്. അപ്പോള്‍ അത്‌ വരയ്ക്കാന്‍ പ്രാപ്തമായ ഫോണ്ട്‌ കൊണ്ടുവന്ന്‌ സിസ്റ്റത്തില്‍ ചേര്‍ക്കണം. അതായത്‌, പഴയലിപിയിലെഴുതിയത്‌ കാണാന്‍ പഴയലിപിഫോണ്ട് തന്നെ വേണ്ടിവരും; കാര്‍ത്തിക മതിയാവുകയില്ല. എങ്കില്‍ മാത്രമേ, ‘ദൃക്സാക്ഷി’ പ്രശ്നം ഒഴിവാവൂ. അങ്ങനെ, പുതിയലിപി ഫോണ്ടുകള്‍ അന്യം നിന്നുപോവും. ഇതൊരു കൌശലമല്ല; മറിച്ച്‌, ദൃക്സാക്ഷി പ്രശ്നം ഒഴിവാക്കാനുള്ള സൊല്യൂഷന്റെ സൈഡ് ഇഫറ്റാണ്. അത്‌ ഇഷ്ടമായില്ലെങ്കില്‍, ഇങ്ങനെ സൈഡിഫക്റ്റില്ലാത്ത ഒരു സൊല്യൂഷന്‍ പ്രപ്പോസ് ചെയ്യൂ.

മഹേഷ്, ചിത്രജന്റെ പുതിയ ഡോക്യുമെന്റില്‍ അപ്പടി പൊളിറ്റിക്സ് ആണല്ലോ. ഇതൊക്കെ വായിക്കാനുള്ള ക്ഷമ യുണിക്കോഡുകാര്‍ കാണിക്കുമോ? അതില് നിന്നും ഉള്ള ടെക്നിക്കല്‍ കണ്ടന്റ് മാത്രം ഒരു പേജിലാക്കി കിട്ടിയാല്‍ നന്നായിരുന്നു. അതില്‍ റിവ്യൂചെയ്തിരിക്കുന്നത്‌ ഗവണ്മെന്റിന്റെ l2/06-186 എന്ന ഡോക്യുമെന്റാണ്. എന്നാല്‍ റിവ്യൂചെയ്യേണ്ടിയിരുന്നത്‌ എറിക്കിന്റെ l2/06-207 ആയിരുന്നു. ആ ഡോക്യുമെന്റാണ് റിവ്യൂകമ്മിറ്റി വായിച്ചു നോക്കിയിട്ടുണ്ടാവുക. l2/06-186 എറിക്കേ വായിച്ചിട്ടുണ്ടാവൂ.

സുറുമ, വ്യത്യസ്ത ഫോണ്ടുകള്‍ ഒരേ ടെക്സ്റ്റിനെ വ്യത്യസ്തമായി കാണിക്കുന്നത് ഒഴിവാക്കാന്‍ pr37-ലെ ഫാള്‍ബാക്കുകള്‍ ഇല്ലാതിരിക്കുകയാണ് വേണ്ടത്‌. അതുതന്നെയാണ് ഞാന്‍ പറഞ്ഞ സൊല്യൂഷനും. ഫാള്‍ബാക്കുള്ളിടത്തോളം എല്ലാ മലയാളികളും ചേര്‍ന്ന്‌, ചന്ദ്രക്കല വേണ്ടിടത്തൊക്കെ zwnj ഉപയോഗിക്കാം എന്ന്‌ തീരുമാനിച്ചത്‌ കൊണ്ട്‌ പ്രശ്നങ്ങള്‍ക്ക്‌ പരിഹാരമാവുകയില്ല. ഉദാഹരണത്തിന്, ഞാന്‍ രചനയില്‍ ഗ്ദ്ധ്രൂ എന്നെഴുതിയത്‌ സന്തോഷ്‌ കാര്‍ത്തികയില്‍ കാണുന്നത്‌ ഞാനെഴുതിയപോലെയല്ല; പിരിച്ചാണ്. അതുപോലെ, ‘ദൃക്സാക്ഷി‘യെന്ന്‍ കാര്‍ത്തികയില്‍ എഴുതിയാല്‍ സന്തോഷ്‌ അതിനെ ‘ദൃക്‌സാക്ഷി‘ എന്നാവും കാണുക. അതായത്‌, തെറ്റായ സീക്വന്‍സും ശരിയായ സീക്വന്‍സും ഒരേ റിസള്‍ട്ട് തരുന്നത്‌ കൊണ്ട്‌ തെറ്റുകണ്ടുപിടിക്കാന്‍ എഴുതിയ ആള്‍ക്ക്‌ കഴിയാതെ പോകുന്നു - വേണ്ടിടത്തൊക്കെ zwnj ഉപയോഗിച്ചിട്ടുണ്ടോ എന്ന്‌ കണ്ടുപിടിക്കാന്‍ സന്തോഷിന് പറ്റുന്നില്ല. അങ്ങനെ ഞാനത്‌ രചനയില്‍ തെറ്റായി കാണുകയും ചെയ്യുന്നു.

റാല്‍മിനോഫ്, IDN-ല്‍ ZW(N)J ഉപയോഗിക്കാന്‍ പാടില്ല. അതിനാല്‍ അവിടെ സ്പൂഫിങ് പ്രശ്നവും ഇല്ല. ചില്ലിന്റെ എന്‍‌കോഡിങ്ങിന് ശേഷം, VIRAMA+ZWJ ചില്ലുണ്ടാക്കാന്‍ ഉപയോഗിക്കുന്നത്‌ സ്റ്റാന്റേഡിന് എതിരാവും. പഴയഡോക്യുമെന്റില്‍ അത്‌ കണ്ടാല്‍ റെന്‍ഡറിങ് എഞ്ചിന്‍ അതിനെ ചില്ലായി കാണിക്കും എന്ന്‌ മാത്രം. ഇതിന് കാനോനിക്കല്‍ ഈക്വിവാലന്‍സ് ഉണ്ടാക്കും എന്നെനിക്ക്‌ തോന്നുന്നില്ല. കൂടുതല്‍ വിവരത്തിന് യുണിക്കോഡിന്റെ ഡിപ്രിക്കേഷന്‍ പോളിസി വായിക്കേണ്ടി വരും (ഞാന്‍ വായിച്ചിട്ടില്ല).

Ralminov said...

സിബു,
ജാള്യത രചനയില്‍ , ജാൾയത
അഞ്ജലിയില്‍ ഒരേ പോലെ. zwj is not used. its a mistake in rachana font, but it can happen.

ചതുരക്കട്ട ഒരു അബദ്ധമാണെന്നാണു് എനിക്കും തോന്നുന്നതു്. ഒരു ഫോണ്ടുപയോഗിച്ചെഴുതിയതു് വായിക്കാന്‍ ആ ഫോണ്ട് തന്നെ വേണമെന്നു് വന്നാല്‍ കഷ്ടമല്ലേ..

മഹേഷ് മംഗലാട്ട് said...

ചതുരക്കട്ട ഒരു പ്രശ്നത്തിനും പരിഹാരമല്ല എന്നാണ് എനിക്ക് തോന്നുന്നത്.
പല കമ്പ്യൂട്ടറുകളില്‍ പലതരം ഫോണ്ടുകള്‍ ഉപയോഗിക്കേണ്ടി വരുന്ന എന്നെപ്പോലൊരാള്‍ ചതുരക്കട്ടകളുടെ ഇടയില്‍പ്പെട്ട് വിഷമിക്കും എന്നല്ലാതെ എന്ത് കാര്യം.മലയാളത്തിലുള്ള ടെക്‍സ്റ്റുകള്‍ നെറ്റ് വഴി വിനിമയം ചെയ്യാന്‍ ഇന്നത്തെ അവസ്ഥയില്‍ സാധിക്കുന്നുണ്ടല്ലോ.അതെങ്കിലും നാളെയും ഉണ്ടാവണം.ചില്ലുകളും കൂട്ടക്ഷരവും പിരിഞ്ഞും തെറ്റിയുമുള്ള അവസ്ഥ ചതുരക്കട്ടയെക്കാള്‍ നല്ലതാണ്.

കൂട്ടക്ഷരങ്ങള്‍ക്ക് ലിപി പഴയതോ പുതിയതോ എന്ന് തീരുമാനിക്കുന്നത് എഴുതുന്ന ആളാകണം,വായിക്കുന്ന ആളാകരുത് എന്ന സുറുമയുടെ അഭിപ്രായത്തോട് യോജിപ്പാണ് എനിക്ക്.

വിവാദത്തിന്‍റെ കാര്യം: എല്ലാ തര്‍ക്കത്തിലും അഭിപ്രായൈക്യം സാദ്ധ്യമല്ല. സാങ്കേതികമായും പ്രായോഗികമായും ശരിയേതെന്നതിന്‍റെ അടിസ്ഥാനത്തിലാവണം അവിടെ തീരുമാനം.
പ്രബുദ്ധകേരളം എന്നു പറയുന്ന കേരളത്തിലെ ജനങ്ങളില്‍ മഹാഭൂരിപക്ഷവും അറിഞ്ഞിട്ടില്ലാത്ത പ്രശ്നത്തിന് നറുക്കിട്ട് തീര്‍പ്പുകല്പിക്കുന്നതു പോലെ അസംബന്ധം വേറൊന്നില്ല

പെരിങ്ങോടന്‍ said...

ആറ്റോമിക് ക്യാരക്ടേഴ്സ് ചില്ലക്ഷരത്തിനു നല്‍കുന്നതു ചില്ലക്ഷരത്തിന്റെ മൂലരൂപവുമായി ചില്ലിനുള്ള ബന്ധത്തെ ദുര്‍ബലമാക്കുന്നതാണു് ഒരു വശത്തെ വാദമെങ്കില്‍ പലപ്പോഴും ആറ്റോമിക് സ്വഭാവം കാണിക്കുന്ന ചില്ലക്ഷരങ്ങളെ IDN ഉം മിക്ക അപ്ലിക്കേഷനുകളും ‘തള്ളുന്ന’ ZW(N)J ഉപയോഗിച്ചു എഴുതുന്ന അസംബന്ധത്തിനെതിരെ പ്രതികരിക്കുകയാണു മറുകൂട്ടര്‍.

യൂണികോഡിനു മുമ്പില്‍ ഇരു വാദവും ഒട്ടനവധി കാലമായി അവതരിപ്പിച്ചു കാണുന്നു, ഇത്രയും കാലമായി ഇതിനൊരു തീര്‍പ്പുകണ്ടെത്താനാവാഞ്ഞതിനു നമ്മളെ തന്നെ പഴിപറയേണ്ടിയിരിക്കുന്നു.

ഇന്നു മൈക്രോസോഫ്റ്റിലെ പീറ്റര്‍ വിമര്‍ശിച്ചതു പോലെ അവസാന നിമിഷം മുഖ്യമന്ത്രി പറഞ്ഞൂന്ന് പറഞ്ഞൊരു പേപ്പറും പൊക്കിപ്പിടിച്ചു വരുന്നത് മലയാള സിനിമയില്‍ കാണുന്ന തരം വളിപ്പാണു്. സിബു പറഞ്ഞതു പോലെ രചനയുടെ ഡോക്യുമെന്റില്‍ രാഷ്ട്രീയമാണു് അധികം കാണുന്നതു്, IDN ഉദാഹരണം മാത്രം ഉപയോഗിച്ചു ZW(N)J -ല്‍ സെക്യൂരിറ്റി ഇഷ്യൂസ് ഇല്ലെന്ന് സമര്‍ഥിക്കുന്നതില്‍ സാധാരണ യൂണികോഡ് ഉപഭോക്താവിന്റെ കണ്ണില്‍ illogical ആണു്. സേര്‍ച്ചിലും മറ്റു അപ്ലിക്കേഷനുകളിലും ZW(N)J നഷ്ടപ്പെടുന്നതു മൂലമുള്ള പ്രശ്നങ്ങള്‍ക്കു് ആരു പരിഹാരമൊതുക്കും. രചന അക്ഷരവേദി പോലുള്ള മെല്ലെപ്പോക്കു സംഘമാണു മലയാളം യൂണികോഡിനു വേണ്ടി നിലകൊള്ളുന്നവരെങ്കില്‍ അതിനുവേണ്ടിയുള്ള ചര്‍ച്ചയും പരിശ്രമങ്ങളും ചത്ത കുഞ്ഞിന്റെ ജാതകം നോക്കുന്നതു പോലുള്ള ഏര്‍പ്പാടാകും.

വിശ്വപ്രഭ viswaprabha said...

സിബു ‘ചതുരക്കട്ട’ എന്നു പറഞ്ഞത് കാര്യമായി തെറ്റിദ്ധരിച്ചിട്ടുണ്ടെന്നു തോന്നുന്നു മഹേഷ് സാറും മറ്റും.

ആഴത്തില്‍ ആലോചിച്ചുനോക്കുമ്പോള്‍ അതൊരു നല്ല ഉപായമാണ്.
പുതിയലിപിയുടെ രൂപകല്പനയില്‍ സാങ്കേതികമായി തെറ്റുകള്‍ കടന്നുകൂടിയിട്ടുണ്ടെന്നു നമുക്കിപ്പോള്‍ അനുമാനിക്കേണ്ടി വരും. അങ്ങനെയുണ്ടെങ്കില്‍ ഇന്നല്ലെങ്കില്‍ നാളെ നമുക്കതു തിരുത്തേണ്ടിയും വരും. എന്നാല്‍ പെട്ടെന്നൊരു ദിവസം ഉപേക്ഷിക്കാനും പറ്റില്ല അത്. അതേ സമയം രണ്ടു പ്രത്യേക യുണികോഡ് പേജുകള്‍ ഉണ്ടാക്കുക എന്നതും സ്വീകാര്യമല്ല.

അപ്പോള്‍ പിന്നെ ബാക്കിയുള്ള വഴി ഇതുതന്നെ!

ചതുരക്കട്ട എന്നത് കാണുവാന്‍ രസമില്ലെങ്കിലും നല്ലൊരു യുണികോഡ് ഉപായമാണ്. ഉള്ളിലടങ്ങിയിട്ടുള്ള തെറ്റുകള്‍ തെറ്റുകളാണെന്നു തിരിച്ചറിയുക എന്നതാണ് ആദ്യത്തെ ശരി. യുണികോഡ് ഒരു ചതുരക്കട്ട കാണിക്കുമ്പോള്‍ നമ്മോടു പറയുന്നത്, “നോക്കൂ, ഇവിടെ ഏതോ ഒരു ഭാഷയിലെ ഒരക്ഷരം എഴുതിയിട്ടുണ്ട്. പക്ഷേ അതു കാണിക്കാനുള്ള ഗ്ലിഫ് എന്റെ കയ്യിലില്ലാട്ടോ, സോറി. പക്ഷേ ഞാന്‍ അതിനെ ശല്യമൊന്നും ചെയ്യില്ല. അങ്ങനെത്തന്നെ കൊണ്ടുനടന്നോളാം” എന്നാണ്. (അതേ സമയം ഒരു ചോദ്യചിഹ്നമാണെന്നു വരികില്‍ യുണികോഡിന് ആ ക്യാരക്റ്ററിനെയോ അതിന്റെ ഭാഷയേയോ തിരിച്ചറിയാന്‍ പോലുമായില്ലെന്നര്‍ത്ഥം. അല്ലെങ്കില്‍ ആ പേജ്/അക്ഷരം യുണികോഡിനെ തിരിച്ചറിഞ്ഞില്ലെന്നും പറയാം. പ്രസ്തുത ക്യാരക്റ്റര്‍ കൂടുതല്‍ പ്രോസസ്സിംഗിന് ഉപയുക്തമാവാതെ എന്നെന്നേക്കുമായി നശിച്ചുപോയി എന്നു കരുതാം.)

ഒരുദാഹരണത്തിന് പഴയ അഞ്ജലി ഉപയോഗിച്ചെഴുതിയ ചില വെബ് പേജുകളിലെ ഒളിച്ചിരിക്കുന്ന തെറ്റുകള്‍ നോക്കിയാല്‍ മതി. ആ തെറ്റുകള്‍ കാണണമെങ്കില്‍ അഞ്ജലി പോര. കാര്‍ത്തിക തന്നെ വേണം. (അഞ്ജലി വെച്ചു വായിച്ചാല്‍ ടോര്‍ച്ചടിച്ചുനോക്കി ഇവിടെയൊന്നും ഇരുളില്ലല്ലോ എന്നു പറയുന്ന പോലെയിരിക്കും!)

കാലക്രമത്തില്‍ പഴയലിപിയിലേക്കുതന്നെ നാം എല്ലാവരും ഒരുമിച്ചു മടങ്ങിപ്പോവുക എന്നത് ഒരു തെറ്റാണോ? ഉപയോഗസ്വാതന്ത്ര്യം എന്ന അളവുകോല്‍ വെച്ചുനോക്കിയാല്‍, അതുവെച്ച് രണ്ടോ അതിലധികമോ വ്യവസ്ഥ നടന്നു പോകട്ടേ എന്നു സമ്മതിച്ചുകൊടുത്താല്‍ പിന്നെ വീണ്ടും മാനകീകരണത്തിനെന്തു പ്രസക്തി?

ചതുരക്കട്ട ഉപായം വാസ്തവത്തില്‍ നിര്‍ബന്ധപൂര്‍വ്വമല്ലാത്ത, സമരാത്മകമല്ലാത്ത സ്വയംസ്വീകാര്യമായ എങ്കിലും സാവകാശമായ ഒരു സംക്രമണത്തിനു വഴിയൊരുക്കും എന്നാണെനിക്കു തോന്നുന്നത്.

Ralminov said...

ചതുരക്കട്ട?

ക്ക എന്നതു് ക ് ക എന്നാണു് ഇപ്പോള്‍ എഴുതുന്നതു്. സിബുവിനു് ക്ക എന്നു് തന്നെ കോഡ്പോയന്റ് നല്‍കണമോ ?
മനസ്സിലായില്ല....

എന്നാല്‍ മാത്രമേ ക്ക എന്ന ഗ്ലിഫില്ലാത്ത ഫോണ്ട് ചതുരക്കട്ട കാണിക്കുകയുള്ളൂ..

സുറുമ || suruma said...

ഇല്ലാത്ത ഗ്ലിഫിനു പകരം 'ഇഷ്ടിക' നിരത്തുന്ന റെന്‍ഡറിങ് സമ്പ്രദായം ഒട്ടും അങ്ങട് ദഹിക്കുന്നില്ല.ZW(N)J ന് മാന്യമായ സ്ഥാനം നല്‍കുകയാണ് ഭേദപ്പെട്ട മാര്‍ഗ്ഗം എന്ന് തോന്നുന്നു.വെറും ഫോര്‍മാറ്റിങിന് അപ്പുറത്തേയ്ക്ക് ഇവയ്ക്ക് പ്രസക്തി ഉണ്ട്.

സുനില്‍ said...

മുല്ലപ്പെരിയാറുപോലെയാവില്ലേ ഇതും? രചനയുടെ പുതിയ വാദം കേട്ട്‌ യൂണിക്കോട്‌ ഇപ്പോഴുള്ള തീരുമാനത്തില്‍നിന്നും പിന്മാറുകയോ തീരുമാനം വൈകിക്കുകയോ ചെയ്യുമോ?
കഷ്ടം! മലയാളം! മാധ്യമങ്ങള്‍ വിവാദങള്‍ടെ പുറകേയാണ്. ആര്‍ക്കും ഒന്നും സോള്‍വ് ചെയ്യണ്ട, കഷ്ടം! -സു-

Ralminov said...

zw(n)j യെ പറ്റി രചനയുടെ അഭിപ്രായം അറിഞ്ഞാല്‍ കൊള്ളാം. ഇങ്ങനെത്തന്നെ പോയാല്‍ മതിയെന്നാണോ ? ഫാര്‍സി,അറബിക് ഫോറങ്ങളിലും ഇവയെപ്പറ്റി നല്ല അഭിപ്രായമല്ല.

സിബു::cibu said...

റാല്‍മിനോഫ്: "ഒരു ഫോണ്ടുപയോഗിച്ചെഴുതിയതു് വായിക്കാന്‍ ആ ഫോണ്ട് തന്നെ വേണമെന്നു് വന്നാല്‍ കഷ്ടമല്ലേ.."
റാല്‍മിനോഫ്: "ക്ക എന്നതു് ക ് ക എന്നാണു് ഇപ്പോള്‍ എഴുതുന്നതു്. സിബുവിനു് ക്ക എന്നു് തന്നെ കോഡ്പോയന്റ് നല്‍കണമോ ?“

റാല്‍മിനോഫ് പറഞ്ഞ രണ്ടും ശരിയല്ല. ഞാന്‍ നേരത്തെ പറഞ്ഞത്‌ തന്നെ, റൂളുപയോഗിച്ച്‌ എഴുതിയിരിക്കുന്നു. മനസ്സിലാകുമോ എന്ന്‌ നോക്കൂ:
consonant + virama + consonant => conjunct ligature if available in the font
.notdef glyph if not available in the font

consonant + chandrakkala => consonant with chandrakkala above right top corner

Notes:

* PR 37 becomes obsolete
* chandrakkala has to be encoded new
* no fall backs
* no zwj and zwnj

സുറുമ: ഇല്ലാത്ത ഗ്ലിഫിനു പകരം 'ഇഷ്ടിക' നിരത്തുന്ന റെന്‍ഡറിങ് സമ്പ്രദായം ഒട്ടും അങ്ങട് ദഹിക്കുന്നില്ല.

ഇല്ലാത്തിടത്ത്‌ ഇഷ്ടിക വച്ചുതന്നെയാണ് എല്ലാഭാഷകളിലേയും ഫോണ്ടുകള്‍ പ്രവര്‍ത്തിക്കുന്നത്‌. പ്രധാനമായും ഇന്ത്യന്‍ ലിപികള്‍ക്ക് മാത്രമേ ജോയിനറുകളും ഫാള്‍ബാക്കുകളും ഉള്ളത്‌. അതുണ്ടാക്കിയ പ്രശ്നമായിരുന്നു ‘ദൃക്സാക്ഷി’.

സുറുമ: ZW(N)J ന് മാന്യമായ സ്ഥാനം നല്‍കുകയാണ് ഭേദപ്പെട്ട മാര്‍ഗ്ഗം എന്ന് തോന്നുന്നു.
ഉദ്ദേശിച്ചത്‌ ഒരു റൂളായി പറയൂ. എന്നാലേ വിശകലനം ചെയ്യാനാവൂ.

മഹേഷ്‌: ചതുരക്കട്ട ഒരു പ്രശ്നത്തിനും പരിഹാരമല്ല എന്നാണ് എനിക്ക് തോന്നുന്നത്. പല കമ്പ്യൂട്ടറുകളില്‍ പലതരം ഫോണ്ടുകള്‍ ഉപയോഗിക്കേണ്ടി വരുന്ന എന്നെപ്പോലൊരാള്‍ ചതുരക്കട്ടകളുടെ ഇടയില്‍പ്പെട്ട് വിഷമിക്കും എന്നല്ലാതെ എന്ത് കാര്യം.
മഹേഷ്‌: കൂട്ടക്ഷരങ്ങള്‍ക്ക് ലിപി പഴയതോ പുതിയതോ എന്ന് തീരുമാനിക്കുന്നത് എഴുതുന്ന ആളാകണം,വായിക്കുന്ന ആളാകരുത് എന്ന സുറുമയുടെ അഭിപ്രായത്തോട് യോജിപ്പാണ് എനിക്ക്.

ഈ രണ്ട്‌ വാചകങ്ങളും കോണ്ട്രഡിക്റ്റിങ് ആണ്. ഒന്നുകില്‍ എഴുതുന്ന ആള്‍ തീരുമാനിക്കുന്നു ലിപി പഴയതോ പുതിയതോ ആവണമെന്ന്‌; അപ്പോള്‍ കൂട്ടക്ഷരമില്ലാത്ത ഫോണ്ടുപയോഗിച്ചാണ് കാണുന്നതെങ്കില്‍ ഇഷ്ടിക കാണും. അല്ലെങ്കില്‍ വായിക്കുന്ന ആള്‍ തീരുമാനിക്കുന്നു ഏത്‌ ഫോണ്ടില്‍ കാണണമെന്ന്‌; അപ്പോള്‍ ‘ദൃക്സാക്ഷി’ വരും. ഇതുരണ്ടില്‍ ഏതെങ്കിലും ഒന്ന്‌ തിരഞ്ഞെടുക്കുകയേ നിവൃത്തിയുള്ളൂ.

പെരിങ്ങൊടര്‍: മിക്ക അപ്ലിക്കേഷനുകളും ‘തള്ളുന്ന’ ZW(N)J ഉപയോഗിച്ചു എഴുതുന്ന അസംബന്ധത്തിനെതിരെ പ്രതികരിക്കുകയാണു മറുകൂട്ടര്‍.
ഇത്‌ ഒരു കാരണം മാത്രമാണ്.. മുമ്പ്‌ ഡിസ്കസ് ചെയ്ത ‘ഞായര്‍’ പ്രശ്നവും യുണീക്കോഡിന്റെ തീരുമാനത്തെ സ്വാധീനിച്ച കാര്യം തന്നെ.

വിശ്വം: അതുവെച്ച് രണ്ടോ അതിലധികമോ വ്യവസ്ഥ നടന്നു പോകട്ടേ എന്നു സമ്മതിച്ചുകൊടുത്താല്‍ പിന്നെ വീണ്ടും മാനകീകരണത്തിനെന്തു പ്രസക്തി?
സ്റ്റാന്റേഡൈസേഷന്‍ പല ലയറുകളില്‍ നടത്താവുന്ന ഒന്നാണ്. യുണീക്കോഡ് സ്റ്റാന്റേഡൈസ് ചെയ്യുന്ന ലെയറല്ല ഫോണ്ടിലുള്ള സ്റ്റാന്റേഡൈസേഷന്‍. ‘ദൃക്സാക്ഷി‘ പ്രശ്നമില്ലെങ്കില്‍ രണ്ടുവ്യവസ്ഥയ്ക്കും ഒരു പ്രശ്നവുമില്ലാതെ കോ-എക്സിസ്റ്റ് ചെയ്യാമായിരുന്നു. അതായത്‌ ഫോണ്ടില്‍ സ്റ്റാന്റേഡൈസേഷന്‍ ആവശ്യമില്ലായിരുന്നു എന്ന്‌. അതാണോ സാമൂഹികമായി ശരി എന്ന്` കാലം തെളിക്കേണ്ടതാണ്.

ralminov said...

ദൃക്‌സാക്ഷി ബോക്സര്‍ എന്നു് കാര്‍ത്തികയില്‍ എഴുതിയാല്‍
ക്സ യ്ക്കു് പകരം ചതുരമാണോ വരേണ്ടതു് ?

ഇതിലും നല്ല ഉപായം കാര്‍ത്തികയും മറ്റും നിരോധിക്കുന്നതാണു്.

സിബു::cibu said...

റാല്മിനോഫ്: "ഇതിലും നല്ല ഉപായം കാര്ത്തികയും മറ്റും നിരോധിക്കുന്നതാണു്."

കാര്ത്തിക നിരോധിക്കുക എന്ന പോംവഴി റാല്മിനോഫ് നിര്ദ്ദേശിക്കുമ്പോള് ഉദ്ദേശിച്ചത് കാര്ത്തിക എന്ന് പേരുള്ള എല്ലാ ഫോണ്ടുകളും നിരോധിക്കുക എന്നല്ലല്ലോ. മറിച്ച് എന്തെങ്കിലും ചില മാനദണ്ഡങ്ങളനുസരിച്ച് ചില ഫോണ്ടുകളെ സ്റ്റാന്റേഡ് അനുസരിക്കുന്നവയെന്നും മറ്റുചിലവയെ അനുസരിക്കാത്തവയെന്നും തരം തിരിക്കുകയല്ലേ. അതായത്, യുണീക്കോഡ് സ്റ്റാന്റേഡൈസേഷനല്ല, മറിച്ച് ഫോണ്ട് സ്റ്റാന്റേഡൈസേഷനാണ് വേണ്ടത് എന്നാവണം റാല്മിനോഫ് ഉദ്ദേശിച്ചത് (അല്ല, ഇനി ഇത്രയ്ക്കുദ്ദേശിച്ചില്ലെങ്കിലും ആലോചിക്കുമ്പോള് എല്ലാ വശവും ആലോചിക്കണമല്ലോ :)

ഫോണ്ട്‌ സ്റ്റാന്റേഡൈസേഷന് യുണിക്കോഡ് സ്റ്റാന്റേഡൈസേഷന്‍ എന്ന പോലൊരു ബോഡി ഇതുവരെ നിലവിലില്ല. അല്ലെങ്കിലും, യുണിക്കോഡ് സ്റ്റാന്റേഡൈസേഷന്‍ ശരിയാണെങ്കില്‍ പിന്നെന്തിന് ഫോണ്ട് സ്റ്റാന്റേഡൈസേഷന്‍?

ഫോണ്ട് സ്റ്റാന്റേഡൈസേഷന് യുണീക്കോഡ് സ്റ്റാന്റേഡൈസേഷനേക്കാള് കോമ്പ്ലെക്സാണ്. യുണീക്കോഡില്‍ ഘടകങ്ങള്‍ മാത്രം വേര്‍തിരിച്ചറിഞ്ഞാല്‍ മതി. ഫോണ്ടിലാവുമ്പോള്‍ അതിന്റെ നാനാവിവിധ കോമ്പിനേഷനുകളും കണ്ടുപിടിച്ച്‌ കാറ്റലോഗ് ചെയ്യേണ്ടതുണ്ട്‌.

ഫോണ്ട്‌ സ്റ്റാന്റേഡൈസേഷന്‍ സ്റ്റാറ്റിക്കാണ്. അതേ സമയം യുണിക്കോഡ് സ്റ്റാന്റേഡൈസേഷനില്‍, ഉദാഹരണത്തിന് ഗ്ധ എന്നൊരു കൂട്ടക്ഷം ഏതെങ്കിലും താളിയോലയില്‍ കണ്ടാല്‍, ഫോണ്ടില്‍ ചേര്‍ക്കാന്‍ വര്‍ഷങ്ങള്‍ കാത്തിരുന്നുള്ള സ്റ്റാന്റേഡ് തിരുത്ത്‌ വേണ്ട.

ഇനിയും പലതും അതിനെ പറ്റി എഴുതാം. ഫോണ്ടല്ല; യുണികോഡ് സ്റ്റാന്റേഡൈസേഷനാണ് വേണ്ടത്‌ എന്നതിനെ പറ്റി പൊതുവെ ധാരണയുണ്ട്. തല്‍കാലം നമുക്ക്‌ യുണിക്കോഡിനെ പറ്റി ചിന്തിക്കാം. കാര്‍ത്തിക നിരോധനവും, ഫോണ്ട് സ്റ്റാന്റേഡൈസേഷനും പിന്നെ...

Ralminov said...

cibu:
ഉദാഹരണത്തിന് ഗ്ധ എന്നൊരു കൂട്ടക്ഷം ഏതെങ്കിലും താളിയോലയില്‍ കണ്ടാല്‍, ഫോണ്ടില്‍ ചേര്‍ക്കാന്‍ വര്‍ഷങ്ങള്‍ കാത്തിരുന്നുള്ള സ്റ്റാന്റേഡ് തിരുത്ത്‌ വേണ്ട.

അപ്പോള്‍ ഗ്ധ എന്ന കൂട്ടക്ഷരം ഇല്ലാത്ത രചന ചതുരം കാണിക്കണമോ ?

I cant get your point. Without standardizing the font, your proposal is void.

Even if it is standardized, if there are instances where
consonant + virama + consonant DOESNT form a conjuct as in the above example, we can see blocks only.

സുറുമ || suruma said...

സിബു: അല്ലെങ്കിലും, യുണിക്കോഡ് സ്റ്റാന്റേഡൈസേഷന്‍ ശരിയാണെങ്കില്‍ പിന്നെന്തിന് ഫോണ്ട് സ്റ്റാന്റേഡൈസേഷന്‍?

കൂട്ടക്ഷരങ്ങളെ സംബന്ധച്ചകാര്യം തീരുമാനിക്കുന്നത് മലയാളഭാഷ ഉപയോഗിക്കുന്ന ജനസമൂഹമാണ്.വിവരസാങ്കേതികവിദ്യയുടെ വ്യാപനത്തിന്റെ അടിസ്ഥാനം തന്നെ സ്റ്റാന്‍ഡേര്‍ഡുകളുടെ സാന്നിദ്ധ്യമായിരിക്കെ, മലയാള അക്ഷരങ്ങളും വാക്കുകളും ഒാരോ വ്യക്തിക്കും താനുദ്ദേശിക്കുന്ന രീതിയില്‍ എഴുതാനും സൂക്ഷിക്കാനും വിനിമയം ചെയ്യാനും ഒരു പൊതു മാനദണ്ഡം ആവശ്യവുമെന്നിരിക്കെ,അതൊന്നും ആവശ്യമില്ലെന്ന സിബുവിന്റെ സമീപനം ദുരൂഹമാകുന്നു.അതുപോലെത്തന്നെ കൂട്ടക്ഷരങ്ങളെ പിരിച്ചുകാണിക്കല്‍ വേണ്ടിവരുമെന്നു സമ്മതിക്കുമ്പോള്‍തന്നെ അതിനു ഉപായങ്ങളൊന്നുമില്ലെന്നു കൈ മലര്‍ത്തുന്നു.

അക്ഷരം അഗ്നിയായി കൊണ്ടുനടക്കുന്നവരും ലക്ഷക്കണക്കിന് ഭാഷാസ്നേഹികളും യൂണിക്കോഡ് ലോകത്തിന് പുറത്ത് കാത്തു നില്ക്കുകയാണ്.അവരെല്ലാമെത്തുമ്പോള്‍ മലയാളം ഇങ്ങനെയൊക്കെ ആയിരുന്നാല്‍ മതിയോ?ആലോചിക്കുക.

മതി.തല്ക്കാലം ഈ ചര്‍ച്ചയില്‍ നിന്നും പിന്‍വാങ്ങുന്നു.കാഴ്ചക്കാരനായി തുടരും.

സിബു::cibu said...

റാല്‍മിനോഫ്: സ്റ്റേറ്റ്മെന്റുകള്‍ക്ക്‌ കാര്യകാരണങ്ങള്‍ നിരത്താന്‍ ശ്രമിക്കൂ. ഇല്ലാതെങ്ങനെ ബാക്കിയുള്ളവര്‍ക്ക്‌ അതെങ്ങനെയെന്ന്‌ മനസ്സിലാവും?

സുറുമ: വസ്തുനിഷ്ഠമായ തര്‍ക്കങ്ങളെങ്ങനെ ഹാനികരമാവും? അതില്ലാതെ നമ്മള്‍ കാര്യങ്ങള്‍ എക്സ്പോര്‍ ചെയ്യുന്നതെങ്ങനെ?

സ്റ്റാന്റേഡൈസേഷന്‍ ആവശ്യത്തിനേ വേണ്ടൂ. അനാവശ്യത്തിനുള്ള സ്റ്റാന്റേഡൈസേഷന്‍ പുരോഗതിക്ക്‌ വിഘാതമാണ്. ഫോണ്ടില്‍ സ്റ്റാന്റേഡൈസേഷനില്ലെങ്കിലുള്ള ഉപകാരത്തിന് ഒരുദ്ദാഹരണമെഴുതാം:
മനോരമയ്ക്ക്‌ ഇന്റര്‍നെറ്റ് എഡിഷന് വേണ്ടി കുറച്ച്‌ നല്ല ഫോണ്ടുകള്‍ വേണം. ഫോണ്ട്‌ ഡിസൈന്‍ ചെയ്യുക എളുപ്പമല്ല. എത്ര ചിഹ്നങ്ങളുണ്ടോ അതിനനുസരിച്ചാണ് അതിനെടുക്കുന്ന അധ്വാനം, ചിലവ്, സമയം എല്ലാം. പുതിയലിപിയാണെങ്കില്‍ 100-150 ചിഹ്നങ്ങളേ ഡിസൈന്‍ ചെയ്യേണ്ടതുള്ളൂ. പഴയലിപിയാണെങ്കില്‍ 900-വും. ഫോണ്ട്‌ സ്റ്റാന്റേഡൈസ് ചെയ്തിട്ടുണ്ടെങ്കില്‍ 150 ചിഹ്നങ്ങളുള്ളത്‌ നോണ്‍സ്റ്റാന്റേഡ്‌ ആണ്. യുണീക്കോഡ് സ്റ്റാന്റേഡൈസേഷന്‍ മാത്രമേ ഉള്ളൂവെങ്കില്‍ 150 ചിഹ്നങ്ങളുള്ളതിനും 900 ലിപികളുള്ളതിനും സ്റ്റാന്റേഡ് അനുസരിക്കുന്നതാവാം. അങ്ങനെ, മനോരമയ്ക്ക്‌ ഒരു പഴയലിപി ഫോണ്ടിന് പകരം മൂന്ന്‌ നാല് വിവിധ ഡിസൈനിലുള്ള പുതിയലിപി ഫോണ്ടുകള്‍ ലഭിക്കും. അത്‌ വിവിധതരം ഫോണ്ടുകളുടെ ഡെവലപ്പ്മെന്റിനെ വളരെ സഹായിക്കുന്നു. അതേസമയം ഇന്‍ഫൊര്‍മേഷന്‍ എക്സ്ചേഞ്ചിനെ ഒരുതരത്തിലും ബാധിക്കുന്നുമില്ല.

ഞാന്‍ നേരത്തെ പറഞ്ഞ ചതുരക്കട്ടയുണ്ടാക്കുന്ന നിയമങ്ങളെ കാര്യമായി മയപ്പെടുത്തി ഇപ്പോഴത്തേതിനോട്‌ വളരെ സാമ്യമുള്ള നിയമങ്ങളാക്കി. ഇവിടെ വായിക്കുമല്ലോ.

Ralminov said...

cibu:
"റാല്‍മിനോഫ്, IDN-ല്‍ ZW(N)J ഉപയോഗിക്കാന്‍ പാടില്ല. അതിനാല്‍ അവിടെ സ്പൂഫിങ് പ്രശ്നവും ഇല്ല."

suppose cibu has a website ഞാൻ.com
(in new encoded chillu)
I am trying to spoof this address with
ഞാന്‍.com (i register my idn as ഞാന്.com , but tells the people its ഞാന്‍.com which is not illegal also, as zwj is not allowed in idn). I can blame cibu for spoofing my address also as mine was the earlier standard)

ചതുരക്കട്ട വെക്കണമെങ്കില്‍ ഫോണ്ട് സ്റ്റാന്‍ഡേര്‍ഡൈസ് ചെയ്യണം എന്നേ ഞാന്‍ പറഞ്ഞുള്ളൂ.
പുതിയ നിര്‍ദ്ദേശം തരക്കേടില്ല.പുതിയലിപിക്കാര്‍ ഹാപ്പിയാകും.

Hussain, Rachana said...

വിശ്വത്തിന്റേയും സുനിലിന്റേയും കുറിപ്പുകള്‍ വ്യക്തമാക്കുന്നത്‌ ചില്ല് എന്‍കോഡ്‌ ചെയ്താല്‍ ഭാഷാ കമ്പ്യൂട്ടിങ്ങിനുണ്ടാകുന്ന എണ്ണമറ്റ ഗുണങ്ങളെക്കുറിച്ച്‌ അവര്‍ക്ക്‌ വ്യക്തമായ ബോദ്ധ്യമുണ്ട്‌ എന്നാണ്‌. നിലവിലുള്ള രീതിയില്‍ ZW(N)J ഉപയോഗിച്ച്‌ ചില്ലുകള്‍ ഉല്‍പാദിപ്പിക്കുമ്പോഴുണ്ടാകുന്ന അപകടങ്ങളെകുറിച്ച്‌ അവര്‍ക്ക്‌ അതുകൊണ്ട് സ്വാഭാവികമായും വല്ലാത്ത ഉല്‍ക്കണ്ഠകളുണ്ട്‌. സുറുമയുടേയും റാല്‍മിനോവിന്റേയും (എന്റേയും) സന്നിഗ്ദ്ധതകളുടെ ഹേതു ഈ ബോദ്ധ്യങ്ങളുടെ അഭാവമാണ്‌.

വിശ്വവും സുനിലും മുന്‍കൈ എടുത്ത്‌ ഉടനെ ഒരു കാര്യം ചെയ്യണം. ചില്ല് എന്‍കോഡ്‌ ചെയ്താല്‍ ഉണ്ടാകുന്ന ഗുണങ്ങള്‍, പ്രയോജനങ്ങള്‍, എളുപ്പങ്ങള്‍ (Merits, and demerits if any) എന്നിവയെ കുറിച്ച്‌
ഒന്ന്
രണ്ട്‌
മൂന്ന്
നാല്‌
.......

എന്നിങ്ങനെ compile ചെയ്ത്‌ അടിയന്തിരമായി ഇവിടെ പ്രസിദ്ധീകരിക്കണം. സിബുവിന്റെ ഫാക്കുകളിലും ഇന്‍ഡിക്‌ ലിസ്റ്റിലെ ചര്‍ച്ചകളിലും എറിക്‌ മുള്ളര്‍, പീറ്റര്‍ കോണ്‍സ്റ്റബിള്‍ എന്നിവരുടെ മെയിലുകളിലും മറ്റുമായി ചിതറികിടക്കുന്ന ആശയങ്ങളെ ക്രോഡീകരിച്ചാലേ ചര്‍ച്ച അര്‍ത്ഥവത്തായി മുന്നേറൂ.

ചില്ലിനുവേണ്ടിയുള്ള വാദങ്ങളെക്കാളും പ്രതിവാദങ്ങളെക്കാളും രാഷ്ട്രീയങ്ങളെക്കാളും മുന്‍ഗണന കൊടുക്കേണ്ടത്‌ പ്രയോജനങ്ങളെക്കുറിച്ചുള്ള വിലയിരുത്തുകളെയാണ്‌. ഒന്നോ രണ്ടോ അപകടങ്ങളുണ്ടാകാമെങ്കിലും, നൂറ്‌ ഗുണങ്ങളുണ്ടെങ്കില്‍ ചില്ലിന്റെ എന്‍കോഡിംഗ്‌ എന്തുകൊണ്ട്‌ സ്വാഗതം ചെയ്തുകൂടാ?

ടൈപ്‌ റൈറ്റര്‍ കട്ടകളില്‍നിന്നും മാതൃഭാഷ ഒരുവിധം രക്ഷപ്പെട്ടു വരുന്നതേയുള്ളു. അപ്പോഴേക്കും ചതുരക്കട്ടകള്‍ പ്രത്യക്ഷപ്പെടുകയായി.

ഹുസൈന്‍, രചന

മഹേഷ് മംഗലാട്ട് said...

ഹുസൈന്‍ ഉന്നയിച്ച കാര്യം പ്രസക്തമാണ്.പ്രശ്നപരിഹാരത്തിനുവേണ്ടിയാണ് നാം ശ്രമിക്കുന്നതെങ്കില്‍ അതിന് പ്രതികരണം ഉണ്ടാവേണ്ടതാണ്.ഇത്രയും നേരമായി ഒരു പ്രതികരണവും ഉണ്ടായില്ല എന്നത് സംശയാസ്പദമാണ്.

പ്രതികരണത്തിനായി അനന്തമായി കാത്തിരിക്കാനാവില്ല.

ചതുരക്കട്ടകളുടേയും വിചിത്രമായ കൂട്ടക്ഷരങ്ങളുടേയും കാലത്തിലേക്കാണ് നാം പോകേണ്ടതെങ്കില്‍ അക്കൂട്ടത്തിലുള്ള, പ്രബോധചന്ദ്രന്‍ നായരാല്‍ നയിക്കപ്പെടുന്ന മലയാളിയായി ഇതാ ഞാനും.

ഇരുപത്തിയൊന്നാം നൂറ്റാണ്ടിലെ കേരളീയജീവിതത്തിന്റെ ചരിത്രത്തിന്റെ ഭാഗമാകുവാന്‍ അദ്ദേഹം നടത്തുന്ന പ്രവര്‍ത്തനം വിജയം വരിക്കുന്നെങ്കില്‍ അതിന്റെ ഫലം നമ്മുക്കെല്ലാം അനുഭവിക്കാം.

Anonymous said...

മാഷേ, നിങ്ങളെപ്പോലുള്ളവര്‍ ഇങ്ങനെ വികാരം കൊണ്ടാല്ലോ, 3-4 കൊല്ലത്തോളം പലരും ഈ വാദങ്ങള്‍ക്കു പുറകേ അലഞ്ഞു തിരിഞ്ഞവരാണു്, അവരുടെ പ്രതികരണം കാത്തിരിക്കാന്‍ ആകെയുള്ള സമയം ഒരു പകലാണോ?

ഹുസൈന്‍ മാഷ് പറഞ്ഞതു കാര്യം, പക്ഷെ വിശ്വമോ സിബുവോ ഹുസൈന്‍ മാഷിനു തന്നെയോ ഇക്കാര്യം ചെയ്യാവുന്നതാണു്, പൊതുസ്ഥലത്തായതുകൊണ്ടു ആര്‍ക്കും ഫാബ്രിക്കേറ്റ് ചെയ്യാന്‍ പറ്റില്ല, അതുകൊണ്ടു് ആരു ചെയ്താലും സാരമില്ല.

സിബു::cibu said...

റാല്‍മിനോഫ്, ഇക്കാര്യങ്ങളെ പറ്റി വിശദമായി ഇന്‍ഡിക് ലിസ്റ്റില്‍ ഒരു ചോദ്യം ഉന്നയിക്കൂ. എനിക്ക്‌ പറയാനുള്ള കാര്യങ്ങള്‍ ഇത്രയുമാണ്:
റാല്‍മിനോഫ് ഉന്നയിച്ച പ്രശ്നം മലയാളം ചില്ലുകള്‍ക്ക്‌ മാത്രമായുള്ളതല്ല; ഡിപ്രിക്കേറ്റ് ചെയ്യപ്പെടുന്ന ഏത്‌ യുണീക്കോഡ് അക്ഷരത്തിനും ബാധകമാണ്. യുണീക്കോഡിന്റെ ഡിപ്രിക്കേഷന്‍ രീതി എന്താണോ അത്‌ തന്നെ, ഇവിടെയും അപ്ലിക്കബിള്‍ ആണ്.
ചില്ലുള്ള എത്ര IDN-കള്‍ ഇതുവരെ റജിസ്റ്റര്‍ ചെയ്തിട്ടുണ്ടാവാം? ഏതെങ്കിലും ഉണ്ടെങ്കില്‍ തന്നെ, നാമമാത്രമാണെന്ന്‌ എന്റെ ഊഹം.
അതുകൊണ്ട്‌ തന്നെ, ഇതുവരെ എഴുതിപ്പോയ 100 വാക്കുകള്‍ തെറ്റിപ്പോവുന്നതിലും എനിക്ക്‌ പ്രധാനം, മലയാളത്തില്‍ ഇനിയെഴുതാനിരിക്കുന്ന കോടിക്കണക്കിന് വാക്കുകള്‍ ശരിയാവുന്നതാണ്.

ഹുസൈന്‍, ആ ഒരുദ്ദേശം വച്ചാണ് ഞാന്‍ http://unicode.wikia.com റജിസ്റ്റര്‍ ചെയ്തത്‌ - ഒരു പ്രശ്നത്തിന്റെ വിവിധ വശങ്ങള്‍ ഒട്ടും വ്യക്തിപരമല്ലാതെ ക്രോഡീകരിക്കുക എന്നത്‌. ഇപ്പോഴും അവിടെ എഴുതുന്നത്‌ ഞാന്‍ മാത്രമാണ്. കൂടുതല്‍ പേര്‍ അവിടം ഉപയോഗിക്കും എന്ന്‌ ഇനിയും ഞാന്‍ ആശിക്കുന്നു. മലയാളം യുണീക്കോഡിന്റെ പ്രശ്നങ്ങളോരോന്നും വെളിവാകുന്ന മുറയ്ക്ക്‌ അവിടെ കാറ്റലോഗ് ചെയ്യണം എന്നതെന്റെ ഒരാശയാണ്. കൂടാതെ അവയ്ക്കുള്ള വിവിധ പരിഹാരമാര്‍ഗ്ഗങ്ങളും. ചില്ലിനെ പറ്റിയുള്ള ചര്‍ച്ച തീര്‍ന്നു എന്ന്‌ തോന്നിയതിനാലാണ് ചില്ലിനെ പറ്റിയുള്ള കാര്യങ്ങള്‍ കൂടുതല്‍ അവിടെ എഴുതാഞ്ഞത്‌. എന്നാല്‍ ഗണേശന്റെ ചില്ല് സൈന്‍ നിര്‍ദ്ദേശത്തെ ഞാ‍ന്‍ വിശദമായി ക്രിട്ടിസൈസ് ചെയ്തിട്ടുണ്ട്‌. ചില്ല് എന്തുകൊണ്ട്‌ എന്‍‌കോഡ് ചെയ്യണം എന്ന എന്റെ വാദങ്ങള്‍ ഞാന്‍ താമസിയാതെ അവിടേയ്ക്ക് കോപ്പി ചെയ്യാന്‍ ശ്രമിക്കാം.

പിന്നെ, ചതുരക്കട്ട കളഞ്ഞ്‌ പുള്ളിവൃത്തമാക്കിയിട്ടുണ്ട്‌ :) വായിക്കുമല്ലോ.

മഹേഷ്‌, പലവേദികളിലും ഉന്നയിച്ച എന്നെ പറ്റിയുള്ള വ്യക്തിപരമായ വിമര്‍ശനങ്ങള്‍ ഞാന്‍ ശ്രദ്ധിക്കാതെയല്ല. എന്നാല്‍ ഞാന്‍ എന്ന വ്യക്തിക്കല്ല, വസ്തുനിഷ്ഠവും സാങ്കേതികവുമായ കാര്യങ്ങള്‍ക്കേ ഈ ചര്‍ച്ചയില്‍ ഒരു പ്രാധാന്യമുള്ളൂ എന്നതിനാലാണ് അതിനൊക്കെ മറുപടി പറഞ്ഞ്‌ ഈ ചര്‍ച്ചയുടെ ഫോക്കസ് നഷ്ടപെടുത്താഞ്ഞത്‌‌. ഇനിയും അങ്ങനെ തന്നെ.

അഗ്രജന്‍ said...

ബ്ലോഗില്‍ വന്നതിന് ശേഷം എനിക്കേറ്റവും പ്രയോജനകരമായി തോന്നിയ ചര്‍ച്ച. അറിവുകള്‍ പകര്‍ന്നു തരുന്നവര്‍ക്ക് നന്ദി.

മാഷ് said...

മലയാളം യുണീകോഡുമായി ബന്ധമുള്ള ഒരു വിഷയം ഞാന്‍ ഇവിടെ പോസ്റ്റ് ചെയ്തിരുന്നു, ഒരു സംശയനിവാരണം പോലെ. ഒരു പക്ഷേ എന്റെ അറിവില്ലായ്മയാവാനും മതി.

Ralminov said...

IDN കാരണമാക്കിയാല്‍ എന്‍കോഡിങ്ങ് മാറ്റുന്നതു് അബദ്ധമാവും. കണ്മണി.കോം, കണ്‍മണി.കോം വെവ്വേറെ ആളുകള്‍ റെജിസ്റ്റര്‍ ചെയ്യുന്നതു് നല്ലതല്ലെന്നാണു് എന്റെ (ഇരുമ്പുലക്കയല്ലാത്ത) അഭിപ്രായം.

ഇന്‍ഡിക് ലിസ്റ്റില്‍ സബ്​സ്ക്രൈബ് ചെയ്യാതെ ഒരു മെയില്‍ അയച്ചു. അതെവിടെപ്പോയോ എന്തോ!!

Hussain, Rachana said...

സിബു: ചില്ല് എന്തുകൊണ്ട്‌ എന്‍‌കോഡ് ചെയ്യണം എന്ന എന്റെ വാദങ്ങള്‍ ഞാന്‍ താമസിയാതെ അവിടേയ്ക്ക് കോപ്പി ചെയ്യാന്‍ ശ്രമിക്കാം.

വാദങ്ങള്‍ അവിടെ നില്‍ക്കട്ടെ. നൂറെണ്ണം വേണ്ട, ഒരഞ്ചു പ്രയോജനങ്ങള്‍ ഇവിടെ കുറിച്ചിടൂ. 'അവിടേയ്ക്കു' കോപ്പി ചെയ്യേണ്ട.
വെബും ലിങ്കുകളും മനുഷ്യനെ കുടുക്കാനുള്ള വലയായിതീരുകയാണ്‌.

ഹുസൈന്‍, രചന

Ralminov said...

viswaprabha wrote:
യുണികോഡ് ഒരു ചതുരക്കട്ട കാണിക്കുമ്പോള്‍ നമ്മോടു പറയുന്നത്, “നോക്കൂ, ഇവിടെ ഏതോ ഒരു ഭാഷയിലെ ഒരക്ഷരം എഴുതിയിട്ടുണ്ട്. പക്ഷേ അതു കാണിക്കാനുള്ള ഗ്ലിഫ് എന്റെ കയ്യിലില്ലാട്ടോ, സോറി. പക്ഷേ ഞാന്‍ അതിനെ ശല്യമൊന്നും ചെയ്യില്ല. അങ്ങനെത്തന്നെ കൊണ്ടുനടന്നോളാം” എന്നാണ്. (അതേ സമയം ഒരു ചോദ്യചിഹ്നമാണെന്നു വരികില്‍ യുണികോഡിന് ആ ക്യാരക്റ്ററിനെയോ അതിന്റെ ഭാഷയേയോ തിരിച്ചറിയാന്‍ പോലുമായില്ലെന്നര്‍ത്ഥം. അല്ലെങ്കില്‍ ആ പേജ്/അക്ഷരം യുണികോഡിനെ തിരിച്ചറിഞ്ഞില്ലെന്നും പറയാം. പ്രസ്തുത ക്യാരക്റ്റര്‍ കൂടുതല്‍ പ്രോസസ്സിംഗിന് ഉപയുക്തമാവാതെ എന്നെന്നേക്കുമായി നശിച്ചുപോയി എന്നു കരുതാം.)

There are factual errors in these statements. Only to put the record straight I intervene.
1.When we see blocks, we understand that the application supports unicode and the written language, but no font available to show those glyphs.
2.When we see question mark, the application is unaware of the language itself or its encoding.It doesnt mean however the data has become useless. The data can be read successfully with unicode aware , langauge supported applications.


And regarding Cibu's new proposal, please read the first comment in this post by Peringodan.

All the problems will be solved if the joiners are elevated from their format control character status, and in the Input method a key is assigned to virama + zwnj ligature.

മലയാളം എഴുതി മടുത്തിട്ടല്ല. മലയാളം അറിയാത്തവരും വായിച്ചോട്ടെ എന്നു് കരുതിയാണു്.

സിബു::cibu said...

റാല്മിനോഫ്, ചില്ലുകള് എന്കോഡ് ചെയ്യുന്നതും എന്കോഡ് ചെയ്യാത്തതും പെര്ഫെക്റ്റ് സൊല്യൂഷന്സ് അല്ല. അതായത് രണ്ടിലും പ്രശ്നങ്ങളുണ്ട്. കൂടുതല് ഗുരുതരമായ പ്രശ്നം സൃഷ്ടിക്കുന്ന സൊല്യൂഷന്, യുണീക്കോഡ് കണ്സോര്ഷ്യം ഒഴിവാക്കി. പ്രശ്നം എന്താണെന്ന് ഹുസൈനിനുള്ള മറുപടിയില്.

കണ്മണി-കണ്മണി എന്നിവയ്ക്ക് രണ്ട് വ്യത്യസ്ത എന്കോഡിങ് ഉണ്ടാവുന്നു എന്നതായിരുന്നു ചില്ല് എന്കോഡിങ്ങിനെതിരെ രചന ഉന്നയിച്ച വാദം. അത് ശരിയുമാണ്. എന്നാല് പരിഹരിക്കാന് പറ്റാത്തതല്ല. ആവശ്യമെങ്കില് അവ തമ്മിലുള്ള ഈക്വിവാലന്സ് കണ്ടുപിടിക്കേണ്ട ചുമതല ഹയര്‍ ലെവല് ലോജിക്/പ്രോട്ടോക്കോളുകള്ക്കാണ്. ഉദാഹരണത്തിന് IDN-ന് വേണ്ടിയാണ് ഈ രണ്ട് വാക്കുകളെങ്കില്, ഒന്ന് മാത്രം അനുവദിക്കുക, ചില്ലിന്റെ എന്കോഡിങ്ങില് മാത്രം വ്യത്യാസമുള്ള മറ്റേ ഡൊമെയിന് നെയിം റിജക്റ്റ് ചെയ്യുക. യുണീക്കോഡിലെഴുതിയ ഏതുവാക്കും ഡൊമെയിന് നേം ആക്കാനാവില്ല. സെക്യൂരിറ്റിക്ക് വേണ്ടി അനേകം നിബന്ധനകള് IDN അനുവദിക്കുന്നതില് ഉണ്ട്. ആ നിബന്ധനകളാണ് ഇവിടെ ഹയര്‍ ലെവല് ലോജിക്.

ഹുസൈന്,
ഇപ്പോഴുള്‍ ചില്ലുണ്ടാക്കുന്ന രീതിക്കുള്ള ഏറ്റവും വലിയ പ്രശ്നം പറയാം. കറക്റ്റ്നെസ്സാണ് അത്‌. ഒരു സീക്വന്‍സ് അതിന്റെ അടിസ്ഥാനഘടകങ്ങളായുള്ള അക്ഷരങ്ങളോട് സത്യസന്ധത പുലര്‍ത്തേണ്ടതുണ്ട്. ഉദാഹരണത്തിന് ‘വാഴ’ എന്നെഴുതാന്‍ ‘വായ’ എന്നെഴുതി രണ്ട് ZWJ ഇട്ടാല്‍ മതി എന്ന രീതിയിലുള്ള എന്‍‌കോഡിങ്ങിനെ യുണീക്കോഡ് റിജക്റ്റ് ചെയ്യുന്നു. ഇതുപോലെയാണ് ഇന്ന് ചില്ലുകളുടെ കാര്യത്തിലും. ഉദാഹരണത്തിന് ‘മലര്‍’, ‘ഞായര്‍’ എന്നിവയില് ഉപയോഗിച്ചിരിക്കുന്ന ഒരേ ചില്ലക്ഷരം പ്രതിനിധാനം ചെയ്യുന്നത്‌ യഥാക്രമം ‘ര’, ‘റ’ എന്നീ വ്യത്യസ്തരണ്ടക്ഷരങ്ങളെ ആണ്. അപ്പോള്‍ ചില്ലുണ്ടാക്കാന്‍ ‘ര + ചന്ദ്രക്കല + ZWJ' ഉപയോഗിക്കണം എന്നു് വയ്ക്കുന്നത്‌ ‘ഞായറിന്റെ’ കാര്യത്തില്‍ കറക്റ്റ്നെസ് വയലേഷനാണ്.

Ralminov said...

അങ്ങനെയെങ്കില്‍ ചില്ല് സൈന്‍ നിര്‍ദ്ദേശത്തെ ഖണ്ഡിക്കാന്‍ സിബു IDN security issue കൂട്ടു് പിടിച്ചതെന്തിനു്? അവിടേയും higher level logic മതിയായിരുന്നല്ലോ?

ഒരിക്കല്‍ എന്‍കോഡ് ചെയ്യപ്പെട്ടാല്‍ ആരു് തന്നെ വിചാരിച്ചാലും അതു് മാറ്റാനൊക്കില്ല. അതു് കൊണ്ടു് തന്നെ ചില്ലു എന്‍കോഡ് ചെയ്യപ്പെടുന്നതിനു് മുമ്പു് അപകടമാവില്ല എന്നു് ഉറപ്പു് വരുത്തേണ്ടതുണ്ടു്.

സിബു::cibu said...

തീര്‍ച്ചയായും അത്‌ എന്റെ തെറ്റാണ്.. എത്രയും പെട്ടെന്ന്‌ തിരുത്താം. ചൂണ്ടിക്കാണിച്ചതിന് നന്ദി.

IDN പ്രശ്നം, വാദങ്ങളുടെ സീക്വന്‍സില്‍ സെക്കന്ററി ഇഷ്യു ആയതിനാല്‍ മുഖ്യവാദങ്ങള്‍ക്കും പ്രപ്പോസലിനും കാര്യമായ വ്യത്യാസമുണ്ടാക്കില്ല എന്ന്‌ ശ്രദ്ധിച്ചുവല്ലോ.

മഹേഷ് മംഗലാട്ട് said...

സിബു ഹുസൈനോട് പറയുന്നു:
ഇപ്പോഴുള്‍ ചില്ലുണ്ടാക്കുന്ന രീതിക്കുള്ള ഏറ്റവും വലിയ പ്രശ്നം പറയാം. കറക്റ്റ്നെസ്സാണ് അത്‌. ഒരു സീക്വന്‍സ് അതിന്റെ അടിസ്ഥാനഘടകങ്ങളായുള്ള അക്ഷരങ്ങളോട് സത്യസന്ധത പുലര്‍ത്തേണ്ടതുണ്ട്.

ചില്ലിന്റെ കാര്യത്തില്‍ വ്യാകരണപണ്ഡിതന്മാരും ഭാഷാശാസ്ത്രജ്ഞരും നടത്തിയ ചര്‍ച്ചകള്‍ വായിച്ചു പഠിക്കാന്‍ അവസരമുണ്ടായിട്ടുണ്ട്. അവിടെയൊന്നും ലിപിചിഹ്നം അടിസ്ഥാനഘടകങ്ങളോട് നീതിപുലര്‍ത്തണം എന്ന് ആരും വാദിക്കുന്നതു കേട്ടിട്ടില്ല. ഏത് സൈദ്ധാന്തികനിലപാടില്‍ നിന്നാണ് ഈ വാദം എന്ന് അറിയാന്‍ താല്പര്യമുണ്ട്.

ഇനി കമ്പ്യൂട്ടറില്‍ ചില്ലിന്റെ ലിപിചിഹ്നം രൂപപ്പെടുന്നതിന്റെ കാര്യത്തിലാണെങ്കില്‍, ഇക്കാര്യത്തെപ്പറ്റി നന്നായി മനസ്സിലാക്കിയവരാണ് CDACല്‍ അതിന്റെ വ്യവസ്ഥ നിശ്ചയിച്ചിട്ടുള്ളത്. പ്രായോഗികമായും താത്വികമായും ISFOC കോഡും അതിന്റെ പ്രയോഗരീതിയും ശരിയാണ്.വിരാമ എന്ന സംജ്ഞയോട് എനിക്ക് വിപ്രതിപത്തിയുണ്ട്.എന്നാല്‍, ഇന്ത്യന്‍ ഭാഷകളെ ഒരു കോഡിനു കീഴില്‍ കൊണ്ടുവന്ന മഹത്തായ പ്രവര്‍ത്തനം ആദരവോടെ അംഗീകരിക്കുവാന്‍ ആര്‍ക്കും സാധിക്കും എന്നാണ് എന്റെ വിശ്വാസം.ചില്ലിന്റെ അടിസ്ഥാനഘടകങ്ങളോട് സത്യസന്ധത പുലര്‍ത്തണം എന്ന് സീബുവിന് തോന്നുന്നതു പോലെ അവര്‍ക്ക് തോന്നാതിരുന്നത് എന്തു കൊണ്ടായിരിക്കാം?

സാങ്കല്പികപ്രശ്നങ്ങള്‍ക്ക് യുക്തിരഹിതമായ പരിഹാരം കല്പിച്ച് അതിന് സൈദ്ധാന്തികസാധൂകരണം കണ്ടെത്താന്‍ ശ്രമിക്കുന്നത് ശാസ്ത്രീയമായ അടിത്തറയുള്ള വിഷയങ്ങളില്‍ എളുപ്പമല്ല.അറിവുള്ളവര്‍ക്ക് അത് എളുപ്പത്തില്‍ തിരിച്ചറിയാനാകും

Ralminov said...

എന്റെ ശരിക്കുള്ള പേരിനു് മൂന്നു് ചില്ലാണുള്ളതു്. ആറു് (6) ഞാന്‍ IDN register ചെയ്യണമല്ലോ ചില്ല് എന്‍കോഡ് ചെയ്താല്‍ !!!
It'll take time to standardize and implement any high level logic in IDN procedure, as it is termed as 'secondary' argument. By that time there may be lot of IDNs using the deprecated method. Then the only way before the IDN will be to EXCLUDE the newly encoded characters from using in IDN (this also will be debated thoroughly).

ഞായറിന്റെ ഉദാഹരണം വാദത്തിനു് കൊള്ളാം.

സിബുവിന്റെ proposal ആദ്യം പറഞ്ഞ വെട്ടിമുറിയിലെത്തിയതു് സിബു ശ്രദ്ധിച്ചോ എന്തോ ! These meta joiners also will be removed by the applications resulting in Tamil like Malayalam.

Nimmy said...

To Ramilov,

Presently there is no method by which the so called chillu characters can be represented in IDN and hence no question of IDN's with deprecated Chillu sequences. As far as I know, Malayalam IDN is not yet acitivated. The Indian authorities were trying to solve the Chillu issue before launching Malayalam IDN.
Nimmy.

കെവി said...

എല്ലാരുടേയും വാദങ്ങള്‍ വായിയ്ക്കുന്നുണ്ടു്. രണ്ടുകൊല്ലത്തോളം ഇതേ കാര്യങ്ങള്‍ തന്നെ വാദിച്ചുവാദിച്ചു കൊതിതീര്‍ന്നതാണു്. അതുകൊണ്ടാ ഇപ്പോ ഒന്നും എഴുതാതെ വിടുന്നതു്, താല്പര്യം നശിച്ചിട്ടാണെന്നു കരുതരുതു്. എല്ലാവര്‍ക്കും വാദിയ്ക്കാന്‍ അവസരം കൊടുക്കണമല്ലോ. പിന്നെ പറഞ്ഞതു് തന്നെ പറഞ്ഞുകൊണ്ടിരിക്കുന്നതിലെ മടുപ്പും.
സസ്നേഹം കെവി

Ralminov said...

Malayalam IDN is active. Try കേരളം.com in Firefox. Some browsers doesn't allow IDN because of the security issue. If we write സര്‍ക്കാര്‍.com , it'll be changed to its punycode (xn--bwca3fc0b1bygbd.com) in the browser.

There were people saying around there is no ZWJ in IDN, so inorder to get Chillu, we should encode Chillu. I also believed so initially.
Now I will say, its simply absurd and it adds convenience of having less trouble in registering IDN. I can register റാല്മിനോവ്.കോം , nobody will prevent me from using റാല്‍മിനോവ്.കോം either.

കെവി said...

ഞാന്‍ നേരത്തെ പറഞ്ഞ ചതുരക്കട്ടയുണ്ടാക്കുന്ന നിയമങ്ങളെ കാര്യമായി മയപ്പെടുത്തി ഇപ്പോഴത്തേതിനോട്‌ വളരെ സാമ്യമുള്ള നിയമങ്ങളാക്കി. ഇവിടെ വായിക്കുമല്ലോ.

സിബുവിന്റെ സ്വപ്നത്തിലെ യുണീക്കോഡ് വായിച്ചു. താത്ത്വികമായി എനിക്കൊരെതിര്‍പ്പുണ്ടു്. യാതൊരുതരം ഫോര്‍മാറ്റിങ്ങും കൂടാതെയുള്ള മലയാളം ടെക്സ്റ്റ് എന്നതു് ഇപ്രകാരമൊരു രീതിയല്‍ അസാധ്യമാകും. പഴയലിപിയില്‍ എഴുതാന്‍ ജോയിനറുകള്‍ ടിപ്പര്‍ലോറിയില്‍ ഇറക്കേണ്ടിവരും. ജോയിനറുകള്‍ ഉപയോഗിച്ചു് പഴയലിപിയില്‍ എഴുതിയ ടെക്സ്റ്റ്, ഒരുപഴയലിപിഫോണ്ടുപയോഗിക്കാന്‍ പറ്റാത്ത അവസ്ഥയില്‍ (ഉദാഹരണത്തിനു്: മൊബൈല്‍ഫോണ്‍ ഡിസ്പ്ലേ, എയര്‍പോര്‍ട്ടിലെ ഫ്ലൈറ്റ് ഇന്‍ഫൊര്‍മേഷന്‍ ഡിസ്പ്ല) കുത്തുവട്ടങ്ങളുമായി വൃത്തികേടാവും. പിന്നെയുള്ള പ്രശ്നം, ഒരായിരം പേജുള്ള ഒരു ഗ്രന്ഥം ഏതോ കാരണവശാല്‍ ജോയിനറുകള്‍ നഷ്ടമായ അവസ്ഥയില്‍ അതിനെ പഴയലിപിയില്‍ അച്ചടിക്കണമെങ്കില്‍ എന്തുചെയ്യും? അത്രയും കൂട്ടക്ഷരങ്ങള്‍ ഉണ്ടാക്കാന്‍ വീണ്ടും ആ ആയിരം പേജിലും പോയി ജോയിനറുകള്‍ കേറ്റണ്ടേ? അതു നടക്കണ കാര്യമാണോ?

ഇത്തരം ഒരു മാറ്റം ഞാന്‍ സിബുവിന്റെ സ്വപ്നത്തിനു നിര്‍ദ്ദേശിക്കുന്നു. ജോയിനറിനു പകരം അണ്‍ജോയിനര്‍ ഉപയോഗിക്കുക. ഒരു സ്വാഭാവിക മലയാളം ടെക്സ്റ്റ്, ഫോര്‍മാറ്റിങ്ങ് ഇല്ലാതെ, ഉപയോഗിക്കുന്ന ഫോണ്ടിനനുസൃതമായി കാണണം. യാതൊരു കുഴപ്പങ്ങളും കുത്തുവട്ടങ്ങളുമില്ലാതെ. പിരിച്ചുകാണിക്കണമെന്നു എഴുത്തുകാരനു നിര്‍ബന്ധമുള്ളവയ്ക്കു് ഒരു അണ്‍ജോയിനര്‍ ഉപയോഗിച്ചു് പിരിക്കാം. എഴുത്തുകാരനു കൂട്ടക്ഷരമായി കാണണമെന്നു നിര്‍ബന്ധമുണ്ടെങ്കില്‍ വായനക്കാരനോടു ഉപദേശിക്കാം, ഒരു പഴയലിപിയുള്ള ഫോണ്ടുപയോഗിക്കാന്‍, പക്ഷേ എല്ലാ അവസരങ്ങളിലും അതു പ്രായോഗികമാണെന്നു കരുതരുതു്. പഴയലിപി കാണിക്കാന്‍ കഴിയാത്ത, സ്ഥലസൌകര്യവും റെസലൂഷന്‍ സൌകര്യവും മറ്റും ഇല്ലാത്ത അവസരങ്ങളില്‍ പുതിയ ലിപിതന്നെ ശരണം. അപ്പോ പഴയലിപിയില്‍ എഴുതിയ മലയാളം ടെക്സ്റ്റിനു കുഴപ്പമൊന്നും പറ്റരുതു്.

സിബു::cibu said...

റാല്മിനോഫ്: All the problems will be solved if the joiners are elevated from their format control character status, and in the Input method a key is assigned to virama + zwnj ligature

ഞാന് നേരത്തെ പറഞ്ഞത് പോലതന്നെ, ഇത്തരം സ്റ്റേറ്റുമെന്റുകള് പറയുമ്പോള്, തെളിവ് വേണം.

ഫോണ്ട് സ്റ്റാന്റേഡൈസേഷനെ പറ്റി പറഞ്ഞതു തന്നെ, ഇന്പുട്ട് മെത്തേഡ് സ്റ്റാന്റേഡൈസേഷനെ പറ്റി പറയാനുള്ളതും.

ചില സീക്വന്സുകള് പ്രശ്നങ്ങളുണ്ടാക്കുമെങ്കില് അത് യുണീക്കോഡില് തന്നെയാണ് നിവൃത്തിയുണ്ടെങ്കില് ഫിക്സ് ചെയ്യേണ്ടത്. മുകളിലെ അപ്ലിക്കേഷനുകളിലല്ല. ഇതൊന്നും കൂടാതെ ഈ നിര്ദ്ദേശത്തിന് പ്രശ്നങ്ങളുണ്ട്. ഈ പറഞ്ഞ പ്രകാരം കീബോര്ഡില് എത്ര ചന്ദ്രക്കലയുണ്ടാവും? രണ്ടെണ്ണം വേണ്ടിവരില്ലേ? 1) virama 2) virama + zwnj. ഇല്ലെങ്കില് കൂട്ടക്ഷരം 'ക്ക' എങ്ങിനെയുണ്ടാക്കും? രണ്ടെണ്ണമുണ്ടെങ്കില് കാര്ത്തികയുപയോഗിക്കുന്ന ആള് ദൃക്സാക്ഷി എന്ന് തെറ്റായി എഴുതിയാല് അതെങ്ങനെ തിരിച്ചറിയും?


മഹേഷ്: അവിടെയൊന്നും ലിപിചിഹ്നം അടിസ്ഥാനഘടകങ്ങളോട് നീതിപുലര്ത്തണം എന്ന് ആരും വാദിക്കുന്നതു കേട്ടിട്ടില്ല. ഏത് സൈദ്ധാന്തികനിലപാടില് നിന്നാണ് ഈ വാദം എന്ന് അറിയാന് താല്പര്യമുണ്ട്.

ഇതെനിക്ക് ഇഷ്ടമായി. ശ്രദ്ധിച്ചുവായിക്കൂ.. മഹേഷ് പറഞ്ഞുവരുന്നത് പണ്ഡിതര് ചില്ലുകളെ അവയുടെ അടിസ്ഥാന അക്ഷരങ്ങളുമായി ബന്ധപ്പെടുത്തിയല്ല കാണുന്നത്‌; മറിച്ച് അവയെ പ്രത്യേക ഒരു എന്റിറ്റി ആയിട്ടാണ്. അതുതന്നെയാണ് ഞാനും പറഞ്ഞത്. ചില്ലുകള് പലകാര്യങ്ങളിലും പ്രത്യേക എന്റിറ്റി ആയി ആണ് പ്രവര്ത്തിക്കുന്നത്; അതുകൊണ്ട് അവയെ എന്കോഡ് ചെയ്യണം.

അക്ഷരങ്ങളെ എന്കോഡ് ചെയ്യേണ്ടതിന്റെ മാനദണ്ഡങ്ങള് UTR#17: Character Encoding Model എന്ന ഡോക്യുമെന്റിലാണ് എഴുതിയിരിക്കുന്നത്. പക്ഷെ, ആ ഡോക്യുമെന്റ് പോരാ എന്നത് ഞാനും സമ്മതിക്കുന്നു.. കുറച്ചുകൂടി കൃത്യമായി കാര്യങ്ങള് എഴുതേണ്ടതുണ്ട്. എന്തായാലും ഈ ചോദ്യം ഇന്ഡിക് ഫോറത്തില് ചോദിക്കൂ.

പിന്നെ, കഴിഞ്ഞ ദിവസം ബൂലോഗക്ലബ്ബില് കമന്റുവന്നില്ല അതുകൊണ്ട് ചില്ല് എന്കോഡ് ചെയ്യരുത് എന്നിങ്ങനെ പോകുന്ന വാദങ്ങള് ഇന്ഡിക് ലിസ്റ്റില് കണ്ടു. ഞാനിവിടെ ഒന്നു രണ്ട് ദിവസം കൂടുമ്പോള് ഒരിക്കലേ കമന്റെഴുതൂ. അത് കാര്യങ്ങള് ആലോചിച്ച് എഴുതാനും, ചര്ച്ച ആവശ്യത്തില് കൂടുതല് ഹീറ്റഡായി പോവാതിരിക്കാനുമാണ്.

റാല്മിനോഫ്: എന്റെ ശരിക്കുള്ള പേരിനു് മൂന്നു് ചില്ലാണുള്ളതു്. ആറു് (6) ഞാന് IDN register ചെയ്യണമല്ലോ ചില്ല് എന്കോഡ് ചെയ്താല് !!!

വേണ്ടിവന്നേക്കാം. എന്നാല് അതൊക്കെ യുണീക്കോഡിന്റേതിനേക്കാള് അതാത് ഭാഷയുടെ പ്രശ്നമാണ്. ഉദാ: color & colour. അല്പ്പം & അല്പം. ഇവിടെയൊക്കെ സ്പെല്ലിംഗ് വ്യത്യാസമുണ്ട്, അതുകൊണ്ട് എന്കോഡിങ് വ്യത്യാസവുമുണ്ട്.

റാല്മിനോഫ്: സിബുവിന്റെ proposal ആദ്യം പറഞ്ഞ വെട്ടിമുറിയിലെത്തിയതു് സിബു ശ്രദ്ധിച്ചോ എന്തോ ! These meta joiners also will be removed by the applications resulting in Tamil like Malayalam.

അത് സ്വപ്നലോകത്തെ യുണീക്കോഡല്ലേ.. അവിടെ നിയമങ്ങളെല്ലാം നമ്മളുണ്ടാക്കുന്നതല്ലെ. ആ പ്രപ്പോസലിലെ വിരാമജോയിനറിനെ കളയാന് പാടില്ല എന്നുപറഞ്ഞാല് കളയാന് പാടില്ല. അത്രേ ഉള്ളൂ.

കെവിനേ, കുത്തുവട്ടത്തിനെ ഒരു വാണിങ്ങായി കണക്കാക്കണം. അത്‌ ഏതെങ്കിലും രീതിയില്‍ ഡിസേബിള്‍ ചെയ്താല്‍ ‘ദൃക്സാക്ഷി’ വരും; ജോസ്തോമസ് തീര്‍ച്ചയായും വരും. കാര്‍ത്തികയിലെഴുതിയത്‌ അഞ്ജലിയില്‍ വായിക്കുന്നതാണ് പ്രോബ്ലമാറ്റിക് സിനാരിയോ.

മഹേഷ് മംഗലാട്ട് said...

സിബുവിന്റെ അഭിപ്രായം വ്യക്തതയില്ലായ്മയും അതിന്റെ ഭാഗമായ തെറ്റിദ്ധാരണകളുമാണ് കാണിക്കുന്നത്.

വ്യാകരണപണ്ഡിതന്മാര്‍,ഭാഷാശാസ്ത്രജ്ഞര്‍ എന്നിവര്‍ വ്യത്യസ്ത തലത്തിലാണ് ഭാഷാപഠനം നടത്തുന്നത്. അവയ്ക്ക് വ്യത്യസ്തങ്ങളായ ലക്ഷ്യങ്ങളും രീതിശാസ്ത്രവുമാണെന്ന് കാര്യവിവരമുള്ളവര്‍ക്കറിയാം.
ഭാഷാ കമ്പ്യൂട്ടിംഗന്റെ കാര്യത്തില്‍ പ്രസക്തമായ ഉള്‍ക്കാഴ്ചകള്‍ മേല്പറഞ്ഞ വിജ്ഞാനശാഖകളില്‍ നിന്ന് കൈക്കൊള്ളുന്നത് മനസ്സിലാക്കാം.
അതിനു പകരം വ്യാകരണപണ്ഡിതന്മാര്‍ ചില്ലിനെ പ്രത്യേക എന്റിറ്റിയായി കണക്കാക്കിയെന്നെല്ലാം വാദിക്കുന്നത് അസംബന്ധമാണ്.

എന്റെ ചോദ്യത്തിന് ഉത്തമം പറയണമെന്നില്ല. എന്റെ ചോദ്യത്തെ തെറ്റായി വ്യാഖ്യാനിച്ച് ഉത്തരമാണ് പറയുന്നത് എന്ന് നടിക്കാതിരിക്കുക.

ചില്ല് എന്‍കോഡ് ചെയ്യണമെന്നതാണ് സിബുവിന്റെ പക്ഷം എന്ന കാര്യത്തില്‍ എനിക്ക് സംശയമേതുമില്ല. അതിന്റെ യുക്തിയായി ഇത്തമം ദുര്‍വ്യാഖ്യാനങ്ങളേയുള്ളൂ എന്നു വരുന്നത് കഷ്ടമാണ്.

സുറുമ || suruma said...

സിബൂ,
താങ്കള്‍ കുറച്ചുകൂടി തുറന്ന സമീപനം എടുുത്തിരുന്നെങ്കില്‍ വല്ലാതെ ആഗ്രഹിച്ചുപോകുന്നു. ചില്ല് എന്‍കോഡിങ് താങ്കള്‍ക്ക് ഒരു fixation ആയിട്ടുണ്ടെന്നുവേണം കരുതാന്‍. കാരണം chillu sign എന്ന പ്രപ്പോസല്‍ വന്നപ്പോള്‍(അത് നിര്‍ദ്ദേശിച്ചത് ഒരു തമിഴനായിരുന്നിട്ടുകൂടി) താങ്കള്‍ അതിനെ എതിര്‍ത്തത് 'ക'-യുടെ ചില്ല് എല്ലാ ഫോണ്ടുകളും ഉപയോഗിച്ചുകൊള്ളണമെന്നില്ല എന്ന ന്യായം പറഞ്ഞാണ്.അതേ സമയം ചില്ല് എന്‍കോഡ് ചെയ്യുമ്പോള്‍ 'ക'-യുടെ ചില്ല് ഉള്‍പ്പെടുത്തുകയും ചെയ്യുന്നു! സന്ദര്‍ഭം അനുസരിച്ച് താങ്കള്‍ വാദമുഖങ്ങള്‍ മാറ്റുന്നു.

ചില്ല് എന്‍കോഡിങിനെ ആരും എതിര്‍ക്കില്ല,അത് ഏറെ പ്രയോജനകരമാണെന്നു വരുകില്‍. നേരത്തെ ഹുസൈന്‍ പറഞ്ഞപോലെ രണ്ടു വാദങ്ങളുടെയും merits and demerits ഒന്നു വിശദമായി പറയൂ.

Ralminov said...

cibu said:
അത് സ്വപ്നലോകത്തെ യുണീക്കോഡല്ലേ.. അവിടെ നിയമങ്ങളെല്ലാം നമ്മളുണ്ടാക്കുന്നതല്ലെ. ആ പ്രപ്പോസലിലെ വിരാമജോയിനറിനെ കളയാന് പാടില്ല എന്നുപറഞ്ഞാല് കളയാന് പാടില്ല. അത്രേ ഉള്ളൂ.

ഞാന്‍ സമാനമായ നിര്‍ദ്ദേശമാണു് വെച്ചതു്. സ്പെഷല്‍ ജോയിനേര്‍സ്. അതിനെപ്പറ്റി ഒന്നും പറഞ്ഞു്കണ്ടില്ല. താങ്കളുടെ നിര്‍ദ്ദേശങ്ങള്‍ താങ്കള്‍ തന്നെ എതിര്‍ക്കുന്ന വിചിത്രമായ ഒരു സ്ഥിതിവിശേഷമാണു് ഇപ്പോള്‍ !!
The STABILITY policy of Unicode doesn't allow to remove Codepoints once they are encoded. So all the problems the proposed Chillus might create must be well debated and the solutions for those problems must be identified, since there wont be any going back option available..

പെരിങ്ങോടന്‍ said...

സുരേഷ് ചില്ലക്ഷരങ്ങള്‍ എന്‍‌കോഡ് ചെയ്യുന്നതിനെ കുറിച്ചു ഇന്‍‌ഡിക് ലിസ്റ്റില്‍ നടന്ന ചര്‍ച്ചയെ ക്രോഡീകരിച്ചു എറിക് മുള്ളര്‍ തയ്യാറാക്കിയ ഡോക്യുമെന്റ് കണ്ടു കാണുമെന്നു വിശ്വസിക്കുന്നു. ഇല്ലെങ്കില്‍ ഇതാ: http://std.dkuug.dk/jtc1/sc2/wg2/docs/N3126.pdf

merit & demerits ഇനി നമുക്കെല്ലാവര്‍ക്കും ഒരുമിച്ചു ചേര്‍ന്നു തയ്യാറാക്കാം.

(We all are making this whole discussion more complicated with every new comment)

Ralminov said...

Extract from Eric's Document:
"While one could think of changing the ignorable status of joiners, this is now becoming more difficult, as the IDN machinery
has already adopted the ignorable status. In other words, it’s not just Unicode we need to change, but IDN as well."

Earlier Cibu was claiming IDN discussion is secondary in discussion pipeline. Anyway, even if the ignorable status of joiners are changed in Unicode, its advisable to preserve the ignorable status in IDN, so that people need not register 6 domain names if their domain name happen to contain 3 chillus. So Eric's argument that change should be made in IDN as well is void.

I am one of those "ones" in Eric's observation.
The van_yavanika etc are very rarely used. Even if we take those arguments, there are lot of words with "nanaarthas"(different meaning with same spelling) . We normally read the sentence in context.
The manushyan example will not arise if people use samvruthokaram properly.
I can't understand how the Unicode consortium accepted these trivial arguments and decided to encode new codepoints, knowing there is no chance for removing those characters later.

കെവി said...

റാല്‍മിനോവ് പറഞ്ഞു: The van_yavanika etc are very rarely used. Even if we take those arguments, there are lot of words with "nanaarthas"(different meaning with same spelling) . We normally read the sentence in context.

ഇപ്പോഴുള്ള ചില്ലുരീതി സൃഷ്ടിക്കുന്ന പ്രശ്നങ്ങളെ ഒന്നടങ്കം are very rarely used എന്നു പറഞ്ഞു് തള്ളുകയാണു് റാല്മിനോവ് ചെയ്യുന്നതു്. ഈ പ്രശ്നത്തിനു പരിഹാരം പറയുക ആദ്യം. ഇതു് നാനാര്‍ത്ഥമുള്ള വാക്കുകളല്ല. രണ്ടു വേറേവേറെ അര്‍ത്ഥമുള്ള വ്യത്യസ്തരീതിയില്‍ എഴുതേണ്ടുന്ന വാക്കുകളാണു്. അവ എഴുതാന്‍ ഒരു zwjയുടെ മാത്രം വ്യത്യാസം എന്നതാണു് ഇപ്പോഴത്തെ ചില്ലിലെ പ്രശ്നം. ഒരു idn രജിസ്റ്റര്‍ ചെയ്യുമ്പോള്‍, ഇപ്പോഴത്തെ ചില്ലിന്റെ രീതിക്കാണു് അപകടം ഉള്ളതു്. വന്‍യവനിക എന്നും വന്യവനിക എന്നും ഉള്ള രണ്ടുവാക്കുകള്‍ തമ്മില്‍ ഒരു zwj യുടെ വ്യത്യാസമേ ഉള്ളൂ. IDN രജിസ്റ്റ്രേഷനില്‍ zwj പുറത്താവും. അപ്പോള്‍ വ്യത്യസ്ത അര്‍ത്ഥമുള്ള ഈ രണ്ടുവാക്കുകള്‍ ഒന്നാവും. വന്‍യവനിക.com എന്നു ലിങ്കു് കൊടുത്താല്‍ തന്നെ വന്യവനിക.com എന്നിടത്തേയ്ക്കാണു് അതുപോവുക. മറിച്ചു് ചില്ലിനു് കോഡുകൊടുത്താല്‍, ഈ രണ്ടുവാക്കുകളും വ്യത്യസ്തമായി തന്നെ നില്ക്കും. പിന്നൊന്നു് ഓര്‍മ്മിക്കുവാനുള്ളതു്, യുണീക്കോഡില്‍ കോഡുകൊടുക്കുന്നതു് ലിപിയിലെ അടിസ്ഥാനഎഴുത്തുരൂപങ്ങള്‍ക്കാണു്, അല്ലാതെ അക്ഷരങ്ങള്‍ക്കല്ല. അങ്ങിനെ അല്ലായിരുന്നെങ്കില്‍, കെവി എന്നെഴുതുമ്പോള്‍, ക് യുടെ കൂടെ എന്ന സ്വരം ചേര്‍ന്നുണ്ടാവുന്ന കെ എഴുതാന്‍ ക് യുടെ കൂടെ അല്ലേ ചേരേണ്ടതു്. മറിച്ചു് എയുടെ പുള്ളിയ്ക്കെന്തിനു കോഡു കൊടുത്തു? അതിനാര്‍ക്കും ഒരു പ്രശ്നവുമില്ലാത്തതെന്തുകൊണ്ടു്?

കെവി said...

dear ralminov,
zwj is not only used by the malayalam language. It has got a common
use as format control for all the international languages. If zwj is
given a special status in relation to malayalam, the whole lot of of
programs which deals with unicode text has to take this special case
into consideration while writing code. ex: a database. while storing
the unformated text, a database will strip the format control
characters. if malayalam alone is given a special postion for zwj,
database has to be rewritten as if to check if the text is in
malayalam then donot strip the zwj/else strip zwj. all the future high
level programs which deals with international unformated text will
face this problem. if international programmers dont take the
speciality of malayalam language, then the malayalam text will get
corrupted. to look for the speciality of zwj in every other languages
to write an international progarm is not practical.

having different status for zwj in unicode and idn will create more
problems. if status of zwj is not going to change in idn, then the security threat I mentioned above will appear.

and to change the usage status of zwj only in view of this problem is malayalam language is not going to happen.

Ralminov said...

"വന്‍യവനിക.com എന്നു ലിങ്കു് കൊടുത്താല്‍ തന്നെ വന്യവനിക.com എന്നിടത്തേയ്ക്കാണു് അതുപോവുക. മറിച്ചു് ചില്ലിനു് കോഡുകൊടുത്താല്‍, ഈ രണ്ടുവാക്കുകളും വ്യത്യസ്തമായി തന്നെ നില്ക്കും."

വന്‍യവനിക.com എന്നു ലിങ്കു് കൊടുത്താല്‍ അതിന്റെ പുണിക്കോഡാണു് ബ്രൌസര്‍ കാണിക്കുക. വന്യവനിക.com റെജിസ്റ്റര്‍ ചെയ്യുന്ന ആള്‍ക്കു് തന്നെ വന്‍യവനിക.com ഉപയോഗിക്കാം എന്ന അധികസൌകര്യമാണു് ഇതു് വഴി ഉണ്ടാവുന്നതു്.

IDN മാനദണ്ഡമാക്കിയാല്‍ ചില്ലു എന്‍കോഡ് ചെയ്യുന്നതു് അബദ്ധമാവും. സര്‍ക്കാര്‍.കോം റെജിസ്റ്റര്‍ ചെയ്യുന്നയാള്‍ നാലു് IDN റെജിസ്റ്റര്‍ ചെയ്യേണ്ടിവരും.

കെവി said...

റാല്മിനോവു് പറഞ്ഞു: വന്‍യവനിക.com എന്നു ലിങ്കു് കൊടുത്താല്‍ അതിന്റെ പുണിക്കോഡാണു് ബ്രൌസര്‍ കാണിക്കുക. വന്യവനിക.com റെജിസ്റ്റര്‍ ചെയ്യുന്ന ആള്‍ക്കു് തന്നെ വന്‍യവനിക.com ഉപയോഗിക്കാം എന്ന അധികസൌകര്യമാണു് ഇതു് വഴി ഉണ്ടാവുന്നതു്.
ഈ അധികസൌകര്യമാണു് അപകടം. idn സ്പൂഫ് ചെയ്യാന്‍ ഉതകുന്നതാണു് ഇത്തരം അധികസൌകര്യം. ഒരാള്‍ വന്‍യവനിക.com എന്നു രജിസ്റ്റര്‍ ചെയ്യുന്നു. മറ്റൊരാള്‍ക്കു് ഇവിടെ വന്യവനിക.com എന്നു ലിങ്കു് കൊടുത്തു് ഉപയോക്താക്കളെ തെറ്റിദ്ധരിപ്പിക്കാമെന്ന അധികസൌകര്യമാണുള്ളതു്. ഇതാണു് ഇപ്പോഴുള്ള ചില്ലിന്റെ പ്രശ്നം. പകരം ചില്ലിനു് കോഡുകൊടുത്താല്‍, സര്‍ക്കാര്‍.com എന്നെഴുതിയാല്‍ ചില്ലിനു പകരം വേറൊന്നും സ്വീകാര്യമല്ലാത്തതിനാല്‍, യാതൊരു വിധ സ്പൂഫിങ്ങിനും സാധ്യതയില്ല.

Ralminov said...

kevi:
ഈ അധികസൌകര്യമാണു് അപകടം. idn സ്പൂഫ് ചെയ്യാന്‍ ഉതകുന്നതാണു് ഇത്തരം അധികസൌകര്യം. ഒരാള്‍ വന്‍യവനിക.com എന്നു രജിസ്റ്റര്‍ ചെയ്യുന്നു. മറ്റൊരാള്‍ക്കു് ഇവിടെ വന്യവനിക.com എന്നു ലിങ്കു് കൊടുത്തു് ഉപയോക്താക്കളെ തെറ്റിദ്ധരിപ്പിക്കാമെന്ന അധികസൌകര്യമാണുള്ളതു്.

വന്‍യവനിക.com രജിസ്റ്റര്‍ ചെയ്യാന്‍ പറ്റില്ല.വന്യവനിക.com പറ്റും. ഇദ്ദേഹത്തിനു് അഡ്രസ്സ് വന്‍യവനിക.com എന്നാണെന്നു് പറയാനും പറ്റും. ഇവിടെ എവിടെയാണു് spoofing ? സര്ക്കാര്.കോം എന്നു് രജിസ്റ്റര്‍ ചെയ്യാം. സര്‍ക്കാര്‍.കോം ആണെന്നും പറയാം. ഇവിടെ എവിടെയാണു് spoofing ? വ്വെബ്​സൈറ്റ് ഒന്നല്ലേയുള്ളൂ.

Ralminov said...

if you are talking about some mischiefs trying to make fun of our site name, please see the real world examples of mispronunciation at
http://domainrookie.com/hilarious-domain-name-mispronouncings

Your 'spoofing' example is nothing.

കെവി said...

റാല്മിനോവ് പറഞ്ഞു: വന്‍യവനിക.com രജിസ്റ്റര്‍ ചെയ്യാന്‍ പറ്റില്ല.വന്യവനിക.com പറ്റും
എന്റെ കര്‍ട്ടനുണ്ടാക്കുന്ന കമ്പനിക്കു് വന്‍യവനിക.com എന്നു രജിസ്റ്റര്‍ ചെയ്യണം. പക്ഷേ വന്യവനിക.com എന്ന പേരില്‍ മറ്റൊരാള്‍ മറ്റൊരു സംഗതിയ്ക്കുവേണ്ടി രജിസ്റ്റര്‍ ചെയ്തുപോയി. അയാള്‍ അയാളുടെ സംഗതി വന്യവനിക.com എന്നു് രജിസ്റ്റര്‍ ചെയ്തതിനു് ഞാനെന്തുപിഴച്ചു? എന്റെ കര്‍ട്ടന്‍ കമ്പനിയ്ക്കു് ഞാനെങ്ങിനെ ഇനി വന്‍യവനിക.com എന്നു രജിസ്റ്റര്‍ ചെയ്യും? ഈ ചില്ലു കാരണം എനിക്കിഷ്ടപ്പെട്ട പേരു് ഉപയോഗിക്കാന്‍ പറ്റാതെ വരുന്നു. അങ്ങിനെ എത്രയോ വാക്കുകള്‍ മലയാളത്തില്‍ രജിസ്റ്റര്‍ ചെയ്യപ്പെടാന്‍ പറ്റാതെ വരും. ഇനി ഭാവിയില്‍ സൃഷ്ടിക്കപ്പെടാനിരിക്കുന്ന എത്രയോ വാക്കുകള്‍ ഇങ്ങനെ രണ്ടാംതരക്കാരായി തീരും. അതിനാരു സമാധാനം പറയും?

കെവി said...

റാല്മിനോവിന്റെ അഭിപ്രായമനുസരിച്ചു് പൊന്‍വീണ.com എന്നു രജിസ്റ്റര്‍ ചെയ്യാനേ പറ്റില്ല മലയാളത്തില്‍. അതു പൊന്വീണ യായിപോകും. ഇതില്‍ പരം ഒരു ഗതികേടു് മലയാളത്തിനു വരാനില്ല. ചില്ലെഴുതിയാല്‍ ചില്ലുതന്നെ വേണം അവിടെ. അതിനുപകരം അതിന്റെ അടിസ്ഥാന അക്ഷരം ഏതുരൂപത്തിലും വയ്ക്കാന്‍ പറ്റില്ല. അതു തെറ്റിദ്ധാരണയാണു്. പൊന്‍മാന്‍ എന്നെഴുതുന്നതും പൊന്മാന്‍ എന്നെഴുതുന്നതും രണ്ടാണു്. മന്‍തന്‍ എന്നെഴുതുന്നയാള്‍ ഒരിക്കലും അതു മന്തന്‍ എന്നുവായിയ്ക്കപ്പെടാന്‍ ആഗ്രഹിയ്ക്കില്ല. കാരണം അതു ഒന്നല്ല. രണ്ടാണു്.

സുറുമ || suruma said...

കെവി,
zwj/zwnj പാടില്ലെങ്കില്‍ എന്തുകൊണ്ട് chillu sign-നെ എതിര്‍ക്കുന്നു?എന്തുകൊണ്ട് zwj/zwnj ന് പകരമായി indic-specific ആയി രണ്ട് പുതിയ characters ആയിക്കൂടാ?ISCII-യിലെ nuktha യും Unicode -ലെ zwj ഉം സമാനമല്ലല്ലോ?

സിബു::cibu said...

സുറുമ: "chillu sign എന്ന പ്രപ്പോസല് വന്നപ്പോള്(അത് നിര്ദ്ദേശിച്ചത് ഒരു തമിഴനായിരുന്നിട്ടുകൂടി) താങ്കള് അതിനെ എതിര്ത്തത് 'ക'-യുടെ ചില്ല് എല്ലാ ഫോണ്ടുകളും ഉപയോഗിച്ചുകൊള്ളണമെന്നില്ല എന്ന ന്യായം പറഞ്ഞാണ്.അതേ സമയം ചില്ല് എന്കോഡ് ചെയ്യുമ്പോള് 'ക'-യുടെ ചില്ല് ഉള്പ്പെടുത്തുകയും ചെയ്യുന്നു!"

ചില്ല് ക ഉള്പ്പെടുത്തണോ വേണ്ടയോ എന്നുള്ളതായിരുന്നില്ല ചില്ല് സൈനിന്റെ ഇഷ്യൂ. അവിടത്തെ പ്രശ്നം ഏതാണ് ന്യായമായ ഫാള്ബാക്ക് എന്നതാണ്. അങ്ങനെ ഒന്നില്ല എന്നായിരുന്നു ഞാന് പറയാന് ശ്രമിച്ചത്. ( http://unicode.wikia.com/wiki/Malayalam/Problems_of_Chillu_Sign_Proposal) ചില്ല് എന്കോഡ് ചെയ്തശേഷം ഫാള്ബാക്ക് എന്നൊന്ന് സ്വാഭാവികമായി തന്നെ ഇല്ല. ഫോണ്ടില് ക ചില്ലില്ലെങ്കില് ചതുരക്കട്ട (അഥവാ വാണിങ് ) എഴുത്തുകാരനും വായനക്കാരനും കിട്ടും. പ്രശ്നമുണ്ടെന്ന് എപ്പോഴും മനസ്സിലാവുകയും ചെയ്യും.

എന്നാല് ഇതല്ല പരമമായ പ്രശ്നം. അത് ഞാന് ഹുസൈനിനോട് പറഞ്ഞപോലെ, ചില്ലുകളുടെ സന്നിഗ്ദതയാണ്. (ഉദാ: ര് എന്നത് 'ര'യുടേയോ 'റ'യുടേയോ?) ഈ പ്രശ്നം zwj ഉപയോഗിച്ചുള്ള സൊല്യൂഷനും, ചില്ല് സൈന് ഉപയോഗിച്ചുള്ളതിനും ഉണ്ട്.

സുറുമ: "ചില്ല് എന്കോഡിങിനെ ആരും എതിര്ക്കില്ല,അത് ഏറെ പ്രയോജനകരമാണെന്നു വരുകില്. നേരത്തെ ഹുസൈന് പറഞ്ഞപോലെ രണ്ടു വാദങ്ങളുടെയും merits and demerits ഒന്നു വിശദമായി പറയൂ."

പെരിങ്ങോടന് പറഞ്ഞപോലെ, ഏറിക്കിന്റെ ഡോക്യുമെന്റ് വായിക്കുകയാണ് എളുപ്പം. ഓരോ പ്രപ്പോസലിന്റേയും വിവിധ ഗുണങ്ങള്‍ എന്തൊക്കെ എന്ന്‌ കാണിച്ച്‌ ഞാനൊരു ടേബിള്‍ ഉണ്ടാക്കിയിട്ടുണ്ട്‌.


റാല്മിനോഫ്: "...ഞാന് സമാനമായ നിര്ദ്ദേശമാണു് വെച്ചതു്. സ്പെഷല് ജോയിനേര്സ്. അതിനെപ്പറ്റി ഒന്നും പറഞ്ഞു്കണ്ടില്ല."

ഇതായിരുന്നോ സ്പെഷല് ജോയിനേഴ്സ് സൊല്യൂഷന്: "All the problems will be solved if the joiners are elevated from their format control character status, and in the Input method a key is assigned to virama + zwnj ligature"

ആയിരുന്നെങ്കില് ഞാന് ഉത്തരം പറഞ്ഞിരുന്നു. അത് ചുവടെ:

"ഞാന് നേരത്തെ പറഞ്ഞത് പോലതന്നെ, ഇത്തരം സ്റ്റേറ്റുമെന്റുകള് പറയുമ്പോള്, തെളിവ് വേണം.

ഫോണ്ട് സ്റ്റാന്റേഡൈസേഷനെ പറ്റി പറഞ്ഞതു തന്നെ, ഇന്പുട്ട് മെത്തേഡ് സ്റ്റാന്റേഡൈസേഷനെ പറ്റി പറയാനുള്ളതും. കൂടാതെ ഈ നിര്ദ്ദേശത്തിന് പ്രശ്നങ്ങളുണ്ട്. ഈ പറഞ്ഞ പ്രകാരം കീബോര്ഡില് എത്ര ചന്ദ്രക്കലയുണ്ടാവും? രണ്ടെണ്ണം വേണ്ടിവരില്ലേ? 1) virama 2) virama + zwnj. ഇല്ലെങ്കില് കൂട്ടക്ഷരം 'ക്ക' എങ്ങിനെയുണ്ടാക്കും? രണ്ടെണ്ണമുണ്ടെങ്കില് കാര്ത്തികയുപയോഗിക്കുന്ന ആള് ദൃക്സാക്ഷി എന്ന് തെറ്റായി എഴുതിയാല് അതെങ്ങനെ തിരിച്ചറിയും?"

ഇല്ലെങ്കില് വിശദമാക്കൂ.

കെവി said...

ഒരു ചെറിയ സംശയം ചോദിച്ചോട്ടെ. മലയാളത്തിലെ അമ്പത്താറക്ഷരത്തില്‍ നിന്നു് ചില്ലുകളെ മാത്രം തിരഞ്ഞുപിടിച്ചു പുറത്താക്കാന്‍ എന്താണിത്ര വ്യഗ്രത. ഈ പറയുന്ന ന്യായം പ്രബോധചന്ദ്രന്‍നായരുടേതെന്നു പറയുന്നതു് തന്നെയല്ലേ? വെട്ടിമുറിച്ചില്ലാതാക്കല്‍. ഈ ന്യായത്തിന്റെ പുറത്താണെങ്കില്‍ സ്വരങ്ങള്‍ക്കും ഇങ്ങിനെയാകാമായിരുന്നു. ഒരു ദീര്‍ഘപ്പുള്ളിയുപയോഗിച്ചു് എല്ലാ സ്വരങ്ങളുടെയും ദീര്‍ഘം എഴുതാമായിരുന്നു. ആ, ഈ,ഊ,ഓ എന്നിവ വെവ്വേറെ എന്‍കോഡു ചെയ്യേണ്ട ആവശ്യമുണ്ടായിരുന്നില്ല. അ+ാ = ആ ഇ+ാ = ഈ, ഉ+ാ = ഊ, എന്നു മതിയായിരുന്നല്ലോ. ഇ എന്ന സ്വരമല്ലേ ഈ എന്നതിന്റെ അടിസ്ഥാനം. അവിടെ ഒരു ഡൈവോര്‍സിന്റെ പ്രശ്നം ഉദിയ്ക്കുന്നില്ലേ?

സുറുമ ചോദിച്ചു: zwj/zwnj പാടില്ലെങ്കില്‍ എന്തുകൊണ്ട് chillu sign-നെ എതിര്‍ക്കുന്നു?
മറുപടി സിബു തയ്യാറാക്കിയ ടേബിളില്‍ വിശദമായി പ്രതിപാദിച്ചിരിക്കുന്നു. ഇവിടെ ഇനി കൂടുതല്‍ വിശദീകരിയ്ക്കേണ്ടി വരുമെന്നു തോന്നുന്നില്ല.

സുറുമ || suruma said...

സിബു: എന്നാല് ഇതല്ല പരമമായ പ്രശ്നം. അത് ഞാന് ഹുസൈനിനോട് പറഞ്ഞപോലെ, ചില്ലുകളുടെ സന്നിഗ്ദതയാണ്. (ഉദാ: ര് എന്നത് 'ര'യുടേയോ 'റ'യുടേയോ?)
അപ്പോള്‍ ഇതാണ് ചില്ലിന്റെ കാര്യത്തില്‍ core issue.നന്ദി സിബൂ,വ്യക്തമാക്കിയതിന്.

എന്റെ അഭിപ്രായത്തില്‍/അറിവില്‍ ഇതെല്ലാം മുമ്പേ തന്നെ പരിഹരിച്ചുകഴിഞ്ഞതാണ്.(ചില്ല് 'ര' യുടെ തന്നെ).കാരണം ലൈബ്രറി കാറ്റലോഗുകള്‍ തയ്യാറാക്കാന്‍ ഇത്തരം സന്നിഗ്ദതകള്‍‍ ഒഴിവാക്കേണ്ടത് അത്യാവശ്യമാണ്.

നേരത്തെ സൂചിപ്പിച്ച ലിഗേച്ചറുകളുടെ സ്റ്റാന്‍ഡേര്‍ഡൈസേഷന്‍(ഒരു minimum level compliance)കൊണ്ട് ചില്ലുകളുടെ മറ്റു പ്രശ്നങ്ങള്‍കൂടി പരിഹരിക്കാവുന്നതാണ്.

സന്തോഷ് said...

ചില്ല് ര-യുടെത് തന്നെ എന്ന് തീര്‍ത്ത് പറയാമോ സുറുമേ? സിബു തന്നെ തയ്യാറാക്കിയ ഈ തെളിവുകള്‍ ശ്രദ്ധിച്ചിരുന്നുവോ?

സുറുമ || suruma said...

കെവി: മലയാളത്തിലെ അമ്പത്താറക്ഷരത്തില്‍ നിന്നു് ചില്ലുകളെ മാത്രം തിരഞ്ഞുപിടിച്ചു പുറത്താക്കാന്‍ എന്താണിത്ര വ്യഗ്രത.

കെവി അക്ഷരങ്ങളെ 51ല്‍ നിന്ന് 56 ആക്കി.ഞാനത് കൂട്ടക്ഷരങ്ങളെയെല്ലാം ചേര്‍ത്ത് 900+ ആക്കി, അതേ ചോദ്യംആവര്‍ത്തിച്ചാലോ?

"മലയാളഭാഷയിലെ ചില്ലക്ഷരങ്ങളെയെല്ലാം യൂണികോഡില്‍നിന്ന് ഒഴിവാക്കാന്‍ ഗൂഢശ്രമം നടക്കുന്നു" എന്ന് പ്രചാരണം നടത്താനാണോ പരിപാടി?

സാക്ഷി said...

"കെവി അക്ഷരങ്ങളെ 51ല്‍ നിന്ന് 56 ആക്കി."

മലയാള അക്ഷരമാലയില്‍ 56 അക്ഷരങ്ങള്‍ തന്നെയല്ലേ ഉള്ളത്. ഈ 51 എവിടെനിന്നു വന്നു?

പച്ചാളം : pachalam said...

ദൈവമേ ബാക്കി അഞ്ചക്ഷരങ്ങള്‍ ആരടിച്ചുമാറ്റി??

(“ദക്ഷിണേന്ത്യയില്‍ പ്രചാരത്തിലുണ്ടായിരുന്ന ഒരു പ്രധാന രൂപമായിരുന്നു ഗ്രന്ഥലിപി. സംസ്കൃത ഗ്രന്ഥങ്ങല്‍ എഴുതാനായിരുന്നു ഈ ലിപി ഉപയോഗിച്ചിരുന്നത്. സംസ്കൃതം എഴുതാന്‍ ആവശ്യമായ 51 വര്‍ണ്ണങ്ങളും അതുള്‍ക്കൊണ്ടിരുന്നൂ.” ഇതാണോ ഉദ്ദേശ്ശിച്ചതു? [വായിച്ചറിവ്] )

Ralminov said...

kevi,
from my mail to indic list:
Any one will be able to register പൊന്വീണ.com and use www.പൊന്‍‌വീണ.com or whatever subdomain he prefer. Its a false perception that we cannot use chillu words in domain names. The browser will correctly display www.പൊന്‍‌വീണ.com and direct it to our original site.

കർട്ടൻ കമ്പനിക്കാരനു് ഒരു ഹൈഫൻ കൂടി ഉപയാഗിച്ചാൽ വൻ-യവനിക.കോം കിട്ടും. നല്ലതും അതാണു്. PenisLand കാരൻ PenIsland കൊണ്ടു്പോയി എന്ന തരത്തിൽ പരിഭവിച്ചിട്ടെന്താ കാര്യം ?

cibu,
Apart from your latest MAIN issue,
will all the problems in your examples be solved if ZWJ/ZWNJ were not FORMAT CONTROL characters? This was what I understood from your logics and examples.

My only complaint in the present system is the stripping of these joiners. I suggest a solution to avoid that. I dont know what "evidence" I must provide to support that.

I am going a bit awkward here, what earthquake will happen if people decide RA is the base character? Why the proponents of change hung to some old texts to bring "proof" to claim otherwise.

Atomic chillu encoding must be considered as a possible "solution" and discussed, not as an "obsession"

Ralminov said...

..and regarding the input method
I suggest replacing the virama sign with zwnj + virama in the present inscript keyboard layout. The virama sign could be put with the Alt_Gr Modifier at the same place.

This method is far better than Cibu's proposal of using joiners instead of unjoiners. Old script users can have another layout with the keys interchanged.

കെവി said...

"മലയാളഭാഷയിലെ ചില്ലക്ഷരങ്ങളെയെല്ലാം യൂണികോഡില്‍നിന്ന് ഒഴിവാക്കാന്‍ ഗൂഢശ്രമം നടക്കുന്നു" ഇതൊരു നല്ല നിരീക്ഷണമാണു്. ഇതിനു പ്രചാരണം കൊടുക്കാന്‍ പക്ഷേ നമ്മളുടെ കൈയില്‍ പത്രക്കാരോ മുഖ്യമന്ത്രിയോ ഒന്നുമില്ല. ചില്ലക്ഷരങ്ങള്‍ക്കു കോഡുകൊടുക്കുന്നതിനെതിരെയുള്ള പ്രത്യേകിച്ചു കാരണമൊന്നുമില്ലാത്ത പ്രവര്‍ത്തനത്തെ ഇപ്പോള്‍ ഈ രീതിയിലാണു് നോക്കിക്കാണേണ്ടതെന്നു സാമാന്യബുദ്ധിയുള്ള ആര്‍ക്കും തോന്നാം. പിന്നെ മലയാളത്തില്‍ എത്ര അക്ഷരങ്ങളുണ്ടെന്നതില്‍ സുറുമയ്ക്കു് യാതൊരു സംശയവുമില്ല. പക്ഷേ ഭാഷാവിദഗ്ദ്ധന്മാര്‍ പലതരത്തില്‍ പറഞ്ഞിരിക്കുന്നു.
REv. പീറ്റര്‍ - 56
ഗുണ്ടര്‍ട്ട് - 49
ഗ്യോര്‍ജ് മാത്തന്‍ - 48
എ ആര്‍ രാജരാജവര്‍മ്മ - 53
ശേഷഗിരി പ്രഭു - 53 (1904)
c.മാധവന്‍പിള്ള‍ 57
ഡോ.അയ്യപ്പപ്പണിക്കരുടേ മലയാളം തെസ്സറസില്‍ 59
രവി ഡീസിയുടെ മലയാളം -ഇംഗ്ലീഷ് നിഘണ്ടുവില്‍ - 60
ചില്ലക്ഷരങ്ങളുടെ പ്രത്യേകതകള്‍ മൂലം അവയെ സ്വതന്ത്ര അക്ഷരങ്ങളായി തന്നെ ഗണിച്ചിരുന്നു പല മഹാരഥന്മാരും. ഭാഷയ്ക്കുവേണ്ടി കമ്പ്യൂട്ടര്‍ ഒരുങ്ങിയ ഈ അവസരത്തില്‍ ചില്ലുകളെയും അവയുടെ പ്രത്യേകതകളെയും ഒഴിവാക്കാതെ തന്നെ ഭാഷാകമ്പ്യൂട്ടിങ് സാധ്യമായിരിക്കെ, എന്തിനുവേണ്ടിയാണു് ചില്ലക്ഷരങ്ങള്‍ക്കെതിരെ വാദിക്കുന്നതു്?

റാല്മിനോവ് പറഞ്ഞു: കർട്ടൻ കമ്പനിക്കാരനു് ഒരു ഹൈഫൻ കൂടി ഉപയാഗിച്ചാൽ വൻ-യവനിക.കോം കിട്ടും. എന്തിനുവേണ്ടി ഹൈഫന്‍ ഉപയോഗിയ്ക്കണം? ഭാഷയെ എന്തിനങ്ങിനെ ബലികഴിക്കണം? വന്‍യവനിക.com ഉം, വന്യവനിക.com ഉം വേറെ വേറെ സൈറ്റായി ഉപയോഗിക്കാതിരിക്കാന്‍ തക്ക തെറ്റെന്താണു് മലയാളികള്‍ ചെയ്തതു്?

കെവി said...

http://chintyam.blogspot.com/2006/02/blog-post_02.html#c114250106244580934

ബെന്നിയുടെ ഈ കമന്റില്‍ ചില്ലക്ഷരത്തിനു കോഡില്ലാത്തതിനാല്‍ ബെന്നി നേരിടുന്ന ഒരു പ്രശ്നം വിശദീകരിച്ചിരിക്കുന്നതു കാണാം.

Ralminov said...

Remarks on Cibu's Table:

1.IDN cannot be spoofed in the present scenario. The example given for spoofing is incorrect.

My version of joiners are not discussed in the table. They are semantically same as the present joiners, but they are not just format control characters. They cannot be stripped by the applications. The IDN can restrict their inclusion, the search application can choose to exclude them from searching, but the result set must include them.
In no place, these joiners should be stripped.

May be I will get STUPID OF THE YEAR award for this proposal. So be it.

Ralminov said...

kevi, did u mention this:
"1) ള് + യ = ള്യ
2) ന്‍റ് + യ = ന്‍റ്യ
3) ക്ഷ് + യ = ക്ഷ്യ
4) ഴ് + യ = ഴ്യ
5) റ് + യ = റ്യ
6) ണ് + ട = ണ്ട
7) ന് + റ്റ + ന്റ
"
I couldn't follow the link. It's broken.
From the list I find, its not related to Chillu issue

കെവി said...

റാല്മിനോവിന്റെ ചോദ്യം മനസ്സിലായില്ല.
ശേഷം ചിന്ത്യത്തിലെ കമന്റിനു കൊടുത്ത ലിങ്കു് ശരിയാണു്, പക്ഷേ ഈ കമന്റു പേജില്‍ അതു മുഴുവനും കാണുന്നില്ല. ബ്ലോഗുപോസ്റ്റിന്റെ പേജില്‍ പോയി നോക്കിയാല്‍ അതു മുഴുവനും കാണാം.

കെവി said...

ശേഷം ചിന്ത്യത്തിലെ " പുതിയ ലാംഗ്വേജ് ഇന്‍റര്‍ഫേസ് പായ്ക്ക്" എന്ന ലേഖനത്തിലെ, 19-മത്തെ കമന്റിലെ രണ്ടാമത്തെ ഖണ്ഡിക.

Ralminov said...

കെവി,
അതില്‍ ആപ്ലിക്കേഷന്റെ പിടിപ്പുകേടിനെപ്പറ്റിയാണു് പരാമര്‍ശം എന്നാണു് ഞാന്‍ മനസ്സിലാക്കിയതു്.

Coming back to Van-Yavinika. Suppose a person registered VanyaVanika.com for his site. And consider later when atomic chillus are allowed in IDN and our Curtain company registered VanYavanika.com.
Now the owner of VanyaVanika can claim his site is VanYavanika (he can easily make it using joiners - for backward compatiblity the older domain names should be protected, correct me if I am wrong) and he is the original owner of it and the matters might lead to litigation regarding spoofing. As VanyaVanika was registered first, priority will be given to him I believe. So even if it becomes possible to register IDNs using atomic Chillus, it is better to avoid them.
No harm ever happen to English language when sites like Experts-Exchange.com were registered, rather it made sitename distinguishable and clear.

Only after I read Cibu's document regarding security issues in IDN, I became concerned about it and really thought about it. What I could infer was Atomic Chillus can bring more harm to IDN security than any other proposal.

Nimmy David said...

Ralminov said:
**There were people saying around there is no ZWJ in IDN, so inorder to get Chillu, we should encode Chillu. I also believed so initially.
Now I will say, its simply absurd and it adds convenience of having less trouble in registering IDN.**

I also believe that zwj is not allowed in IDN. I tried to type the word "sarkar" in Malayalam on the address bar and was not getting the chillu. Instead, I got RA + Chandrakkala.I assume this is because IDN is rejecting the zwj.

Nimmy David

സുറുമ || suruma said...

കെവി,
അക്ഷരങ്ങളുടെ എണ്ണത്തിന്റെ കാര്യത്തില്‍ താങ്കളു‍ടെ ഉറപ്പുതന്നെയാണ് എന്റെയും ഉറപ്പ്. പ്രചാരമുള്ള 5 ചില്ലുകള്‍ ചേര്‍ത്ത് താങ്കള്‍ അത് 56 (51+5)ആക്കി എന്ന ധാരണയില്‍ നിന്നാണ് 51 എന്ന് പറഞ്ഞത്. ചില്ലുകളും മറ്റു കൂട്ടക്ഷരങ്ങളും മലയാളത്തില്‍ ഏറ്റവും ആവശ്യം തന്നെയാണ്. ചില്ല് എന്‍കോഡിങ് ഒരിക്കലും പാടില്ല എന്നു് എവിടെയും പറഞ്ഞിട്ടില്ല. ഇപ്പോള്‍ അടിയന്തിര സാഹചര്യം ഇല്ല എന്നാണ് ഉദ്ദേശിച്ചത്.

ചില്ല് എന്‍കോഡിങ് വേണമോ വേണ്ടയോ എന്നത് സൈബര്‍ലോകത്തില്‍ മാത്രം ഒതുങ്ങേണ്ട ചര്‍ച്ചയല്ല. മലയാളത്തില്‍ ഗ്രന്ഥസൂചി തയ്യാറാക്കുന്നത് ഇപ്പോള്‍ തന്നെ സങ്കീര്‍ണ്ണതകള്‍ നിറഞ്ഞതാണെന്ന് ആ രംഗത്ത് പ്രവര്‍ത്തിക്കുന്നവര്‍ പറയുന്നു. വിവരശേഖരണത്തില്‍ sorting ന്റെ പ്രാധാന്യം വളരെ വലുതാണ്. ഈ കാര്യങ്ങളില്‍ ചില്ല് എന്‍കോഡിങ് കൂടുതലായി യാതൊരു സങ്കീര്‍ണ്ണതകളും ഉണ്ടാക്കുകയില്ലെന്ന താങ്കള്‍ക്ക് ഉറപ്പുതരാന്‍ കഴിയുമോ?

മേല്‍പറഞ്ഞ കാര്യവുമായി തട്ടിച്ചു നോക്കുമ്പോള്‍ വന്യവനിക/വന്‍യവനിക യെല്ലാം ചെറിയ പ്രശ്നമാണെന്നു കരുതുന്നു.ഇതു പോലെ പ്രശ്നകാരകങ്ങളായ എത്ര വാക്കുകള്‍ ഉണ്ട്? വന്യ, വന്‍, വനിക, യവനിക എന്നിവയ്ക്ക് വേറിട്ട് നിലനില്‍ക്കാന്‍ കഴിയുന്നതുകൊണ്ട് റാല്‍മിനോവ് പറ‍ഞ്ഞപോലെ hyphenനോ മറ്റോ കൊണ്ട് ഇവയെ വേര്‍തിരിച്ച് കാണിക്കുന്നത് വലിയ പാതകമാണെന്ന് കരുതുന്നില്ല.
duplication IDN ല്‍ അസാധ്യമായതുകൊണ്ട് എത്രയോ ഡൊമൈനുകള്‍ hyphen ഉപയോഗിച്ച് നാമം രെജിസ്റ്റര്‍ ചെയ്യുന്നുണ്ട്.

Ralminov said...
This comment has been removed by a blog administrator.
Ralminov said...

വന്‍യവനിക.com ഉം, വന്യവനിക.com ഉം വേറെ വേറെ സൈറ്റായി ഉപയോഗിക്കാതിരിക്കാന്‍ തക്ക തെറ്റെന്താണു് മലയാളികള്‍ ചെയ്തതു്?

നന്‍മ.കോം, നന്മ.കോം എന്നിങ്ങനെ രണ്ടു് സൈറ്റുണ്ടായാലത്തെ സ്ഥിതിയാവും കൂടുതല്‍ അപകടകരമാണെന്നാണു് എന്റെ നിരീക്ഷണം.

Ralminov said...

I also believe that zwj is not allowed in IDN. I tried to type the word "sarkar" in Malayalam on the address bar and was not getting the chillu. Instead, I got RA + Chandrakkala.I assume this is because IDN is rejecting the zwj.

I didnt say ZWJ is ALLOWED in IDN. Infact the restriction of these joiners doesnt prevent us from using sarkar.com. Whether you use sar_kar_.com or sarkar.com or sarkar_.com or sar_kar.com in the browser you'll reach the registered sarkar.com domain. Is it not a convenience? The non-display of chillu in browser has nothing to do with IDN restriction, it is a browser specific problem.

സുറുമ || suruma said...

റാല്‍മിനോവ്: നന്‍മ.കോം, നന്മ.കോം എന്നിങ്ങനെ രണ്ടു് സൈറ്റുണ്ടായാലത്തെ സ്ഥിതിയാവും കൂടുതല്‍ അപകടകരമാണെന്നാണു് എന്റെ നിരീക്ഷണം.

ഈ അഭിപ്രായത്തോടു യോജിക്കുന്നു. കാരണം മലയാളത്തില്‍ സാധാരണ നാം spelling പറയാറില്ല. 'താങ്കളുടെ സൈറ്റിന്റെ പേരെന്താ?' എന്നു ചോദിച്ചാല്‍ സാധാരണഗതിയില്‍ മറുപടി 'നന്‍മ'.കോം' എന്നായിരിക്കും.

കെവി said...

നന്‍മ.കോം, നന്മ.കോം എന്നിങ്ങനെ രണ്ടു് സൈറ്റുണ്ടായാലത്തെ സ്ഥിതിയാവും കൂടുതല്‍ അപകടകരമാണെന്നാണു് എന്റെ നിരീക്ഷണം.
idn സുരക്ഷയെ സംബന്ധിച്ചിടത്തോളം ഈ വാദം നിലനില്ക്കുന്നതല്ല. കാരണം ഇതു് color.com ഉം colour.com തമ്മിലുള്ള പ്രശ്നത്തിനു തുല്യമാണു്. ഒരു സൈറ്റിന്റെയും ഇമെയിലിന്റെയും വിലാസം എപ്പോഴും അതിന്റെ കൃത്യമായ സ്പെല്ലിങ്ങിലാണു് ഇരിക്കുന്നതു്. അല്ലാതെ അതു കേട്ടെഴുതുവാന്‍ സാധ്യമല്ല തന്നെ. കളര്‍.കോം എന്നു് ഒരാള്‍ പറഞ്ഞാല്‍ അയാള്‍ കളറിന്റെ ഏതു സ്പെല്ലിങ്ങാണു് ഉദ്ദേശിച്ചതെന്നു് എങ്ങിനെ അറിയും? അത്തരുണത്തില്‍ കൃത്യമായ സ്പെല്ലിങ് ചോദിയ്ക്കേണ്ടി വരും. അതുപോലൊരു പ്രശ്നമേ നന്‍മ.കോം ഉം നന്മ.കോം തമ്മിലുള്ളൂ. പക്ഷേ zwj ഉപയോഗിച്ചു ചില്ലെഴുതുമ്പോള്‍, നന്‍മ.കോം എന്നു രജിസ്റ്റര്‍ ചെയ്യാനേ പറ്റില്ല. അതിനുള്ള കാരണമോ, നന്മ.കോം രജിസ്റ്റര്‍ ചെയ്തതിനാല്‍. ഒരു വാക്കു രജിസ്റ്റര്‍ ചെയ്തതിനാല്‍ മറ്റൊരു വാക്കു ഉപയോഗിക്കാന്‍ പറ്റാതെ വരുന്നതു് എന്തു ഭാഷാകമ്പ്യൂട്ടിങ്ങാണു്?

സുറുമ || suruma said...

color/colour എന്നതും നന്മ/നന്‍മ എന്നതും താരതമ്യം ചെയ്യാമോ? ഭാഷാ പണ്ഡിതര്‍ അഭിപ്രായം പറയേണ്ട വിഷയമാണ്.

IMHO, അങ്ങനെ/അങ്ങിനെ എന്നത് സ്പെല്ലിങ് വ്യതാസമാണ്. അതുപോലെയാണോ നന്മ/നന്‍മ?

Anonymous said...

I fully agree with KV. Only visual look alikes are to be considered as spoofed sites. This is primarily because we can access sites by clicking on links.

Nimmy

കെവി said...

IMHO, അങ്ങനെ/അങ്ങിനെ എന്നത് സ്പെല്ലിങ് വ്യതാസമാണ്. അതുപോലെയാണോ നന്മ/നന്‍മ?
"ന്മ" എന്ന കൂട്ടക്ഷരം പുതിയലിപിയുടെ ആവിഷ്കാരത്തോടെ "ന്‍മ" എന്നെഴുതേണ്ടി വന്നു. പുതിയലിപിയ്ക്കുവേണ്ടി സൃഷ്ടിച്ച പുതിയ സ്പെല്ലിങ് മാത്രമാണു് നന്‍മ. ശരിയായ സ്പെല്ലിങ് നന്മ എന്നാണു്. സ്ഥിരമായ ഉപയോഗത്തിലൂടെ രണ്ടും സ്വീകാര്യമായിരിക്കുകയാണു് ഇപ്പോള്‍. അങ്ങിനെ/അങ്ങനെ, color/colour എന്നിവകളെപ്പോലെ.

സുറുമ || suruma said...

കെവി,
പുതിയ ലിപിയില്‍ എഴുതുന്ന 'നന്‌മ' യും പുതിയ സ്പെല്ലിങ് ആണോ?

Ralminov said...

dn സുരക്ഷയെ സംബന്ധിച്ചിടത്തോളം ഈ വാദം നിലനില്ക്കുന്നതല്ല. കാരണം ഇതു് color.com ഉം colour.com തമ്മിലുള്ള പ്രശ്നത്തിനു തുല്യമാണു്.

അല്ല.I believe ഇതു് നമ്മുടെ "ദൃക്സാക്ഷി" പ്രശ്നം പോലെയാണു്.
ചില്ലുകാർക്കു് മാത്രം മതിയോ സൈറ്റ്. നമ്മുടെ ജോസ്തോമസിനും ഒന്നു് വേണ്ടേ? അവിടെ ഹൈഫനിടാം അല്ലേ !!!

കെവി said...

ചില്ലക്ഷരങ്ങളെ കുറിച്ചുള്ള ചര്‍ച്ചയില്‍ ജോസ്തോമസിനെന്തു കാര്യം? പിന്നെ ജോസ്തോമസിന്റെ കുഴപ്പം എന്നുപറയുന്നതു്, ശുദ്ധമലയാളംയുണീക്കോഡ് ടെക്സ്റ്റില്‍ ഒരു കുഴപ്പവുമില്ലാത്ത സംഗതിയാണു്. ഉപയോഗിക്കുന്ന ഫോണ്ടിനനുസൃതമായി അക്ഷരങ്ങള്‍ കൂടിച്ചേരുന്നതു് വേണ്ടെന്നു വെയ്ക്കുകയാണെങ്കില്‍ പിന്നെ പഴയലിപിയേ വേണ്ടെന്നു വയ്ക്കുകയാണു് നല്ലതു്. പുതിയലിപിയില്‍ വായിച്ചാല്‍ ജോസ്തോമസിനു കുഴപ്പമില്ലെന്നു കരുതുന്നുവെങ്കില്‍, പഴയലിപിയിലും അതിനുകുഴപ്പമൊന്നുമില്ല. ജോസ്തോമസെന്നു് എഴുതിയതു് ഒരുകാരണവശാലും എവിടെയും മാറിപ്പോകുന്നില്ല. കമ്പ്യൂട്ടര്‍ വിനിമയങ്ങളില്‍പ്പെട്ടു് അതിനു് അര്‍ത്ഥമാറ്റമോ രൂപമാറ്റമോ സംഭവിക്കാത്തിടത്തോളം കാലം അതിനു് ഒരു കുഴപ്പവുമുണ്ടെന്നു പറയാവതല്ല. ജോസ്തോമസ് എന്നെഴുതുമ്പോള്‍ സയും തയും കൂടിച്ചേരരുതു്, കസ്തൂരി എന്നെഴുതുമ്പോള്‍ കൂടിച്ചേരുകയും വേണം.

Ralminov said...

ഞാന്‍ പറയാനുദ്ദേശിച്ചതു് നന്മ, നന്‍മ Presentation difference മാത്രമേയുള്ളൂ എന്നാണു്, ദൃക്സാക്ഷി, ജോസ്തോമസ് എന്നിവരെപ്പോലെ..color, colour പോലെ spelling change ഇല്ല എന്നാണു്.

In my solution of joiners, the presentation of these joiners should be retained, not stripped by any applications. It doesnt bring any spelling change. But chillu encoding brings spelling change.

Ralminov said...

Another thing, why no concern about the inability of registering Jos_Thomas (with zwnj). If you are much worried about the presentation issue in IDNs, you should worry about non-joiners also. Koirala is another example. Normally people register their names and company names in IDN, not original malayalam and the words like Jos_Thomas will be more frequent than the theoretical Van_Yavanika and Kan_Valayam.

കെവി said...

zwnj യുടെ ആവശ്യമില്ലാതെ തന്നെ ജോസ്തോമസ് വളരെ വൃത്തിയായി എനിക്കു കാണാം. അതങ്ങിനെത്തന്നെ രജിസ്റ്റര്‍ ചെയ്യുകയും ചെയ്യാം. കൂട്ടത്തില്‍ പറയട്ടെ, ഞാനുപയോഗിക്കുന്ന ഫോണ്ടുകള്‍ കാര്‍ത്തികയും നിളയും. ജോസ്തോമസും കസ്തൂരിയും മറ്റും ഏതു പ്രോഗ്രാമിലും ഏതു ഫോണ്ടിലും യാതൊരു അര്‍ത്ഥവ്യത്യാസവും കൂടാതെ എഴുതിയ ആളിനും വായിയ്ക്കുന്ന ആളിനും കിട്ടും. ജോസ്തോമസിലെ സ്ത കൂടിച്ചേരരുതു്, പക്ഷേ കസ്തൂരിയിലെ സ്ത കൂടിച്ചേരണം എന്നൊക്കെ വിചാരിച്ചാല്‍ അതിനാണു് ഇഷ്ടമുള്ള രീതിയില്‍ ഫോണ്ടുകള്‍ പണിയാന്‍ സൌകര്യമുള്ളതു്. ജോസ്തോമസിനു പ്രശ്നമുണ്ടെന്നു പറയുമ്പോള്‍, നിങ്ങള്‍ ഇല്ലാത്ത ഒരു പ്രശ്നം ഉണ്ടെന്നു സങ്കല്പിക്കുകയാണു്.

Ralminov said...

I too dont have any problem with JosThomas. Similarly I dont have any problem with Ralminov, Ponveena, Nanma either. Though it would be nicer to see Ral_minov, Pon_veena etc , it is better to have ANY ONE of those versions (not both) allowed in IDN to avoid spoofing, phishing and what not.

Do you know about classic example of paypal? Do a googling if you dont.

Another classical example with Antony. ആന്റണി.കോം , ആന്‍റണി.കോം. Now as joiner is not allowed both are same. If chillu is encoded and allowed in IDN, the sites are distinct.

Ralminov said...

ഇപ്പോള്‍ തന്നെ IDN Spoofable ആണു്.
ഉദാ:
തളള.കോം (ThaLaLa.com) , തള്ള.കോം (ThaLLa.com)
തെററ്.കോം (TheRaR.com), തെറ്റ്.കോം (TheRR.com pron Thett_.com)

The first ones without virama, second ones with virama

ഈ എരിതീയിലേക്കു് എണ്ണയും കൂടി ഒഴിക്കണോ?

Rules should be implemented to prevent these, if not yet done.

Tharkovsky said...

ചില്ലുകള്‍ encode ചെയ്യുന്നതിലൂടെ ZWJ ഒഴിവായിക്കിട്ടും എന്നൊരു വലിയ ഗുണമുണ്ട്‌. നൂറുശതമാനം Unicode compliancy ഇല്ലാത്ത IDN ന്റെ പോരായ്മകളെ അങ്ങനെ മറികടക്കുകയും ചെയ്യാം. അപ്പോഴും വേണ്ടാത്തിടത്ത്‌ കൂട്ടക്ഷരങ്ങള്‍ ഉണ്ടാകുന്നത്‌ ഒഴിവാക്കാന്‍ ZWNJ ഉപയോഗിക്കേണ്ടിവരും. ഇല്ലെങ്കില്‍ ജോസ്തോമസ്‌-ദൃക്സാക്ഷി പ്രശ്നം പിന്നെയും പരിഹരിക്കപ്പെടാതെകിടക്കും; IDN പ്രശ്നമുണ്ടാക്കുകയും ചെയ്യും. ZWNJ നെ പൂര്‍ണ്ണമായി ഒഴിവാക്കാനും ഭാഷാകമ്പ്യൂട്ടിങ്ങിലുള്ള അവശേഷിക്കുന്ന പ്രശ്നങ്ങള്‍ പരിഹരിക്കാനും താഴെപറയുന്ന ടെക്നിക്‌ നിര്‍ദ്ദേശിക്കുന്നു:

സ്ത, ക്സ, യ്‌ല, വ്സ, സ്ക പോലെ വളരെക്കുറച്ച്‌ കൂട്ടക്ഷരങ്ങള്‍ അപൂര്‍വ്വം അവസരങ്ങളില്‍ മാത്രമേ പിരിഞ്ഞു വരുന്നുള്ളൂ. അത്തരം കൂട്ടക്ഷരങ്ങളെ കണ്ടുപിടിച്ച്‌ ചില്ലുകളെപോലെ ENCODE ചെയ്യുക.

ഈ പരിഹാരമാര്‍ഗ്ഗത്തെകുറിച്ച്‌ സിബു, കെവി, റാല്‍മിനോവ്‌, സുറുമ, മയ്യഴി, രചന, പെരിങ്ങോടര്‍ മുതലായവരുടെ അഭിപ്രായങ്ങള്‍ / വിമര്‍ശനങ്ങള്‍ അറിഞ്ഞാല്‍ കൊള്ളാമെന്നുണ്ട്‌

(താര്‍ക്കോവ്സ്കി എന്ന എന്റെ പേരില്‍ ZW(N)J പ്രശ്നം കൂട്ടത്തോടെ കടന്നുവരുന്നു.)

സിബു::cibu said...

ചര്‍ച്ചകളില്‍ തീപാറുന്നുണ്ടെങ്കിലും കൂടുതല്‍ ആളുകള്‍ മലയാളത്തിന്റെ യുണീകോഡ് എന്‍‌കോഡിങ്ങിനെ പറ്റി ചിന്തിക്കുന്നത്‌ വളരെ നല്ലൊരു കാര്യം.

തര്‍ക്കോവ്സ്കി... ചുരുക്കം ചില വാക്കുകള്‍ക്ക്‌ മാത്രമല്ല, ഏത്‌ കൂട്ടക്ഷരത്തിനും ജോസ്തോമസിന്റെ ഗതി വരാം. ഒരാളുടെ പേര് ഇന്ന അക്ഷരത്തിലേ തുടങ്ങാവൂ എന്നൊന്നുമില്ലല്ലോ. പിന്നെ, കൂട്ടക്ഷരങ്ങള്‍ക്കാണൊ മലയാളത്തില്‍ ക്ഷാമം? ഈ പ്രശ്നം ഇന്നത്തെ zw(n)j -ഉം ഫാള്‍ബാക്കും വച്ചുള്ള ഇന്നത്തെ യുണീക്കോഡിന്റെ ആര്‍ക്കിടക്ചറില്‍ ഒഴിച്ചുകൂടാനാവാത്തതാണെന്നാണ് എന്റെ പക്ഷം.

റാല്‍മിനോഫ്, ‘തളള’, ‘തെററ്’ ഒക്കെ IDN അനുവദിക്കുമ്പോള്‍ പരിഗണിക്കേണ്ട പ്രശ്നങ്ങള്‍ തന്നെ. ഇതൊക്കെ ആര് എവിടെ ചെയ്യുന്നു എന്ന്‌ എനിക്ക്പോഴും ഒരു പിടിയുമില്ല. സിഡിറ്റിലെ സുലോചന കുറെ പ്രപ്പോസലുകള്‍ വച്ചിരുന്നു.

റാല്‍മിനോഫ് പറഞ്ഞ നിര്‍ദ്ദേശങ്ങളനുസരിച്ച്‌ ഞാന്‍ എന്റെ ടേബിള്‍ പുതിക്കിയിട്ടുണ്ട്‌.

രണ്ടാമത്തെ പ്രപ്പോസലാണ് റാല്‍മിനോഫിന്റെ നിര്‍ദ്ദേശത്തെ പറ്റിയുള്ള കമ്പാരിസണ്‍.

Ralminov said...

Please read about Spoofing here (from wikipedia)

quote

URL spoofing and phishing

Another kind of spoofing is "webpage spoofing," also known as phishing. In this attack, a legitimate web page such as a bank's site is reproduced in "look and feel" on another server under control of the attacker. The intent is to fool the users into thinking that they are connected to a trusted site, for instance to harvest user names and passwords.

This attack is often performed with the aid of URL spoofing, which exploits web browser bugs in order to display incorrect URLs in the browsers location bar; or with DNS cache poisoning in order to direct the user away from the legitimate site and to the fake one. Once the user puts in their password, the attack-code reports a password error, then redirects the user back to the legitimate site.

unquote

In the present method and in my proposed method THIS KIND of ATTACK is not possible.And if IDN doesnt care about URL mirroring of the new proposed encoded chillus, it is very easy to spoof. If IDN implements mirrored URLs, then there cannot exist VanYavanika.com and VanyaVanika.com independently, so the very argument of encoding Chillus (for the sake of IDN) becomes void. It is a either-or condition. We cant have both the worlds together. A security trade-off must be done, if we must have VanYavanika.com and VanyaVanika.com separately registered. The Anrony.com and Antony.com is another example.

So it is incorrect to say IDN is "spoofable" if two or more names are permitted to point to a single website. It is similar to URL redirection or URL mirroring.
Those kind of "attacks" can be termed as "trademark attacks", not spoofing for sure.
Ofcourse through my ളള, ററ etc examples , IDN is presently spoofable. Also , considering most of us cannot visually distinguish R-sign and YA-sign, it is advisable not to use these in IDNs.

If we need Chillu encoding for some reasons, we can have a non joining chandrakkala also to eliminate the ZWNJ as well.

I just presented my concerns about encoding Chillus. Also I suggested an alternative(my proposal is flexible, it could be just similar to present joiners everywhere, the only change being NOT FORMAT CONTROL characters, so VanYavanika and VanyaVanika is same for me EVERYWHERE , not just in IDN and ALL the MINUSes and PLUSes in present encoding will be applicable PLUS WhatYouWriteIsWhatYouSee !!!).


Also I dont support any DELAYING tactics in solving the present problems in Unicode Malayalam. Sooner the better.

സുറുമ || suruma said...

Ralminov: If we need Chillu encoding for some reasons, we can have a non joining chandrakkala also to eliminate the ZWNJ as well.

Then, how can one visually distinguish between normal chandrakkala and non-joining chandrakkala? I think an appended non-joining character would be a better option.

Ralminov said...

Please note my first preference is to have replacements for ZW(N)J.. I see that I share your opinion.

Why should we have a visual distinction ? In the keyboard (input method) we can have both of them at the same key (one with the Alt_Gr modifier, I speak with WinXP SP2 in hand) and the other as normal. We can also have another keyboard (if needed, with keys reversed) and the user can choose whatever he prefer. Now I have four keyboards, one phonetic, one default from MS, one with joiners and conjuncts using AltGr, and the last with the proposed chillus...

It doesn't make any difference with the present system other than instead of two key sequence, we use only one.. Spoofing problem should be taken care of, by domain mirroring or whatever..
The search applications should treat both chandrakkalas as same..
If encoding Chillu is possible without any problem, this is also possible easily.

Tharkovsky said...

സിബു,
കൂട്ടക്ഷരങ്ങള്‍ക്ക്‌ മലയാളത്തില്‍ ക്ഷാമമില്ലെങ്കിലും, കൂട്ടക്ഷരങ്ങളുണ്ടാകുന്ന ഘടകവ്യഞ്ജനങ്ങളെ എളുപ്പത്തില്‍ നിജപ്പെടുത്താന്‍ കഴിയും.

കൂട്ടക്ഷരങ്ങളുണ്ടാകാത്ത വ്യഞ്ജനങ്ങളെ ഒഴിവാക്കി ചില്ലക്ഷരങ്ങളെപ്പോലെ encode ചെയ്യേണ്ടവയെ താഴെ പട്ടികയില്‍ ചേര്‍ക്കുന്നു (ഖ, ഝ, ഠ, ര എന്നിവ ഒഴിവാക്കിയിരിക്കുന്നു.)

ക് , ഗ് , ഘ് , ങ്
ച് , ഛ് , ജ് , ഞ്
ട് , ഡ് , ഢ് , ണ്
ത് , ഥ് , ദ് , ധ് , ന്
പ് , ഫ് , ബ് , ഭ് , മ്
യ് , ല് , വ്
ശ് , ഷ് , സ് , ഹ്
ള് , ഴ് , റ്

ആകെ 32 കള്ളികളേ ഇതിനാവശ്യമുള്ളു. ചില്ലുകള്‍ endode ചെയ്തു കഴിഞ്ഞാലും Malayalam Code Page ല്‍ പിന്നെയും 44 കള്ളികള്‍ ഒഴിഞ്ഞു കിടപ്പുണ്ട്‌. അവയില്‍ ഇവയെ encode ചെയ്തു കേറ്റാവുന്നതേയുള്ളു. Shift, ALT, CTRL എന്നിവ കൂട്ടമായോ ഒറ്റക്കോ ഉപയോഗിച്ച്‌ ഇവയൊക്കെ കീബോഡില്‍ നിസ്സാരമായി ഘടിപ്പിക്കാവുന്നതേയുള്ളു.

ക്ഷ, ത്സ മുതലായവയുമായി വരുന്ന കൂട്ടക്ഷരങ്ങളെ ഇവവെച്ചു ഉല്‍പാദിപ്പിച്ചാല്‍, പിന്നീടുവരുന്നവയുമായി കൂടിചേരാതെ നിലനിന്നുകൊള്ളും.
ക + ് + ഷ് + ണ --> ക്ഷ് ണ (please read the last product ommitting space)
ത + ് + സ് + ന --> ത്സ് ന (read the rectangle as chandrakkala)

'ര' കൂടിച്ചേര്‍ന്നുണ്ടാകുന്ന റകാരങ്ങളേയും ഇങ്ങനെ വേര്‍തിരിച്ചു നിര്‍ത്താം
ക + ് + ക് + ര --> ക്ക് ര
സ + ് + ത് + ര --> സ്ത് ര

ഇതിനായി ക്ഷ്, ത്സ്, ക്ക്, സ്ത് മുതലായ ഗ്ലിഫുകള്‍ കൂട്ടക്ഷരങ്ങളെപോലെ ഡിസൈന്‍ ചെയ്യേണ്ടിവരും. ഏറിയാല്‍ നാല്പതെണ്ണം.

ZWNJ നെ ഒഴിവാക്കാന്‍ വേറെ ഒരുവഴിയും ഞാന്‍ കാണുന്നില്ല. ചില്ലക്ഷരങ്ങളെ മാത്രം Encode ചെയ്യുന്നതിലൂടെ ജോസ്തോമസ്‌ പ്രശ്നം പരിഹരിക്കാനും പോകുന്നില്ല. ജോസ്തോമസ്‌ പ്രശ്നം പരിഹരിക്കാന്‍ ചില്ലിനുവേണ്ടി വാദിക്കുന്നവര്‍ (സിബുവും പെരിങ്ങോടരും, കെവിയും വിശ്വവും സുനിലുമടക്കം) ആരുംതന്നെ ഇതുവരെ ഒരു പരിഹാരവും നിര്‍ദ്ദേശിച്ചു കണ്ടില്ല.

പട്ടികയില്‍ കൊടുത്തിട്ടുള്ള അക്ഷരങ്ങള്‍ക്ക്‌ വേറിട്ട ഒരു നിലനില്‍പ്‌ വേണമെന്നു ആദ്യമായി ബോദ്ധ്യപ്പെട്ടത്‌ Microsoft നാണ്‌. Service Pack 2 വിന്റെ കൂടെ അവര്‍ മലയാളത്തിനായി ഡിസൈന്‍ ചെയ്ത കാര്‍ത്തിക ഫോണ്ടില്‍ മുകളിലത്തെ പട്ടികയില്‍ കൊടുത്ത മിക്കവാറും അക്ഷരങ്ങള്‍ ഗ്ലിഫുകളായി ഉണ്ട്‌. ചില്ലുകള്‍ പോലെയുള്ള അവയുടെ വേറിട്ട വ്യക്തിത്വം നാം കാണാന്‍ വൈകിയിരിക്കുന്നു. ZWJ ഒഴിവാക്കിയതുപോലെ ZWNJ ഒഴിവാക്കാന്‍ എല്ലാ പഴുതുകളും അടച്ച് നാം ഉടനടി സ്റ്റെപ്പുകളെടുത്തേ പറ്റൂ. ഇക്കാര്യത്തില്‍ വലിയ അനാസ്ഥയാണു കാണിച്ചിരിക്കുന്നത്. ഇത്‌ ഇപ്പോല്‍ തന്നെ യൂണികോഡിന്റെ ശ്രദ്ധയില്‍ കൊണ്ടുവന്ന് ചില്ലിനോടൊപ്പം തന്നെ encode ചെയ്യാനുള്ള തീര്പ്പുകള്‍ എടുപ്പിക്കാന്‍ സിബുവും കൂട്ടരും യത്നിക്കണം.

Sorting ല്‍ ചില്ലിന്റെ encoding പ്രശ്നങ്ങള്‍ ഉണ്ടാക്കാത്തതുപോലെ, ഈ 32 വ്യഞ്ജനം+ Chandrakkala യുടെ encoding ഉം യാതൊരു പ്രശ്നവും ഉണ്ടാക്കില്ല.

സിബു::cibu said...

തര്‍ക്കോവ്സ്ക്കി, ടൈപ്പ്‌ ചെയ്യുന്നവന് ‘സ്‌‘ എന്നെഴുതാനിപ്പോള്‍ രണ്ട്‌ ഓപ്ഷന്‍സില്ലേ? അതിലേത്‌ ഉപയോഗിക്കണമെന്ന്‌ അവനെങ്ങനെ തീരുമാനിക്കും? രണ്ടെഴുതിയാലും കാണുന്നത്‌ ഒന്നാവുന്നത്‌ കൊണ്ട്‌ ഒരുപോലെ ഡിസ്‌പ്ലേ ചെയ്യപ്പെടുന്ന ഒരു വാക്കിന് രണ്ട്‌ സ്പെല്ലിംഗ് ഉണ്ടാവില്ലേ? അത്‌ നന്നല്ല.

Anonymous said...

തര്‍ക്കോവ്സ്ക്കിയുടെ അഭിപ്രായം വായിച്ചു മനസ്സിലാക്കാന്‍ ശ്രമിക്കുന്നു. ഒരു സംശയം:

ക്ഷ, ത്സ മുതലായവയുമായി വരുന്ന കൂട്ടക്ഷരങ്ങളെ ഇവവെച്ചു ഉല്‍പാദിപ്പിച്ചാല്‍, പിന്നീടുവരുന്നവയുമായി കൂടിചേരാതെ നിലനിന്നുകൊള്ളും.
ക + ് + ഷ് + ണ --> ക്ഷ് ണ (please read the last product ommitting space)
ത + ് + സ് + ന --> ത്സ് ന (read the rectangle as chandrakkala)


ഈ ഉദാഹരണങ്ങള്‍ തീര്‍ത്തും സ്വീകാര്യമായി തോന്നുന്നില്ല. തീക്ഷ്ണം, ജ്യോത്സ്ന, മുതലായ വാക്കുകളില്‍ ക്ഷ്ണ, ത്സ്ന മുതലായ കൂട്ടക്ഷരങ്ങള്‍ക്കു് എന്താണു് കുഴപ്പമെന്നു മനസ്സിലായില്ല. വായിയ്ക്കുന്ന ആള്‍ക്കു് അങ്ങിനെ അധികം കൂട്ടക്ഷരങ്ങള്‍ ഇഷ്ടമല്ലെങ്കില്‍ ചുമ്മാ ഇഷ്ടമുള്ളൊരു പുതിയലിപി ഫോണ്ടുപയോഗിച്ചാല്‍ പോരേ. അതുകൊണ്ടു തീരുന്ന പ്രശ്നമല്ലേ അതിലുള്ളൂ. ജോസ്തോമസ് എന്ന വാക്കില്‍ ദൃശ്യപരമായ പ്രശ്നമല്ലേ ഉള്ളൂ, അല്ലാതെ സയും തയും കൂടിച്ചേരുന്നതുകൊണ്ടു് വാക്കിന്റെ അര്‍ത്ഥമോ ശബ്ദമോ മാറിപ്പോകുന്നുണ്ടോ? ഇതു് എന്‍കോഡിങ് തലത്തില്‍ പരിഹരിക്കേണ്ട പ്രശ്നമല്ലെന്നാണു് എന്റെ അഭിപ്രായം. ജോസ്തോമസ് വായിയ്ക്കുമ്പോള്‍‍ സ്ത എന്ന കൂട്ടക്ഷരം സൃഷ്ടിക്കുന്ന അരോചകത്വം മാറ്റാന്‍ രണ്ടു വഴികളുണ്ടു്. 1. വായിയ്ക്കുമ്പോള്‍ സ്ത എന്ന കൂട്ടക്ഷരമില്ലാത്ത ഫോണ്ടുപയോഗിക്കുക. 2. എഴുതുമ്പോള്‍ സ് കഴിഞ്ഞിട്ടു് ഒരു zwnj ഉപയോഗിക്കുക
ഇതല്ലാതെയുള്ള പരിഹാരം ഒരിക്കലും സ്തനം, കസ്തൂരി മുതലായ വാക്കുകളെ സ്ത എന്ന കൂട്ടരക്ഷത്തോടെ തന്നെ എഴുതാനും വായിയ്ക്കാനും പറ്റാതാക്കുന്ന തരത്തിലാകരുതെന്നും അഭിപ്രായമുണ്ടു്.

Ralminov said...

"2. എഴുതുമ്പോള്‍ സ് കഴിഞ്ഞിട്ടു് ഒരു zwnj ഉപയോഗിക്കുക"

ഈ ജോയിനറുകള്‍ മാഞ്ഞു് പോകുന്നതാണല്ലോ പ്രശ്നം..പിന്നെ ചിലയിടങ്ങളില്‍ അനുവദിക്കാത്തതും !!! ഈ പ്രശ്നമല്ലേ ചില്ലുകള്‍ക്കുമുള്ളൂ, ഗവേഷണകുതുകിയല്ലാത്ത ഒരു സാധാരണ ബ്ലോഗനു്..

Ralminov said...

ജോസ് തോമസിനെ വിടാം..(can be written/read better with a space, like all of those van yavanika examples) കൊയ്രാളയേയോ ?
(I mean KoiraaLa- കൊയ്‍രാള)...

Ralminov said...

ഇനി അതു് പേരല്ലേ , മലയാളമല്ലല്ലോ എന്നു് വയ്ക്കാം.. അപ്പോള്‍ -സമ്പദ്രംഗത്തെ- എന്നു് വായിക്കുമ്പോഴോ ?

-സമ്പദ്‍രംഗത്തെ- എന്നാണു് ഉദ്ദേശിച്ചതു്..

Ralminov said...

I didnt refer any grammar texts to fin d these examples. Just used Firefox + Padma combination to read Malayalam newspapers online ! As Padma uses ZWJ correctly we dont see any problems in Chillus. But it is not possible to put ZWNJ in a ascii-unicode converter, so it is very easy to find the unnecessary joining real world problems in malayalam if we use the above said method.
You can find the stripping of ZWNJ is as serious as stripping of ZWJ. So we should give equal preference to both these issues.

Anonymous said...

ഈ പ്രശ്നത്തിനു് ഒരു പോംവഴിയും സ്വീകാര്യമല്ലെന്നു് ഞാന്‍ പറഞ്ഞില്ല. തര്‍ക്കോവ്സ്ക്കി മുന്നോട്ടു വച്ച പോംവഴിയെക്കുറിച്ചു് മനസ്സിലാക്കാന്‍ ശ്രമിക്കുന്നതേയുള്ളൂ. തര്‍ക്കോവ്സ്ക്കി സൂചിപ്പിച്ച ഉദാഹരണങ്ങളെക്കുറിച്ചു് ആദ്യം മനസ്സില്‍ വന്ന സംശയം പ്രകടപ്പിച്ചുവെന്നു മാത്രം. ക്ഷ, ത്സ തുടങ്ങിയവയ്ക്കു് zwnj ഒരു നല്ല പരിഹാരമാര്‍ഗ്ഗം തന്നെയാണു്, കാരണം അഥവാ zwnj ഈ വാക്കുകള്‍ക്കിടയില്‍ നിന്നു് നഷ്ടപ്പെട്ടാലും വാക്കിന്റെ അര്‍ത്ഥത്തിനോ ശബ്ദത്തിനോ യാതൊരു മാറ്റവും സംഭവിക്കുന്നുല്ല. കൊയ്രാള പക്ഷേ മറ്റൊരു പ്രശ്നമാണു്. അതിനു് പരിഹാരം കണ്ടെത്തേണ്ടതുണ്ടു്. തര്‍ക്കോവ്സ്ക്കിയുടെ നിര്‍ദ്ദേശത്തെക്കുറിച്ചു അഭിപ്രായം പറയൂ റാല്മിനോവു്. അതിന്റെ ഗുണവശങ്ങളും ദോഷവശങ്ങളും കണ്ടെത്തേണ്ടതുണ്ടു്. എല്ലാതും എല്ലാവര്‍ക്കും മനസ്സില്‍ തോന്നണമെന്നില്ല. മറ്റു വലിയ ദോഷങ്ങളൊന്നും കൂടാതെ ഈ നിര്‍ദേശത്തിനു പ്രശ്നപരിഹരം‍ സാധ്യമെങ്കില്‍ ഇതൊരു formal proposal ആയി utc യ്ക്കു സമര്‍പ്പിക്കണം. അവിടെ ഇതു വീണ്ടും ചര്‍ച്ചചെയ്യപ്പെടും. അതിനുമുമ്പു് ഇവിടൊരു ചര്‍ച്ച നല്ലതാണു്, കൂടുതല്‍ മെച്ചപ്പെട്ട ഒരു പ്രൊപ്പോസല്‍ തയ്യാറാക്കാന്‍ അതിനാല്‍ സാധിക്കും. അതുകൊണ്ടു് തര്‍ക്കോവ്സ്ക്കിയുടെ നിര്‍ദ്ദേശത്തെക്കുറിച്ചുള്ള അഭിപ്രായങ്ങള്‍ കേള്‍ക്കട്ടെ എല്ലാവരില്‍ നിന്നും.

Ralminov said...

ചില്ലുകളേപ്പോലെത്തന്നെ അനാവശ്യ Proposal ആണിതും. zwnj/zwj preserve ചെയ്യുകയാണു് solution. തീരെ നിവൃത്തിയില്ലങ്കില്‍ malayalam specific special joiners ആവാം..

Tharkovsky said...

"How to avoid ZWNJ from Malayalam computing" is the sole purpose of proposing my solution. Those who advocate the encoding of Cillus and there by discarding ZWJ should show the responsibility to suggest ways to eliminate the occurrence of ZWNJ. Both ZWJ and ZWNJ are two sides of the same coin and one cannot simply ignore ZWNJ when strong points are put against ZWJ in the name of Cillu encoding.

Where are those Cillu encoders? Where are those enemies of ZWJ? Why are you hiding on the problems of ZWNJ? Can you suggest a better solution than mine to circumvent ZWNJ?

Whatever logics hold for the prevention of ZWJ equally hold for ZWNJ also. Or otherwise come with reasons to justify the occurrence of ZWNJ while standing against ZWJ.

Ralminov said...

A non-joining candrakkala and Ganesan's chillu sign are also the proposals that could very well be considered, if for some reason everyone hates the joiners !!!

«Oldest ‹Older   1 – 200 of 254   Newer› Newest»