Tuesday, August 15, 2006

യുണീക്കോഡ് വിവാദം: ചായക്കോപ്പയിലെ കൊടുങ്കാറ്റ്

യുണീക്കോഡിനെ പറ്റി വിവാദം എന്ന്‌ കഴിഞ്ഞ ആഴ്ച്ചയിലെ പത്രങ്ങളില്‍ എല്ലാവരും കണ്ടുകാണും. എന്താണ് എന്ന്‌ എനിക്കും ആദ്യം മനസ്സിലായില്ല. ഇതുവരെ മനസ്സിലായത്‌ എല്ലാവരുടേയും അറിവിലേയ്ക്കായി ഒരു FAQ ആയി ഇട്ടിരിക്കുന്നു.

250 comments:

  1. സിബു ഈ വാര്‍ത്ത രചനയ്ക്കു് അനുകൂലമായ സെന്റിമെന്റ്സ് സൃഷ്ടിച്ചെടുക്കുവാന്‍ മനഃപ്പൂര്‍വ്വം ഫാബ്രിക്കേറ്റ് ചെയ്തതല്ലേ എന്നു ഞാന്‍ സംശയിക്കുന്നു. കൂട്ടക്ഷരങ്ങള്‍ പിരിച്ചെഴുതുന്ന രീതിയില്‍ എന്‍‌കോഡ് ചെയ്യുവാന്‍ യൂണികോഡ് മണ്ടന്മാരല്ല എന്നറിയാവുന്നവര്‍ ചുരുക്കമായിരിക്കും. ലിപിയെ അതിന്റെ സംശുദ്ധ രൂപത്തിലേയ്ക്കു സംരക്ഷിച്ചെടുക്കുക എന്നതാണു യൂണികോഡിന്റെ പ്രഖ്യാപിത ലക്ഷ്യം. 1970 -നു മുമ്പ് അച്ചടിച്ച ഏതെങ്കിലും ഗ്രന്ഥത്തിലെ കൂട്ടക്ഷരങ്ങള്‍ യൂണികോഡിനു അയച്ചുകൊടുത്താല്‍ ഒരു ചര്‍ച്ചപോലും ആവശ്യമില്ലാതെ തീരുമാനിക്കപ്പെടേണ്ടതാണു്, കൂട്ടക്ഷരങ്ങളുടെ കാര്യം. എന്തു തന്നെയായാലും അങ്ങിനെയൊരു ഇഷ്യൂ ഉണ്ടായില്ല, എന്നാല്‍ പത്രം പ്രചരിപ്പിക്കുന്നതാകട്ടെ സീ-ഡാക്കിന്റെ ഉദ്ദേശം ഇപ്രകാരം അക്ഷരങ്ങളെ പിരിച്ചെഴുതുന്നതില്‍ യൂണികോഡിനെ സ്വാധിക്കുക എന്നത്രെ. വളരെ തെറ്റായ വാര്‍ത്തയാവണമതു്, അപ്രകാരമൊരു എന്‍‌കോഡിങ് ഒരിക്കലും നടക്കുവാന്‍ പോകുന്നില്ലെന്നു തിരിച്ചറിയുവാന്‍ അതിബുദ്ധിയൊന്നും ആവശ്യമില്ല. പത്രവാര്‍ത്തയുടെ ഉദ്ദേശം മറ്റൊന്നാവണം, പ്രായേണ ആര്‍ക്കും തെറ്റുന്നു തോന്നാവുന്ന ഒരു തീരുമാനം, സീ-ഡാക്കിന്റെയും മറ്റുള്ളവരുടേതുമായി പ്രചരിപ്പിച്ചു രചനയ്ക്കു് ഒരു ‘രക്ഷകന്റെ’ പരിവേഷം നല്‍കുകയെന്നുള്ളതു്.

    മലയാളം യൂണികോഡിനു ഇപ്പോഴുള്ള എന്‍‌കോഡിങ്ങില്‍ മാറ്റങ്ങള്‍ ആഗ്രഹിക്കാത്തവര്‍ ഇപ്പോഴുള്ള എന്‍‌കോഡിങ്ങില്‍ സോഫ്റ്റ്‌വെയറുകളും ടെക്സ്റ്റുകളും തയ്യാറാക്കി വിപണത്തിനു വച്ചിരിക്കുന്നവരാണു്. മറ്റൊന്നു ബ്ലോഗന്മാരാണു് ;) ബ്ലോഗന്മാര്‍ക്കു വാണിജ്യതാല്പര്യങ്ങള്‍ ഇല്ലെന്നും മലയാളത്തിന്റെ നന്മയ്ക്കായി മാറ്റങ്ങള്‍ ഉള്‍ക്കൊള്ളുവാന്‍ തയ്യാറാണെന്നും അനുഭവങ്ങള്‍ തെളിയിക്കുന്നു. ആര്‍ക്കാണു മലയാളത്തില്‍ വാണിജ്യതാല്പര്യമെന്നു് എല്ലാവര്‍ക്കും അറിയാം, ദുഷിച്ച ഇടയന്മാരെ തിരിച്ചറിയുവാന്‍ ജനം വിവേകം കാണിക്കുമെന്നു നമുക്കു പ്രത്യാശിക്കാം.

    ReplyDelete
  2. "ചില്ലക്ഷരങ്ങളുളുടെ പ്രശ്നമുള്‍പ്പെടെ” പ്രശ്നത്തിങ്ങളില്‍ ഒരു തീരുമാനം ഉണ്ടാവുന്നതു വരെ ഇക്കാര്യങ്ങളില്‍ മുന്നോട്ടു നീങ്ങരുതെന്ന് കേരള ഗവണ്മന്‍റ് യൂണികോഡ് കണ്‍സോര്‍ഷ്യത്തിനെ അറിയിച്ചതായി അറിയാന്‍ കഴിഞ്ഞു. രചനയാണ് ഇതിന് പിന്നിലെങ്കില്‍ ഇത്തരം കള്ളനാണയങ്ങളെ വെളിച്ചത്ത് കൊണ്ടുവരേണ്ടേ? മാതൃഭൂമിയിലെ ശ്രീ എന്‍. പി. ആറിനോ മറ്റാര്‍ക്കെങ്കിലുമോ ഇക്കാര്യത്തില്‍ സഹായിക്കാന്‍ കഴിയുമോ?

    ReplyDelete
  3. '..ഫോണ്ടാണ്‌ ഈ ടെക്സ്റ്റിനെ പുതിയലിപിയിലാണോ പഴയലിപിയിലാണോ കാണിക്കേണ്ടതെന്ന്‌ തീരുമാനിക്കുന്നത്‌. എല്ലാ കൂട്ടക്ഷരങ്ങളുള്ള ഫോണ്ട്‌ പഴയലിപിയില്‍ ഒരുവാക്കിനെ കാണിക്കും. അതുപോലെ അധികം കൂട്ടക്ഷരങ്ങളില്ലാത്ത ഫോണ്ട്‌ അതേ വാക്കിനെ തന്നെ പുതിയലിപിയിലും വായനക്കാരനെ കാണിക്കും. അതായത്‌, എഴുത്തുകാരനല്ല, വായനക്കാരനാണ്‌ ഒരു കൃതി ഏത്‌ ലിപിയിലാണ്‌ കാണേണ്ടത്‌ എന്നു തീരുമാനിക്കുന്നത്‌..'
    എന്‍റെ ഒരു കണ്‍ഫ്യൂഷന്‍ മാറിക്കിട്ടി.
    ഇതേ കുറിച്ച് എന്തെങ്കിലും പറയാനുള്ള അറിവില്ല.
    എന്താണ് ‘യൂണികോഡ് വിവാദ’ ത്തിനു പിന്നിലെ ‘വാണിജ്യതാല്പര്യങ്ങള്‍‘ എന്നറിയാന്‍ ആകാംക്ഷയുണ്ട്.

    ReplyDelete
  4. തീര്‍ച്ചയായും ആ ആര്‍ട്ടിക്ക്‌ള്‍ വായിച്ചു ഒരുപാട് കാര്യങ്ങള്‍ അറിയാതിരുന്നത്‌ അറിയാന്‍ കഴിഞ്ഞു. സിബു ഇക്കാര്യം ഇവിടെ പറഞ്ഞത്‌ എന്തായാലും വളരെ നന്നായി. കൂടാതെ, അതു വായിച്ചു കഴിഞ്ഞാല്‍ തന്നെ മനസ്സിലാവുമല്ലൊ സംഗതി ചായക്കോപ്പയിലെ കൊടുങ്കാറ്റ്‌ തന്നെയാണെന്ന്‌. ഇക്കാര്യം ഇവിടെ ചര്‍ച്ചക്കായി ഇട്ടതില്‍ ഒരുപാട്‌ നന്ദി ഉണ്ട്‌ സിബൂ...

    ReplyDelete
  5. പ്രിയപ്പെട്ട കൂട്ടുകാരേ,
    രചനയുമായി ഒരു മനംതുറന്ന ചര്‍ച്ച ആവശ്യമുണ്ട്.
    ഒരു പക്ഷേ നാം ഉദ്ദേശിക്കുന്ന വാണിജ്യതാല്പര്യങ്ങള്‍ ഒന്നും രചനക്കെങ്കിലും ഇല്ലെന്നു കരുതണം തല്‍ക്കാലം.
    ഞാന്‍ യാത്രയിലാണ്. ഇതേക്കുറിച്ച് വിശദമായി പിന്നെ എഴുതാം. തല്‍ക്കാലം മുന്‍‌വിധികളൊക്കെ മാറ്റിവെക്കണം ദയവായി.

    ReplyDelete
  6. യൂണികോഡ് മെയിലിങ് ലിസ്റ്റില്‍ ചില്ലുകള്‍ക്കെതി അവര്‍ സമര്‍പ്പിച്ച ഡോക്യുമെന്റ് വിമര്‍ശകരെ ഭയന്നെന്ന പോലെ മറച്ചുവയ്ക്കുവാന്‍ ശ്രമിച്ചും, ഡിസ്കഷനുകളില്‍ നിന്നൊഴിഞ്ഞു നില്‍ക്കുന്നതുമെല്ലാം രചനയെ അവിശ്വസിക്കുവാന്‍ എന്നെ പ്രേരിപ്പിച്ചിരുന്നു. ഇപ്പോള്‍ സി-ഡാക്ക് കൂട്ടക്ഷരങ്ങള്‍ പിരിച്ചെഴുതുവാന്‍ നിര്‍ദ്ദേശിക്കുന്നു (അസാദ്ധ്യമായ വസ്തുത, അപ്രകാരമല്ല മലയാളം എന്നു തെളിയിക്കുവാന്‍ ലിംഗ്വിസ്റ്റ് -ന്റെ സഹായം പോലും തേടേണ്ടി വരില്ല, ഇത്രയും ദുര്‍ബലമായ ഒരു ആര്‍ഗ്വുമെന്റ് യൂണികോഡ് സ്വീകരിക്കുമോ എന്നു തന്നെ ഉറപ്പില്ല) എന്നെല്ലാം പത്രങ്ങള്‍ എഴുതിക്കാണുമ്പോള്‍ ന്യായമായും ഒരു ഫൌള്‍ പ്ലേ (ആരെയോ കരിവാരിത്തേയ്ക്കാന്‍ ശ്രമിക്കുന്നതുപോലെ) നടന്നിട്ടുണ്ടെന്നു തോന്നുന്നു. ചില്ലുകള്‍ എന്‍‌കോഡ് ചെയ്യുവാന്‍ ശിപാര്‍ശചെയ്യുന്ന എറിക് മുള്ളറുടെ പേപ്പര്‍ യൂണികോഡ് കണ്‍സോര്‍ഷ്യം അംഗീകരിച്ചതോടെ തുടങ്ങിയതല്ലേ ഈ വിഭ്രാന്തി എന്നായിരുന്നു എന്റെ സംശയം. മുഖ്യമന്ത്രിവരെ ഇടപെടുന്ന സ്ഥിതിയിലായിട്ടുണ്ടു കാര്യങ്ങള്‍.

    വിശ്വം പറഞ്ഞ സ്ഥിതിയ്ക്കു് ഇനി വാഗ്വാദങ്ങള്‍ക്കും ആരോപണങ്ങള്‍ക്കും ഞാനില്ല, കാര്യങ്ങളുടെ നിജസ്ഥിതി വെളിപ്പെടുത്തുവാന്‍ വിശ്വം തന്നെ മുന്‍‌കൈയെടുക്കുക.

    ReplyDelete
  7. രചനയുടെ താല്പര്യങ്ങള്‍ വാണിജ്യപരമാണോ എന്നറിയില്ല. പക്ഷേ ചില താല്പര്യങ്ങള്‍ എന്തായാലുമുണ്ടെന്ന് അവര്‍ നടത്തുന്ന പി ആര്‍ പ്രകടനങ്ങള്‍ കാണുമ്പോള്‍ തോന്നും. മനോരമയില്‍ വന്ന ഏറ്റവുമൊടുവിലത്തെ റിപ്പോര്‍ട്ടും അതു വെളിവാക്കുന്നു. യുണിക്കോഡിനെപ്പറ്റിയോ ഫോണ്ടുകളേപ്പറ്റിയോ ഒരു പിണ്ണാക്കുമറിയാത്ത ലേഖകനെ ബ്രെയിന്‍ വാഷ് ചെയ്തെഴുതിച്ച റിപ്പോര്‍ട്ടാണതെന്ന് ആര്‍ക്കാണു മനസിലാകാത്തതു്. ഏതാനും മാസം മുന്‍‌പ് മലയാളം വാരികയില്‍ മനോജ് പുതിയവിളയെഴുതിയ രചനാ സ്തുതിയിലും ഇത്തരമൊരു വിലകുറഞ്ഞ കൈകടത്തല്‍ പ്രകടമായിരുന്നു. യുണികോഡ് തന്നെ രചനയുടെ കണ്ടെത്തെലാണെന്നായിരുന്നു അതിലെ സൂചനകള്‍! രചന സംശയത്തിന്റെ മുള്‍മുനയിലാകുന്നുണ്ടെങ്കില്‍ അതിനുത്തരവാദി അവര്‍തന്നെ.

    ReplyDelete
  8. C-DAC strongly deny this allegation. As the representative of Govt. of India, Department of Information Technology, we have interfaced very closely with the State government in finalizing the issues to be taken up with Unicode Consortium (the major one being encoding of chillus), in 100% conformance with Govt. of Kerala’s directives. The IT Secretary, Govt. of Kerala, directly passed on the final report to DIT. That report doesn’t recommend removal of even a single character from the Unicode chart, but recommend addition of certain characters instead. We once again stress that the alleged mutilation of the Malayalam language by removing many characters is completely baseless and we haven’t passed on any such documents to DIT with or without the knowledge of Kerala state IT department.

    K.G.Sulochana
    Head, Language Technology Section
    C-DAC, Thiruvananthapuram

    സീ-ഡാകിലെ ഭാ‍ഷാടെക്നോളജി ഹെഡ് കെ.ജി.സുലോചനയുടെ വിശദീകരണം. തെറ്റായ വാര്‍ത്ത എഴുതുന്ന റിപ്പോര്‍ട്ടര്‍മാരെയും പ്രസിദ്ധീകരിക്കുന്ന പത്രത്തേയും കൊല്ലണോ വളര്‍ത്തണോ എന്നാണു് ഇനി തീരുമാനിക്കാനുള്ളതു്.

    ReplyDelete
  9. പ്രിയ വിശ്വം, സുഹൃത്തുക്കളേ

    പല കാരണങ്ങളാല്‍ വയനാട്ടില്‍ വരാനും നിങ്ങളോടൊത്തു സംഗമിക്കാനും കഴിഞ്ഞില്ല. ബ്ലോഗുകളെ കുറിച്ചു ഞാന്‍ പഠിച്ചു വരുന്നതേയുള്ളൂ. നിങ്ങളോടൊപ്പം ഉണ്ടായിരുന്നെങ്കില്‍ കാര്യങ്ങള്‍ എളുപ്പത്തില്‍ പഠിക്കാമായിരുന്നു. അടുത്തുതന്നെ ഒരെണ്ണം തുടങ്ങണം. നല്ലൊരു ആശയം മനസ്സില്‍ തോന്നിയിട്ടുണ്ട്‌. അതിനുമുമ്പേ നിലവിലുള്ള മലയാളം ബ്ലോഗുകളൊക്കെ കാണണം, അറിയണം.

    രചനയെക്കുറിച്ച്‌ താങ്കളുടെ കുറിപ്പ്‌ സന്ദര്‍ഭോചിതമായി. സുഹൃത്തുക്കള്‍ക്ക്‌ തെറ്റിദ്ധാരണകളുണ്ട്‌. രചനയുടെ വാണിജ്യതാല്‍പര്യങ്ങളെക്കുറിച്ചോര്‍ത്തപ്പോള്‍ തമാശ തോന്നി. ജോജി എന്നൊരു സുഹൃത്ത്‌ രചന എഡിറ്റര്‍ വിറ്റു നടപ്പുണ്ട്‌. 200 രൂപയ്ക്ക്‌. അദ്ദേഹത്തിനു ഞാനതു വെറുതെ കൊടുത്തതാണ്‌. മൂന്നുവര്‍ഷം മുമ്പ്‌. രണ്ടായിരം ഇന്‍സ്റ്റല്ലേഷന്‍ കിട്ടിയിട്ടുണ്ടാകണം. കണക്കുകള്‍ രചന ചോദിച്ചിട്ടില്ല. അങ്ങനെയൊരു കരാറും ഉണ്ടായിരുന്നില്ല. ഞങ്ങളില്‍ പെടാത്ത ഒരാള്‍ അങ്ങനെ മാര്‍ക്കറ്റ്‌ ചെയ്തതുകൊണ്ടു അത്രയ്ക്കും കേരളീയര്‍ നഷ്ടപ്പെട്ടു പോയ അക്ഷരങ്ങള്‍ ഉപയോഗിക്കാനിടയായി.

    ഈയിടെ നല്ലൊരു വാര്‍ത്തയുണ്ട്‌. ബൈബിള്‍ (സത്യവേദപുസ്തകം) അതിന്റെ എല്ലാ തനിമയും നിലനിര്‍ത്തി ടൈപ്പ്സെറ്റ്‌ ചെയ്തു പ്രസിദ്ധീകരിച്ചിരിക്കുന്നു. തിരുവല്ലയില്‍ നിന്നാണു്‌. ഗംഭീരമായിരിക്കുന്നു. 1920 ലാണു്‌ അത്‌ അവസാനമായി അച്ചുനിരത്തിയത്‌ എന്നാണു അറിയാന്‍ കഴിഞ്ഞത്‌. ഇപ്പോഴത്തെ ഈ സംരംഭത്തിനുവേണ്ടി ഞാന്‍ രചനയിലില്ലാത്ത അമ്പതിലേറെ കൂട്ടക്ഷരങ്ങള്‍ ഉണ്ടാക്കികൊടുത്തു. ഈ ശ്രമങ്ങള്‍ക്കും പ്രതിഫലമൊന്നും ചോദിച്ചില്ല, കൈപ്പറ്റിയില്ല. ഇതൊക്കെ നിങ്ങള്‍ കുട്ടികള്‍ വിശ്വസിക്കുമോ എന്തോ! കുറച്ചൊക്കെ കൊമ്മേര്‍ഷ്യല്‍ ആയിരുന്നെങ്കില്‍ എന്നിപ്പോള്‍ തോന്നുന്നു. അന്നു വിശ്വത്തോടു പറഞ്ഞതുപോലെ പണമുണ്ടായിരുന്നെങ്കില്‍ പ്രഗത്ഭരായ കലാകാരന്‍മാര്‍ക്ക്‌ ചെറിയ പ്രതിഫലമൊക്കെകൊടുത്തു എണ്ണം പറഞ്ഞ കുറച്ചു ഫോണ്ടുകള്‍ വരപ്പിച്ചെടുപ്പിക്കാമായിരുന്നു.

    2005 ല്‍ രചനയുടെ ഓപ്പണ്‍ ടൈപ്‌ ഫോണ്ട്‌ ഗ്നു ജിപി എല്‍ ആയി ഇറങ്ങിയ വിവരവും കൂട്ടുകാര്‍ അറിഞ്ഞുകാണുമല്ലോ.

    രചനയോടുള്ള അപ്രിയത്തിനു കാരണം സിബുവിന്റെ ചില്ലുവാദങ്ങളെ ചിത്രജന്‍ എതിര്‍ത്തതാണ്‌ എന്നതായിരിക്കാം. സിബുവിന്റെ ഭാഷാസ്നേഹവും സേവനവും ആദരിച്ചുകൊണ്ടു പറയട്ടെ: ഈ പ്രശ്നത്തില്‍ അവസാന്‍ വാക്കു എന്റേതാണു എന്നുള്ള നിലപാടും വാശിയും വൈകാരികതയും ആശാസ്യമല്ല. ഇപ്പറഞ്ഞത്‌ ഹുസൈനും ചിത്രജനും ബാധകമാണു്‌.

    നമ്മുടെ ഡിജിറ്റല്‍ ചര്‍ച്ചകളില്‍ പരിഗണിക്കപ്പെടാതെ പോകുന്ന ഒരു യാഥാര്‍ത്ഥ്യമുണ്ട്‌. മലയാളത്തിലെ ഭാഷാപണ്ഡിതന്‍മാരുടേയും രചയിതാക്കളുടേയും ചെറിയൊരു ശതമാനം പോലും വരുന്നില്ല യൂണികോഡ്‌ മലയാളം ഡിസ്കഷന്‍ ഗ്രൂപ്പില്‍ ഇപ്പോള്‍ പങ്കെടുക്കുന്ന്വര്‍. വലിയൊരു ഭൂരിപക്ഷത്തെ, അവര്‍ കമ്പ്യൂട്ടറിന്റേയും നെറ്റിന്റേയും വരേണ്യലോകത്തിലില്ല എന്ന ഒറ്റ കാരണകൊണ്ടു ഭാഷാകമ്പ്യുട്ടിങ്ങിന്റെ എല്ലാ ആധികാരികതയും നാം സ്വയം സൂത്രത്തില്‍ എറ്റെടുക്കുകയാണു്‌. നാം വിചാരിച്ചാലേ കാര്യങ്ങല്‍ നേരെയാകൂ എന്നൊരു മെഗല്ലോമാനിയ നമ്മെ പിടികൂടിയിരിക്കുന്നു. നമ്മുടെ പണ്ഡിതരും സാഹിത്യകാരുമൊക്കെ ബൂലോഗന്‍മാരുടെ തള്ളിച്ചയില്‍ പാര്‍ശ്വവല്‍ക്കരിക്കപ്പെട്ടുപോയിരിക്കുന്നു. വാളെടുത്തവരൊക്കെ വെളിച്ചപ്പാടുകള്‍. ലോഹടൈപ്പുകളുടെ കാലത്ത്‌ അച്ചുനിരത്തിയവരും ലോഹം ഉരുക്കിയൊഴിച്ചവരും നമ്മുടെ അക്ഷരമാലയെ ക്രമീകരിക്കുന്ന ഭാരങ്ങളൊന്നും ഏറ്റെടുത്തിരുന്നില്ല. എന്നാല്‍ ഇന്നത്തെ ഐടി മെറ്റലര്‍ജിക്കാരുടെ അവസ്ഥ എന്താണ്‌?

    ചില്ലിന്റെ കാര്യത്തില്‍ ഒരു അന്തിമ തീരുമാനം ഡിജിറ്റല്‍ ഭാഗ്യവാന്‍മാര്‍ മാത്രം തീരുമാനിക്കുന്നത്‌ ഭാഷയൊടും ജനതയോടും ചെയ്യുന്ന അനീതിയായിരിക്കും. നമ്മുടെ ഠ വട്ടത്തെ നമുക്കു അതിവര്‍ത്തിക്കാന്‍ കഴിയണം. സിബുവിന്റേയും ചിത്രജന്റേയും വാദങ്ങളെ നല്ല തുടക്കമായിമാത്രം പരിഗണിക്കാനുള്ള സന്നദ്ധത നാം കാണിക്കണം. നമ്മുടെ സൌഹൃദങ്ങള്‍ നമുക്കു വിലപ്പെട്ടതാണു്‌; നമ്മുടേതുമാത്രമായതു ഒതുക്കണം. ഭാഷ നമ്മുടേതു മാത്രമല്ല.

    ചില്ലിന്റെ കര്യത്തില്‍ വിപുലമായ ഒരു ചര്‍ച്ച ഇനിയും ആവശ്യമുണ്ട്‌ എന്നാണ്‌ എന്റെ വ്യക്തിപരമായ അഭിപ്രായം. സായ്പന്‍മാര്‍ തീര്‍ച്ചയാക്കിയത്‌ അവസാന തീര്‍പ്പാണോ? ബെയ്ലിയുടേയും ഗുണ്ടര്‍ട്ടിന്റേയും ലെഗസി ഇവര്‍ക്ക്‌ എത്രമാത്രം അവകാശപ്പെടാനാകും? അതൊരു ഫാക്കുകൊണ്ട്‌ തീരുമാനിക്കേണ്ട ഒന്നല്ല. പതിനായിരം മെയിലുകലുടെ ശബ്ദവൊട്ടെടുപ്പല്ല അതിനു വേണ്ടത്‌. സര്‍ക്കാരിന്റെ മുദ്രയൊ ഭാഷാ
    ഉദ്യ്ഗസ്ഥന്‍മാരുടെ കസേരവലിപ്പമോ കൊണ്ടല്ല അതു തീരുമാനിക്കപ്പെടേണ്ടത്‌. ഇ-ജീവികള്‍ക്കും ബൂലോകന്‍മാര്‍ക്കും ഫോണ്ടന്‍മാര്‍ക്കും അപ്പുറം പേന ഉന്തികളുടെ വിശാലമായ ഒരു ലോകം ഭൂമി മലയാളത്തിലുണ്ട്‌. ആ പാവങ്ങള്‍ യൂണികോഡും പബ്ലിക്‌ ഹിയറിങ്ങും രചനയും വരമൊഴിയുമൊന്നും കേട്ടിട്ടില്ല. മലയാള സാഹിത്യകാരന്‍മാരുടേയും ഭാഷാപണ്ഡിതന്‍മാരുടേയും പത്രപ്രവര്‍ത്തകരുടേയും കേരളത്തിലെ ഐടി വിദഗ്ദ്ധന്‍മാരുടേയുമൊക്കെ വിശാലമായ ഒരു വേദിയില്‍ വെച്ച്‌ ചില്ലും കൂട്ടക്ഷരവുമൊക്കെ ചര്‍ച്ചാവിഷയമാകണം. കേരള സര്‍ക്കാര്‍ തന്നെ ഇതിനു മുന്‍കൈയെടുക്കണം. നിലവിലുള്ള 'മലയാളം സ്റ്റാന്‍ഡേര്‍ഡൈസേഷന്‍ ആന്റ്‌ കാരക്ടര്‍ എന്‍കോഡിംഗ്‌ കമ്മിറ്റി' യ്ക്ക്‌ ഇത്തരം കാര്യങ്ങള്‍ തീരുമാനിക്കാന്‍ യതൊരു അര്‍ഹതയുമില്ല. സഖാവ്‌ പി ഗോവിന്ദപിള്ളയാണ്‍ ഇപ്പോഴും ഈ കമ്മിറ്റിയുടെ ചെയര്‍മാന്‍. 1999 ല്‍ മലയാളത്തിന്റെ സമഗ്ര ലിപി സഞ്ചയം രചന അവതരിപ്പിച്ചപ്പോള്‍'തലമുടി നരച്ച വൃദ്ധരുടേയും തലച്ചോറു നരച്ച യുവാക്കളുടേയും പണിയാണ്‌ രചന' എന്നു പറഞ്ഞത്‌ ആരാണ്‌?. ഋകാരങ്ങളും റകാരങ്ങളും ഭാഷയ്ക്കു അധികപ്പറ്റാണെന്നു കണ്ടെത്തിയ 'മലയാള തനിമക്കാര്‍' ഇപ്പോഴും ഈ കമ്മിറ്റിയിലുണ്ട്‌. പ്രബോധബാധയേറുന്ന ക്ലിക്കുകള്‍ സിഡിറ്റിന്റെ അകത്തളങ്ങളില്‍ കറങ്ങിനടക്കുന്നു . 'സ്ത' കൂട്ടഷരമായി പരിഗണിക്കാം, എന്നാല്‍ 'സ്ന' ചന്ദ്രക്കലയിട്ടുതന്നെ പിരിച്ചെഴുതണം എന്ന്‌ ഈ കമ്മിറ്റി നിര്‍ദ്ദേശിച്ചിട്ട്‌ അധികം വര്‍ഷങ്ങളായില്ല. ഈ നിര്‍ദ്ദേശങ്ങള്‍ വരുമ്പോള്‍ ലോകത്ത്‌ യൂണിക്കോഡ്‌ ഉണ്ടായിരുന്നു, ഓപ്പണ്‍ടൈപ്പിന്റെ പ്രയോഗസാദ്ധ്യതകള്‍ അനാവരണം ചെയ്യപ്പെട്ടുകഴിഞ്ഞിരുന്നു. എന്നിട്ടും കമ്മിറ്റിക്കാര്‍ ടൈപ്‌ റൈറ്റര്‍ യുഗത്തില്‍ തന്നെയായിരുന്നു. ഭാഷയായിരുന്നില്ല അവരുടെ പ്രശ്നം, ഭാഷയുടെ മാനകീകരണമായിരുന്നു അവരുടെ പ്രശ്നം. നൂറ്റിയെഴുപത്തഞ്ചു വര്‍ഷം കൊണ്ട്‌ എഴുത്തിലും അച്ചടിയിലും സ്വയമേവ മാനകീകരിക്കപ്പെട്ട, എന്നാല്‍ എഴുപതുകളിലെ ലിപിപരിഷ്കരണം കൊണ്ട്‌ അപമാനകീകരിക്കപ്പെട്ട നമ്മുടെ ഭാഷയെ 'പ്‌റബോധ ചന്‌ ദ്‌ രന്‌ മാ' രാക്കാനായിരുന്നു ഈ കമ്മിറ്റിക്കാരുടെ ആദ്യകാല ശ്രമങ്ങള്‍. ഈ കമ്മിറ്റിക്കാര്‍ ഇക്കഴിഞ്ഞ നാലഞ്ചു വര്‍ഷത്തിനിടയില്‍ എത്രമാത്രം നവീകരിക്കപ്പെട്ടിട്ടുണ്ട്‌? ഇവരുടെ കയ്യില്‍ ഭാഷയുടെ സാങ്കേതിക ചിന്തകള്‍ എത്ര സുരക്ഷിതമാണ്‌? ശ്രീമതി സുലോചന ദേവി ആദരിക്കപ്പെടേണ്ട വലിയ ഭാഷാ ഉദ്യോഗസ്ഥയാകാം. ചില്ലിന്റേയും മറ്റും കാര്യത്തില്‍ തീര്‍പ്പു കല്‍പിക്കാന്‍ അവര്‍ക്ക്‌ ഭാഷാ പണ്ഡിത്യവും അനുഭവങ്ങളും എത്രത്തോളമുണ്ട്‌? മലയാളഭാഷ എഴുതുകയും വായിക്കുകയും ചെയ്യുന്ന കേവലം ഒരു മലയാളി എന്നതിലുപരി ഭാഷ പരിജ്ഞാനത്തിന്റെ ആഴങ്ങള്‍ കണ്ടറിഞ്ഞവരുടെ അഭിപ്രായങ്ങള്‍ സ്വരൂപിക്കുകതന്നെവേണം ഇക്കാര്യത്തില്‍.

    എറിക്‌ മുള്ളറുടെ ലേഖനത്തിലൂടെ കടന്നുപോകുമ്പോല്‍ മനസ്സിലാകുന്ന വിചിത്രമായ വസ്തുത യൂണികോഡ്‌ എന്‍കോഡിങ്ങിനേക്കാള്‍ അവസാനവാക്കായി എടുക്കേണ്ടത്‌ ഐ.ഡി.എന്‍ എങ്ങനെ പെരുമാറുന്നു എന്നുള്ളതാണ്‌ എന്നാണ്‌. മുപ്പത്‌ വര്‍ഷങ്ങള്‍ക്കുമുന്‍പ്‌ റ്റൈപ്‌ റൈറ്ററിലെ 90 കട്ടകള്‍ എങ്ങനെ പെരുമാറും എന്നതിനെ ആസ്പദിച്ചുണ്ടായ രീതിശാസ്ത്രത്തില്‍നിന്നും ഐടി യുഗവും മെച്ചപ്പെട്ടിട്ടില്ലെന്നാണൊ ഇതു സൂചിപ്പിക്കുന്നത്‌? വന്‍യവനിക പോലെയുള്ള വാക്കുകള്‍ കാണുമ്പോള്‍ ആറേഴു വര്‍ഷം മുമ്പത്തെ ഒരു സംഭവം ഓര്‍ക്കുന്നു. രചനയുടെ കാരക്റ്റര്‍ സെറ്റ്‌ കണ്ടതിനു ശേഷം ഒരു സുഹൃത്ത്‌ അതു സമഗ്രമല്ലെന്നു വാദിച്ചു. ഴ യുടെ ഋകാരം എവിടെ എന്നാണു്‌ അദ്ദേഹം ചോദിച്ചത്‌. സംവൃതോകാരത്തിന്റെ പ്രശ്നങ്ങളും വിസ്മരിച്ച മട്ടാണു്‌. കേരളപാണിനീയത്തൊടൊപ്പം റഫറന്‍സില്‍ ചില്ലിന്റെ ആ മരവിപ്പിച്ചുകൊല്ലുന്ന സാധനവുമുണ്ട്‌. ജനങ്ങള്‍ക്കിടയില്‍ ചൂടുപിടിച്ച വാദപ്രതിവാദങ്ങള്‍ക്കുശേഷമാണു ഇതൊക്ക തീരുമാനിക്കപ്പെട്ടത്‌ എന്നു സിബു പറയുമ്പോള്‍, ആരാണീ ജനങ്ങള്‍? മലയാളത്തിലെ എത്ര എഴുത്തുകാര്‍, എത്ര മലയാളം അദ്ധ്യാപകര്‍, എത്ര മലയാളം ഗവേഷകര്‍, മലയാളക്കരയിലെ എത്ര ഐടി വിദഗ്ദ്ധര്‍ .... ഈ ജനങ്ങളിലുണ്ട്‌?

    സര്‍ക്കാര്‍ തീരുമാനിച്ചാല്‍ വിശാലമായ ഒരു ചര്‍ച്ചാ വേദി എത്രയും പെട്ടെന്നു വിളിച്ചുകൂ‍ട്ടാവുന്നതേയുള്ളൂ. മലയാളം കമ്പ്യുട്ടിങ്ങിന്റെ യഥാര്‍ത്ഥ പബ്ലിക്‌ ഹിയറിംഗ്‌ അതായിരിക്കണം. ഇതിനായി മലയാളീ ബ്ലോഗര്‍മാരില്‍നിന്നും ശബ്ദമുയരണം.

    എല്ലാവര്‍ക്കും നന്‍മകള്‍ നേരുന്നു.
    ഹുസൈന്‍, രചന

    ReplyDelete
  10. ഹുസൈന്സാറും ഇവിടെ എത്തിപ്പെട്ടതില് വലിയ സന്തോഷം... ടെക്നിക്കലായുള്ള ചോദ്യങ്ങള്ക്ക് മറുപടി പറയാം. (ആര് എന്തിന്` അങ്ങനെ ചെയ്തു എന്നിങ്ങനെയുള്ള ചോദ്യങ്ങളിലേയ്ക്ക് ഇതെല്ലാം കഴിഞ്ഞ്‌ കടക്കാം :)

    ഇപ്പോഴത്തെ ഈ സംരംഭത്തിനുവേണ്ടി ഞാന് രചനയിലില്ലാത്ത അമ്പതിലേറെ കൂട്ടക്ഷരങ്ങള് ഉണ്ടാക്കികൊടുത്തു.

    അവ രചന ഫോണ്ടിലുള്പ്പെടുത്തി പ്രസിദ്ധീകരിക്കാമോ?


    എറിക് മുള്ളറുടെ ലേഖനത്തിലൂടെ കടന്നുപോകുമ്പോല് മനസ്സിലാകുന്ന വിചിത്രമായ വസ്തുത യൂണികോഡ് എന്കോഡിങ്ങിനേക്കാള് അവസാനവാക്കായി എടുക്കേണ്ടത് ഐ.ഡി.എന് എങ്ങനെ പെരുമാറുന്നു എന്നുള്ളതാണ് എന്നാണ്. മുപ്പത് വര്ഷങ്ങള്ക്കുമുന്പ് റ്റൈപ് റൈറ്ററിലെ 90 കട്ടകള് എങ്ങനെ പെരുമാറും എന്നതിനെ ആസ്പദിച്ചുണ്ടായ രീതിശാസ്ത്രത്തില്നിന്നും ഐടി യുഗവും മെച്ചപ്പെട്ടിട്ടില്ലെന്നാണൊ ഇതു സൂചിപ്പിക്കുന്നത്?


    എന്കോഡിങ് യന്ത്രത്തിനു വേണ്ടിയാണ്. കമ്പ്യൂട്ടറും ടൈപ്രൈറ്ററും യന്ത്രങ്ങളാണ് - മനുഷ്യരേക്കാള് ബുദ്ധികുറഞ്ഞവ. അതുകൊണ്ട് തന്നെ, ഒരു വാക്ക് കാണുമ്പോള് മലയാളിയേപ്പോലെ അതില് ചില്ല് ര-ആണോ റ-ആണോ എന്ന് word context-ഇല് നിന്നും തീരുമാനിക്കാന് യുണീക്കോഡിനാവില്ല. തുടര്ന്നുള്ള സന്ധികളും അങ്ങനെ തന്നെ. സ്ക്രീനിലെ Rendering ആണ് മനുഷ്യന് വേണ്ടിയുള്ളത്. അത് ശരിയാം വണ്ണം ഒരു എന്കോഡിങ് കൊണ്ട് സാധ്യമാന്നുണ്ടോ എന്ന് തീരുമാനിക്കലാണ് ഇന്ഡിക് ലിസ്റ്റിലെ ചര്ച്ചകളുടേയും മറ്റും ഉദ്ദേശം.

    വന്യവനിക പോലെയുള്ള വാക്കുകള് കാണുമ്പോള് ആറേഴു വര്ഷം മുമ്പത്തെ ഒരു സംഭവം ഓര്ക്കുന്നു. രചനയുടെ കാരക്റ്റര് സെറ്റ് കണ്ടതിനു ശേഷം ഒരു സുഹൃത്ത് അതു സമഗ്രമല്ലെന്നു വാദിച്ചു. ഴ യുടെ ഋകാരം എവിടെ എന്നാണു് അദ്ദേഹം ചോദിച്ചത്.

    രചന ഒരു ഫോണ്ടാണ്; ഒരു സ്റ്റാന്റേഡല്ല. രചനയില് ‘ഴൃ‘ എന്ന കൂട്ടക്ഷരം കണ്ടില്ലെങ്കില്, ആവശ്യക്കാരന് അങ്ങനെ ഒന്നുണ്ടാക്കാവുന്നതേ ഉള്ളൂ. എന്നാല് യുണീക്കോഡില് ഒരു വാക്കിന് കൃത്യതയില്ലെങ്കില് അതുണ്ടാക്കാന് മറ്റൊരു മാര്ഗമില്ല. Soundness, completeness, precision എന്നിവയാണ് എന്കോഡിങ് സിസ്റ്റത്തിന് അവശ്യം വേണ്ടഗുണങ്ങള്. ബാക്കിയുള്ളവ ഉണ്ടായാല് നന്ന്; നിര്‍ബന്ധമില്ല. വന്യവനിക/വന്‍യവനിക, എന്തലമുറ/എന്‍തലമുറ, പിന്നിലാവും/പിന്‍നിലാവും എന്നീ പെയറുകളില്‍ എഴുത്തിലൂടെ കാണിക്കുന്ന അര്‍ഥവ്യത്യാസം എന്‍‌കോഡിങ്ങില്‍ ഇല്ല. precision അഥവാ security എന്ന ഗുണമാണ് ഈ ambiguity-ഇല് നഷ്ടപ്പെട്ട് പോകുന്നത്. 'അവന്‍/അവന്' എന്നീ ഉദാഹരണങ്ങള് ഉണ്ടെന്നറിയാഞ്ഞിട്ടല്ല; അവയെടുത്താല് ചര്ച്ച സംവൃതോകാരത്തെ പറ്റിയായിപ്പോവും എന്നതുകൊണ്ടാണ് കരുതിക്കൂട്ടി അവയെ ഒഴിവാക്കിയത്.

    [കൂടുതലിവിടെ]

    ReplyDelete
  11. മലയാളം കമ്പ്യൂട്ടിങ്ങിന് ഇന്നൊരു മഹത്തായ ദിവസമാണ്! എനിക്കും!

    ഏഴു വര്‍ഷമായി ഞാന്‍ കാത്തിരിക്കുകയാണ് ഈ രണ്ടു പ്രതിഭകളും ഒരൊറ്റ താളില്‍ വന്ന്‌ ഇക്കാര്യം ചര്‍ച്ച ചെയ്യാന്‍ വേണ്ടി. വരമൊഴി യാഹൂഗ്രൂപ്പില്‍ ആദ്യമായി കമ്പ്യൂട്ടറിലെ മലയാളലിപി മാനനീകരണത്തെപ്പറ്റിയും, പിന്നെ യുണികോഡിനെപ്പറ്റിയും എഴുതിയ അന്നു മുതല്‍ രചനയെ കാത്തിരിക്കുകയായിരുന്നു.

    ഈയിടെ ഹുസ്സൈനെ നേരിട്ടു കണ്ടപ്പോള്‍ ഒരു കാര്യം വ്യക്തമായി. നാടോടികളായി അലഞ്ഞുതിരിയാന്‍ വിധിക്കപ്പെട്ട സിബുവിനേയും ഞങ്ങള്‍ മറ്റു കൂട്ടുകാരേയും പോലെത്തന്നെ ഒഴുക്കിനെതിരെ അവരുടേതായ നിലയില്‍ യുദ്ധം ചെയ്യുന്നവരാണ് ഹുസ്സൈനും ചിത്രജനും കൂട്ടരും എന്ന്. ആ കൂടിക്കാഴ്ചയെ പറ്റി ഒരു നീണ്ട റിപ്പോര്‍ട്ടു തന്നെ എഴുതിയുണ്ടാക്കിയിട്ടുണ്ട് ഞാന്‍. എങ്കിലും ഹുസ്സൈന്‍ കൂടി വായിച്ച് സമ്മതം അറിയിച്ചതിനുശേഷമേ അതു വെളിച്ചത്താക്കൂ എന്നു വിചാരിച്ചു.

    തിരിച്ചുവന്നതിനുശേഷം വരമൊഴിയില്‍ തുടക്കം തൊട്ട് ഇക്കാര്യത്തില്‍ നടത്തിയിട്ടുള്ള ചര്‍ച്ചകള്‍ വായിച്ചു പഠിക്കുകയായിരുന്നു ഞാന്‍. ചിലേടത്തൊക്കെ രചനയെത്തന്നെ നിര്‍ദയം വിമര്‍ശിച്ചിട്ടുണ്ട് ഞാനടക്കമുള്ള അവിടത്തെ അംഗങ്ങള്‍. തുറന്നൊരു ചര്‍ച്ചയ്ക്ക് തയ്യാറാവാതെ രചന പിന്‍‌വലിഞ്ഞു നിന്നതുകൊണ്ടാകാം പക്വത വരാത്ത, ചെറുപ്പക്കാരായ ഞങ്ങളുടെ സ്വരങ്ങളില്‍ കാര്‍ക്കശ്യമേറിയത്. എന്നിരുന്നാലും സ്വന്തം അമ്മമൊഴിയോടുള്ള ഞങ്ങളുടെ നിസ്വാര്‍ത്ഥമായ പ്രതിബദ്ധത ആ ചര്‍ച്ചകളിലാകമാനം കാണാം.

    പരമ്പരാഗതമായ നമ്മുടെ മലയാളലിപിസഞ്ചയത്തിനെ രചന അത്യദ്ധ്വാനം ചെയ്തുകൊണ്ടു തന്നെ കണ്ടെടുക്കുകയും പുനരാവിഷ്കരിക്കുകയുമുണ്ടായി എന്നു ഞങ്ങള്‍ പത്രങ്ങളിലൂടെയും മറ്റും വായിച്ചറിഞ്ഞിരുന്നു. ഇതിനെ തുടര്‍ന്ന് സിബുവും മറ്റുള്ളവരും രചനയുമായി ബന്ധപ്പെടുവാനും ശ്രമിച്ചിരുന്നു. അന്നു ബാംഗ്ലൂരില്‍ ജോലി ചെയ്തിരുന്ന സിബു ഹുസ്സൈന്‍ സാറിന് രണ്ടു പ്രാവശ്യമെങ്കിലും മെയിലയക്കുകയും ചെയ്തു. പക്ഷേ നിര്‍ഭാഗ്യവശാല്‍ വ്യക്തമായ ഒരു മറുപടി ആ സമയത്ത് ലഭിച്ചില്ലെന്നാണറിവ്.

    99 ആഗസ്റ്റ് 27 ന് ഡോ.അച്യുത്ശങ്കര്‍ വരമൊഴിയിലേക്ക് സ്വയം പരിചയപ്പെടുത്തിക്കൊണ്ട് ഒരു പ്രധാനപ്പെട്ട മെയില്‍ അയക്കുകയുണ്ടായി. ഗ്ലിഫുകളും എന്‍‌കോഡിങ്ങും തമ്മിലുള്ള വ്യത്യാസത്തെപ്പറ്റിയും രചനയുടെയും മലയാളത്തനിമയുടേയും യുണികോഡിന്റെയും (വ്യവിധോദ്ദേശ്യങ്ങളായ)ലക്‌ഷ്യങ്ങളെപ്പറ്റിയും ആദ്യമായി ആ മെയിലില്‍ ആണ് പരാമര്‍ശിക്കപ്പെട്ടത്. അതേത്തുടര്‍ന്നാണ് ഈയിടെ വീണ്ടും ചൂടുപിടിച്ചിട്ടുള്ള ‘ര’-‘റ’-ര്‍-ചില്ല്-കൊളേഷന്‍ ‍ചര്‍ച്ചയും ആദ്യമായി അവിടെ വന്നത്. ഒരു പക്ഷേ രചന കൂടി അന്ന് ആ ചര്‍ച്ചയില്‍ പങ്കെടുത്തിരുന്നെങ്കില്‍ മലയാളം യുണികോഡ് (സര്‍ക്കാരിന്റെയും ഭാഷാഇന്‍സ്റ്റിവിഷത്തിന്റേയും ഒന്നും സഹായമില്ലാതെതന്നെ) വര്‍ഷങ്ങളുടെ കുതിച്ചുചാട്ടം നടത്തിയേനെ!

    വേണ്ടത്ര അറിവുള്ള ഭാഷാശാസ്ത്രജ്ഞന്മാരുടെ അഭാവം കൊണ്ട്, ഭാഷയില്‍ മുറിവൈദ്യം മാത്രം അറിയാവുന്ന, എന്നാല്‍ യന്ത്രസാങ്കേതികതയില്‍ കുറച്ചൊക്കെ നൈപുണ്യമുള്ള ഒരു പിടി ആളുകള്‍ മാത്രം വരമൊഴി ഗ്രൂപ്പില്‍ ബാക്കിവന്നു. അതുകൊണ്ടു തന്നെ ലിപി/എന്‍‌കോഡിങ്ങ് രംഗത്ത് (വേറേ ഉത്തരവാദിത്തമുള്ള ആരും തിരിഞ്ഞുനോക്കാതിരിക്കുമ്പോള്‍) വരമൊഴിഗ്രൂപ്പിനെങ്കിലും സജീവമായി ഒരു ചര്‍ച്ച തുടര്‍ന്നുകൊണ്ടുപോവാന്‍ സാധിച്ചില്ല.

    എങ്കിലും ഒരു പ്രത്യേക ലിപിയുടെ രൂപത്തിലും കോഡ്മാപ്പിലും നേരിട്ട് ബന്ധമില്ലാത്തതാണെങ്കില്‍ പോലും ഒരു transliteration പദ്ധതിയുടെ മാത്രം വക്താവായി മാറിനില്‍ക്കാതെ സിബുവും വരമൊഴിഗ്രൂപ്പും ലിപിമാനനീകരണത്തിനുവേണ്ടിയും യുണികോഡ് അംഗീകാരത്തിനുവേണ്ടിയും ശ്രമിച്ചുകൊണ്ടിരുന്നു.

    ഒരു ഘട്ടത്തില്‍ വരമൊഴി പ്രോഗ്രാം സിബു യുണികോഡിലേക്കു കൂടി വ്യാപിപ്പിച്ചു. ഉപയോഗയുക്തമായ ഒരു യുണികോഡ് ലിപി അപ്പോഴും മലയാളത്തിലുണ്ടായിക്കഴിഞ്ഞിരുന്നില്ല. ഏറെക്കുറെ ആര്‍ക്കും വേണ്ടാത്ത ആ ഫീച്ചര്‍ മലയാളം വിക്കി വന്നപ്പോളാണ് ആളുകള്‍ ശ്രദ്ധിച്ചുതുടങ്ങിയതു തന്നെ. അങ്ങനെയാണ് കെവിന്‍ വെറുതെ ഒരു രസത്തിനെന്ന പോലെ അഞ്ജലി യുണികോഡ് വരച്ചുണ്ടാക്കാന്‍ തുടങ്ങിയത്.

    രചനയെ എതിരിടാന്‍ വേണ്ടിയല്ല രചന കണ്ടെത്തിയ ലിപിരൂപങ്ങള്‍ കെവിന്‍ അഞ്ജലിയില്‍ ചേര്‍ത്തുവെച്ചത്. കുറഞ്ഞ പ്രയത്നം, ചക്രം വീണ്ടും കണ്ടുപിടിക്കേണ്ടല്ലോ എന്നൊക്കെയേ അയാള്‍ വിചാരിച്ചിരുന്നുള്ളൂ. മാത്രമല്ല, അറിഞ്ഞിടത്തോളം ഒരു സ്വതന്ത്ര സോഫ്റ്റ്വെയര്‍ ആയിരുന്നു ലിപി ആ സമയത്ത്.

    ഒരു പക്ഷേ മലയാളത്തിലെ പഴയ ലിപിയെ ഉയിര്‍ത്തെഴുന്നേല്‍പ്പിച്ചതില്‍ രചന വഹിച്ച പങ്കിനോടൊപ്പം തന്നെ ഒപ്പം വെച്ചുകാണണം കെവിന്‍ അയാളുടെ യുണികോഡ് ഫോണ്ട് പഴയ ലിപിയില്‍ സൃഷ്ടിക്കാന്‍ തീരുമാനിച്ച അസാധാരണമായ ചങ്കൂറ്റവും എന്നാണെനിക്കിപ്പോള്‍ തോന്നിയിട്ടുള്ളത്. ഇക്കഴിഞ്ഞ രണ്ടു വര്‍ഷങ്ങളില്‍ അഞ്ജലി ആര്‍ജ്ജിച്ച പ്രചാരം തന്നെ ഗൌരവമായി കാണേണ്ടതാണ്. എങ്കില്‍ പോലും ഹുസ്സൈനിന്റെ അത്ര തന്നെ സൌമ്യപ്രകൃതിയായി എനിക്കു തോന്നിയിട്ടുള്ള കെവിന്‍ ഇപ്പോഴും അങ്ങനെ ഒരു ക്രെഡിറ്റു ചോദിച്ചുവാങ്ങുവാന്‍ ആഗ്രഹിക്കുന്നു എന്നുതോന്നുന്നില്ല.ഇടയ്ക്കൊരിക്കല്‍ രചനയില്‍ നിന്നും എടുത്തിട്ടുള്ള ഭാഗങ്ങള്‍ അഞ്ജലിയില്‍ നിന്നും നീക്കം ചെയ്യണമെന്ന് ആവശ്യപ്പെട്ടപ്പോള്‍ ഖിന്നതയോടെ, എന്നാല്‍ മറിച്ചൊരക്ഷരം ഉരിയാടാതെ കെവിന്‍ അതനുസരിക്കുകയും ചെയ്തു.


    ഇത്രയും കാര്യങ്ങള്‍ ദീര്‍ഘമായി ഇവിടെ എഴുതിയത് ഒരു പ്രത്യാശയോടു കൂടിയാണ്. കഴിഞ്ഞുപോയ ഈ സംഭവങ്ങളില്‍ നാം പരസ്പരം അറിയാതെ ചെറിയ തെറ്റിദ്ധാരണകളൊക്കെ ഉണ്ടായിട്ടുണ്ടാവാം.പക്ഷേ ഇനിയും നമുക്കതൊക്കെ മറന്നുകളയാമെന്നു ഞാന്‍ അഭ്യര്‍ത്ഥിക്കുന്നു.

    ഇത്തവണ നാട്ടില്‍ വന്നപ്പോഴത്തെ ഏറ്റവും വലിയ നേട്ടമായി ഞാന്‍ കാണുന്ന രണ്ടോ മൂന്നോ കാര്യങ്ങളില്‍ ഒന്ന് ഹുസ്സൈനെ കണ്ടുമുട്ടിയതാണ്. നേരിട്ടുകണ്ടപ്പോള്‍ എന്റെ ധാരണകളില്‍ എത്ര മാത്രം അബദ്ധങ്ങളുണ്ടായിരുന്നു എന്ന് എനിക്കു തിരിച്ചറിയാനായി. പരസ്പരം അറിയാതെ നാം നമ്മുടെ ശക്തിയും ഊര്‍ജ്ജവും ഇനി ദുര്‍വ്യയം ചെയ്തുകൂടാ. ഡോക്റ്റര്‍ മഹേഷ്, രാമചന്ദ്രന്‍ മാസ്റ്റര്‍, ഹുസ്സൈന്‍ തുടങ്ങി കേരളത്തില്‍ തന്നെയുള്ള ഭാഷാവിദഗ്ദരായ തലമുതിര്‍ന്ന ചേട്ടന്മാരും കടലുകള്‍ക്കക്കരെ, സാങ്കേതികമായി ദീര്‍ഘവീക്ഷണവും എന്നാല്‍ മറ്റുള്ള കാര്യങ്ങളില്‍ പരിമിതികളും ഉള്ള സിബുവിനേയും കെവിനേയും ബെന്നിയെപ്പോലെയും ഉള്ള കുഞ്ഞനിയന്മാരും ഒത്തൊരുമിച്ചാല്‍ മഹത്തായിരിക്കും ആ സൈന്യം!

    പ്‌രബോധചന്‌ദ്‌രിക ഇനിയും ഉദിച്ചുവന്നിട്ടില്ലാത്ത നമ്മുടെ നാട്ടിലെ തന്നെ വേരെടുത്ത കസേരകളും ‘പാഷാണഇന്‍സ്റ്റിവിഷങ്ങളും’ നോക്കിനില്‍ക്കേ തന്നെ നമുക്കൊരുമിച്ച് ഐക്യദാര്‍ഢ്യത്തോടെ ജനങ്ങളിലേക്കും നമ്മുടെ മലയാളഭാഷയിലേക്കും ഇറങ്ങിച്ചെല്ലാം!

    അസ്തപ്രജ്ഞയായിക്കിടക്കുന്ന തുഞ്ചന്റെ കിളിപ്പെണ്ണിന് ഒരു തുള്ളി വെള്ളമെങ്കിലും വായിലിറ്റിച്ചുകൊടുക്കാം ഇനി നമുക്കൊത്തൊരുമിച്ച്!

    യുണികോഡടക്കമുള്ള കാര്യങ്ങളില്‍ മുന്‍‌വിധികളും വാശികളും എല്ലാം മാറ്റിവെച്ച് നമുക്കൊന്നിക്കാനാവും. അന്നു ഞാന്‍ പറഞ്ഞതുപോലെ യന്ത്രങ്ങളുടെ യുക്തിഭദ്രതയ്ക്ക് തെറ്റായ പല വഴികളും ഉണ്ടാവാം. പക്ഷേ ശരിയായ ഒരൊറ്റ വഴിയേ കാണൂ.ആ വഴി ഏതായാലും നമുക്കൊരുമിച്ചു കണ്ടുപിടിക്കാം.

    അതെത്ര വേഗം ചെയ്യുന്നുവോ അത്രയ്ക്കും ആരോഗ്യം കൂടും നമ്മുടെയൊക്കെ അമ്മമലയാളത്തിന്.

    ഗ്ലിഫുകളുടേയും എന്‍‌കോഡിങ്ങിന്റേയും പ്രശ്നങ്ങള്‍ വേര്‍തിരിച്ച് കണ്ട് ഒറ്റയ്ക്കൊറ്റായി നമുക്ക് ചര്‍ച്ച ചെയ്യാം. അവയില്‍ തന്നെ സംവൃതോകാരം, ലഘുവിരാമം, ചില്ലുകള്‍ എന്നിവയെക്കുറിച്ചും 1970-ലെ കൊലപാതകത്തിനെക്കുറിച്ചും നമുക്കു പിന്നെയും ഇഴപിരിച്ച് ചെറിയ ചെറിയ പ്രശ്നങ്ങളാക്കി മാറ്റാം.
    ആ തലത്തില്‍ വേറെ പാണ്ഡിത്യമുള്ള പുതിയ ആളുകളെയും നമുക്കു തേടിപ്പിടിക്കാം!

    input ചെയ്യുമ്പോഴും output ചെയ്യുമ്പോഴും ഉഭയദിശകളിലും‍ മാറ്റം വരാത്ത ഒരു ലിപിസഞ്ചാലനവ്യവസ്ഥയും എല്ലാര്‍ക്കും സ്വീകാര്യമായ ഒരു അക്ഷരക്രമീകരണരീതിയും അന്‍പതു-നൂറു വര്‍ഷത്തിന്റെയെങ്കിലും ചരിത്രപരമായ പിന്‍ബലമുള്ള അക്ഷരരൂപങ്ങളുമാവട്ടെ ഏറ്റവും അടിസ്ഥാനപരമായി നമ്മുടെ കൂട്ടായ മൂന്നു ലക്‌ഷ്യങ്ങള്‍!
    ആ ലക്ഷ്യങ്ങളെക്കുറിച്ചുതന്നെ ഒരു മാര്‍ഗ്ഗരേഖയുണ്ടാക്കാം ആദ്യം.

    ReplyDelete
  12. ഹുസൈന്‍,

    സര്‍ക്കാര്‍ തീരുമാനിച്ചാല്‍ വിശാലമായ ഒരു ചര്‍ച്ചാ വേദി എത്രയും പെട്ടെന്നു വിളിച്ചുകൂ‍ട്ടാവുന്നതേയുള്ളൂ. മലയാളം കമ്പ്യുട്ടിങ്ങിന്റെ യഥാര്‍ത്ഥ പബ്ലിക്‌ ഹിയറിംഗ്‌ അതായിരിക്കണം. ഇതിനായി മലയാളീ ബ്ലോഗര്‍മാരില്‍നിന്നും ശബ്ദമുയരണം.


    താങ്കളെപ്പോലെ ഒരാള്‍ കുറേനേരത്തെ തന്നെ പറയേണ്ടിയിരുന്ന വാക്കുകളായിരുന്നു ഇവ; അച്ചുനിരത്തുന്നവരോടുള്ള അവജ്ഞയാകാം ഒരു പക്ഷെ പറയാതിരിക്കുവാനുള്ള കാരണം. ഇപ്പോഴെങ്കിലും താങ്കള്‍ തന്നെ പറഞ്ഞ മെഗലൊമാനിയ ‘ധാര്‍ഷ്ട്യം’ മാറ്റിവച്ചു ചര്‍ച്ചവേണമെന്നു് ആവശ്യപ്പെടുന്നതില്‍ വളരെ സന്തോഷം. എത്രയും പെട്ടെന്നു കാര്യങ്ങള്‍ക്കൊരു തീര്‍പ്പുണ്ടാകുവാനാണു് ഐ.ടി വിദഗ്ദര്‍ കാത്തിരിക്കുന്നതു്, അനേകം പേര്‍ ഇപ്പോള്‍ തന്നെ യൂണികോഡ് ഉപയോഗിക്കുന്നു, തെറ്റുകള്‍ കുമിഞ്ഞുകൂടും മുമ്പ് തിരുത്തലുകള്‍ നടന്നിരിക്കേണ്ടതുണ്ടു്. ഇന്റര്‍നെറ്റ് ഉപയോഗിക്കാനില്ലാത്ത-വരേണ്യരല്ലാത്തവര്‍ ഞങ്ങളെന്നു വിലപിക്കുന്നതുകൊണ്ടു വലിയ പ്രയോജനമൊന്നുമില്ല, കേരള ഐ-ടി മിഷന്‍ ലക്ഷങ്ങള്‍ പാഴാക്കുന്ന വേളയില്‍, ഭാഷാകമ്പ്യൂട്ടിങ് പ്രവര്‍ത്തകര്‍ക്കു ചര്‍ച്ച ചെയ്യുവാന്‍ ഒരു ചെറുവേദിയെങ്കിലും നേടിയെടുക്കാനാവണമായിരുന്നു സ്വാധീനവും അധികാരവും വാക്കുകളും എല്ലാവരും ഉപയോഗിക്കേണ്ടിയിരുന്നതു്.

    എല്ലാവിധ ആശംസകളും രചന അക്ഷരവേദിക്കു നേര്‍ന്നുകൊണ്ടു്,

    സ്നേഹാദരവുകളോടെ

    ReplyDelete
  13. ഈ ചര്‍ച്ചകള്‍ വായിക്കാന്‍ കഴിയുന്നത്‌ തന്നെ മഹാഭാഗ്യം!! എല്ലാ ചര്‍ച്ചകളും ഇങ്ങനെ പരസ്യവേദിയിലാക്കാന്‍ കഴിയില്ലെന്നറിയാം, എന്നാലും പറ്റുന്നിടത്തോളം, നിങ്ങളുടെ വിജ്ഞാനം ഞങ്ങള്‍ക്കും പകര്‍ന്നു തരിക.

    ReplyDelete
  14. ഹുസ്സൈന്‍ സാറിന് നമസ്കാരം!
    പല രാഷ്ട്രീയമാനങളുള്ള ഈ സംഭവത്തെ പുതിയ വെളിച്ചത്തില്‍ കാണാനും പഠിക്കാനും ഹുസ്സൈന്‍ സാറും മഹേഷുമൊക്കെയുമായുള്ള സംവാദങള്‍ സഹായിച്ചു. ഇനിയും തുറന്ന മനസ്സോടേ മുന്‍‌ധാരണകളില്ലാതെ രചനയുമായി സഹകരിച്ച്‌ ,സംവദിച്ച്‌ സര്‍ക്കാറിനെ നേരാംവഴിയില്‍ കൊണ്ട്നടത്താന്‍ നമുക്ക് ശ്രമിക്കാം.
    വേണ്ടത്‌ ചെയ്യാന്‍ വിശ്വം മുന്‍‌കൈ എടുക്കുമെന്ന്‌ കരുതുന്നു.-സു-

    ReplyDelete
  15. കൂട്ടരെ, മലയാളലിപികളെ വെട്ടിമുറിച്ച്‌ എണ്ണം കുറച്ച്‌ യൂണിക്കോടില്‍ കൊണ്ടുവരുന്നതിന് കാരണമായി പറയുന്നത്‌ യൂണിക്കോട്‌ ഫസ്റ്റ് ലെവല്‍ ഇമ്പ്ലിമെന്റേഷന്‍, അക്ഷരങളുടെ എണ്ണം കുറച്ചാല്‍ സാധ്യമാണെന്നും അതുവഴി ചെറിയ ഉപകരണങളില്‍കൂടി മലയാളം സാധ്യമാകുമെന്നും ആണ്. തമിഴില്‍ 22 അക്ഷരങളാക്കി കുറച്ച്‌ ഒരു എങ്കോഡിങ് രീതി കൊണ്ട് വന്നു, അവിടുത്തെ ഐ.ടി വ്ദഗ്‌ദ്ധര്‍ എന്നൊക്കെ കേട്ടു. ബെന്നിയാണ് ഇക്കാര്യത്തില്‍ കുറച്ചുകൂടെ വിശദമായി പറയാന്‍ കഴിവുള്ള ആള്‍. ഫസ്റ്റ് ലെവല്‍ ഓഫ് ഇമ്പ്ലിമെന്റേഷന്‍ എന്താണ് എന്നൊക്കെ പഠിക്കേണ്ടിയിരിക്കുന്നു എനിക്ക്‌!
    ചില്ലക്ഷരങളെക്കുറിച്ച്‌ അഭിപ്രായവ്യത്യാസമുണ്ടെങ്കിലും രചനയുമായി സഹകരിച്ച്‌ പോകണമെന്നുതന്നെയാണ് എനിക്ക്‌ തോന്നിയത്‌. ഹുസ്സൈന്‍ സാറെ കാണുകയും പലപ്രാവശ്യമായി ധാരാളം വര്‍ത്തമാനം പറയുകയും ചെയ്തപ്പോഴാണ് വിവിധ വശങളെക്കുറിച്ച്‌ കൂടുതല്‍ അറിയാന്‍ കഴിഞത്‌.ബെന്നിയും കെവിനുംകൂടെ ഈ ചര്‍ച്ചയില്‍ പങ്കേറ്റുക്കട്ടെ.-സു-

    ReplyDelete
  16. ഹുസൈന്‍ മാഷിനു് ബ്ലോഗുലകത്തേയ്ക്കു സ്വാഗതം.

    മാഷിന്റ ചില അഭിപ്രായങ്ങള്‍ക്കുള്ള മറുപടികള്‍.

    മലയാളത്തിലെ പ്രഗത്ഭരെ മുഴുവനും പങ്കെടുപ്പിച്ചു കൊണ്ടു് യുണീക്കോഡു് കണ്‍സോഷ്യത്തിനു് അതിന്റെ പ്രവര്‍ത്തനങ്ങള്‍ മുന്നോട്ടുകൊണ്ടുപോകാന്‍ കഴിയില്ല. അതൊരു അന്താരാഷ്ട്രസംഘടനയാണു്. അതിനു് ലോകത്തിലെ ജീവിച്ചിരിക്കുന്നതും മൃതമായതുമായ എല്ലാ ഭാഷകളുടെയും എഴുത്തുരൂപങ്ങള്‍ എന്‍കോഡുചെയ്യേണ്ടതായിട്ടുണ്ടു്. അങ്ങിനെ ജോലിഭാരമുള്ള അവര്‍ കേരളത്തില്‍ വന്നു് എല്ലാ പണ്ഡിതന്മാരേയും ഒരുമിച്ചു വിളിച്ചു ചേര്‍ത്തു് ചില്ലുകളെക്കുറിച്ചും സംവൃതോകാരത്തെക്കുറിച്ചും ചര്‍ച്ച ചെയ്യുകയെന്നതു് നടപ്പുള്ള കാര്യമല്ല. എന്നാലവര്‍ ലോകം മുഴുവനുമായി ചിതറിക്കിടക്കുന്ന എല്ലാ ഭാഷക്കാരുമായും ചര്‍ച്ചകള്‍ നടത്തുകയും ചെയ്യുന്നുണ്ടു്. ലോകം മുഴുവനുമുള്ള ജനങ്ങളുമായി ചര്‍ച്ച ചെയ്യാനായി അവര്‍ തിരഞ്ഞെടുത്ത മാര്‍ഗ്ഗം ഇമെയിലാണു്. പിന്നെ ഞങ്ങളെപ്പോലെ വിദൂരദേശങ്ങളില്‍ കിടക്കുന്നവര്‍ നാട്ടിലൊരു യോഗം വിളിച്ചുചേര്‍ത്തു ചര്‍ച്ചകള്‍ നടത്തുന്നതിനെക്കുറിച്ചു ചിന്തിക്കാന്‍ തന്നെ നേരമില്ല. ജോലിക്കിടയില്‍ ജോലിതന്നെ റിസ്കെടുത്താണു് ഇന്‍ഡിക് ലിസ്റ്റിലെ ചര്‍ച്ചകളില്‍ പങ്കെടുക്കുന്നതു്.

    ഇനി ഹുസൈന്‍ മാഷും എത്തിചേര്‍ന്നനിലയ്ക്കു് കൂടുതല്‍ പ്രഗത്ഭരെ ഈ ചര്‍ച്ചകളിലേയ്ക്കു് ആനയിയ്ക്കാന്‍ ബുദ്ധിമുട്ടുണ്ടാവില്ല. നാട്ടിലെവിടെയെങ്കിലും യോഗംചേര്‍ന്നു് അടിച്ചുപിരിഞ്ഞതു കൊണ്ടു ഗുണമൊന്നുമുണ്ടാകാന്‍ പോകുന്നില്ല. യുണീക്കോഡ് ഒരിക്കലും വോട്ടെടുപ്പിലൂടെയല്ല കാര്യങ്ങള്‍ തീരുമാനിക്കുന്നതു്, വാദങ്ങളുടെയും തെളിവുകളുടെയും അടിസ്ഥാനത്തിലാണു്. യുണീക്കോഡിനെക്കുറിച്ചു വ്യക്തമായ ധാരണയോടു കൂടി അതിനെ സമീപിച്ചാലേ, അതുകൊണ്ടു് ഗുണമുണ്ടാവുകയുള്ളൂ. അല്ലെങ്കില്‍ കൈയിലുള്ള പശുവില്‍ നിന്നു് കറന്നെടുക്കാവുന്ന പാലിനെക്കുറിച്ചറിയാതെ, ഇതിനെക്കൊണ്ടു് ഭാരവണ്ടിവലിക്കാനൊക്കില്ലെന്നു് പറഞ്ഞു് ദൂരെക്കളയുന്ന പോലെയാകും.

    സസ്നേഹം കെവി

    ReplyDelete
  17. മലയാളത്തിന്റെ യൂനിക്കോഡ്‌ കോഡുകളുടെ കാര്യത്തില്‍ സര്‍ക്കാര്‍ ഭാഗത്തു നിന്നും അപകടകരമായ ഇടപെടലുകളുണ്ടായി എന്ന പത്രവാര്‍ത്ത ആകാവുന്നവത്ര ആളുകളിലേക്ക്‌ എത്തിക്കുക എന്ന ഉദ്ദേശ്യത്തോടെ മെയിലുകള്‍ അയച്ച ഒരാളാണ്‌ ഞാന്‍. ഒരു പക്ഷേ, കാള പെറ്റെന്നു കേട്ട്‌ കയറെടുത്തതു പോലെ, നേരിട്ട്‌ അറിവില്ലാത്ത കാര്യങ്ങള്‍ വായിച്ച്‌ കമ്പം പിടിച്ചതുപോലെയാണ്‌ എന്റെ ഇടപെടല്‍ എന്ന്‌ തോന്നാവുന്നതാണ്‌. മലയാളക്കരയില്‍ മലയാളം കമ്പ്യൂട്ടിങ്ങിനെക്കുറിച്ച്‌ മനസ്സിലാക്കാന്‍ ശ്രമിക്കുന്ന ഭാഷാദ്ധ്യാപകന്‍ എന്ന നിലയിലും ഈ രംഗത്തു പ്രവര്‍ത്തിക്കുന്ന കേരളത്തിലും പുറത്തുമുള്ളവരുമായി ആശയവിനിമയം നടത്താനുള്ള ഒരു അവസരവും പാഴാക്കാതിരിക്കുകയും ചെയ്യുന്നയാള്‍ എന്ന നിലയിലും ഇക്കാര്യത്തില്‍ സര്‍ക്കാര്‍ ഭാഗത്തു നിന്നും ഉണ്ടാകാവുന്ന ഇടപെടല്‍ ഏതു വിധത്തിലായിരിക്കുമെന്ന്‌ എനിക്ക്‌ ഊഹിക്കാവുന്നതാണ്‌.
    ശരാശരിയില്‍ താഴ്ന്ന ബുദ്ധിനിലവാരവും അതിലും കുറഞ്ഞ സത്യസന്ധതയും മാത്രം കൈമുതലായുള്ള സര്‍ക്കാര്‍ കമ്മിറ്റിയംഗങ്ങള്‍ മുമ്പ്‌ പറഞ്ഞ കാര്യങ്ങള്‍ പലര്‍ക്കും അറിവില്ലാത്തതായിരിക്കുമെന്നതിനാല്‍ ഇവിടെ പറയട്ടെ.
    1.മലയാളഭാഷയിലെ അക്ഷരങ്ങളുടെ എണ്ണം കമ്പ്യൂട്ടറില്‍ മലയാളം ഫലപ്രദമായി ഉപയോഗിക്കുന്നതിന്‌ തടസ്സമാണ്‌.
    2ളിപിപരിഷ്കരണത്തിലൂടെ ലിപിചിഹ്നങ്ങളുടെ എണ്ണത്തില്‍ വളരെയധികം കുറവ്‌ വരുത്താനായിട്ടുണ്ട്‌. പുതിയ പരിഷ്കാരത്തിലൂടെ എണ്ണം 90 ആയി ചുരുക്കാം.
    3.മലയാളത്തിലെ സ്വരങ്ങളില്‍ നാലെണ്ണം (ഞാന്‍ ഉപയോഗിക്കുന്ന സോഫ്റ്റ്‌ വേറിന്റെ പരിമിതി കാരണം അവ ഇവിടെ ടൈപ്പ്‌ ചെയ്യാന്‍ സാധിക്കുന്നില്ല) ഉപേക്ഷിക്കേണ്ടതാണ്‌.
    4. ലിപിപരിഷ്കരണത്തിനു ശേഷം പഴയലിപിയിലേക്ക്‌ തിരിച്ചുപോകാനുള്ള ശ്രമം പിന്തിരിപ്പനാണ്‌.

    ഇത്തരം വാദമുഖങ്ങള്‍ അവതരിപ്പിക്കുന്നതിനിടയില്‍ കുറേ വിചിത്രവാദങ്ങളും അവര്‍ അവതരിപ്പിക്കുന്നുണ്ട്‌. രചന എന്നു കേള്‍ക്കുന്നതു തന്നെ അരോചകമായി കണക്കാക്കിയ ഇവര്‍ യൂനിക്കോഡില്‍ മലയാളലിപികള്‍ക്കുള്ള കോഡുകള്‍ നിര്‍ണ്ണയിക്കുന്ന പ്രവര്‍ത്തനത്തില്‍ രചന അവതരിപ്പിച്ച വാദങ്ങളെ സര്‍ക്കാര്‍ നിലപാട്‌ എന്ന നിലയില്‍ ഒരു രേഖ അയച്ചുകൊടുത്ത്‌ തകര്‍ക്കാന്‍ മുതിര്‍ന്നു. മലയാളലിപികളില്‍ ആവശ്യമില്ലാത്തവ ഏതൊക്കെയെന്ന്‌ അറിയിക്കുന്ന പ്രസ്തുത രേഖ എക്കാലത്തെയും വലിയ തമാശയായിരുന്നു. യൂനിക്കോഡ്‌ ഈ രേഖയെന്തുചെയ്തുവെന്നു പറയേണ്ടതില്ലല്ലോ.
    1971 ല്‍ പുറത്തിറക്കിയ ലിപി പരിഷ്കരണത്തെക്കുറിച്ചുള്ള ഒരു രേഖ ഇപ്പോള്‍ സര്‍ക്കാര്‍ പങ്കാളിത്തമുള്ള ഒരു വെബ്ബ്‌ സൈറ്റില്‍ പ്രസിദ്ധീകരിച്ചിട്ടുണ്ട്‌. മലയാളം കീബോര്‍ഡ്‌ ലേഔട്ട്‌ നിശ്ചയിക്കാനുള്ള ഒരു കമ്മിറ്റിയുടെ റിപ്പോര്‍ട്ടാണത്‌. ഇത്‌ ഒരു വ്യാജരേഖയാണ്‌ എന്നാണ്‌ എനിക്കു തോന്നിയിട്ടുള്ളത്‌. കാരണങ്ങള്‍ പലതാണ്‌. ടൈപ്പ്‌ റൈറ്റര്‍ കീബോര്‍ഡിനെക്കുറിച്ചുള്ള ഒരു തീര്‍പ്പല്ലാതെ അക്കാലത്ത്‌ കമ്പ്യൂട്ടര്‍ ടൈപ്പ്‌ സെറ്റിങ്ങിനെക്കുറിച്ച്‌ ഇങ്ങനെ ഒരു ആലോചന വരാനിടയില്ലാത്ത വിധത്തില്‍ കൊണ്ടുപിടിച്ച ടൈപ്പ്‌ റൈറ്റര്‍ കച്ചവടം നടക്കുന്ന കാലമാണത്‌. മാത്രമല്ല കമ്മിറ്റിയംഗങ്ങള്‍ 1971 നു ശേഷം പ്രകടിപ്പിച്ച അഭിപ്രായങ്ങളാണ്‌ നേരത്തെ പറഞ്ഞത്‌. അങ്ങനെയാണെങ്കില്‍ പ്രസ്തുതരേഖയില്‍ ഇന്നു നമ്മള്‍ വായിക്കുന്ന അഭിപ്രായങ്ങള്‍ വരാനിടയില്ല.
    ലിപി സംബന്ധമായ കാര്യങ്ങള്‍ അവനവന്‍ വഹിക്കുന്ന സര്‍ക്കാര്‍ ലാവണങ്ങള്‍ നല്‍കുന്ന പിന്‍ബലത്തോടെ തീര്‍പ്പാക്കാന്‍ സാധിക്കാത്തവയാണെന്നും ഗള്‍ഫിലും അമേരിക്കയിലുമുള്ള ഭാഷാസ്നേഹികളായ നിരവധി യുവാക്കള്‍ പരപ്രേരണയോ വിശേഷാല്‍ അധികാരങ്ങളോ ഇല്ലാതെ ഇക്കാര്യത്തില്‍ സന്നദ്ധസേവനം നടത്തുമെന്നും രചനയുടേയോ അതിന്റെ പിന്നില്‍ പ്രവര്‍ത്തിച്ചവരുടേയോ സ്വാര്‍ത്ഥമല്ല തനതുലിപിസഞ്ചയം കമ്പ്യൂട്ടറില്‍ സാദ്ധ്യമാക്കലെന്നും സര്‍ക്കാര്‍ കമ്മിറ്റി ഇനിയെങ്കിലും മനസ്സിലാക്കട്ടെ.

    സര്‍ക്കാര്‍ ഇടപെടലിനെക്കുറിച്ചുള്ള വാര്‍ത്തകള്‍ പുറത്തു വന്നപ്പോള്‍ അതിനെക്കുറിച്ച്‌ ബ്ലോഗുകളില്‍ വന്ന പ്രതികരണങ്ങളില്‍ രചനയെക്കുറിച്ച്‌ തെറ്റിദ്ധാരണാജന്യമായ നിരീക്ഷണങ്ങള്‍ കാണാനിടയായി. രചന എന്ന ടെക്സ്റ്റ്‌ എഡിറ്റര്‍ കേരളത്തില്‍ വ്യാപകമായ നിലയില്‍ വാണിജ്യപരമായി ഉപയോഗിക്കപ്പെടുന്നില്ല എന്ന വസ്തുത ആദ്യമേ പറയട്ടെ. മലയാളത്തിന്റെ തനതുലിപിയില്‍ പുസ്തകം അച്ചടിച്ചു കാണണം എന്ന വാശി കേരളത്തില്‍ വളരെക്കുറച്ചു പേര്‍ക്കു മാത്രമേ ഉള്ളൂ. അക്കാരണത്താല്‍ ഇതുവരെ രചന ഉപയോഗിച്ച്‌ ടൈപ്പ്സെറ്റുചെയ്ത പുസ്തകങ്ങളുടെ എണ്ണം വളരെ എളുപ്പത്തില്‍ തയ്യാറാക്കാവുന്നതാണ്‌. ആസ്കി കോഡിലുള്ള രചനയില്‍ നിന്ന്‌ യൂനികോഡിലേക്ക്‌ മാറുമ്പോള്‍, ഇക്കാരത്താല്‍ത്തന്നെ വലിയ നഷ്ടമൊന്നും ആര്‍ക്കും ഉണ്ടാവുകയില്ല.

    യൂനികോഡിനു മുന്നില്‍ രചന അക്ഷരവേദിയിലെ ആര്‍.ചിത്രജകുമാറും,ഗംഗാധരനും അവതരിപ്പിച്ച അഭിപ്രായങ്ങള്‍ സിബു ജോണി അവതരിപ്പിച്ചവപോലെ വിഷയാധിഷ്ഠിതമാണ്‌. അവ ഏതൊരു പണ്ഡിതസദസ്സിനു മുമ്പിലും അവതരിപ്പിക്കാവുന്നവയാണ്‌. എന്നാല്‍ എക്കാലത്തും സര്‍ക്കാര്‍ ഇടപെടല്‍ നിഷേധാത്മകമാണ്‌. പി.ഗോവിന്ദപ്പിള്ളയാണ്‌ ഇത്തരം കാര്യങ്ങള്‍ നിശ്ചയിക്കുന്ന കമ്മിറ്റിയുടെ അദ്ധ്യക്ഷന്‍ എന്നതു
    തന്നെ ഇക്കാര്യം വ്യക്തമാക്കുന്നു. നേരത്തെ പറഞ്ഞ വിചിത്രവാദങ്ങള്‍ അവതരിപ്പിച്ച പ്രൊഫസ്സര്‍സംഘം കൂടെയുമുണ്ട്‌. അവരോട്‌ തര്‍ക്കിച്ചിട്ടു കാര്യമില്ല. പക്ഷെ ഒരു ജനതയുടെ ഭാഷയെ തങ്ങളുടെ ഉച്ചക്കിറുക്കുകള്‍കൊണ്ട്‌ വികലമാക്കാനുള്ള അവരുടെ ശ്രമങ്ങള്‍ക്കെതിരെ ജാഗ്രത പുലര്‍ത്തേണ്ടതുണ്ട്‌.
    ബ്ലോഗിങ്ങിലൂടെ യൂനിക്കോഡ്‌ മലയാളലിപി പ്രചാരത്തില്‍ വന്നു കഴിഞ്ഞു, ഇപ്പോഴും പലവിധം പ്രശ്നങ്ങളോടെയാണ്‌ നാമേവരും ഈ ലിപികള്‍ ഉപയോഗിക്കുന്നത്‌.പ്രശ്നങ്ങളില്ലാത്ത കുറ്റമറ്റ എന്‍കോഡിംഗ്‌ എത്രയും വേഗം പൂര്‍ത്തികരിക്കുകയാവണം നമ്മുടെ ലക്ഷ്യം. അതിനിടയില്‍ പ്രസക്തമല്ലാത്ത വൈകാരികവിഷയങ്ങള്‍ സമചിത്തതയോടെ നമ്മുക്ക്‌ കൈകാര്യം ചെയ്യാന്‍ സാധിക്കണം.

    ReplyDelete
  18. മയ്യഴീ,

    ഈ കമന്റ് സ്വന്തം ബ്ലോഗിലെ ഒരു പോസ്റ്റ് ആയി ഇടൂ. ഒരു ബ്ലോഗ് കമന്റായി (അതും ബൂലോഗക്ലബ്ബിലെ മലവെള്ളപ്പാച്ചില്‍ പോലെയുള്ള പോസ്റ്റുകളിലെ ഒരു കമന്റായി) മാത്രം കിടക്കാനുള്ളതല്ല ഇതു്.

    പത്തുവരിയില്‍ കൂടുതലുള്ള കാമ്പുള്ള എല്ലാ കമന്റുകളും ഇങ്ങനെ വേണമെന്നാണു് എന്റെ അഭിപ്രായം. (സിബുവും കെ. പി. യും ഇതു മുമ്പു പറഞ്ഞിട്ടുണ്ടു്.) പോസ്റ്റിട്ടിട്ടു് അതിന്റെ ഒരു ലിങ്ക് കമന്റായി കൊടുക്കാമല്ലോ.

    ReplyDelete
  19. ഇതുവരെ വായിച്ചതില്‍ നിന്നും രണ്ടുകൂട്ടരും തമ്മിലുള്ള പ്രധാന ഉടക്ക് ചില്ലിനെച്ചൊല്ലിയാണെന്നു തോന്നുന്നു.പിന്നെ one-upmanship ഉം.വെബ് ലോകത്തില്‍ സിബുവും പ്രിന്റിങ്ങ്/ടൈപ്‌സെറ്റിങ്ങ് രംഗത്ത് രചനയും ചെയ്ത സംഭാവനകള്‍ നിസ്തുലമാണ്.
    ഒരു ഫോണ്ട് ഉണ്ടാക്കിയതിന്റെ പരിമിതമായ അറിവുവെച്ച് ചില കാര്യങ്ങള്‍ കുറിക്കുന്നു.
    ചില്ലുകള്‍ക്ക് code point നല്‍കുന്നതു തന്നെയാണ് നല്ലത്.കാരണം സ്ക്രിപ്റ്റ് എന്‍ജിന്‍ ലളിതമാക്കുന്നതിനും effective ആക്കുന്നതിനും അതുപകരിക്കും.
    അതോടൊപ്പം യ,ര/റ,വ എന്നിവയുടെ അര്‍ദ്ധരൂപങ്ങളും വന്നാല്‍ നന്നായിരിക്കും.
    ഇവയുടെ സ്ഥാനം അതാതു base characters ന്റ സമീപത്തു നിഘണ്ടുവിലെ ക്രമത്തില്‍ ആവുകയും വേണം.

    ReplyDelete
  20. ഈ പോസ്റ്റും ഇതിലെ കമന്റുകളും എല്ലാം ചേര്‍ത്ത് ഉമേഷ്‌ജി പറഞ്ഞതുപോലെ ഒരു പോസ്റ്റാക്കുകയോ, അല്ലെങ്കില്‍ ഈ ചര്‍ച്ചയിലെ കാര്യങ്ങള്‍ നഷ്ടപ്പെട്ടു പോകാത്തവണ്ണം എന്തെങ്കിലും പരിപാടി ചെയ്യാനോ മറ്റോ പറ്റുമോ?

    ReplyDelete
  21. ഉമേഷേ,

    മൊത്തം ഈ പോസ്റ്റും എല്ലാ കമന്റുകളും മുഴുവനായിത്തന്നെ സുസ്ഥിരമായ മറ്റൊരു സ്ഥലത്തേക്ക് മാറ്റിയിടുകയോ പകര്‍ത്തുകയോ തന്നെ വേണം.


    എന്നിരുന്നാലും അതോടൊപ്പം തന്നെ, പരസ്യമായി ഈ ചര്‍ച്ച ഇതേ പേജില്‍ തുടരട്ടെ എന്നാണെനിക്കു തോന്നുന്നത്.

    മാത്രമല്ല, ഗൌരവമായി ഈ വിഷയത്തില്‍ പങ്കെടുക്കാന്‍ കഴിയുന്ന എല്ലാവരും ഇതു വായിക്കുകയും അഭിപ്രായങ്ങള്‍ ചേര്‍ത്തുവെക്കുകയും കൂടി വേണം.

    സാം (malayalam.ttf), സന്തോഷ്, ബെന്നി എന്നിവര്‍ ഈ താള്‍ ദത്തശ്രദ്ധരായി വായിക്കുന്നുണ്ടെന്നു പ്രതീക്ഷിക്കുന്നു.


    രാജീവ് (വരമൊഴി യാഹൂഗ്രൂപ്പ് അംഗം),അനീഷ്(മായ), സജിത്കുമാര്‍ (VC++ ActiveX), ബിനു മേലേടം, സോജി, അച്ചായന്‍, റെഡ്ഡി തുടങ്ങിയ ലാത്തി/മാധുരി സ്രഷ്ടാക്കള്‍ എന്നിവര്‍ക്കു വേണ്ടിയുള്ള തിരച്ചില്‍ ശക്തമാക്കുന്നുണ്ട്.

    ReplyDelete
  22. എനിക്കൊന്നും മനസ്സിലാവുന്നില്ലെങ്കില്‍ പോലും ഞാന്‍ പറ്റാവുന്ന വിധത്തില്‍ ശ്രദ്ധിച്ച് വായിക്കുന്നുണ്ട്..

    ഈ പോസ്റ്റില്‍ തന്നെ ചര്‍ച്ച തുടര്‍ന്നാല്‍ ഈ പോസ്റ്റ് മാത്രം നോക്കിയാല്‍ മതിയല്ലൊ.ബാക്കി കുറേ ലിങ്കുകള്‍ ക്ലിക്ക് ചെയ്യണ്ടല്ലൊ.അത് ഇതിന്റെ കണ്ടിന്യുവിറ്റി കളയും...എന്ന് എനിക്ക് തോന്നുന്നു..

    റിയലി സോറി....ഫോര്‍ ദ ഓഫ്...

    ReplyDelete
  23. സിബു വിക്കിയയില്‍ (വിക്കിപീഡിയയില്‍ അല്ല,)
    ഇങ്ങനെ ഒരു പേജ് തുടങ്ങിയിട്ടുണ്ട്. ഈ ചര്‍ച്ചയിലെ കാതലായ കാര്യങ്ങള്‍ പിന്നീട് അവിടേക്കു മാറ്റുന്നത് യുക്തമാണോ എന്ന് സിബു പറയട്ടെ.

    ReplyDelete
  24. വിശ്വം എന്നെയാണ് ഉദ്ദേശിച്ചതെങ്കില്‍, അതെ, ഞാന്‍ വായിക്കുന്നുണ്ട്. പലയാവര്‍ത്തി.

    ശരിയായ ധാരണയുടെ അഭാവത്തില്‍, ‘കള്ളനാണയം’ തുടങ്ങിയ ഉത്തരവാദിത്ത രഹിതമായ പ്രയോഗങ്ങളുള്‍ക്കൊള്ളിച്ചുള്ള എന്‍റെ മുന്നഭിപ്രായത്തിന് ക്ഷമ ചോദിക്കുന്നു.

    ReplyDelete
  25. ആദ്യമേ പറയട്ടെ, ചര്‍ച്ചകളുടെ ഊന്നല്‍ ഇന്നലെ എന്തു സംഭവിച്ചു എന്നതിനേക്കാള്‍ നാളെ നമുക്കെന്തു ചെയ്യാമെന്നതിനെ പറ്റിയാകണം.


    ആശയസംഘട്ടനം ആവശ്യമാണ്‌.

    ഉമേഷും ഞാനും തമ്മില്‍ പലകാര്യങ്ങളിലും അഭിപ്രായവ്യത്യാസമുണ്ട്‌. കെവിനും ഞാനും ബിന്ദു-രേഫത്തിന്റെ അടികഴിഞ്ഞ്‌ കയ്യും കാലും ഉഴിഞ്ഞുകൊണ്ടിര്‍ക്കുന്നേ ഉള്ളൂ. സംവൃതോകാരത്തിന്റെ കാര്യത്തില്‍ പെരിങ്ങോടരും ഞാനും നസീറും ബാലങ്കന്‍നായരും പോലെയാണ്‌. ബ്ലോഗില്‍ കിടന്നടി, വിക്കിയില്‍ ചെന്നടി, ഇന്‍ഡിക്‌ ലിസ്റ്റിലടി. തിരിഞ്ഞുനോക്കിയാല്‍, അതൊക്കെയും ആ വിഷയം കുറച്ചുകൂടി ആഴത്തില്‍ അപഗ്രഥിക്കാനാണ്‌ സഹായിച്ചിട്ടുള്ളത്‌.

    ഈ സംവാദങ്ങള്‍ പോലുള്ള ഒന്നാണ്‌ ഞാന്‍ ചില്ലുകളുടെ കാര്യത്തില്‍ രചനയുമായും പ്രതീക്ഷിക്കുന്നത്‌. പിന്നെ, പഴയ/പുതിയ ലിപി പോലെ ഒരു രാഷ്ട്രീയവല്‍ക്കരിക്കപ്പെടേണ്ട വിഷയമല്ല ചില്ലുകള്‍. അത്‌ ഒ-യുടെ ചിഹ്നം പോലെയുള്ള അനേകം ചെറിയ ചെറിയ പ്രശ്നങ്ങളില്‍ ഒന്ന്‌ മാത്രമാണ്‌. ചില്ലിനെ പറ്റിയുള്ള തീരുമാനം എന്തായാലും മലയാളം യുണീക്കോഡ്‌ ഉപയോഗിക്കുന്ന ആളെ സംബന്ധിച്ചിടത്തോളം വളരെ ചെറിയ ഇമ്പാക്റ്റേ ഉള്ളൂ.

    യുണീക്കോഡിന്റെ ആവിര്‍ഭാവത്തോടെ ലിപി വിവാദത്തിന്റെ സ്കോപ്പ്‌ ഗണ്യമായി കുറഞ്ഞു. കാരണം, കടലാസ്സില്‍ നിന്നും തീര്‍ത്തും വ്യത്യസ്തമായി യുണീക്കോഡില്‍ വായനക്കാരനാണ്‌ ലിപി ഏതുതരം വേണം എന്ന്‌ തീരുമാനിക്കുന്നത്‌. കടലാസ്സില്‍ അത്‌ എഴുത്തുകാരനോ പ്രസാധകനോ ആയിരുന്നു. അതുകൊണ്ട്‌ തന്നെ, സ്കൂള്‍ വിദ്യാഭ്യാസം കഴിഞ്ഞവരെ സംബന്ധിച്ചിടത്തോളം, വരമൊഴി ഉപയോഗിക്കണോ ഇന്‍സ്ക്രിപ്റ്റ്‌ കീബോര്‍ഡ്‌ ഉപയോഗിക്കണോ എന്നുള്ള ചര്‍ച്ചപോലെയാണീ സംഗതി - തികച്ചും വ്യക്തിപരമായ തെരഞ്ഞെടുപ്പ്‌. എന്നാല്‍, കുട്ടികളെ സ്കൂളില്‍ ഏത്‌ രീതി പഠിപ്പിക്കണം എന്നത്‌ ഒരു രാഷ്ട്രീയവിഷയം തന്നെ ആണെന്നത്‌ വിസ്മരിക്കുന്നില്ല. പക്ഷെ, ആ രാഷ്ട്രീയം യുണീക്കോഡില്‍ കടന്നുവരേണ്ട കാര്യമില്ല എന്ന്‌ മാത്രം.

    കെവിനെഴുതിയപോലെ എല്ലാ മലയാളികളും കൂടി ഒരു വട്ടമേശക്ക്‌ ചുറ്റുമിരുന്ന്‌ ചര്‍ച്ച ചെയ്യാന്‍ പ്രായോഗിക ബുദ്ധിമുട്ടുകളുണ്ട്‌. മാത്രവുമല്ല, അങ്ങനെയുള്ള ഒരു ചര്‍ച്ച കൊണ്ട്‌ തീരുന്നതല്ല മലയാളം യുണീക്കോഡിലെ കുഞ്ഞിക്കുഞ്ഞി പ്രശ്നങ്ങള്‍. ഓരോ വാദമുഖങ്ങളും അതുന്നയിക്കുന്നവര്‍ സാവധാനം സമയമെടുത്ത്‌ റിഫൈന്‍ ചെയ്തുകൊണ്ടിരിക്കണം. അതിന്നുള്ള വളരെ നല്ല ഉപാധിയാണ്‌ ഇമെയിലും ബ്ലോഗിങ്ങും വിക്കിയും. അതിന്‌ സാധ്യമല്ലാത്തവരുണ്ടെങ്കില്‍ അവര്‍ക്ക്‌ ഈ ഡിജിറ്റല്‍ വേള്‍ഡില്‍ എത്താനുള്ള ഒരു ബ്രിഡ്ജ്‌ ഉണ്ടാക്കണം. അല്ലാതെ ഡിജിറ്റലിള്ളവര്‍ക്ക്‌ മലയാളത്തില്‍ വിവരമില്ല എന്ന്‌ ദ്യോതിപ്പിച്ചിട്ടൊന്നും നേടാനില്ല. യുണീക്കോഡ്‌ ഡിജിറ്റല്‍ ലോകത്തിനുള്ളതാണ്‌. ഡിജിറ്റല്‍ ലോകവുമായി പരോക്ഷമായിട്ടെങ്കിലും ഇന്റര്‍ഫേസ്‌ ചെയ്യാത്തവര്‍ക്ക്‌ യുണീക്കോഡുകൊണ്ടൊരു ഉപകാരവുമില്ല. മലയാളത്തില്‍ പത്താം ക്ലാസ്സോ അതിനു് മേലേയോ വിദ്യാഭ്യാസവും അതിലുപരി താത്പര്യവും ഉള്ളവരാണ്‌ ഇവിടെ ചര്‍ച്ചയില്‍ പങ്കെടുക്കുന്നവര്‍. അതുകൊണ്ട്‌ യുണീക്കോഡ്‌ ചര്‍ച്ചകള്‍ക്കാവശ്യമായ മലയാളത്തിലുള്ള പ്രാവീണ്യം എല്ലാവര്‍ക്കുമുണ്ട്‌. എന്നാല്‍ എന്താണ്‌ എന്‍കോഡിംഗ്‌, യുണീക്കോഡതില്‍ ചെയ്യുന്നതെന്താണ്‌ എന്നതിലുള്ള അവബോധത്തിന്റെ കുറവാണ്‌ കൂടുതല്‍ പ്രശ്നമായി ഞാന്‍ കാണുന്നത്‌. ചര്‍ച്ചകളില്‍ പങ്കെടുത്ത്‌ സംശയം ചോദിച്ച്‌ ഉണ്ടാക്കാവുന്ന വിവരമേ ഉള്ളൂ അതും. പക്ഷെ, അതിനുള്ള ക്ഷമകാണിക്കണം എന്നുമാത്രം.

    ReplyDelete
  26. സുറുമാ, ഈ പറഞ്ഞ കാരണങ്ങള്‍ ഒരു ഫോണ്ടില്‍ എന്തുകൊണ്ട്‌ ആ ചിഹ്നങ്ങള്‍ വേണം എന്നതിനുള്ള വാദമാണ്‌. സൗകര്യം (convienence) എന്‍കോഡ്‌ ചെയ്യപ്പെടുന്നതിന്‌ മതിയായ കാരണമല്ല. ഞാന്‍ നേരത്തേ പറഞ്ഞ 3 കാര്യങ്ങള്‍ ലംഘിക്കപ്പെട്ടാലേ അതിനു വകുപ്പുള്ളൂ:

    completeness violation: മലയാളം എഴുത്തിലുള്ള എന്തെങ്കിലും യുണീക്കോഡുവച്ച്‌ എഴുതാന്‍ പറ്റാതിരിക്കുക. തല്‍ക്കാലം എനിക്ക്‌ ഇങ്ങനെയൊന്നും ഉള്ളതായി അറിവില്ല. നിര്‍ബന്ധമാണെങ്കില്‍ ഗുണ്ടര്‍ട്ടിന്റെ നിഘണ്ടുവിലുള്ള യ-യുടെ ചില്ല്‌ പൊക്കിക്കൊണ്ടുവരേണ്ടി വരും.

    soundness violation: തെറ്റായി എന്‍കോഡ്‌ ചെയ്യപെടുക. ഇതിന്‌ ഉദാഹരണങ്ങളുണ്ട്‌ എന്നാണെന്റെ പക്ഷം. 'ഞായര്‍' എന്ന വാക്കിലെ ചില്ലെഴുതുന്നത്‌ 'ര' വച്ചാണിപ്പോള്‍. അത്‌ തെറ്റാണ്‌.

    ambiguity: എഴുത്തിലുള്ള വേര്‍തിരിവ്‌ എന്‍കോഡിങ്ങില്‍ ഇല്ലാതിരിക്കുക. അതുപോലെ തിരിച്ചും. അതിനുദാഹരണമായാണ്‌: വന്‍യവനികയും വന്യവനികയും പറഞ്ഞിരുന്നത്‌. എഴുത്തിലെ വേര്‍തിരിവ്‌ എന്‍കോഡിങ്ങിലില്ല. പിന്നെ എങ്ങനെ അവ കാഴ്ചയ്ക്ക്‌ വ്യത്യാസപ്പെടുന്നു എന്നല്ലേ. 'വന്‍യവനികയില്‍' ചില്ലുണ്ടാക്കാന്‍ ഉപയോഗിക്കുന്നത്‌ zero width joiner എന്ന ഒരു ഫോര്‍മാറ്റ്‌ കണ്ട്രോള്‍ അക്ഷരമാണ്‌. ഫോര്‍മാറ്റ്‌ എന്നാല്‍ ബോള്‍ഡാക്കുക, ഇറ്റാലിക്സ്‌ ആക്കുക എന്നിങ്ങനെയുള്ള കാര്യങ്ങളെ പറയുന്നതാണ്‌.

    ReplyDelete
  27. ടൈപ്പിംഗ്‌ ഇപ്പോഴും ബാലികേറാ മലയാണ്‌. എല്ലാ സുഹൃത്തുക്കളുമായും നിരന്തരം സംവദിക്കണമെന്നുണ്ട്‌. കയ്യെഴുത്തിലായിരുന്നെങ്കിലെന്ന്‌ ആശിച്ചുപോകുന്നു. ചിലതെല്ലാം കുത്തിക്കുറിക്കുന്നുണ്ട്‌. ദിവസങ്ങളെടുക്കും അതൊക്കെ ഈ പരുവത്തിലാക്കാന്‍. എന്നില്‍ നിന്നും വലുതായൊന്നും പ്രതീക്ഷിക്കരുത്‌. ഞാനൊരു ഭാഷാവിദഗ്ദ്ധ്നല്ല. കമ്പ്യുട്ടര്‍ വിദഗ്ദ്ധനുമല്ല. എന്നാല്‍ ആവുംവിധം പ്രതികരിക്കാന്‍ ശ്രമിക്കാം.

    ബൈബിളിനു വേണ്ടിയുണ്ടാക്കിയ പ്രത്യേക ഗ്ലിഫുകള്‍ വേര്‍തിരിച്ച്‌ ഒരു ഫയലാക്കി ഞാന്‍ സിബുവിന്‌ അയച്ചുതരാം. അവ രചനയുടെ ഇപ്പോഴത്തെ ഫോണ്ടില്‍ ഉള്‍പ്പെടുത്താന്‍ ഉദ്ദേശമില്ല. പലതും ലുബ്ധപ്രചാരമായിപ്പോയി. അതുകൊണ്ട്‌ ചരിത്രപരമായ പ്രാധാന്യമേ അവയ്ക്കുള്ളു. ചില കൂട്ടക്ഷരങ്ങല്‍ ഞാന്‍ ഡിസൈന്‍ ചെയ്യാനേ തുനിഞ്ഞില്ല (ഉദാ: എല്‍ ന്റെ അടിയില്‍ ച, ദ യോട്‌ ചേര്‍ന്ന്‌ എഴുതുന്ന ഗ). ചില്ല്‌ പ്രത്യേകം എന്‍ക്കോഡ്‌ ചെയ്യുകയാണെങ്കില്‍ ഒന്നുകൂടി എല്ലാം റീകംപൈല്‍ ചെയ്യേണ്ടിവരും. അപ്പോഴാകാം ഇവയുടെ ഉള്‍പ്പെടുത്തല്‍. ലെഫ്റ്റ്‌ രേഫത്തിന്റെ (കുത്തക്ഷരങ്ങളുടെ) ഫീച്ചേഴ്സിനെ കുറിച്ച്‌ ഞാന്‍ ഇനിയും പഠിക്കേണ്ടതുണ്ട്‌.

    ചര്‍ച്ചകള്‍ അനേകരിലേക്കു വ്യാപിക്കുന്നതില്‍, വിപുലീകരിക്കപ്പെടുന്നതില്‍ സന്തോഷം. അനേകം ബ്ലോഗുകളിലല്ലാതെ ഇവിടെ ഒരൊറ്റയിടത്ത്‌ ചര്‍ച്ചകള്‍ സമാഹരിക്കപ്പെടുന്നതാണ്‌ എന്തുകൊണ്ടും നല്ലത്‌.

    പെട്ടെന്ന്‌ ഒരു പത്തുപേരുടെ പേര്‍ കുറിക്കട്ടെ.

    എംടി
    സുകുമാര്‍ അഴീക്കോട്‌
    എം എന്‍ വിജയന്‍
    ടി പദ്മനാഭന്‍
    സക്കറിയ
    സച്ചിദാനന്ദന്‍
    ജി ശങ്കരപ്പിള്ള
    സുഗതകുമാരി
    അടൂര്‍ഗോപാലകൃഷ്ണണ്‍
    വേണുഗോപാലപ്പണിക്കര്‍
    .......

    ചിന്തകള്‍കൊണ്ടും എഴുത്തുകള്‍ കൊണ്ടും നമ്മുടെകാലത്തെ, നമ്മുടെ ആശയപ്രപഞ്ചത്തെ നിര്‍മ്മിച്ചവര്‍, സമ്പന്നരാക്കിയവര്‍. ഇങ്ങനെ ഒരു അഞ്ഞൂറു പേരെങ്കിലും ജീവിച്ചിരിക്കുന്നു. എനിക്കുറപ്പുണ്ട്‌ മുകളിലത്തെ ലിസ്റ്റില്‍ പെട്ട ഒരു വ്യക്തിയെങ്കിലും ഇപ്പോഴത്തെ ഈ ചര്‍ച്ചയെക്കുറിച്ച്‌ ഒരറിവും ഇല്ലാത്തവരാണെന്ന്‌. നമുക്ക്‌ പുച്ഛിക്കാം ഇവരൊക്കെ കേവലം ഇ-കഴുതകളാണെന്ന്‌. ഇവരെക്കൂടി ഈ ചര്‍ച്ചയുടെ ഉള്ളടക്കം എത്തിക്കുന്നതില്‍ എന്താണ്‌ തെറ്റ്‌? എന്താണതിനൊരു വഴി? വിശാലമായ ഒരു വേദിയെക്കുറിച്ചുപറയുമ്പോള്‍ എന്തിനാണിത്ര അസഹിഷ്‌ണുത?

    സസ്നേഹം
    ഹുസൈന്‍, രചന

    ReplyDelete
  28. ഹുസ്സൈന്‍ സാര്‍,

    വീണ്ടും ഇവിടെ വന്നു പോകുന്നതു കാണുമ്പോള്‍ അളവറ്റ സന്തോഷം, നന്ദി!

    നാട്ടിലെ ഇന്റര്‍നെറ്റ് / കമ്പ്യൂട്ടര്‍ പരിമിതികളെക്കുറിച്ച് ഒരിക്കല്‍കൂടി വളരെ ബോദ്ധ്യമായി ഇപ്പോള്‍ എനിക്കും. അതുകൊണ്ട് അങ്ങയുടെ മറുപടികള്‍ എണ്ണത്തില്‍ കുറഞ്ഞും അളവില്‍ ചുരുങ്ങിയും ആയിരിക്കുമെന്ന് അറിയുകയും ചെയ്യാം. അറിയാതെ വന്നുപോകുന്ന അക്ഷരത്തെറ്റുകളും ഒരു പ്രശ്നമായി ഞങ്ങള്‍ പരിഗണിക്കുകയില്ല അങ്ങയുടെ കാര്യത്തില്‍.

    താങ്കളെഴുതിയ പത്തുപേര്‍ മാത്രമല്ല, ആയിരക്കണക്കിന് മഹത്തുക്കള്‍ ഞങ്ങളൊക്കെ ഇട്ടുപേക്ഷിച്ചുപോന്ന ആ അമ്മവീട്ടില്‍ ഉണ്ടെന്നറിയാം. അവരെ ഞങ്ങള്‍ കാണുന്നത് താഴെയായല്ല, വളരെ വളരെ ഉയരങ്ങളിലിരിക്കുന്ന അക്ഷരദേവതകളായാണ്.

    പ്രായമേറിയിട്ടും സ്വന്തം അദ്ധ്വാനവും ഒരു മുഴുവന്‍ ജീവിതത്തിന്റേയും പരിശീലനവും വെച്ചുകൊണ്ട് മലയാളഗ്രന്ഥമഹാസൂചികയുണ്ടാക്കാന്‍ കച്ചകെട്ടിയിറങ്ങിയ കേ.എം. ഗോവിസാറിന്റെ അത്ര തന്നെ അടുക്കും ചിട്ടയുമുള്ള ഒരു ചിന്താപ്രപഞ്ചം, ആ ഡാറ്റാബേസ് വിഷന്‍, ഒരു പക്ഷേ ഞങ്ങള്‍ ഈ-ജീവികളില്‍ ആയിരത്തിനൊന്നേ ഉണ്ടാവൂ. കൈവിരലുകള്‍കൊണ്ട് അക്ഷരം തപ്പടിക്കുന്ന എന്റെ കൂട്ടരില്‍ എല്ലാവരും organized thought-ന്റെ മൂര്‍ത്തിഭാവങ്ങളൊന്നുമല്ല. ഞങ്ങള്‍ക്ക് ശീലം കൊണ്ടുള്ള മിടുക്കുണ്ടാകുമായിരിക്കും, പക്ഷേ അനുഭവം കൊണ്ടുള്ള തിളക്കവും മുന്നറിവുകൊണ്ടുള്ള മികവും മേല്‍പ്പറഞ്ഞ സാഹിത്യനായകന്മാര്‍ക്കൊക്കെയും ഗോവിസാറിനും വാസുപ്രദീപിനും അങ്ങയേപ്പോലുള്ള മറ്റു ചേട്ടന്മാര്ക്കും തന്നെ കൂടുതല്‍. ഇക്കാര്യം സമ്മതിച്ചുതരാന്‍ ആര്‍ക്കും ഇവിടെ മടിയുണ്ടാവുമെന്നു തോന്നുന്നില്ല.

    നമുക്കു വേണ്ടത് അവരെക്കൂടി ഈ ചര്‍ച്ചയില്‍ പങ്കെടുപ്പിക്കുകയാണ്. പക്ഷേ അതെങ്ങനെ നടക്കും എന്നു വേണം ഇനി ചിന്തിക്കാന്‍. നാട്ടില്‍ തന്നെയുള്ള സൌകര്യങ്ങള്‍ അവര്‍ക്കും ഞങ്ങള്‍ക്കും ഇടയിലൊരു പാലമാക്കി വെക്കാന്‍ നാം ഒരുമിച്ച് എന്തു ചെയ്യണം?

    കമ്പ്യൂട്ടറിലൂടെയോ അച്ചടിച്ച പകര്‍പ്പുകളിലൂടെയോ, അല്ലെങ്കില്‍ നേരിട്ടുള്ള മുഖാമുഖങ്ങളിലൂടെയോ നമുക്ക് അവരുമായി എങ്ങനെ ആശയവിനിമയം നടത്താം?

    അക്കരെയക്കരെ കിടക്കുന്ന ഞങ്ങളെക്കാള്‍ ഇക്കാര്യങ്ങളില്‍ ഫലോന്മുഖമായി പ്രവര്‍ത്തിക്കാന്‍ സാധിക്കുക നാട്ടിലുള്ള നമ്മുടെ തന്നെ പ്രതിരൂപങ്ങള്‍ക്കാണ്. അവരെ എങ്ങനെ കൂടുതലായി ഇവിടേക്ക് വിളിച്ചുവരുത്താം?

    ആത്മസംയമനത്തോടെ നമുക്കു കൂട്ടായി ആലോചിക്കാം.

    ReplyDelete
  29. ഹുസൈന്‍ മാഷ്‌ പറഞ്ഞ ലിസ്റ്റിലെ ഏതെങ്കിലും ഒരു പുപ്പുലിയെ പിടിക്കാം നമുക്കാദ്യം. ഹുസൈന്‍ മാഷ്ക്ക്‌ ഏറ്റവും അറിയാവുന്ന ഒരാളെ. ഇവിടെ നടക്കുന്ന ചര്‍ച്ചകളുടെ പ്രസക്ത ഭാഗങ്ങള്‍ പ്രിന്റൗട്ട്‌ ആയോ സ്ക്രീനില്‍ തന്നേയോ കാണിച്ചു കൊടുക്കാം. അവരെഴുതുന്ന മറുപടി ആരെങ്കിലും സ്കാന്‍ ചെയ്തോ ടൈപ്പ്‌ ചെയ്തോ പോസ്റ്റണം. ഓഡിയോ ഫയലായാലും പ്രശ്നമില്ല.

    ReplyDelete
  30. സുഹൃത്തുക്കളേ,

    ആഗോളീകരണത്തിന്റെ ഫലമായി വംശനാശഭീഷണി നേരിട്ടുകൊണ്ടിരിക്കുന്ന അനേകം പ്രാദേശികഭാഷകളിലൊന്നുമാത്രമാണ്‌ മലയാളം. പുതിയ കാലത്തിന്റെ വേഗതയോ അനുഭവസങ്കീര്‍ണ്ണതകളോ സമര്‍ത്ഥമായി ആവിഷ്കരിക്കാനുതകുംവിധം അത്‌ കാലങ്ങളായി പുതുക്കപ്പെട്ടുപോന്നിട്ടില്ല. പുതിയ കമ്പോളവ്യവസ്ഥയില്‍ വില്‍പനച്ചരക്കാക്കി മാറ്റാവുന്ന വലിയ വിജ്ഞാനനിക്ഷേപങ്ങളോ സാഹിത്യസമ്പത്തോ താരതമ്യേന ഈ ഭാഷയിലില്ല. ഉള്ളത്‌ ഭൂപ്രകൃതി, കാലാവസ്ഥ, ആചാരാനുഷ്ഠാനങ്ങള്‍ എന്നിവയോടൊട്ടിനില്‍ക്കുന്ന ചില സംസ്കാരവിശേഷങ്ങള്‍ മാത്രമാണ്‌. അതും അനുദിനം ക്ഷയിച്ചുകൊണ്ടിരിക്കുന്നു.

    ഇത്തരമൊരു വിശാലപശ്ചാത്തലത്തില്‍വേണം വിവരസാങ്കേതികവിദ്യയെ പ്രയോജനപ്പെടുത്തിക്കൊണ്ട്‌ നമ്മുടെ ഭാഷയെ അതിന്റെ തനിമകളോടെ നവീകരിക്കാനുള്ള ഉദ്യമങ്ങളെ വിലയിരുത്തേണ്ടത്‌ എന്നു തോന്നുന്നു. അധികാരവും സമ്പത്തും കൈയ്യാളുന്നവരുടെ ഭാഷ അതിര്‍ത്തികള്‍ മായ്ച്ചു മുന്നേറുമ്പോള്‍, ഓരങ്ങളിലേയ്ക്ക്‌ ഒതുക്കപ്പെടുന്ന ജനത നിശ്ശബ്ദരാവുന്നു. അവര്‍ക്ക്‌ സ്വന്തം ഭാഷയോടുതന്നെ നിന്ദ തോന്നുന്നു.അങ്ങനെയാണ്‌ മാതൃഭാഷ മറക്കുന്നതില്‍ അഭിമാനിക്കുന്ന മലയാളിയുണ്ടാവുന്നത്‌.

    അതിനാല്‍ ഭാഷാനവീകരണശ്രമങ്ങള്‍ കേവലമായ അതിജീവനതന്ത്രമെന്നതിനപ്പുറം സ്വത്വസാക്ഷാത്കാരത്തിന്റെ രാഷ്ട്രീയംകൂടി ഉള്‍ക്കൊള്ളുന്നുണ്ട്‌. അപ്രകാരം പ്രത്യയശാസ്ത്രപരമായ ഒരടിത്തറയുണ്ടാകുമ്പോഴാണ്‌ ഈ ചര്‍ച്ചകള്‍ക്ക്‌ മുഴക്കമുണ്ടാവുകയുള്ളു എന്നും ഞാന്‍ കരുതുന്നു. കോളനിവിരുദ്ധ സമരങ്ങളാണ്‌ ഇന്ത്യന്‍ പ്രാദേശികഭാഷകളില്‍ നവോത്ഥാനത്തിന്റെ വിത്തുപാകിയതെന്ന ചരിത്രപാഠം നമോര്‍ക്കുക.

    ഇനി ചര്‍ച്ചയിലേക്കു വരാം. തീര്‍ച്ചയായും എന്‍കോഡിങ്ങിലും റെന്‍ഡറിങ്ങിലും സന്ദിഗ്ദ്ധതകളില്ലാത്ത ഒരു സംവിധാനം നമ്മുടെ ഭാഷയ്ക്കുണ്ടായേ മതിയാവൂ. യൂണിക്കോഡ്‌ സര്‍ക്കാര്‍തലത്തിലും സാമൂഹ്യതലത്തിലും സ്വീകരിക്കപ്പെടുകയുംവേണം. എന്തുകൊണ്ട്‌? ലിപിവിന്യാസത്തിലെ ഏകീകരണമെന്നത്‌ ഒരു ജനതയുടെ ഒരുമയും പെരുമയും പ്രതിരോധവുമാണെന്ന തിരിച്ചറിവുകൊണ്ട്‌.

    ഒന്നാമത്തെ പ്രശ്നം സാങ്കേതികമാണ്‌. സിബുവിനേയും ഹുസൈനേയും പോലെ പരിചയസമ്പന്നന്മാരായവര്‍ കൈകോര്‍ത്തുനിന്നാല്‍ നിസ്സാരമായി പരിഹരിക്കാവുന്നതല്ലേയുള്ളൂ ഇത്‌? വരമൊഴിയും രചനയുമെല്ലാം ഈ സംഗമത്തിലേയ്ക്കുള്ള പല കൈവഴികളായിരുന്നുവെന്ന്‌ ചരിത്രം രേഖപ്പെടുത്താതിരിക്കില്ല. രണ്ടാമത്തേത്‌ സാമൂഹ്യസ്വീകാര്യതയുടെ പ്രശ്നമാണ്‌. ഏറ്റവും എളുപ്പവും ലഭ്യതയുമുള്ളത്‌ തിരഞ്ഞെടുക്കുക എന്നതിലായിരിക്കും പൊതുസമ്മതി. ഒരു മാധ്യമത്തിന്റെ വ്യാപനത്തിന്‌ അതിനേക്കാള്‍ മികച്ച മുന്നുപാധികളാവശ്യമില്ല. യൂണിക്കോഡ്‌ മലയാളം അങ്ങനെയായിരിക്കുമെന്ന്‌ തെളിയിച്ചു കാണിക്കേണ്ടതുണ്ട്‌.

    നിര്‍ഭാഗ്യവശാല്‍ മലയാളത്തില്‍ ഭാഷാപണ്ഡിതന്മാരും സാങ്കേതികവിദഗ്ദ്ധരും രണ്ടറ്റത്തു നില്‍ക്കുന്നു. സരസ്വതിയും ലക്ഷ്മിയും ഒരിടത്തു വാഴാത്തതുപോലെ. പണ്ഡിതന്മാര്‍ ഇക്കരെയും വിദഗ്ദ്ധര്‍ അക്കരെയും. കേരളക്കരയിലെ എഴുത്തുകാരും സാംസ്കാരികനായകന്മാരും ഇന്നും അച്ചടികൌതുകം വിട്ടുമാറാത്ത പ്രകൃതത്തിലാണ്‌. കംപ്യൂട്ടര്‍ ഉള്ളവര്‍പോലും അതിനെ ഒരു പരിഷ്കരിച്ച ടൈപ്‌റൈറ്ററായി മാത്രമേ ഉപയോഗിച്ചുകാണുന്നുള്ളു. അച്ചടി പ്രധാനമായതുകൊണ്ടാകണം, തനതുലിപിയെ സ്നേഹിക്കുന്നവര്‍, രചനയെ സ്വാഗതം ചെയ്തത്‌. എന്റെ കാര്യംതന്നെ എടുക്കാം. ഹുസൈനാണ്‌ എന്നെ മലയാളത്തില്‍ 'ടൈപ്പിനിരുത്തിയത്‌'. എന്റെ രണ്ടു കവിതാസമാഹാരങ്ങളും രചനയില്‍ ഞാന്‍ സ്വയം കംപോസ്‌ ചെയ്ത്‌ പ്രസിദ്ധീകരിച്ചതാണ്‌.

    എന്നാല്‍ ഇന്റര്‍നെറ്റിന്റെ സാദ്ധ്യതകള്‍ ഭാഷയ്ക്കുവേണ്ടി പ്രയോജനപ്പെടുത്തുന്നതില്‍ പ്രവാസികളായ മലയാളികളാണ്‌ മുന്‍കൈയ്യെടുത്തത്‌. അത്‌ സ്വാഭാവികവുമായിരുന്നു. അഞ്ജലിയും വരമൊഴിയും മറ്റും അങ്ങനെ ലഭിച്ചു. ചിന്തയിലൂടെയാണ്‌ ഞാന്‍ അഞ്ജലി ആദ്യം കണ്ടത്‌. മനോഹരമായ ആ ഫോണ്ട്‌, ചില വൈകല്യങ്ങളുണ്ടെങ്കില്‍പ്പോലും ഇന്നും ഞാനുപയോഗിക്കുന്നു. ഇന്നിപ്പോള്‍ കേരളത്തിലും മിക്കവാറും എല്ലായിടത്തും ബ്രോഡ്ബാന്റ്‌ ഇന്റര്‍നെറ്റ്‌ ലഭ്യമാണ്‌. അക്ഷയ പദ്ധതിയും ഐ.ടി അറ്റ്‌ സ്കൂളും വ്യാപിച്ചതോടെ നെറ്റുപയോഗം അനുദിനം വര്‍ദ്ധിച്ചുവരുന്നുമുണ്ട്‌. ഈ സാഹചര്യത്തില്‍ ഇന്റര്‍നെറ്റിലെ മലയാളത്തിന്റെ സാന്നിദ്ധ്യവും പ്രശ്നങ്ങളും തീര്‍ച്ചയായും ഇനിയുള്ള ദിവസങ്ങളില്‍ ചര്‍ച്ചാവിഷയമായിരിക്കും.

    എന്നാല്‍ അച്ചടിച്ചുകണ്ടതുമാത്രം പ്രമാണമായി കരുതുന്ന ഭൂരിപക്ഷം മലയാളികളുടെ ഇടയിലേക്കുകൂടി ഈ ചര്‍ച്ച വ്യാപിക്കണമെന്നുണ്ടെങ്കില്‍ ഇത്‌ ഈ ബ്ലോഗില്‍ മാത്രം ഒതുങ്ങിയാല്‍ മതിയാവില്ല. ബ്ലോഗുകളെക്കുറിച്ച്‌ ഈയ്യിടെ മാദ്ധ്യമങ്ങളില്‍വന്ന വാര്‍ത്തകള്‍ ഇക്കാര്യത്തില്‍ ആയിരക്കണക്കിന്‌ അന്വേഷണങ്ങള്‍ ഉണ്ടാക്കിയിട്ടുണ്ടെന്നു ഞാന്‍ കരുതുന്നു. സുനില്‍ മാദ്ധ്യമത്തിലെഴുതിയതിന്‌ നല്ല പ്രതികരണമായിരുന്നു. ഈയ്യിടെ കോഴിക്കോട്‌ മലബാര്‍ ക്രിസ്റ്റ്യന്‍ കോളേജില്‍ ഇക്കാര്യത്തെക്കുറിച്ചു നടന്ന ഓറിയെന്റേഷന്‍ സെമിനാറില്‍ മഹേഷിനൊപ്പം ഞാനും പങ്കെടുത്തിരുന്നു.


    ഈ വരുന്ന കേരളപ്പിറവിദിനത്തോടെ യൂണിക്കോഡ്‌ എന്‍കോഡിങ്‌ സംബന്ധിച്ച പ്രശ്നം സമയബന്ധിതമായി പരിഹരിക്കാന്‍ നമുക്കു കഴിയുമോ?

    ( ഇത്രയും എഴുതിക്കഴിഞ്ഞപ്പോള്‍ ചില നെറ്റികള്‍ ചുളിയുന്നത്‌ ഞാന്‍ കാണുന്നു. എന്തുകൊണ്ട്‌ 'ഹരിതകം' യൂണിക്കോഡിലേക്കു മാറിയില്ല? തീര്‍ച്ചയായും മാറും, വൈകാതെ.)

    ReplyDelete
  31. ലിപിവിന്യാസത്തിലെ ഏകീകരണമെന്നത്‌ ഒരു ജനതയുടെ ഒരുമയും പെരുമയും പ്രതിരോധവുമാണെന്ന തിരിച്ചറിവുകൊണ്ട്‌.

    ഇന്റര്‍നെറ്റിലെ മലയാളം എന്നാല്‍ യുണീക്കോഡ് മാത്രമല്ല. ഫോണ്ടുകള്‍ ജനങ്ങള്‍ ഭാഷ ഉപയോഗിക്കുന്ന രീതി എല്ലാം അതിനു പുറത്താണ്. പഴയലിപിവേണമോ പുതിയതുവേണമോ എന്നതില്‍ യുണീക്കോഡൊന്നും പറയില്ല. ഏതൊക്കെ രീതിയില്‍ മലയാളം എഴുതപ്പെടുന്നുണ്ടോ അതൊക്കെയും അവതരിപ്പിക്കാന്‍ യുണീക്കോഡ് ബദ്ധശ്രദ്ധമാണ്. അതുകൊണ്ട്‌ തന്നെ പഴയലിപി/പുതിയലിപി സാംസ്കാരികസംവാദവും അതിന്റെ രാഷ്ട്രീയവും യുണീക്കോഡിന് പുറത്താണ് സംഭവിക്കേണ്ടത്‌.

    ഒന്നാമത്തെ പ്രശ്നം സാങ്കേതികമാണ്‌. സിബുവിനേയും ഹുസൈനേയും പോലെ പരിചയസമ്പന്നന്മാരായവര്‍ കൈകോര്‍ത്തുനിന്നാല്‍ നിസ്സാരമായി പരിഹരിക്കാവുന്നതല്ലേയുള്ളൂ ഇത്‌?

    ആദ്യമേ ഓര്‍ത്തിരിക്കേണ്ട കാര്യം ഞാന്‍ നേരത്തേ പറഞ്ഞത്‌ തന്നെയാണ്. ഒരു മലയാളിക്ക് വളരെ പ്രത്യക്ഷമായി കാണുന്ന ഒരു പ്രശ്നവും യുണീക്കോഡിലില്ല. ഉള്ളതൊക്കെയും വളരെ ഉള്ളിലുള്ള ചെറിയ പ്രശ്നങ്ങളാണ്. ഉദാഹരണങ്ങള്‍: യ-യുടെ ചില്ല് യുണീക്കോഡിലില്ല; ‘നന്‍‌മ‘യും ‘നന്മ’യും രണ്ട്‌ വെവ്വേറെ സ്പെല്ലിംഗ് വച്ചാണ് അവതരിപ്പിക്കുക (ചില്ല് എന്‍‌കോഡിങിന് ശേഷം). കുത്തിട്ടുള്ള രേഫത്തിന്റെ പുതിയ ലിപിയിലെ അവതരണം; etc. ഓരോ പ്രശ്നവും പരിഹരിക്കാനുള്ള കൃത്യമായ വഴി യുണിക്കോഡ് കണ്‍സോര്‍ഷ്യം പറഞ്ഞിട്ടുണ്ട്‌. പ്രശ്നത്തിന്റെ രണ്ട്‌ ഭാഗവും പറയുന്ന ടെക്നിക്കല്‍ ഡൊക്യുമെന്റുകള്‍ അവര്‍ക്കയച്ചുകൊടുക്കുക. അവരുടെ കമ്മറ്റി (ഇപ്പോള്‍ ഏകദേശം 10 പേരുടെ) കൂടി വോട്ടിനിട്ട്‌ തീരുമാനിക്കും. (ഈ പത്തില്‍ ഒരാള്‍ ഇന്ത്യാ ഗവണ്മെന്റ് പ്രതിനിധിയാണ്.) ഇത്രയൊക്കെത്തന്നെയെ ഇനിയും ചെയ്യാനുള്ളൂ. ഈ പ്രശ്നങ്ങള്‍ ഇന്ഡിക് ലിസ്റ്റില്‍ എന്നപോലെ ഇവിടേയും ചര്‍ച്ച ചെയ്യപ്പെടേണ്ടത്‌ ആവശ്യമാണെന്ന്‌ ഞാന്‍ സമ്മതിക്കുന്നു. ഇനി മുതല്‍ കഴിയാവുന്നതും ഞാനതിന് ശ്രമിക്കാം.

    ReplyDelete
  32. യൂനിക്കോഡില്‍ എന്താണ്‌ സംഭവിക്കുന്നത്‌ എന്ന്‌ അറിയാത്തവരാണ്‌ തല്‍പരരായ മലയാളികളില്‍ ഭൂരിഭാഗവും. അവരില്‍ ചിലര്‍ മൌലികമായ ഉള്‍ക്കാഴ്ചയോടെ നിര്‍ദ്ദേശങ്ങള്‍ നല്‍കാന്‍ പ്രാപ്തരായവരുമാണ്‌.ഉദാഹരണം ഡോ.എം.ആരൃാഘവവാര്യര്‍. കമ്പ്യൂട്ടറും ഇന്റര്‍നെറ്റ്‌ സംവിധാനവുമുള്ള ഡോ.എം.ആരൃാഘവവാര്യര്‍ എന്ന എപിഗ്രാഫിസ്റ്റ്‌ ഞാന്‍ പറയുമ്പോഴാണ്‌ ഇക്കാര്യം അറിയുന്നത്‌.കാരണം ഈ വിവരങ്ങള്‍ സാധാരണനിലയില്‍ നെറ്റില്‍ കയറുന്ന ഒരാള്‍ കാണണമെന്നില്ല എന്നതു തന്നെ.

    എന്റെ പോയിന്റ്‌ ഇതാണ്‌: മലയാളികളുടെ പൊതുശ്രദ്ധയില്‍ ഈ ചര്‍ച്ചയുടെ പ്രസക്തഭാഗങ്ങളെങ്കിലും എത്തേണ്ടേ? അതിന്‌ നമുക്കു ചെയ്യാന്‍ സാധിക്കുന്നതെന്താണ്‌?
    എവിടെയെങ്കിലും സമ്മേളനം വിളിച്ചുകൂട്ടുന്നതല്ലാത്ത നിര്‍ദ്ദേശത്തിന്‌ കാത്തിരിക്കുന്നു.

    പൊതുശ്രദ്ധയില്‍ വന്നാല്‍ ഉണ്ടാകാവുന്ന ചര്‍ച്ചാഘോഷങ്ങളെക്കൂടി കണക്കിലെടുക്കുക

    ReplyDelete
  33. രാഘവവാര്യര്‍ സാറിനെ ആദ്യം ഇവിടേയ്ക്കും അതുകഴിഞ്ഞ്‌ ഇന്‍ഡിക് ലിസ്റ്റിലേയ്ക്കും നമുക്ക്‌ കൂട്ടിക്കൊണ്ടുപോകാം.

    ഒരു തുടക്കമായി, രാഘവവാര്യര്‍ സാറിനും ബാക്കിയുള്ളവര്‍ക്കുമായി ഇന്‍ഡിക് ലിസ്റ്റിലെ ഇന്നത്തെ ഒരു ചോദ്യം തരാം. മൈക്രോസോഫ്റ്റില്‍ ഈ കാര്യങ്ങള്‍ കൈകാര്യം ചെയ്യുന്ന പീറ്റര്‍ ആണ് ഇത്‌ ചോദിച്ചത്‌. ‘സ്ക്ര‘ എന്ന കൂട്ടക്ഷരത്തിന് ഏതൊക്കെ രൂപങ്ങള്‍ ഉണ്ട്‌ എന്നായിരുന്നു ചോദ്യം. എനിക്കറിയാവുന്ന നാലഞ്ച്‌ രൂപങ്ങള്‍ ഞാന്‍ വരച്ചുകൊടുത്തു. അപ്പോള്‍ ഗണേശന്‍ എന്ന തമിഴ്‌ ഗ്രന്ഥലിപിയില്‍ ഗവേഷണം ചെയ്യുന്നവന്‍ പറയുന്നു; ‘സ’യ്ക്കും പഴയമലയാളത്തില്‍ ചില്ലുണ്ടായിരുന്നു. അതുകൊണ്ട്‌ സ-ചില്ല്‌ ക്ര എന്നും എഴുതാം എന്ന്‌. ഇത്‌ ശരിയാണോ? എനിക്ക്‌ ഒരു പിടിയും ഇല്ലാത്ത കാര്യമാണ്. തമിഴ് ഗ്രന്ഥലിപിയും മലയാളവും തമ്മിലുള്ള വേര്‍തിരിവ്‌ എഴുത്ത്‌ വച്ച്‌ നോക്കിയാല്‍ എവിടെയാണ്. (ഗണേശന്‍ എവിടെ നോക്കിയാലും ഗ്രന്ഥലിപിയേ കാണൂ എന്നതുകൊണ്ടാണ് കക്ഷിയെ സംശയിക്കുന്നത്‌) മറുപടി ഇവിടെ എഴുതിയാലും, ഇന്‍ഡിക് ലിസ്റ്റില്‍ നേരെ എഴുതിയാലും ഒരു കുഴപ്പവുമില്ല.

    ഇത്‌ യുണീക്കോഡിലെ കുഴക്കുന്ന പ്രശ്നങ്ങളില്‍ ഒന്നുമല്ല. എന്നാലും അവിടത്തെ ഡിസ്കഷനില്‍ നിന്നും ഒരു സാമ്പിള്‍ ഇവിടെ ഇട്ടു എന്ന്‌ മാത്രം.

    ReplyDelete
  34. അഭിവന്ദ്യരേ, എന്റെ ചെറിയ ഒരു നിര്‍ദ്ദേശം. ഇത്തരമൊരു സംവാദം ചിന്തയുടെ സംവാദം ഫോറത്തില്‍ നടന്നാല്‍ തീര്‍ച്ചയായും ഞാന്‍ അവ പ്രിന്റ് എടുത്ത്‌ അഡ്ഡ്രസ്സ് കൈവശമുള്ള നാട്റ്റിലെ എല്ലാവര്‍ക്കും അയച്ചുകൊടുക്കാം.മഹേഷ്/പി.പി.ആര്‍/ഹുസ്സൈന്‍ എന്നിവര്‍ നാട്ടിലാണല്ലോ. അവര്‍ക്കതു ചര്‍ച്ച ചെയ്യുകയും തിരിച്ച്‌ ഫോറത്തിലെക്ക്‌ വിവരങള്‍ സമാഹരിക്കുകയും ആകാം. ബൂലോകക്ലബില്‍, പോസ്റ്റുകള്‍ താം തിരിച്ച്‌ ലിസ്റ്റ് ചെയ്യുന്നില്ല. അതിനാല്‍ തന്നെ ഈ ബ്ലോഗിലെ ഈ സംവാദത്തിലേക്ക്‌ എത്തിപ്പെടാന്‍ വളരെ വിഷമം.ഇപ്പോള്‍ തന്നെ ഈ പോസ്റ്റിന്റെ ലിന്‍ക് ഞാന്‍ പ്രത്യ്ഏകം സൊക്ഷിച്ചിരിക്കുകയാണ്. എല്ലാവരും സമ്മതിച്ചാല്‍ ചിന്ത ഫോറത്തിലേക്ക്‌ ഇത്രയും ഭാഗങള്‍ മാറ്റുകയും പ്രിന്റ്‌ ചെയ്ത്‌ ഏവര്‍ക്കും അയച്ചുകൊടുക്കുകയും ചെയ്യ്ം. മേല്വിലാസങള്‍ ദയവായി അയച്ചുതരിക.-സു-

    ReplyDelete
  35. സിബു,
    തമിഴ്‌ദേശങ്ങളില്‍ സംസ്കൃതം എഴുതാനായി ഗ്രന്ഥലിപിയാണു് ഉപയോഗിച്ചിരുന്നതു്. സംസ്കൃതത്തിന്റെ സ്വാധീനം ഏറെയുണ്ടായിരുന്ന തമിഴ്‌ദേശമായ മലനാട്ടില്‍ അതുകൊണ്ടു തന്നെ ഗ്രന്ഥലിപി (തമിഴ് മൂലമായുള്ള വാക്കുകള്‍ വട്ടെഴുത്തിലും സംസ്കൃതം ഗ്രന്ഥത്തിലും) വ്യാപകമായി ഉപയോഗിച്ചിരുന്നു. മണിപ്രവാളം കൃതികള്‍ (മലയാളം-സംസ്കൃതം) മിക്കവയും ഇത്തരം ഹൈബ്രിഡ് ലിപിയിലാണു് പത്തൊന്‍‌പതാം നൂറ്റാണ്ടുവരെയും എഴുതിക്കൊണ്ടിരുന്നതു് . രണ്ടു തരത്തിലുള്ള ഗ്രന്ഥലിപിയില്‍ പല്ലവഗ്രന്ഥമായിരുന്നു മലയാളത്തിനു് ഉപയോഗിച്ചിരുന്നതെന്നും തെളിവുകളുണ്ടു് (ഇത്രയും ബ്രിട്ടാനിക്ക തരുന്ന വിവരം).

    വിക്കിയിലെ Malayalam Script, Grantha, Malayalam Language എന്നീ ലേഖനങ്ങള്‍ കാണുക, വട്ടെഴുത്തും ഗ്രന്ഥലിപിയും ഉപയോഗിച്ചിരുന്ന കാലത്തെപറ്റി പരാമര്‍ശങ്ങളുണ്ടു്. ഈ ചിത്രവും കാണുക. സ-യുടെ ചില്ലിനു ഗണേശനോടു് തെളിവുകള്‍ ചോദിക്കൂ :)

    ReplyDelete
  36. ചില്ല് എന്‍കോഡിങില്‍ ശരിയായ സ്ഥാനം നിര്‍ണ്ണയിച്ചില്ലെങ്കില്‍ index ചെയ്യുമ്പോള്‍ കൃത്യത നഷ്ടപ്പെട്ടേക്കാം.ഉദാഹരണത്തിന് കാര്‍,കാര്,കാറ്‍ ഇവയുടെ ക്രമം എന്തായിരിക്കും?
    പുതിയലിപി ഉപയോഗിക്കുന്ന ഒരാള്‍ക്ക് കൂട്ടക്ഷരം prevent ചെയ്യാന്‍ ZWNJ ഉപയോഗിക്കാന്‍ തോന്നില്ല.'ലോക്‌സഭ' എന്നത് പഴയലിപിയില്‍ 'ലോക്സഭ' എന്നാകും.

    ReplyDelete
  37. ലിസ്റ്റില്‍ 'ജി ശങ്കരപ്പിള്ള' എന്നത്‌ 'കെ ജി ശങ്കരപ്പിള്ള' എന്ന് തിരുത്തണം. - ഹുസ്സൈന്‍

    ReplyDelete
  38. പ്രിയ സുഹൃത്തുക്കളേ,

    ഉള്ളടക്കം കൊണ്ടും പങ്കെടുക്കുന്നവരുടെ പ്രാമുഖ്യം കൊണ്ടും ഈ ചര്‍ച്ചയുടെ പ്രാധാന്യം അനുദിനം ഏറിവരുകയാണ്.

    ബൂലോഗക്ലബ്ബ് എന്ന തിരക്കേറിയ, പലര്‍ക്കും സര്‍വ്വതന്ത്ര നിയന്ത്രണമുള്ള ഒരു ബ്ലോഗില്‍ ഈ ചര്‍ച്ച തുടരുന്നതില്‍ ചിലരൊക്കെ ആശങ്ക പ്രകടിപ്പിച്ചിട്ടുണ്ട്. എന്തുവേണമെന്ന് കൂട്ടായി തന്നെ തീരുമാനിക്കാം.

    എന്റെ അഭിപ്രായത്തില്‍ ഇവിടെതന്നെ തുടരുകയാണ് നല്ലത്. blogspot.com എന്ന ഒരൊറ്റ ഏജന്‍സിക്കു മാത്രമേ ഈ ഇടത്തില്‍ പരമാധികാരമുള്ളൂ. ബൂലോഗക്ലബ്ബിലെ നമ്മുടെ മറ്റു കൂട്ടുകാരൊക്കെ ഈ പോസ്റ്റിനും കമന്റുകള്‍ക്കും തല്‍ക്കാലം ഉപദ്രവമൊന്നും ചെയ്യില്ലെന്നും പ്രതീക്ഷിക്കാം.
    ഇതോടൊപ്പം തന്നെ ഈ പേജിന്റെ പകര്‍പ്പുകള്‍ മറ്റിടങ്ങളിലായി സൂക്ഷിക്കുവാനും ശ്രമിക്കുന്നുണ്ട്.
    കൂടാതെ ഇതു മൊത്തമായി, പതിവായി പുന:പ്രസിദ്ധീകരിക്കുന്ന ഒരു PDF തുടര്‍പ്പുസ്തകമാക്കാമെന്നും ആലോചിക്കുന്നു.ഉള്ളടക്കം ഏറുന്ന മുറയ്ക്ക് രണ്ടോ മൂന്നോ ദിവസത്തിലൊരിക്കല്‍ എന്ന നിലയ്ക്ക് ഈ PDF ശൃംഖല ഈ-മെയിലിലോ അച്ചടിച്ചോ താല്‍പ്പര്യമുള്ള ആളുകള്‍ക്ക് എത്തിക്കാവുന്നതാണ്.

    ദയവുചെയ്ത് നിങ്ങളുടെ അഭിപ്രായങ്ങള്‍ അറിയിക്കുക.

    ReplyDelete
  39. ആദ്യമേ പറയട്ടെ, നാജൊരു ഭാഷാപരിജ്ഞാനിയോ യൂണീകോഡിനെക്കുറിച്ചറിവുള്ള സാങ്കേതികവിദഗ്ദ്ധനോ അല്ല. unicode.orgല്‍നിന്നും കിട്ടിയ കുറെ വിവരങ്ങളും സിബുവിന്റെ വിക്കി ലേഖനവും ബെന്നിയോടു കുറച്ചു സംസാരിച്ചതുംവച്ചാണ്‌ ഇതെഴുതുന്നത്‌.

    മാറിയ സാഹചര്യങ്ങളില്‍ ഭാഷയുടെ നിലനില്‍പ്പ്‌ വിനിമയോപാധി എന്ന നിലയില്‍നിന്നും വളരെയധികം മാറിയിട്ടുണ്ട്‌. ചിന്തിക്കാന്‍വേണ്ട അടിസ്ഥാനോപാധിയാണ്‌ ഇന്നു ഭാഷ. വിനിമയത്തിന്‌ മറ്റു പല രീതികളും സാധ്യമാണെങ്കിലും ചിന്തിക്കാനും ചിന്തയെ index ചെയ്യാനും പകര്‍ത്താനും പിന്നീടാവശ്യമുള്ളപ്പോള്‍ തിരഞ്ഞെടുത്തുപയോഗിക്കാനും ഭാഷ അനിവാര്യ്മാണ്‌. ഇതേ പ്രക്രിയയില്‍നിന്നും manual labourനെ ഒഴിവാക്കി മനുഷ്യന്റെ ക്രിയേറ്റിവിറ്റിക്ക്‌ പരമാവധി സാദ്ധ്യതകള്‍ തുറന്നുകൊടുക്കുകയാണ്‌, അല്ലെങ്കില്‍ ആയിരിക്കണം, ഭാഷകമ്പ്യുട്ടിങ്ങിന്റെ ലക്ഷ്യം.

    ബെന്നിയും സിബുവും(വിക്കിയില്‍) സൂചിപ്പിച്ചതുപോലെ ഡിജിറ്റല്‍ ലോകത്തെ ഭാഷകളുടെ പ്രസക്തിതന്നെ അതിന്റെ സെര്‍ച്ചബിലിറ്റിയിലാണ്‌. ഒരു വേര്‍ഡ്പ്രോസസ്സരിനകത്ത്നട്ത്തുന്ന സെര്‍ച്ചും റീപ്ലേസുമല്ല, സെര്‍ച്ച്‌എന്‍ജിനുകള്‍ക്കും വെബ്സ്പൈഡറുകള്‍ക്കും എളുപ്പത്തില്‍ വിവരങ്ങള്‍ ലഭ്യമാക്കാനും അവയെ നിമിഷനേരംകൊണ്ട്‌ ഇന്‍ഡക്സ്‌ ചെയ്യാനും കഴിയുന്നരീതിയിലുള്ള സെര്‍ച്ചബിലിറ്റി.(പി.ഭാസ്കരനുണ്ണിയുടെ രണ്ടു പുസ്തകങ്ങള്‍, പത്തൊമ്പതാം നൂറ്റാണ്ടിന്റേയും ഇരുപതാം നൂറ്റാണ്ടിന്റെയും കേരളചരിത്രം, searchable ആയ ഒരു ഫോര്‍മാറ്റിലായിരുന്നെങ്കില്‍ എന്നാശിച്ചിട്ടുണ്ട്‌. അമൂല്യമായ ചരിത്രരേഖകള്‍, പക്ഷേ ഒരു വാക്ക്‌ അന്വേഷിച്ചുകണ്ടുപിടിക്കണമെങ്കില്‍ കഷ്ടപ്പെട്ടുപോകും) അത്തരമൊരു ഭാഷകമ്പ്യൂട്ടിങ്ങിനുമാത്രമേ അറിവിന്റെ ഉല്‍പ്പാദകര്‍ക്ക്‌ ആവശ്യമായ വിവരങ്ങല്‍ സമയത്തെത്തിക്കന്‍ കഴിയൂ. ആ വിവരങ്ങളാണ്‌ നാളത്തെ അറിവുകള്‍, തര്‍ജ്ജമചെയ്യപ്പെട്ട സെകന്‍ഡ്‌ഹാന്‍ഡ്‌ വിവരങ്ങളല്ല, ആ ഭാഷയില്‍ ചിന്തിക്കുകയും അതില്‍ത്തന്നെ ഉല്‍പ്പാദിക്കപ്പെടുകയും ചെയ്ത മൗലികമായ അറിവുകള്‍. ഒരു ഭാഷ വളരുന്നത്‌ കുറെപ്പേര്‍ അതുപയോഗിക്കുമ്പോളല്ല, കുറച്ചുപേര്‍ ആ ഭാഷയില്‍ ചിന്തിക്കുമ്പോളാണ്‌.

    മലയാളം യൂണീകോഡില്‍ ഇപ്പോഴുള്ള പ്രശ്നം ഭാഷാപരമെന്നതിനേക്കാള്‍ സാങ്കേതികമാണെന്നാണ്‌ ഞാന്‍ മനസ്സിലാക്കുന്നത്‌. ആരുംതന്നെ ഉപയോഗിച്ചുകണ്ടിട്ടില്ലാത്ത മലയാളം അക്കങ്ങള്‍ക്കുവരെ യൂണീകോഡ്‌ എന്‍കോഡിങ്ങുണ്ടായിരിക്കെ വ്യാപകമായി ഉപയോഗിക്കുന്ന ചില്ലക്ഷരങ്ങള്‍ക്കതുവേണ്ടെന്ന്‌ പറയുന്നത്‌ അതിശയമായിത്തോന്നുന്നു. ഹുസ്സൈന്‍ നയിക്കുന്ന രചനയാണ്‌ ഇത്തരമൊരു നീക്കത്തിന്‌ മുന്‍കൈയെടുത്തതെങ്കില്‍ എന്തായിരുന്നു അത്തരമൊരു തീരുമാനത്തിനുപിന്നിലെന്ന് വിശദമാക്കിയാല്‍ നന്നായിരുന്നു. അദ്ദേഹത്തിന്റെ വെര്‍ഷനുംകൂടി പരിഗണിക്കാതെ ഈ ചര്‍ച്ച പൂര്‍ണ്ണമാകില്ലല്ലോ.

    ഹുസ്സൈന്‍ പറയുന്ന ഭാഷാവിദഗ്ദരുടെ ലിസ്റ്റ്‌ ചിരിപ്പിക്കുന്നതാണെന്നുപറയാതിരിക്കാന്‍ വയ്യ. ഇവരില്‍ ഏതെങ്കിലും നാലുപേരെ (ബെന്നി പറഞ്ഞപോലെ സച്ചിദാനന്ദനെ ഒഴിവാക്കാം, വേണുഗോപാലപ്പണിക്കര്‍ ആരാണെന്നെനിക്കറിയുകയുമില്ല) ഒരു കമ്മറ്റിയിലിട്ടാല്‍ അടുത്ത നൂറുവര്‍ഷത്തേക്ക്‌ മലയാളത്തില്‍ യൂണികോഡ്‌ പ്രശ്നങ്ങള്‍ തീരില്ല. ഒരു ഹൈസ്കൂള്‍ മലയാളം അധ്യാപകനു കൈകാര്യം ചെയ്യാന്‍ കഴിയുന്നതിലുംകൂടുതല്‍ ഭാഷാപ്രശ്നങ്ങളുണ്ടൊ ഇതില്‍?


    ഒരു ഭാഷ ഉപയോഗിക്കപ്പെടുന്നത്‌ ചിന്തിക്കാന്‍ അതു നകുന്ന സാധ്യതകളുടെയും ചിന്തക്കാവശ്യമായ വിവരങ്ങള്‍ നല്‍കാനുള്ള ശേഷിയുടെയും അടിസ്ഥാനത്തിലായിരിക്കും.. knowledge ഉപയോഗിക്കുന്ന ഒരു സമൂഹം എന്ന നിലയില്‍നിന്നും അതു സൃഷ്ടിക്കുന്ന സമൂഹം എന്ന നിലയിലേക്കൂള്ള പരിവര്‍ത്തനത്തില്‍ ഭാാഷ ഒരു വലിയ പങ്കുവഹിക്കേണ്ടതുണ്ട്‌. സാഹിത്യ്കാരന്റെയും അവന്റെ വായനക്കരന്റെയും നൊസ്റ്റാള്‍ജിയക്ക്‌ ഭാഷയുടെ വീഴ്ചയില്‍ ഒന്നും ചെയ്യാനാകില്ല. അതിലും ഭേദം തീര്‍ച്ചയായും ഹുസ്സൈന്‍ പരിഹസിച്ച ഐ.ടി.മെറ്റലര്‍ജിക്കാരാണ്‌.

    ReplyDelete
  40. ബെന്നി,
    പ്രമുഖ ഭാഷാശാസ്ത്ര പണ്ഡിതനായ ഡോ.ടി.ബി.വേണുഗോപാലപ്പണിക്കര്‍ കാലിക്കറ്റ്‌ യൂനിവേഴ്സിറ്റിയില്‍ മലയാളവിഭാഗം മേധാവിയായിരിന്നു.
    വ്യാകരണമല്ല ഭാഷാശാസ്ത്രമെന്നും ഭാഷാശാസ്ത്രമല്ല ലാങ്ഗ്വിജ്‌ ടെക്നോളജിയെന്നും മനസ്സിലാക്കാനോ അംഗീകരിക്കാനോ പലപ്പോഴും നമ്മുടെ പണ്ഡിതന്മാര്‍ കൂട്ടാക്കാറില്ലെങ്കിലും ഈ ചര്‍ച്ചകളില്‍ അവര്‍ക്കു കാര്യമില്ലെന്ന നിലപാട്‌ ശരിയല്ല.ചര്‍ച്ചകളുടെ ഉള്ളടക്കം പരമാവധി ആളുകളില്‍ എത്തിക്കുകയല്ലേ നല്ലത്‌?

    ReplyDelete
  41. മൂന്ന് ദിവസത്തെ ഗ്യാപ്പിന്‌ ശേഷം നെറ്റില്‍ കയറിയപ്പോള്‍ ആദ്യം വന്ന് നോക്കിയത്‌ ഇവിടെയാണ്‌. നിറഞ്ഞ സന്തോഷം.

    എല്ലാ ഭാഷാ പണ്ഡിതരേയും നേരിട്ട്‌ ഇത്തരം ചര്‍ച്ചകളില്‍ ഉള്‍ക്കൊള്ളിക്കാനുള്ള പ്രായോഗിക പ്രയാസങ്ങള്‍ കണക്കിലെടുക്കണ്ടേ? അതു നോക്കുമ്പോള്‍ പരിഹരിക്കപ്പെടാത്ത / ചര്‍ച്ചയിലുള്ള വിഷയങ്ങളുടെ ഒരു ലിസ്റ്റ്‌ ഉണ്ടാക്കി പ്രസിദ്ധീകരിക്കുന്നത്‌ നന്നായിരിക്കും എന്ന് തോന്നുന്നു. നമുക്ക്‌ ഈ കാര്യത്തില്‍ പോസിറ്റിവ്‌ ആയി സംഭാവന ചെയ്യാന്‍ കഴിയും എന്ന വിശ്വാസമുള്ള ഓരോരുത്തരുടേയും അഭിപ്രായം, ലിസ്റ്റില്‍ ഉന്നയിച്ചിട്ടുള്ള ഓരോ വിഷയത്തിലും രേഖപ്പെടുത്തി, ക്രോഡീകരിക്കാമല്ലോ. മാധ്യമലോകത്തുള്ള നമ്മുടെ ബൂലോഗ സുഹൃത്തുക്കള്‍ക്ക്‌ ഇക്കാര്യത്തില്‍ സഹായിക്കാന്‍ കഴിയില്ലേ?

    ReplyDelete
  42. മലയാളം അക്കങ്ങള്‍ ടൈപ്പ്‌ ചെയ്യാന്‍ രചനയിലും വരമൊഴിയുടെ പുതിയ വേര്‍ഷനിലും സൌകര്യമുണ്ട്‌. ഇക്കാര്യത്തെക്കുറിച്ച്‌ ഡോ.എം.ആര്‍. രാഘവവാര്യര്‍ മുമ്പൊരിക്കല്‍ പറഞ്ഞ കാര്യം രേഖപ്പെടുത്തട്ടെ. ഇത്‌ വളരെ പ്രസക്തവും പ്രയോജനപ്രദവുമാണ്‌. എന്നാല്‍ മലയാളം അക്കങ്ങളെ ദശാംശസ്ഥാനത്തിന്റെ ക്രമത്തിലാണ്‌ ഈ ടെക്സ്റ്റ്‌ എഡിറ്ററുകള്‍ നമ്മുക്ക്‌ നല്‍കുന്നത്‌. അതിന്റെ തനതു രൂപത്തിലല്ല.

    അക്കങ്ങളുടെ തനത്‌ ആലേഖനരീതി തിരിച്ചു കൊണ്ടു വരേണ്ടതല്ലേ?

    ReplyDelete
  43. സുറുമ: ചില്ല് എന്കോഡിങില് ശരിയായ സ്ഥാനം നിര്ണ്ണയിച്ചില്ലെങ്കില് index ചെയ്യുമ്പോള് കൃത്യത നഷ്ടപ്പെട്ടേക്കാം.ഉദാഹരണത്തിന് കാര്,കാര്,കാറ് ഇവയുടെ ക്രമം എന്തായിരിക്കും?


    ഡിക്ഷ്ണറിയിലെ സോര്ട്ടിങ് ക്രമത്തിനെ കൊലേഷന് എന്നാണ് വിളിക്കുക. കൊലേഷനില് ഒരക്ഷരത്തിനും വ്യത്യസ്ത സംഖ്യകൊടുത്ത് അവയുടെ ഓഡറില് ആണ് സോര്ട്ടിങ് എന്നാണ് പൊതുവെ നമ്മള് ഡിക്ഷ്ണറികളില് കണ്ടുവരാറ്. യുണീക്കോഡ് കൊലേഷനില്, ഒരു അക്ഷരത്തിന് 3 (കൂടുതലും ആവാം) ലെവല് സംഖ്യകള് കൊടുക്കുന്നു. ഉദാ: അ = (4, 20, 2), ആ = (5, 20, 2) . സോര്ട്ട് ചെയ്യുമ്പോള് ആദ്യലെവല് സംഖ്യകള് വച്ചാദ്യം സോര്ട്ട് ചെയ്യുന്നു. പിന്നെ, രണ്ടാം ലെവല് വച്ച് അതിനു ശേഷം മൂന്ന് എന്നിങ്ങനെ. അക്ഷരത്തിന്റെ ഏറ്റവും പ്രധാനപ്പെട്ട ഗുണങ്ങളാണ് ആദ്യത്തെ ലെവലില് വേര്ത്തിരിക്കപ്പെടുന്നത്`. രണ്ടാമത്തെ ലെവലില് അത്രതന്നെ പ്രധാനമില്ലാത്തവ; ഉദാ: കാപ്പിറ്റല് ലെറ്റര് സ്മോള് ലെറ്റര്.

    http://www.unicode.org/reports/tr10/ എന്ന ഡോക്യുമെന്റ് ഇതിനെ പറ്റി വളരെ നന്നായി വിവരിക്കുന്നുണ്ട്. ഈ കൊലേഷന് വിലകള്ക്ക് യുണിക്കോഡ് ചാര്ട്ടിലെ വിലകളുമായി (encoded values) ബന്ധമില്ല. ഓരോ അക്ഷരത്തിന്റേയും ഡിഫാള്ട്ട് കൊലേഷന് വില എന്തെന്ന് ഇവിടെ പറയുന്നു: http://www.unicode.org/Public/UCA/latest/allkeys.txt ഇതാണ് ഒട്ടുമിക്ക പ്രോഗ്രാമുകളും ഉപയോഗിക്കുന്നത്. ഒരപ്ലിക്കെഷന് സ്വന്തം കൊലേഷന് വിലകള് നിശ്ചയിക്കുന്നതിനും ഒരു വിരോധവുമില്ല.

    മലയാളം കൊലേഷനില് ചില്ല്, സംവൃതോകാരം ചന്ദ്രക്കല എന്നിവ ചെറിയ പ്രശ്നങ്ങള് ഉണ്ടാക്കുന്നുണ്ട്. അതെങ്ങനെയാവാം എന്ന് നമുക്കിവിടെ ആലോചിക്കാവുന്ന ഒന്നാണ്.

    സുറുമ: പുതിയലിപി ഉപയോഗിക്കുന്ന ഒരാള്ക്ക് കൂട്ടക്ഷരം prevent ചെയ്യാന് ZWNJ ഉപയോഗിക്കാന് തോന്നില്ല.'ലോക്സഭ' എന്നത് പഴയലിപിയില് 'ലോക്സഭ' എന്നാകും.

    ഇതൊരു വലിയ പ്രശ്നമാണ്; എന്റെ കയ്യില്‍ ഒരുത്തരവും ഇതിനില്ല. യുണീക്കോഡ്, രണ്ടുലിപിയും കൂടി ഒറ്റ എന്കോഡിങ് കൊണ്ട് റെപ്രസെന്റ് ചെയ്യാന് തീരുമാനിച്ചതിന്റെ സൈഡ് ഇഫക്റ്റാണിത്. ഇത് പഴയലിപിക്ക് ഒരു അഡ്വാന്റേജ് തരുന്നുണ്ട്. അതായത്, പഴയലിപിയിലെഴുതിയത് പുതിയ ലിപിക്കാരന് ഒരു പ്രശ്നവുമില്ലാതെ വായിക്കാം; എന്നാല് പുതിയലിപിയിലെഴുതിയത് പഴയലിപിക്കാരന് 'ലോക്സഭ', 'ദൃക്സാക്ഷി' പ്രശ്നങ്ങളില്ലാതെ വായിക്കാനാവില്ല. അതായത്‌, മലയാളം തെറ്റുകൂടാതെ എഴുതണമെങ്കില്‍ പഴയലിപി തന്നെ ഉപയോഗിക്കണം എന്ന്‌. ഈ പ്രശ്നത്തെ പറ്റി കൂടുതല് ഇവിടെ: http://varamozhi.blogspot.com/2005/07/unicode-issues-with-visible-virama.html

    ബെന്നി: എഴുപതുകളിലെ കൊലപാതകം നടന്നില്ലായിരുന്നുവെങ്കില്‍ വലിയൊരു കുതിച്ചുചാട്ടം മലയാളഭാഷയ്ക്ക് സാധിക്കില്ലായിരുന്നു...ഗ്ലിഫ് സൃഷ്ടിയിലെ മാനകീകരണത്തെ പറ്റി എപ്പോഴാണ് നാം ചര്‍ച്ച ചെയ്യുക?

    എന്തു് കുതിച്ചു ചാട്ടം? 1980-കള്‍ വരെ പഴയലിപി തന്നെയാണ് അച്ചടിയില്‍. ടൈപ്രൈറ്ററിന് വേണ്ടിയാണ് ലിപിയെ മുറിച്ചത്‌. അതല്ലാതെ വേറേ വഴിയില്ലായിരുന്നു. 1980-ന് ശേഷം, കമ്പ്യൂട്ടറ് ടൈപ്പ്സെറ്റിങ് (അച്ചുനിരത്തിയല്ലാതെ) വന്നപ്പോഴാണ് പ്രസാധകരും ടെക്സ്റ്റ് ബുക്കുകളും ആവഴി പോയത്‌. 1980-ന് ശേഷം 2000-വരെ എന്തെങ്കിലും കുതിച്ചു ചാട്ടം നടന്നുവോ? 2000-ഇല്‍ ആറ്‌ ഫോണ്ട്‌ ഫയലുകള്‍ വച്ച്‌ കമ്പ്യൂട്ടര്‍ ടൈപ്പ്സെറ്റിങിലും പഴയലിപി ആവാം എന്ന്‌ രചന കാണിച്ചു തന്നു. അപ്പോഴേയ്ക്കും യുണീക്കോഡിന്റെ കാലമായി. പഴയലിപി പുതിയലിപി എന്നിവയല്ലാതായി വിനിമയരീതി; പകരം അത്‌ കൂടുതല്‍ ഗോപ്യമായ എന്‍‌കോഡിംഗ് ആയിമാറി. ഇന്ന്‌, സ്കൂളുകളില്‍ ഏത്‌ ലിപി പഠിക്കണം എന്നത്‌ മാത്രമാണ് ചോദ്യം. അതിന്റെ ഉത്തരമായാല്‍ ബാക്കിയെല്ലാത്തിന്റേയും ഉത്തരം എളുപ്പത്തില്‍ കിട്ടും.

    ബെന്നി: സാങ്കേതികതയുടെ പിന്നണിക്കഥകളെല്ലാം സകലരോടും പറഞ്ഞതിനുശേഷം മാത്രം മതി തീരുമാനമെന്നത് ഒരു ഐഡിയല്‍ സങ്കല്‍പ്പമാണ്, എന്നാല്‍ നടക്കാത്ത കാര്യം. ഭാഷാ കമ്പ്യൂട്ടിംഗിന്‍റെ കാര്യത്തിലും ഇങ്ങനെത്തന്നെ.

    സത്യം.

    ബെന്നി: സോര്‍ട്ടിംഗും സെര്‍ച്ചിംഗും ഫൈന്‍ഡ് ആന്‍ഡ് റീപ്ലേസിംഗുമൊന്നും വേണ്ട രീതിയില്‍ നടത്താന്‍ ഇപ്പോഴത്തെ യൂണിക്കോഡ് കണ്ടന്‍റ് ഉപയോഗിച്ച് സാധ്യമല്ല.

    എന്തുകൊണ്ട്‌ പറ്റില്ല?

    ബെന്നി: ഇപ്പോഴുള്ള യൂണിക്കോഡ് മലയാളത്തില്‍ “ഡെസ്ക്ടോപ്പ്” എന്ന വാക്ക് മൂന്നോ നാലോ രീതിയില്‍ ടൈപ്പ് ചെയ്തിരിക്കുന്നത് ഞാന്‍ ശ്രദ്ധിച്ചിട്ടുണ്ട്.

    യുണീക്കോഡ് സ്പെല്ലിംഗില്‍ ആണോ വ്യത്യാസം; അതോ ഫോണ്ട്‌ കാണിക്കുന്നതിലുള്ളതോ?. യുണീക്കോഡ് സ്പെല്ലിംഗിലുള്ള വേരിയേഷന്‍സ് ആണെങ്കില്‍ പ്രശ്നമാണ്. അത്‌ മിക്കവാറും യുണിക്കോഡല്ല, ഭാഷ പരിഹരിക്കേണ്ട കാര്യങ്ങളാവും. അതായത്‌ ‘ഡെസ്ക്‍ടോപ്’ എന്നാണോ ‘ഡെസ്ക്‍ടോപ്പ്’ എന്നാണോ എന്നത്‌ ഭാഷ തീരുമാനിക്കേണ്ടതാണ് എന്നര്‍ഥം.

    ബെന്നി: അവരതില്‍ ഉപയോഗിച്ചിരിക്കുന്നത് കാര്‍ത്തിക ഫോണ്ടാണ്. അതായത് ഓഫീസ് ലിപ്പില്‍ മലയാളം പുതിയ ലിപിയുടെ ഗ്ലിഫുകളാണ് ഉപയോഗിക്കുന്നത്.നാളെ അഡോബിയും അവരുടെ ഉല്‍പ്പന്നങ്ങള്‍ ലോക്കലൈസ് ചെയ്തേക്കും. അവരതില്‍ രചന ഉപയോഗിക്കുകയാണെങ്കിലോ?

    ഡിഫാള്‍ട്ട് ഫോണ്ട്‌ മാറ്റാനുള്ള സൌകര്യം ഓപ്പറേറ്റിങ് സിസ്റ്റം ചെയ്തുകൊടുക്കേണ്ടതാണ്. അതായത്‌ ഈ പ്രശ്നം മൈക്രോസോഫ്റ്റിന്റേതാണ്.

    ബെന്നി: രചനയെയും ഹുസ്സൈനെയും പരിചയപ്പെടുത്തുമ്പോള്‍ “തല്‍ക്കാലം” രചനയെ വിശ്വസിക്കാന്‍ വിശ്വം ആവശ്യപ്പെട്ടത് ശ്രദ്ധിച്ചു. “പ്‌രബോധചന്‌ദ്‌രിക” എന്നെഴുതി, ഹുസ്സൈന്‍ പരിഹസിക്കുന്ന പ്രബോധചന്ദ്രന്‍ മാഷുടെ ...

    ഇവിടെ വിശ്വാസത്തിന്റെ പ്രശ്നമൊന്നുമില്ല. ആരേയും കളിയാക്കേണ്ട കാര്യവുമില്ല. ഇവിടെ ചര്‍ച്ച ചെയ്യുന്നത്‌ ആശയപരമായ വ്യത്യാസങ്ങളാണ്. അത്‌ വ്യക്തിപരമാക്കേണ്ടകാര്യം ഒട്ടും തന്നെയില്ല. എല്ലാവരും അത്‌ ശ്രദ്ധിച്ചാല്‍ നന്ന്‌.

    ബെന്നി: ഏതൊക്കെ അക്ഷരങ്ങള്‍ കൂടിച്ചേരണമെന്നും ഏതൊക്കെ ചേരരുതെന്നുമുള്ള ഏകദേശ ധാരണ യൂണിക്കോഡില്‍ ഇപ്പോഴുണ്ട്. ഈ സംവിധാനത്തിന് എത്രത്തോളം ആഴത്തില്‍ പോവാന്‍ കഴിയും?
    അധികം ആഴത്തിലൊന്നും പറ്റില്ല. രണ്ടുരീതിയില്‍ എഴുതിയാലും എപ്പോഴും അര്‍ഥം ഒരുപോലുള്ളവയെ മാത്രം യുണീക്കോഡിന് ഒരുപോലെ കാണാനാവും. എന്നാല്‍ വാക്കിന്റെ context മനസ്സിലാക്കാന്‍ അതിന് പറ്റില്ല. അത്‌ ചെയ്യേണ്ടത്‌ യുണീക്കോഡിനെ ഉപജീവിക്കുന്ന higher അപ്ലിക്കേഷന്‍സ് ആണ്. അവയാണ് സന്ധികളും മറ്റും കൈകാര്യം ചെയ്യേണ്ടത്.


    ചന്ത്രക്കാരന്‍: ആരുംതന്നെ ഉപയോഗിച്ചുകണ്ടിട്ടില്ലാത്ത മലയാളം അക്കങ്ങള്‍ക്കുവരെ യൂണീകോഡ്‌ എന്‍കോഡിങ്ങുണ്ടായിരിക്കെ വ്യാപകമായി ഉപയോഗിക്കുന്ന ചില്ലക്ഷരങ്ങള്‍ക്കതുവേണ്ടെന്ന്‌ പറയുന്നത്‌ അതിശയമായിത്തോന്നുന്നു.

    ചില്ലക്ഷരം പ്രത്യേകം എന്‍‌കോഡ് ചെയ്യാതെ തന്നെ ചില്ലുകള്‍ എഴുതാന്‍ വഴിയുണ്ടാക്കണം എന്നതാണ് രചനയുടെ വാദം. പ്രത്യക്ഷത്തില്‍ ആ വാദത്തില്‍‍ തെറ്റില്ല. കാരണം ‘നന്മ’ എന്നും ‘നന്‍‌മ’ എന്നും എഴുതിയാല്‍ അര്‍ഥം ഒന്നാണല്ലോ. അര്‍ഥവും അടിസ്ഥാന അക്ഷരങ്ങളും ഒന്നാണെന്നില്‍‍ ആ രണ്ടുവാക്കുകളുടേയും സ്പെല്ലിംഗും ഒന്നായിരിക്കേണ്ടേ. എഴുത്ത്‌ രീതിയിലുള്ള വ്യത്യാസം (അത്‌ ‘ശബ്‌ ദം’ ‘ശബ്ദം’ എന്നിവ പോലെ) മാത്രമേ അവ തമ്മിലുള്ളൂ... ഇത്രയുമാണ് ചുരുക്കത്തില്‍.

    യുണീക്കോഡ് എഴുത്തിനുപയോഗിക്കുന്ന എല്ലാ ചിഹ്നങ്ങളും എന്‍‌കോഡ് ചെയ്യാന്‍ ശ്രമിക്കുന്നില്ല. പകരം എഴുത്തിന്റെ Deep structure‍-ല്‍ ആണ് യുണീക്കോഡിന്റെ ശ്രദ്ധ‌. ‘ന്‍‌ ‘-ന്റേയും ‘ന്’-യുടേയും അടിസ്ഥന അക്ഷരം ‘ന’ തന്നെയാണല്ലോ. ആ Deep structure-ന്റെ എന്‍‌കോഡിങില്‍ നിന്നും എല്ലാ ചിഹ്നങ്ങളും എഴുത്തുരീതികളും ഉണ്ടാക്കാന്‍ ഫോണ്ടിന് സാധിക്കണം.

    ‘നന്മ’/‘നന്‍‌മ’ എന്നിവ ‘colour/color' പോലെ ആണെന്നും, ചില്ലുകള്‍ വേറേ വാക്കുകളില്‍ അര്‍ഥവ്യത്യാസം ഉണ്ടക്കുന്നുണ്ടെന്നും ആണ് ഞാനടങ്ങുന്ന സംഘത്തിന്റെ മറുവാദം. കൂടുതല്‍ ഇവിടെ: http://varamozhi.blogspot.com/2005/06/unicode-malayalam-chillu-discussion.html

    മയ്യഴി: എന്നാല് മലയാളം അക്കങ്ങളെ ദശാംശസ്ഥാനത്തിന്റെ ക്രമത്തിലാണ് ഈ ടെക്സ്റ്റ് എഡിറ്ററുകള് നമ്മുക്ക് നല്കുന്നത്. അതിന്റെ തനതു രൂപത്തിലല്ല.

    അവയുടെ 'തനത് രൂപം' എന്താണെന്ന്‌ പറഞ്ഞുതരാമോ?

    മയ്യഴി: അക്കങ്ങളുടെ തനത്‌ ആലേഖനരീതി തിരിച്ചു കൊണ്ടു വരേണ്ടതല്ലേ?

    തിരിച്ചുകൊണ്ടുവരിക എന്നാല്‍ എന്താണര്‍ഥം? സാധാരണപ്രയോഗത്തില്‍ വരുത്തുക എന്നതാണോ? അതിനോടെനിക്ക്‌ യോജിപ്പില്ല. എന്നാല്‍ സോഫ്റ്റ്വെയറിലും യുണിക്കോഡിലും അങ്ങനേയും എഴുതാന്‍ വഴിയുണ്ടാക്കുക എന്നതാണെങ്കില്‍, അത്‌ തീര്‍ച്ചയായും വേണ്ടതാണ്.


    കണ്ണൂസ്: അതു നോക്കുമ്പോള്‍ പരിഹരിക്കപ്പെടാത്ത / ചര്‍ച്ചയിലുള്ള വിഷയങ്ങളുടെ ഒരു ലിസ്റ്റ്‌ ഉണ്ടാക്കി പ്രസിദ്ധീകരിക്കുന്നത്‌ നന്നായിരിക്കും എന്ന് തോന്നുന്നു.

    അങ്ങനെ ഒരു ശ്രമം ഇവിടെ ഉണ്ടായിരുന്നു: http://varamozhi.blogspot.com/2005/07/unicode-suggestions-proposals.html
    ഇപ്പോഴത്‌ http://unicode.wikia.com/wiki/Malayalam എന്ന സൈറ്റിലേയ്ക്ക്‌ പറിച്ചു നട്ടുകൊണ്ടിരിക്കയാണ്.

    ---
    ഈ മറുപടി മൊത്തം എഴുതിയപ്പോഴേക്കും ഒന്നൊന്നര മണിക്കൂറിലധികം എടുത്തു. സമയം തന്നെയാണ് ഏറ്റവും വലിയ പ്രതിബന്ധം. :(

    ReplyDelete
  44. മലയാളം യൂണിക്കോഡ്‌ സംബന്ധിച്ച്‌ നിലവിലുള്ള അവസ്ഥ, പ്രശ്നങ്ങള്‍, തര്‍ക്കങ്ങള്‍, ന്യായീകരണങ്ങള്‍, നിര്‍ദ്ദേശങ്ങള്‍ ഇവ അക്കമിട്ടു നിരത്തുന്ന ഒരു സംക്ഷിപ്തരേഖ ആര്‍ക്കെങ്കിലും തയ്യാറാക്കിത്തരാമോ? ഏതെങ്കിലും ശ്രദ്ധേയമായ അച്ചടിമാദ്ധ്യമത്തില്‍ പൊതുചര്‍ച്ചയ്ക്കായി പ്രസിദ്ധീകരിക്കാനാണ്‌.

    ReplyDelete
  45. തിരമൊഴീ, സിബൂന്റെ വിക്കിയെ തന്നെ ശരണം പ്രാപിയ്ക്കണം. ഇവിടെ http://unicode.wikia.com/wiki/Malayalam

    ReplyDelete
  46. സുഹൃത്തുകളെ,

    ഞാനല്ല രചനയെ നയിക്കുന്നത്‌, തുടക്കം മുതലേ, ഇന്നും, ചിത്രജകുമാര്‍ ആണ്‌.

    ഫോണ്ട്‌ ഡ്സൈനിംഗ്‌ ആയിരുന്നു എന്റെ പണി. ഡോ. വിജയകുമാരന്‍ നായരുമൊത്ത്‌ രചന എഡിറ്ററിന്റെ കോഡിങ്ങില്‍ പങ്കുചേരുകയുണ്ടായി. കാലിഗ്രാഫിയിലെ പല പ്രശ്നങ്ങളും പറഞ്ഞുതന്നത്‌ സുബാഷ്‌ കുര്യാക്കോസും നാരായണ ഭട്ടതിരിയുമാണ്‍. രചനയുടെ ഓപ്പണ്‍ ടൈപ്‌ നിര്‍മ്മിതിയില്‍ അന്‍വര്‍, മുത്തുകൃഷ്ണന്‍ എന്നിവര്‍ പങ്കുചേര്‍ന്നിട്ടുണ്ട്‌. യതിചരിതം, രാമായണം, ബൈബിള്‍ തുടങ്ങിയ ഗ്രന്ഥങ്ങളുടെ ടൈപ്സെറ്റിങ്ങില്‍ ഞാന്‍ സഹകരിക്കുകയുണ്ടായി . 1999 തുടക്കം മുതല്‍ 2005 മാര്‍ച്ചുവരെ Project Co-ordinator എന്ന നിലക്കായിരുന്നു എന്റെ പ്രവര്‍ത്തനങ്ങള്‍. കഴിഞ്ഞ ഒരു വര്‍ഷമായി രചനയുടെ ഡെവലപ്മെന്റില്‍ എനിക്കു പങ്കാളിയാകാന്‍ കഴിയുന്നില്ല. പ്രധാന കാരണം ലിനക്സിലുള്ള എന്റെ അജ്ഞതയാണ്‌. രാജീവ്‌ സെബാസ്റ്റ്യന്‍ ആണ്‌ ലിനക്സിന്റെ കോഡിംഗ്‌ നിര്‍വ്വഹിക്കുന്നത്‌. ഭാഷാപരമായ പ്രശ്നങ്ങള്‍ ചിത്രജനും ഗംഗാധരനും കൈകാര്യംചെയ്യുന്നു.

    ചിത്രജന്‍ തന്നെയാണ്‌ രചനയെ ഇപ്പോഴും നയിക്കുന്നത്‌.

    - ഹുസൈന്‍, രചന

    ReplyDelete
  47. LIP-ല്‍ ഉപയോഗിച്ചിരിക്കുന്ന ഫോണ്ട് മാറ്റാന്‍ ഒരുപാധി ഉണ്ടാവേണ്ടതാണ്. Malayalam LIP-ലെ default font ആയ കാര്‍ത്തിക മാറ്റാന്‍ സാധിക്കും. ഓഫീസ് LIP ഞാന്‍ ശ്രമിച്ചിട്ടില്ലെങ്കിലും ഇത് സാധ്യമാകുമെന്ന് തന്നെയാണ് വിശ്വാസം. ഇല്ലെങ്കില്‍, സിബു പറഞ്ഞതു പോലെ, അത് മൈക്രോസോഫ്റ്റിന്‍റെ പ്രശ്നമായി മാറുന്നു.

    അതുപോലെ format control characters aware അല്ലാത്ത ടെക്സ്റ്റ് എഡിറ്ററുകളില്‍ വിവിധ രീതിയില്‍ എഴുതപ്പെടുന്ന (ഡെസ്ക്ടോപ്പ് പോലുള്ള) വാക്കുകള്‍ സേര്‍ച് ചെയ്യുന്നത് ഉദ്ദേശിച്ച ഫലം നല്‍കണമെന്നില്ല.

    ReplyDelete
  48. ഫലപ്രദമായ ഒരു ചര്‍ച്ച Skype (www.skype.com) വഴി നടത്താവുന്നതേ ഉള്ളൂ. ഒരേ സമയം 5 കമ്പ്യൂട്ടറുകള്‍ക്ക് വരെ ഇതില്‍ പങ്കെടുക്കാം. ഒരു കമ്പ്യൂട്ടറിനു മുന്‍പില്‍ ഒന്നിലധികം ആള്‍ക്കാരെ വിളിച്ചു വരുത്താന്‍ പറ്റുമെങ്കില്‍ ധാരാളം പേര്‍ക്കിതില്‍ പങ്കെടുക്കാം. ഉദാ: ദക്ഷിണകേരളത്തിലെ വിദഗ്ധര്‍ തിരുവനന്തപുരത്തും, ഉത്തരകേരളത്തിലെ വിദഗ്ധര്‍ തൃശ്ശൂരും. DSL സംവിധാനം എങ്കിലും വേണ്ടിവരും എന്നേ ഉള്ളൂ. Skypecast ഉപയോഗിച്ച് 100 പേര്‍ക്ക് വരെ പറ്റുമെന്ന് പറയുന്നു, പരീക്ഷിച്ച് നോക്കിയിട്ടില്ല. ആറ് മാസം കൊണ്ട് എഴുത്ത്‌കുത്തിലൂടെ പരിഹരിക്കുന്ന കാര്യങ്ങള്‍ ഒരു മണിക്കൂറിലെ നേരിട്ടുള്ള ചര്‍ച്ചയിലൂടെ പരിഹരിക്കാം.

    ReplyDelete
  49. ഇതുകാണൂ “http://mallu-ungle.blogspot.com/2006/09/blog-post.html“
    -സു-

    ReplyDelete
  50. "ഹുസൈന്‍ പറയുന്ന ഭാഷാവിദഗ്ദ്ധരുടെ ലിസ്റ്റ്‌ ചിരിപ്പിക്കുന്നതാണെന്ന്‌ പറയാതിരിക്കാന്‍ വയ്യ." - ചന്ദ്രക്കാരന്‍

    ചിരിയുടേയും (കരച്ചിലിന്റേയും) നാനാര്‍ത്ഥങ്ങള്‍ നമ്മെ പഠിപ്പിച്ച കോമാളികളുടെ പട്ടിക കാണുമ്പോള്‍ മറ്റെന്തു ചെയ്യാന്‍? അവന്‍മാര്‍ക്ക്‌ ഭാഷയുടേയും അക്ഷരമാലയുടേയും കാര്യങ്ങള്‍ അല്‍പം ഐടി ചേര്‍ത്ത്‌ വിളമ്പിയാല്‍, ഭേഷായി! ഇനിയൊരു നൂറുവര്‍ഷത്തേക്ക്‌ മണ്ണുകപ്പാന്‍ മറ്റൊന്നും തേടേണ്ടിവരില്ല.

    പിരിയുന്ന സന്ധ്യയില്‍ നീ പറഞ്ഞു
    ചിരിയായിരുന്നു നമുക്കു ഭാഷ
    നമുക്കു പാത.
    (കെ.ജി. ശങ്കരപ്പിള്ള: അയ്യപ്പപണിക്കര്‍ക്ക്‌)

    ReplyDelete
  51. ഹുസൈന്‍ മാഷേ, രചനയുടെ ഒരു ഓപ്പറേറ്റിങ് സിസ്റ്റത്തെക്കുറിച്ചു് പത്രങ്ങളിലൂടെ കേട്ടു, പക്ഷേ എവിടെയും കാണാന്‍ പോലും കിട്ടിയില്ല. മാഷുക്കതിനെക്കുറിച്ചന്തെങ്കിലും വിവരമുണ്ടോ? മലയാളത്തെ എടുത്തമ്മാനമാടുന്ന ആദ്യത്തെ ഓപ്പറേറ്റിങ് സിസ്റ്റമെന്നൊക്കെയാണു് കേട്ടതു്. ഇപ്പോഴെന്റെ കൈയിലുള്ള ഉബുന്ദുവിനു് മലയാളം കൈകാര്യം ചെയ്യുന്നതില്‍ അത്ര ശുഷ്കാന്തി പോര, അതാണു് രചനയുടേതെന്നു് കേട്ടപ്പോള്‍ എനിയ്ക്കൊരിളക്കം. മാഷേ, അപ്പോ ഉബുന്ദു ഇപ്പോള്‍ ചെയ്യുന്നതിനേക്കാള്‍ എത്രത്തോളം മെച്ചമുണ്ടാകും രചനയുടെ ഓപ്പറേറ്റിങ് സിസ്റ്റം ഉപയോഗിച്ചാലു്? മറുപടിയ്ക്കു വേണ്ടി കാത്തിരിയ്ക്കുന്നു. ഞാന്‍ മാത്രമല്ല, പലരും.

    ReplyDelete
  52. കെവീ,
    ഉബുണ്ടുവില്‍ മലയാളം നന്നാക്കാന്‍ ഞാന്‍ ഒരു ഫോണ്ടും കുറച്ച് പാച്ചുകളും ഉണ്ടാക്കിയിട്ടുണ്ട്(സാധനം ഇവിടെ).

    കെവീ പറഞ്ഞപോലെ രചനയുടെ മലയാളം ലിനക്സിനെപ്പറ്റി കൂടുതല്‍ അറിയാന്‍ ആഗ്രഹിക്കുന്നു.

    ReplyDelete
  53. അതുശരിയാണു മാഷേ!

    ആവശ്യമെങ്കില്‍ ഇവിടെയുള്ള കൂട്ടുകാര്‍ക്കും രചനയുടെ മലയാളം OS-ല്‍ എന്തെങ്കിലും സഹായം ചെയ്യാന്‍ പറ്റിയാലോ!

    ചര്‍ച്ചയുടെ അടുത്ത ഭാഗമായി നമുക്കൊരു കര്‍മ്മപരിപാടി വരച്ചെടുക്കണ്ടേ? അതില്‍ ഇതും ചേര്‍ക്കണം.

    (പിന്നെ അന്നു ഹുസ്സൈന്മാഷുമായി സംസാരിച്ചതുപോലെ,)
    1. നിലവിലുള്ള എന്‍‌കോഡിങ്ങ് പ്രശ്നങ്ങളില്‍, വസ്തുനിഷ്ടമായ ചര്‍ച്ച, വിശകലം, സമരഞ്ജനം, ശുപാര്‍ശകള്‍.

    2. നിലവിലുള്ള യുണികോഡ് ഫോണ്ടുകളിലെ പ്രശ്നങ്ങള്‍ (സാങ്കേതികം, ലിഗേറ്റ് കോണ്‍ജുഗേറ്റ് സ്ഥാനനിര്‍ണ്ണയം, അച്ചടി/സ്ക്രീന്‍ അനുയുക്തത):വസ്തുനിഷ്ടമായ ചര്‍ച്ച, വിശകലം, സമരഞ്ജനം, ശുപാര്‍ശകള്‍.

    സമരഞ്ജനത്തില്‍ ഉരുത്തിരിഞ്ഞുവരുന്ന ആശയങ്ങള്‍ കണക്കിലെടുത്ത് ഈ ഫോണ്ടുകള്‍ ഓരോന്നും അവ ആദ്യം ഉണ്ടാക്കിയവര്‍ തന്നെ മെച്ചപ്പെടുത്തി പുതിയ വേര്‍ഷനുകള്‍ ഉണ്ടാക്കട്ടെ.

    3. യുണികോഡ് പ്രചാരണത്തിന് സാദ്ധ്യമായ മുന്നണികള്‍ കണ്ടെത്തലും പ്രേരിപ്പിക്കലും.

    ഇവയ്ക്കു പുറമേ ആകാവുന്ന മറ്റു വിഷയങ്ങള്‍:

    4.പരസ്പരം സമ്മതമാണെങ്കില്‍ മാത്രം, മേല്‍പ്പറഞ്ഞപോലെയുള്ള ഒറ്റയ്ക്കല്ലാതെ കൂട്ടായ OS വികസനം തുടങ്ങിയവ.

    5.ഗോവിസാറിന്റെ ഗ്രന്ഥസൂചിക അടക്കം സാദ്ധ്യമായ ഭാഷാസമ്പത്തുകളൊക്കെ ഡിജിറ്റൈസ് ചെയ്ത് പൊതു ഉപയോഗത്തിന് തയ്യാറാക്കല്‍ തുടങ്ങിയവ.

    ഈ ഇനങ്ങളില്‍ ഊന്നി ഈ കര്‍മ്മപരിപാടി ഒന്നു വൃത്തിയായി ചട്ടപ്പെടുത്താം നമുക്കിനി?

    ആര്‍ക്കൊക്കെ എങ്ങനെയൊക്കെ പങ്കെടുക്കാം?
    ഏതേതു സമയാവധികള്‍?

    ദയവുചെയ്ത് നമുക്കെല്ലാം ചര്‍ച്ച ഇവിടെ തന്നെ തുടരാം.

    സാങ്കേതികമായി ഇനി വിശദവിവരങ്ങളിലേക്കു കടക്കുന്നതുകൊണ്ട് വിരോധമില്ലെന്നു കരുതുന്നു.

    സൌകര്യത്തിനു വേണ്ടി ഇംഗ്ലീഷിലും എഴുതുകയോ ഉദ്ധരിക്കുകയോ ചെയ്യാം.

    ReplyDelete
  54. ഹുസൈന്‍ മാഷേ, ഈ രചന ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തെക്കുറിച്ച് ഞാനും കേട്ടു. അതെക്കുറിച്ച് കേരളകൌമുദിയിലും സമകാലീന മലയാളത്തിലും ഒക്കെ വന്ന ഗംഭീരന്‍ റിപ്പോര്‍ട്ടുകളും വായിച്ചു. പക്ഷെ അത് എവിടെ കിട്ടുമെന്നോ എങ്ങനെ കിട്ടുമെന്നോ ഒന്നും ആരും എവിടെയും എഴുതി കണ്ടില്ല. ഈ വിഷയത്തെക്കുറിച്ച് താങ്കള്‍ക്ക് ഞാ‍നൊരു ഈ-മെയിലും അയച്ചിരുന്നു (ചിന്ത.കോം‌‌ല്‍ കൊടുത്തിരിക്കുന്ന വിലാസത്തിലേക്ക്). അതിനും മറുപടി കണ്ടില്ല. ചിന്തയിലെ പോളിനോടും ഞാനീ‍ വിഷയം സൂചിപ്പിച്ചിരുന്നു.
    രചനയുടെ ഓ/എസ് എന്താണെന്നും അത് എവിടെ കിട്ടുമെന്നും ഒക്കെ ഒന്ന് വിശദീകരിച്ചാല്‍ കൊള്ളാമായിരുന്നു.

    ReplyDelete
  55. Dear Friends

    From Chintha sites I have for the fist time seen the that old news in Hindu. It is full of factual errors.

    First of all, as I explained, I'm not the 'leader' of Rachana. R. Chitrajakumar is the project leader from the very beginning.

    I'm totally away from the linux development mainly because of my ignorance in Linux.

    I have participated in the Rachana meeting in February but I haven't given any interview or press release to any news paper including the Hindu.

    Rajeev Sebastian is the man behind all linux coding and it is learnt that it will be released soon.

    ReplyDelete
  56. ബെന്നിയുടെ അഭിപ്രായങ്ങളെകുറിച്ച്‌:

    1998 ല്‍ ഡോ. പ്രബോധചന്ദ്രന്‍ നായരുടെ നേതൃത്വത്തിലുള്ള 'മലയാളത്തനിമ' പരിഷ്കരണപ്രകാരം 'പ്രകൃതി' എന്നതില്‍ ഋകാരം ഉണ്ടായിരുന്നില്ല! കേരള ഭാഷാ ഇന്‍സ്റ്റിറ്റ്യൂറ്റ്‌ അതിനെ ശക്തമായി പിന്താങ്ങിയിരുന്നു. എതിരായ ഒരഭിപ്രായം പൊന്തിയില്ലായിരുന്നുവെങ്കില്‍ അത്‌ സര്‍ക്കാര്‍ അംഗീകരിച്ചേനേ. ഈ ദുരന്തം നടക്കാതെ പോയത്‌ 1999ല്‍ രചനയുടെ സജീവമായ ഇടപെടല്‍ മൂലമായിരുന്നു. 1973ല്‍ സംഭവിച്ചതുപോലെ, ആരുമറിയാതെ ഈ 'റ'കാര ലിപി പാഠപുസ്തകങ്ങളില്‍ പ്രത്യക്ഷപ്പെട്ടേനെ. എങ്കില്‍ എന്താകുമായിരുന്നു ഭാഷാകമ്പ്യുട്ടിങ്ങിന്റെ ഇന്നത്തെ അവസ്ഥ? 'പ്രകൃതി'യുടെ Unicode rendering ഇന്ന്‌ എങ്ങനെയാകുമായിരുന്നു?


    ലിപിയുടെ എണ്ണം കുറക്കലും വെട്ടിച്ചുരുക്കലും അത്ര ലളിതമായി കാണാന്‍ വയ്യ. അതൊരു വലിയ സാംസ്കാരിക പ്രശ്നമായാണ്‌ രചന കാണുന്നത്‌. നിത്യചൈതന്യ യതിയെപ്പോലുള്ളവര്‍ ഈ വിഷയത്തില്‍ ആഴത്തില്‍ ചിന്തിച്ചിരുന്നു.

    'ഒരു ഭാഷയെ കൊല്ലാനുള്ള എളുപ്പ വഴി ലിപി മാറ്റലാണ്‍'എന്ന്‌ എം.ടി. എഴുതി.

    അതുകൊണ്ട്‌ പ്രബോധചന്ദ്രന്‍ നായരുടെ ലിപിപരിഷ്കരണ അമിതാവേശം അത്ര നിര്‍ദ്ദോക്ഷമായി കാണാന്‍ കഴിയുന്നില്ല. പ്രത്യേകിച്ച്‌, ഇന്നും അദ്ദേഹവും ശിഷ്യരും സുഹൃത്തുക്കളും character encoding കമ്മിറ്റിയില്‍ സജീവസാന്നിദ്ധ്യമായുള്ളപ്പോള്‍.

    ലിപി പരിഷ്കാരംകൊണ്ട്‌ ഭാഷയ്ക്ക്‌ നേട്ടമുണ്ടായി എന്ന ബെന്നിയുടെ പ്രസ്താവന അദ്ഭുതകരമായി തോന്നുന്നു. എന്തൊക്കെയാണ്‌ ആ നേട്ടങ്ങള്‍?

    എണ്ണം കുറക്കുന്നതിനും ലളിതവല്‍ക്കരിക്കുന്നതിനും വേണ്ടി വാദിച്ച പെരിയോര്‍ എന്തു കൊണ്ട്‌ 'തമിഴ്പുലവര്‍ കൊണ്ടുവന്ന പതിനെട്ടുമെയ്യും പന്ത്രണ്ടുയിരുംചേര്‍ന്ന മുപ്പത്‌ ലിപികളുള്ള ലിപിമാല' അംഗീകരിച്ചില്ല?

    മലയാളലിപിവ്യന്യാസത്തെ ലളിതവല്‍ക്കരിക്കാനുള്ള ഏറ്റവും 'നല്ല' നിര്‍ദ്ദേശം വന്നത്‌ 1930കളിലായിരുന്നു: 'മലയാളലിപിയെ റോമനൈസ്‌ ചെയ്യുക!' അതോടെ നമ്മുടെ ഭാഷ അന്തര്‍ദേശീയമായിത്തീരുകയും പഠിക്കാന്‍ എളുപ്പമുള്ളതായിത്തീരുകയും ചെയ്യുമായിരുന്നു! ഇതിനെതിരെ ഉയര്‍ന്ന സഞ്ജയന്റെ കൂര്‍ത്തപരിഹാസം എല്ലാ ലിപിലാളിത്യവാദങ്ങള്‍ക്കും എതിരെ എക്കാലവും പ്രസക്തമാണ്‌.

    സുഹ്രുത്തുക്കള്‍ പറയുന്നതുപോലെ പഴയ-പുതിയ ലിപിപ്രശ്നങ്ങള്‍ രചന ഇറങ്ങിയ 1999 ലുള്ളതുപോലെ ഇന്ന്‌ പ്രസക്തമല്ല. തിരമൊഴിയില്‍ യൂണികോഡിന്റെ വ്യാപനം മലയാളത്തിന്റെ തനതുലിപിയുടെ ആഘോഷമായി മാറും എന്ന്‌ ഞാന്‍ കരുതുന്നു. പരിഷ്കരിച്ച ലിപി പഠിച്ച പുതിയ തലമുറയിലുള്ള കുട്ടികള്‍ പോലും പഴയലിപിയെ സഹര്‍ഷം സ്വാഗതം ചെയ്യുന്ന കാഴ്ചയാണ്‍ എങ്ങും കാണുന്നത്‌. തനതിന്റെ എണ്ണം പറഞ്ഞ കുറച്ച്‌ ഫോണ്ടുകളും Unicode compliant DTP packages, പ്രത്യേകിച്ച്‌ Pagemaker ഉം വന്നാല്‍ പത്രങ്ങളടക്കം മലയാളത്തിലെ ഭൂരിപക്ഷം പ്രസിദ്ധീകരണങ്ങളും തനതു ലിപിയിലാകാന്‍ അധിക വര്‍ഷം എടുക്കില്ല.

    അതുകൊണ്ട്‌ ഇത്തരം വ്യാപകമായ ഷിഫ്റ്റ്‌ സംഭവിക്കും മുമ്പേ, ബെന്നി സൂചിപ്പിക്കും പോലെ, ജീവല്‍പ്രധാനമായ കാര്യം Unicode Encoding എന്നന്നേക്കുമായി fix ചെയ്യുക എന്നതുതന്നെയാണ്‌. ലോഹടൈപ്പുകളുടെ കാലത്ത്‌ തെറ്റുകള്‍ സംഭവിച്ചാല്‍ തിരുത്താന്‍ സാവകാശങ്ങളുണ്ടായിരുന്നു. നിലവിലുള്ള encoding പ്രശ്നങ്ങളില്‍ Unicode Consortium അപക്വമായ തീരുമാനങ്ങളെടുത്താല്‍ പിന്നീട്‌ ഇഷ്ടാനുസരണം തള്ളാനും കൊള്ളാനും നമുക്ക്‌ കഴിയാതെ വരും.

    ഗ്ലിഫുകളുടെ ഏകീകരണത്തെകുറിച്ചുള്ള ബെന്നിയുടെ നിര്‍ദ്ദേശം ശ്രദ്ധേയമാണ്‌. ഇക്കാര്യത്തില്‍ ചില ചിന്തകള്‍ എനിക്കുണ്ട്‌. വിശദമായി പിന്നീടാകാം.


    പിന്‍കുറിപ്പ്‌:

    ലിപിപരിഷ്കരണത്തിന്‌ ചുക്കാന്‍പിടിച്ച എന്‍.വി.കൃഷ്ണവാരിയര്‍ക്ക്‌ മലയാളത്തെ കൂടുതല്‍ ലളിതവല്‍ക്കരിക്കാനും സുഗമമാക്കാനും ശാസ്ത്രീയമായ വേറെയും ചിന്തകള്‍ ഉണ്ടായിരുന്നതായി മാങ്ങാട്‌ രത്നാകരന്‍ ഒരിക്കല്‍ എഴുതികണ്ടു.

    ഈ=അീ‍
    ഊ=അൂ‍,....

    എന്നിങ്ങനെ!!

    ReplyDelete
  57. ഹുസൈന്‍ മാഷേ ഈ ചര്‍ച്ചയില്‍ ആരും ‘യന്ത്രത്തിനു വേണ്ടിയുള്ള ലിപി പരിഷ്കരണത്തിനെ’ പിന്‍‌താങ്ങുന്നുവെന്നു കരുതുന്നില്ല. എന്നാല്‍ യന്ത്രത്തിനു പൂര്‍ണ്ണമായും ഭാഷയെ മനസ്സിലാക്കുവാന്‍ ചില്ലുകള്‍, രേഫം എന്നിവ എന്‍‌കോഡ് ചെയ്യേണ്ട ആവശ്യകതയെ കുറിച്ചെല്ലാം പലരും അനുബന്ധ വേദികളില്‍ എഴുതിയിട്ടുള്ളതാണു്. ഈ കാര്യങ്ങളിലാണല്ലോ നമ്മള്‍ എത്രയും പെട്ടെന്നു തീരുമാനങ്ങള്‍ എടുക്കേണ്ടതും. പത്രത്തില്‍ വന്ന വാര്‍ത്ത തെറ്റാണെന്നു ഏറെക്കുറെ എല്ലാവര്‍ക്കും ബോധ്യമായിക്കാണും, യൂണികോഡില്‍ മലയാളം ലിപി വെട്ടിമുറിക്കുവാന്‍ നീക്കങ്ങളൊന്നും നടക്കുന്നില്ലെന്നാണു ബോധ്യമായിരിക്കുന്നതു്.

    മലയാളത്തിനെ റോമനൈസ് ചെയ്യാമെന്ന 1930 -ലെ വാദം കേട്ടപ്പോള്‍ നെഞ്ചുവേദനിച്ചു പോയി :(

    ReplyDelete
  58. എന്റമ്മോ, മലയാളത്തെ ചതുരത്തിലെഴുതേണ്ടി വരുമായിരുന്ന അവസ്ഥ കേട്ടു് ഞാനും ഞെട്ടുന്നു. ആലോചിയ്ക്കാന് വയ്യ.

    ReplyDelete
  59. പെരിങ്ങോടന്‍,

    ലിപിയുടെ വെട്ടിമുറിക്കല്‍ എന്ന സങ്കല്‍പം താത്വികമായിത്തന്നെ യൂണികോഡിലില്ല. ഭാഷയിലെ അടിസ്ഥാന അക്ഷരങ്ങളേയും അവയില്‍നിന്നും നിഷ്പദിച്ചുണ്ടാകുന്ന സംയുക്തങ്ങളേയും (ligatures) ഉള്‍ക്കൊള്ളുന്ന സമഗ്രലിപിസഞ്ചയത്തേയും ഒപ്പം ലോകഭാഷകളേയും സംരക്ഷിക്കുകയും പ്രയോഗക്ഷമമാക്കുകയും ചെയ്യുക എന്ന യൂണികോഡിന്റെ ലക്ഷ്യം സങ്കേതികം മാത്രമല്ല സാംസ്കാരികം കൂടിയാണ്‌. യൂണികോഡിന്റെയും ഓപ്പണ്‍ ടൈപ്പിന്റെയും വ്യാപനവും പ്രവര്‍ത്തകങ്ങളിലുള്ള സമന്വയീകരണങ്ങളും (embedding) നമ്മുടെ ഭാഷാ ഇന്‍സ്റ്റിറ്റ്യുട്ടിന്റേയും 'മലയാളതനിമ'ക്കാരുടേയും ക്ലിക്കിന്റേയും സ്വപ്നങ്ങളെ എന്നന്നേക്കുമായി കൊന്നിരിക്കുന്നു. ലിപി വിഷയത്തില്‍ അവരുടെ വെളിപാടുകള്‍ക്ക്‌ ഇനി യാതൊരു പ്രസക്തിയുമില്ല. തനതുലിപിയുടെ കാര്യത്തില്‍ രചനയുടെ 'കുത്തക'യും തകര്‍ന്നിരിക്കുന്നു. അഞ്ജലിയെപ്പോലെ ഒരു നൂറുപുഷ്പങ്ങള്‍ വിരിയട്ടെ

    എന്‍കോഡിങ്ങില്‍ നിലനില്‍ക്കുന്ന ചില അവ്യക്തത്കള്‍ മാത്രമാണ്‌ ശേഷിക്കുന്ന പ്രധാന പ്രശ്നം. എത്രയും വേഗം അവയ്ക്ക്‌ പരിഹാരം കാണ്ടെത്തുമെന്ന്‌ നമുക്ക്‌ പ്രത്യശിക്കാം. ആസ്ഥാന കമ്മറ്റികളില്‍ ഉപവിഷ്ഠരായിരിക്കുന്ന വെട്ടിമുറിയന്‍മാര്‍ക്കുനേരെ പക്ഷേ നമുക്കൊരു കണ്ണുവേണം.

    ഹുസൈന്‍, രചന

    ReplyDelete
  60. പെരിങ്ങോടന്‍,

    ലിപിയുടെ വെട്ടിമുറിക്കല്‍ എന്ന സങ്കല്‍പം താത്വികമായിത്തന്നെ യൂണികോഡിലില്ല. ഭാഷയിലെ അടിസ്ഥാന അക്ഷരങ്ങളേയും അവയില്‍നിന്നും നിഷ്പദിച്ചുണ്ടാകുന്ന സംയുക്തങ്ങളേയും (ligatures) ഉള്‍ക്കൊള്ളുന്ന സമഗ്രലിപിസഞ്ചയത്തേയും ഒപ്പം ലോകഭാഷകളേയും സംരക്ഷിക്കുകയും പ്രയോഗക്ഷമമാക്കുകയും ചെയ്യുക എന്ന യൂണികോഡിന്റെ ലക്ഷ്യം സങ്കേതികം മാത്രമല്ല സാംസ്കാരികം കൂടിയാണ്‌. യൂണികോഡിന്റെയും ഓപ്പണ്‍ ടൈപ്പിന്റെയും വ്യാപനവും പ്രവര്‍ത്തകങ്ങളിലുള്ള സമന്വയീകരണങ്ങളും (embedding) നമ്മുടെ ഭാഷാ ഇന്‍സ്റ്റിറ്റ്യുട്ടിന്റേയും 'മലയാളതനിമ'ക്കാരുടേയും 'ക്ലിക്കി'ന്റേയും സ്വപ്നങ്ങളെ എന്നന്നേക്കുമായി കൊന്നിരിക്കുന്നു. ലിപി വിഷയത്തില്‍ അവരുടെ വെളിപാടുകളുടെ അപഹാസ്യത അവരില്‍ ചിലര്‍ക്കെങ്കിലും ഇപ്പോള്‍ ബോദ്ധ്യമായിക്കാണും. തനതുലിപിയുടെ പുനരുദ്ധാരണവും വ്യാപനവും സ്വീകാര്യതയും 99ലെ രചനയുടെ സ്വപ്നത്തേക്കാള്‍ വേഗത്തില്‍ ഇന്ന്‌ സംഭവിച്ചുകൊണ്ടിരിക്കുന്നു. അഞ്ജലിയെപ്പോലെ നൂറുപുഷ്പങ്ങള്‍ വിരിയട്ടെ

    എന്‍കോഡിങ്ങില്‍ നിലനില്‍ക്കുന്ന ചില അവ്യക്തത്കള്‍ മാത്രമാണ്‌ ശേഷിക്കുന്ന പ്രധാന പ്രശ്നം. എത്രയും വേഗം അവയ്ക്ക്‌ പരിഹാരം കാണ്ടെത്തുമെന്ന്‌ നമുക്ക്‌ പ്രത്യാശിക്കാം. ആസ്ഥാന കമ്മറ്റികളില്‍ ഉപവിഷ്ഠരായിരിക്കുന്ന വെട്ടിമുറിയന്‍മാര്‍ക്കുനേരെ പക്ഷേ നമുക്കൊരു കണ്ണുവേണം.

    ഹുസൈന്‍, രചന

    ReplyDelete
  61. യൂണിക്കോഡില്‍ ചില്ലിനേക്കുറിച്ച് ഒരു ചര്‍ച്ചയുണ്ടായിരുന്നല്ലോ..
    ര്‍ കിട്ടാന്‍ ര ആണോ, റ ആണോ ബേസ് വേണ്ടതെന്ന്....
    ക്ര എന്നെഴുതാന്‍ ക ്ര മതിയെങ്കില്‍ കര്‍ എഴുതാനും കര് zwj പോരേ...
    അതായത് ര തന്നെ ബേസായി ഉപയോഗിച്ചുകൂടേ....

    ReplyDelete
  62. നല്ല ചോദ്യം. ഇതിനുള്ള ഉത്തരം വിശദമായി എറിക് മുള്ളര് ഇവിടെ എഴുതിയിരിക്കുന്നു. ചുരുക്കത്തില്‍ ഇങ്ങനെ പറയാം:

    * ഉച്ചാരണം നോക്കിയല്ല എഴുത്തിനുപയോഗിക്കുന്ന അടിസ്ഥാനഅക്ഷരം എന്താണെന്ന്` തീരുമാനിക്കുന്നത്‌. അതുകൊണ്ട് തന്നെ, ‘ക്ര’യും ‘കര്‍’ഉം തമ്മിലുള്ള റാല്‍മിനോവ് ഉദ്ദേശിച്ച സാമ്യം ഇല്ലാതെയാവുന്നു.
    * അടിസ്ഥാന അക്ഷരം ഏതാണെന്ന്` തീരുമാനിക്കാന്‍ ഭാഷാശാസ്ത്രപരമായ പ്രത്യേകതകളാണ് കണക്കിലെടുക്കാറ്‌ പലപ്പോഴും പറഞ്ഞ ഉദാഹരണം: അവര്‍ + അല്ല > അവരല്ല. അതില്‍ നിന്നും ‘ര്‍’ എന്നത് ‘ര’യുടെ മറ്റൊരു രൂപം ആണെന്ന്` തെളിയുന്നു. അതുപോലെ, ‘ഞായര്‍’ + ‘അല്ല’ > ഞായറല്ല എന്നതില്‍ നിന്നും ‘ര്‍’ എന്നത്‌ ‘റ’യുടെ രൂപവും ആണെന്ന്‌ വരുന്നു.

    ReplyDelete
  63. ഞാനുദ്ദേശിച്ചത് ഒരു consensus ലേക്ക് എത്തുന്നതിലേക്കുള്ള സാദ്ധ്യതയേയാണ്. ഈ പ്രശ്നം അനന്തമായി തുടരുന്നതില്‍ അര്‍ത്ഥമില്ല. മാത്രമല്ല ബെന്നിയാണെന്ന് തോന്നുന്നു, മുമ്പ് സൂചിപ്പിച്ചത് പോലെ മറ്റ് ദ്രാവിഡ ഭാഷകളിലും ര തന്നെയാണ് ബേസ്..
    അല്ലെങ്കില്‍ ചില്ലുകള്‍ വേറെ എന്‍കോഡ് ചെയ്യണം. അതില്‍ എന്താ ഇത്ര തര്‍ക്കം!!!

    ReplyDelete
  64. എന്ത് കൊണ്ട് ചില്ല് എന്‍കോഡ് ചെയ്യുന്നില്ല...

    അവന്‍ അല്ല -> അവനല്ല ആയതു കൊണ്ടാണോ.....
    അങ്ങനെയെങ്കില്‍ ...
    കരി ഇല്ല -> കരിയില്ല ആവുന്നതോ...

    മത്സരം, മത്സ്യം, ഭീഭത്സം = മല്‍സരം, മല്‍സ്യം, ഭീഭല്‍സം !!!
    ത = ല !!!

    പിന്നെ അര്‍ത്ഥവ്യത്യാസങ്ങള്‍!!!..
    നല്ലതാളി, കാതിലോല !!! കേട്ടിട്ടില്ലേ...

    കരിയില്ല എന്നെഴുതിയാല്‍ കരി(ആന, കാര്‍ബണ്‍) ഇല്ലെന്നാണോ കരിയുകയില്ലെന്നാണോ?
    അര്‍ത്ഥം സാന്ദര്‍ഭികമാണ്.

    അത് കൊണ്ടുതന്നെ ഭാഷയുടെ മുകളില്‍ അധികം കെട്ടിമറിയാതെ ചില്ല് എന്‍കോഡ് ചെയ്യുന്നതാവും ഉചിതം...

    ReplyDelete
  65. എന്ത് കൊണ്ട് ചില്ല് എന്കോഡ് ചെയ്യുന്നില്ല...
    അവന് അല്ല -> അവനല്ല ആയതു കൊണ്ടാണോ.....
    അങ്ങനെയെങ്കില് ...
    കരി ഇല്ല -> കരിയില്ല ആവുന്നതോ...

    ഇവിടെ രണ്ട് സ്വരങ്ങള്‍ തമ്മില്‍ ചേരുന്നുണ്ട്‌. പക്ഷെ, എന്താണ് തെളിയിക്കാന്‍ ശ്രമിക്കുന്നത്‌? അതിനുമുമ്പുള്ള ഉദാഹരണത്തില്‍ സ്വരമില്ലാത്ത ഒരു വ്യഞ്ജനവും ‘അ’യും തമ്മില്‍ ചേരുമ്പോള്‍ ആ വ്യഞ്ജനം അതിന്റെ ‘അ’ ചേര്‍ന്ന സ്വാഭാവികരൂപത്തില്‍ ആവുന്നു. അതില്‍ നിന്ന്‌ സ്വരമില്ലാത്ത രൂപത്തിന്റെ സ്വാഭാവികരൂപം ഏതാണെന്നും വെളിപ്പെടുന്നു.

    മത്സരം, മത്സ്യം, ഭീഭത്സം = മല്സരം, മല്സ്യം, ഭീഭല്സം !!!

    ഉവ്വ്‌. ‘ല’യുടേയും ‘ത’യുടേയും ചിലായി ‘ല്‍’ മലയാളികള്‍ ഉപയോഗിക്കുന്നുണ്ട്‌.


    പിന്നെ അര്ത്ഥവ്യത്യാസങ്ങള്!!!..
    നല്ലതാളി, കാതിലോല !!! കേട്ടിട്ടില്ലേ...
    കരിയില്ല എന്നെഴുതിയാല് കരി(ആന, കാര്ബണ്) ഇല്ലെന്നാണോ കരിയുകയില്ലെന്നാണോ?

    ഒരു വാക്കിന് വിവിധ അര്‍ഥങ്ങള്‍ ഉണ്ടാവാം; അത്‌ പലരീതിയില്‍ വായിക്കപ്പെടാം (eg: read). എന്നാല്‍ അതൊന്നും യുണീക്കോഡിന് വിഷയമല്ല. ഇവിടെ എഴുത്തിലുള്ള വ്യത്യാസങ്ങള്‍ മാത്രമേ പഠിക്കുന്നുള്ളൂ.

    ReplyDelete
  66. അതാണു് റൂള്‍ എന്നറിയാതെ എഴുതിയതാണ്.


    ചില്ല് ചില്ലായി എന്‍കോഡ് ചെയ്താല്‍ എന്ത് പറ്റും?
    (അതാണ് സിബുവിന്റെ നിലപാട് എന്ന് തോന്നുന്നു)

    ഓ.ടോ സിബു എന്റെ കമന്റ് ക്വോട്ട് ചെയ്തപ്പോള്‍ ZWJ എവിടെപ്പോയി? മാത്രമല്ല സിബുവിന്റെ സൈറ്റുകള്‍ ചില്ലുകള്‍ കാണുന്നില്ല..(Windows XP SP2, FireFox 1.5) It is okay in IE. But my sites and many other sites are showing properly in both..

    Also I had put a comment regarding reph in cibu's blog.. May be another foolishness.

    ReplyDelete
  67. ബെന്നി,

    തമിഴ്‌ പുലവരുടെ ലിപിമാലയെക്കുറിച്ചുള്ള പരാമര്‍ശം ഡോ. പുതുശ്ശേരി രാമചന്ദ്രനെ ഉദ്ധരിച്ചതാണ്‌. ദ്രാവിഡ ലിപികളില്‍ അദ്ദേഹം ആഴത്തില്‍ ഗവേഷണം ചെയ്തിട്ടുണ്ട്‌.

    ReplyDelete
  68. ഞാനിപ്പഴും ഒരു കുട്ടിയാണെന്നാണ് എന്റെ വിചാരം.. അത്കൊണ്ടു് തന്നെ എന്റെ സംശയവും തീരില്ല...

    ദയവായി ഇവിടെ കാണൂ

    ReplyDelete
  69. റാല്‍മിനോവ് പറഞ്ഞത്‌ കാര്യം. ZWJ, ZWNJ എന്നിവ ഫോര്‍മാറ്റ് കണ്ട്രോള്‍ ചെയ്യുന്നവയുടെ ഗണത്തിലാണ് പെടുക. ഫോര്‍മാറ്റ് എന്നാല്‍ ബോള്‍ഡ്, ഇറ്റാലിക്സ് എന്നിവ. ഇത്തരം ക്യാരക്റ്റേഴ്സ് എടുത്തുവയ്ക്കണോ വേണ്ടയോ എന്ന്‌ എവിടേയ്ക്കാണോ കോപ്പി ചെയ്യുന്നത്‌ ആ അപ്ലിക്കേഷന്‍ തീരുമാനിക്കും. വേഡില്‍ നിന്നും നോട്ട്പാഡിലേയ്ക്ക്‌ കോപ്പി ചെയ്യുമ്പോള്‍ അത്‌ ഫോര്‍മാറ്റ് കണ്ട്രോള്‍ ഒക്കെ എടുത്തുകളയുമായിരിക്കണം.

    ചില്ലുകള്‍ എന്‍‌കോഡ് ചെയ്യപ്പെടുവാന്‍ ഈ ഒരു പ്രശ്നം ഒരു വലിയ കാരണമാണ്. ചില്ലുകള്‍ സ്റ്റാന്റേഡിലെത്താനുള്ള ഒരു കടമ്പ(വോട്ടിങ്)കൂടി വിജയകരമായി പൂര്‍ത്തിയാക്കുന്നു എന്ന മെയില്‍ കഴിഞ്ഞ ദിവസം ഇന്‍ഡിക് ലിസ്റ്റില്‍ ഉണ്ടായിരുന്നു.

    ഓഫ്: കമന്റില്‍ എഴുതുന്നവരുടെ ഫോട്ടോ ഡിസ്പ്ലേ ചെയ്യാനുള്ള ഓപ്ഷന്‍ എടുത്തു കളയാമോ. അത്‌ പേജ് ലോഡ് ചെയ്യാന്‍ വല്ലാതെ താമസമുണ്ടാക്കുന്നു.

    ReplyDelete
  70. സിബു:
    ZWJ, ZWNJ എന്നിവ ഫോര്‍മാറ്റ് കണ്ട്രോള്‍ ചെയ്യുന്നവയുടെ ഗണത്തിലാണ് പെടുക

    ZWNJ എന്നത് ബോള്‍ഡ്, ഇറ്റാലിക്സ് എന്നിവ പോലെയാണോ?.syllable പിരിക്കുവാന്‍ ആണ് ZWNJ പ്രയോജനപ്പെടുന്നത്.അപ്ലിക്കേഷനുകള്‍ ഇതിനെ അവഗണിക്കുകയാണെങ്കില്‍ പിന്നെ ഇതിന്റെ ആവശ്യമെന്താണ്?.അപ്ലിക്കേഷനുകള്‍ ആണ് തിരുത്തപ്പെടേണ്ടത്.ഇത്തരം control charactersനെ റെന്‍ഡറിങ്ങിനു മാത്രമായി പരിമിതപ്പെടുത്തുന്നത് ശരിയാണോ? എന്റെ അഭിപ്രായത്തില്‍ space എപ്രകാരം വാക്കുകളെ പിരിക്കുന്നുവോ ഏതാണ്ട് അതുപോലെയാണ് ZWNJ syllableനെ പിരിക്കുന്നത്.ഇങ്ങനെ പിരിക്കുന്നത് ഒഴിവാക്കാനാകാത്ത പല സന്ദര്‍ഭങ്ങളുമുണ്ട്(ഉദാ: അറബിയിലുള്ള ചില വാക്കുകള്‍ മലയാളത്തില്‍ എഴുതുമ്പോള്‍).

    ഞാന്‍ നേരത്തെ സൂചിപ്പിച്ച പോലെ ചില്ല് എന്‍കോഡ് ചെയ്യുന്നത്(unicode philosophyക്ക് എതിരാണെങ്കിലും) ഒരു സൌകര്യം ആണ്(sorting പ്രശ്നമാകില്ലെങ്കില്‍).അതേസമയം ZWNJ ഒരു ആവശ്യകത ആണെങ്കില്‍ ZWJ കൂടി ആകാവുന്നതാണ്.അങ്ങനെ വരുമ്പോള്‍ ചില്ല് എന്‍കോഡ് ചെയ്യുന്നത് redundant ആകും.

    അതുകൊണ്ട് ZWJ,ZWNJ എന്നിവയ്ക്ക് മറ്റു control charactersല്‍ നിന്ന് ഭിന്നമായി, പ്രത്യേക പരിഗണന നല്‍കേണ്ടതുണ്ട്.

    ReplyDelete
  71. http://www.unicode.org/charts/PDF/U2000.pdf
    ഈ രേഖയിലെ മൂന്നാംപേജില്‍ zwj & zwnj-കള്‍ format characters എന്നാണു് യുണിക്കോഡ് നിര്‍വ്വചിച്ചിരിക്കുന്നതു്. അവകളുടെ സ്വഭാവം മാറ്റാന്‍ വയ്യാത്തതുകൊണ്ടാണു് യുണിക്കോഡ് ചില്ലുകള്‍ എന്‍കോഡു ചെയ്യാന്‍ തീരുമാനിച്ചതു്.

    ReplyDelete
  72. സുറുമ, ZW(N)J ഒരു ഫോര്‍മാറ്റ് കാരക്റ്ററാണെന്നുള്ളത്‌ കെവിന്‍ കാണിച്ചു തന്നുവല്ലോ.

    സുറുമ ചിന്തിച്ച പോലെ ചിന്തിച്ച്‌ ഗണേശന്‍ (ഒരു തമിഴന്‍) ഒരു പ്രപ്പോസല്‍ കണ്‍സോര്‍ഷ്യത്തിനു മുന്നില്‍ വച്ചിരുന്നു. ZW(N)J ഫോര്‍മാറ്റിങ് അല്ലാത്ത കാര്യങ്ങള്‍ക്ക്‌ stable അല്ലാത്തതിനാല്‍ (ആ ഓപ്പറേഷനുകളില്‍ എടുത്ത്‌ കളയപ്പെടുമോ ഇല്ലയോ എന്ന്‌ ഉറപ്പില്ലാത്തതിനാല്‍), CHILLU SIGN എന്ന ഒരു പുതിയ അക്ഷരം കൊണ്ടുവന്ന്‌ ചില്ലുകളുടെ പ്രശ്നം സോള്‍വ് ചെയ്യാം എന്ന്‌. അതിനെ പറ്റിയുള്ള എന്റെ പരാതികള്‍ ഇവിടെ.

    ഓട്ടോ: ആരെങ്കിലും ബൂലോഗക്ലബ്ബില്‍ കമന്റിന്റെ കൂടെ ഫോട്ടോ ഡിസ്പ്ലേ ചെയ്യുന്നത്‌ എടുത്തുമാറ്റിയാല്‍ വലിയ ഉപകാരം.

    ReplyDelete
  73. Cibu:"ഓട്ടോ: ആരെങ്കിലും ബൂലോഗക്ലബ്ബില്‍ കമന്റിന്റെ കൂടെ ഫോട്ടോ ഡിസ്പ്ലേ ചെയ്യുന്നത്‌ എടുത്തുമാറ്റിയാല്‍ വലിയ ഉപകാരം. "

    ഇതില്‍ എവിടെയാണ് സിബൂ ഫോട്ടോകള്‍ വരുന്നത്? ഇന്നാളും എഴുതിയതു കണ്ട് ഞാന്‍ അരിച്ചുപെറുക്കി നോക്കിയിരുന്നു.
    ഇപ്പോഴത്തെ settings വെച്ച് profile images കമന്റുകളുടെ കൂടെ വരില്ലല്ലോ!

    :(?

    ReplyDelete
  74. എന്തത്ഭുതം! ഇപ്പോള്‍ ഫോട്ടോകളില്ല. പെരിങ്ങോടരുടെ മുഖത്തിനു തൊട്ടടുത്താണ് ഞാനാകമന്റിട്ടതെന്നുറപ്പാണ്. എന്തായാലും ഇപ്പോള്‍ പ്രശ്നങ്ങളില്ല. നന്നായി.

    ReplyDelete
  75. സിബൂ,
    സിബു പറയുന്ന പോലെയെങ്കില്‍, 'ര','റ' എന്നവ, ചില്ലിന്റെ കാര്യത്തിലെന്നപോലെ, post base ആയി വരുമ്പോഴും പ്രശ്നങ്ങള്‍ ഉണ്ടാകുന്നില്ലേ?അതുപോലെ 'ല', 'ള' എന്നിവയും.ligature formationല്‍ 'ക്‌ലബ്ബ്' ആണോ 'ക്ളബ്ബ്' ആണോ ശരി?ഇതോക്കെ കാണിക്കുന്നത് യൂണികോഡിന്റെ പരിമിതികളെയാണ്.

    സിലബ്ള്‍ പിരിക്കുന്ന കാര്യത്തെപ്പറ്റി സിബുവിന്റെ അഭിപ്രായം അറിഞ്ഞില്ല.

    ReplyDelete
  76. സുറുമ, സിലബിള്‍ ഒരു ഫൊണറ്റിക് പ്രോപര്‍ട്ടി ആണ്. എഴുത്തില്‍ അതിന് സമാനമായ കാര്യമാണ് ക്ലസ്റ്റര്‍ (രണ്ടും ഒന്നല്ല). ഒരു ക്ലസ്റ്ററിന്റെ തന്നെ, അര്‍ഥവ്യത്യാസമില്ലാത്ത രണ്ട്‌ രൂപങ്ങളെ കാണിക്കാന്‍ ഫോര്‍മാറ്റ് ക്യാരക്റ്റേഴ്സ് ഉപയോഗിക്കാം.

    എല്ലാ അപ്ലിക്കേഷനുകള്‍നും ഫോര്‍മാറ്റ് പ്രിസര്‍വ് ചെയേണ്ട ആവശ്യമില്ല. ഉദാഹരണത്തിന് ഗൂഗിളിന്റെ സേര്‍ച്ച് ഡാറ്റാബേസ്. മലയാളത്തിലൊരുദാഹരണമായി ‘ശബ്ദം’ ‘ശബ്‌‌ദം’ എന്നീ രണ്ട്‌ രൂപങ്ങളെ എടുക്കാം. ഇവിടെ അര്‍ഥവ്യത്യാസമില്ല; രൂപവ്യത്യാസമേ ഉള്ളൂ. അതിനാല്‍ ഇവ തമ്മില്‍ വേര്‍തിരിക്കുന്നത്‌ ഫോര്‍മാറ്റിംഗ് ആവണം - ‘aflame'-ഉം ‘aflame'-ഉം പോലെ.

    ഇത്‌ സ്പേസ് വാക്കുകളെ പിരിക്കും പോലെ അല്ല - സ്പേസില്‍ മാത്രം വ്യത്യാസമുള്ള ‘a flame'-ഉം 'aflame'-ഉം തമ്മില്‍ അര്‍ഥവ്യത്യാസമുണ്ടാവുന്നുണ്ടല്ലോ.

    ZW(N)J ഉപയോഗിച്ചാല്‍ അര്‍ഥവ്യത്യാസം ഒരിക്കലും ഉണ്ടാവാന്‍ പാടില്ലാത്തതാണ്. അര്‍ഥവ്യത്യാസമുണ്ടാക്കുന്ന അറബി ഉദാഹരണങ്ങള്‍ എഴുതാമോ...

    ‘പ്ല’-യില്‍ ‘ള’ ആണോ ‘ല’ ആണോ എന്നത്‌ ഒരു ചോദ്യമാണ്. ഇപ്പോള്‍ യുണിക്കോഡില്‍ അത്‌ ‘ല’ തന്നെയാണ്; ‘ള’ അല്ല. മറിച്ചാണ് എന്ന് ഉച്ചാരണം വച്ച്‌ തോന്നുമെങ്കിലും ഉച്ചാരണം എഴുത്തിന്റെ കാര്യങ്ങള്‍ തെളിയിക്കാന്‍ ഉപയോഗിക്കാവുന്ന ഒന്നല്ല. അതുകൊണ്ട്‌, ഉച്ചാരണം ഉപയോഗിക്കാതെ അതില്‍ ഏതാണെന്ന്‌ തെളിയിക്കാന്‍ നോക്കണം.

    ‘പ്ലാവ്’ എന്നവാക്ക്‌ ‘പിലാവ്’ എന്നതില്‍ നിന്നായതുകൊണ്ട്‌, അവിടെ ‘ല’ ആണ് എന്ന്‌ സമര്‍ഥിക്കാന്‍ എളുപ്പമാണ്. തിരിച്ച്‌ പറയാന്‍ ഞാന്‍ ഉദാഹരണമൊന്നും കണ്ടില്ല. കൂടാതെ, മദ്ധ്യമങ്ങള്‍ക്ക്‌ ചിഹ്നങ്ങള്‍ ഉപയോഗിക്കുന്നത്‌ ഗ്രന്ഥലിപി രീതിയാണ്. അതുകൊണ്ടുതന്നെ, (പിലാവ്, പ്ലാവ്) പോലെ, ‘ള’ ഉപയോഗിച്ചുള്ള ജോഡികള്‍ കണ്ടെത്തുക ദുഷ്ക്കരമായിട്ടാണനുഭവം. കിട്ടിയാല്‍ അറിയാന്‍ വളരെ താത്പര്യമുണ്ട്‌.

    ReplyDelete
  77. മറ്റൊരു കര്‍മ്മയോഗിയുടെ കമന്റുകള്‍ ഇവിടെ വായിക്കാം.
    http://paivakil.blogspot.com/2006/10/chillu-encoding.html
    -സു-

    ReplyDelete
  78. This comment has been removed by the author.

    ReplyDelete
  79. കുളംകലക്കല്‍ നടത്തുന്നത് ആദ്യമാറ്റിട്ടൊന്നുമല്ല

    ലോനപ്പേട്ടന്‍ എന്താ ഉദ്ദേശിച്ചതു്? ഇവിടെ ആരു കുളം കലക്കിയെന്നാ?

    ReplyDelete
  80. ലോനപ്പേട്ടന്‍ കഥയറിയാതെ ആട്ടം കണ്ട് അഭിപ്രായം പറഞ്ഞതാണെന്ന് തോന്നുന്നു.

    ReplyDelete
  81. സിബൂ,
    കൂട്ടക്ഷരം പിരിച്ചെഴുതുന്ന കാര്യമല്ല ഉദ്ദേശിച്ചത്.അതുകൊണ്ട് ‘ശബ്ദം’, ‘ശബ്‌‌ദം’ എന്നീ ഉദാഹരണങ്ങള്‍ ഇവിടെ പ്രസക്തമാണെന്നു തോന്നുന്നില്ല.മറ്റു പല സന്ദര്‍ഭങ്ങളിലും കൂട്ടക്ഷരം ഉണ്ടാകുന്നത് ഒഴിവാക്കേണ്ടതുണ്ട്.

    ഉദാഹരണത്തിന്,

    1.പേരുകള്‍ എഴുതുമ്പോള്‍: സ്വന്തം പേര് എങ്ങിനെ എഴുതണമെന്നത് ഓരോ വ്യക്തിയുടെയും താല്പര്യമാണ്.'നിതീഷ്‌കുമാര്‍' എന്നത് 'നിതീഷ്കുമാര്‍' ആകുന്നത്, 'ശ്രേയാംസ്‌കുമാര്‍' 'ശ്രേയാംസ്കുമാര്‍' ആകുന്നത്, അല്ലെങ്കില്‍ 'ജോസ്‌തോമസ്' 'ജോസ്തോമസ്' ആകുന്നത് അതാതു വ്യക്തികള്‍ സഹിക്കുമോ? തന്റെ പേര് എങ്ങനെ കാണും/കാണിക്കും എന്ന് ഉറപ്പില്ലാത്ത ഒരു വ്യവസ്ഥയെ എത്രപേര്‍ ഉള്‍ക്കൊള്ളും?

    2.അന്യഭാഷാ പദങ്ങള്‍ മലയാളത്തില്‍ എഴുതുമ്പോള്‍: അറബിഭാഷയുടെ ഉച്ചാരണരീതി ഉദ്ദേശിച്ചാണ് നേരത്തെ അതെപ്പറ്റി സൂചിപ്പിച്ചത്.അറബിഭാഷ അറിയാത്തതുകൊണ്ട് ഉദാഹരണങ്ങള്‍ പറയാന്‍ വിഷമം.('മഗ്‌രിബ്' എന്നൊക്കെ എഴുതിക്കണ്ടിട്ടുണ്ട്.)

    3.ഡിക്ഷ്ണറികളില്‍ ഉച്ചാരണം എഴുതുമ്പോള്‍: അന്തരിച്ച എം. കൃഷ്ണന്‍നായരെ(സാഹിത്യ വാരഫലം)യും ഓര്‍ക്കാം.

    4.കഥകളിലും മറ്റും പ്രാദേശിക വായ്മൊഴികള്‍ അവതരിപ്പിക്കേണ്ടി വരുമ്പോള്‍.

    ഈ പറഞ്ഞതെല്ലാം പ്രധാനമായും rendering പ്രശ്നങ്ങളാണ്.ടൈപ്‌റൈറ്റര്‍ മലയാളം അരോചകം ആകുന്നതിനു കാരണം അത് കൂട്ടക്ഷരങ്ങളെ വെട്ടിമുറിക്കുന്നതുകൊണ്ടാണ്.അല്ലാതെ അര്‍ത്ഥവ്യത്യാസം കൊണ്ടല്ലല്ലോ.ഇതേ വിചാരമാണ് അനാവശ്യമായി കൂട്ടക്ഷരം കാണുമ്പോഴും ഉണ്ടാകുന്നത്.കാരണം വാക്കുകള്‍ക്ക് ഇമേജിന്റെ ഒരു തലം കൂടിയുണ്ട്.

    ZW(N)J യെ എന്തുപേരുചൊല്ലി വിളിച്ചാലും വേണ്ടില്ല; അവയുടെ നിര്‍വ്വഹിക്കുന്ന ധര്‍മ്മമാണ് പ്രധാനം.

    മലയാളം ഫോണ്ടുകള്‍ക്ക് സ്റ്റാന്‍ഡേര്‍ഡൈസേഷന്‍ ആവശ്യമാണ്.പല ഫോണ്ടുകളിലും ര/റ ല/ള എന്നിവ തെറ്റായ രീതിയിലാണ് കൂട്ടക്ഷരം ഉണ്ടാക്കാന്‍ ഉപയോഗിച്ചിരിക്കുന്നത്.സിബു പറഞ്ഞ 'ദൃക്‌സാക്ഷി' പ്രശ്നവും('ക'യുടെ ചില്ല്) ഇതുകൊണ്ട് പരിഹരിക്കാം.

    (തുലാവര്‍ഷത്തിലെ മിന്നലാടിയ മദര്‍ബോര്‍ഡ് മാറ്റാന്‍ വൈകിയതുകൊണ്ട് കമന്റുകള്‍ കാണാനും മറുപടി എഴുതാനും വൈകി.ദയവായി പൊറുക്കുക.)

    ReplyDelete
  82. ZW(N)J ഫോര്‍മാറ്റ് ക്യാരക്ടേഴ്സ് പ്രിസേര്‍വ് ചെയ്യണം എന്ന വാദത്തില്‍ എന്തെങ്കിലും ദോഷമുണ്ടോ സിബു?

    ReplyDelete
  83. സുറുമയോട് ഒരു ചോദ്യം, ഏറെ നാളായി ചോദിക്കണമെന്നു കരുതിയതാണ്:

    പാന്‍‌ഗോ പാച്ചുകള്‍ ഗ്നോമിന് സബ്മിറ്റ് ചെയ്തിട്ടുണ്ടോ? എങ്കില്‍, അവ അപസ്‌ട്രീം ആകാത്തത് എന്തേ ഇനിയും?

    ReplyDelete
  84. ഏവൂരാന്‍,
    പാന്‍‌ഗോ പാച്ചുകള്‍ സബ്മിറ്റ് ചെയ്തിട്ടില്ല.കാരണം, 'വ', 'യ' എന്നീ അക്ഷരങ്ങളുടെ അര്‍ദ്ധരൂപങ്ങള്‍ വ്യത്യസ്തരീതിയിലാണ് substitution ചെയ്തിരിക്കുന്നത്.
    നിലവിലുള്ള രീതിയില്‍ 'വ' യുടെ പകുതി 'വ' + '്' എന്നാണ് ടേബിളില്‍.ഉദാഹരണത്തിന് 'ക്' + 'വ' എന്ന് അടിക്കുമ്പോള്‍ shaper engine അതിനെ 'ക' + 'വ്' എന്നാക്കുകയും 'വ്' -ന് പകരം നേരത്തെ പറഞ്ഞ 'വ' + '്' -ന്റെ ligature സ്ഥാപിക്കുകയും 'ക്വ' എന്ന് കാണുകയും ചെയ്യുന്നു.ഇത് കൂട്ടക്ഷരത്തില്‍ 'വ' രണ്ടാമതായി വരുമ്പോള്‍ മാത്രമേ സംഭവിക്കുുകയുള്ളൂ.

    ഇതിനു വിപരീതമായി 'വ' യുടെ പകുതി post-base ആക്കാതെ '്' + 'വ' എന്ന് വെറും കൂട്ടക്ഷരം ആയി കൈകാര്യം ചെയ്യുന്ന രീതി ഉപയോഗിക്കുന്ന ഫോണ്ടുകള്‍ക്കു വേണ്ടിയാണ് പ്രധാനമായും പാച്ച് ഉണ്ടാക്കിയത്.'രചന'യുടെ പഴയ വേര്‍ഷന്‍, FreeSerif(ഉബൂണ്ടുവിലുള്ളത്) എന്നിവ ഈ രീതിയാണ് ഉപയോഗിക്കുന്നത്.

    rendering-നു വേണ്ടി തട്ടിക്കൂട്ടിയതായതുകൊണ്ട് പാച്ചുകള്‍ സബ്മിറ്റ് ചെയ്യേണ്ട എന്നുവച്ചു.

    ReplyDelete
  85. സുറുമ,

    വ്യക്തമാക്കിയതിനു നന്ദി.

    അല്പ സ്വല്പം അപൂര്‍ണ്ണമെങ്കിലും ഇവ സബ്മിറ്റ് ചെയ്യ‌പ്പെടുകയും അപ്‌സ്ട്രീം ആവുകയും ചെയ്തിരുന്നുവെങ്കില്‍ നന്നാീയിരുന്നു.
    റ്

    താങ്കള്‍ ചൂണ്ടിക്കാട്ടിയ പ്രശ്നം ഉണ്ടാവുമെങ്കിലും, ഉള്ളതിനക്കാള്‍ മെച്ചപ്പെട്ട് രീതിയില്‍ റെന്‍ഡറിംഗ് ലഭിക്കും എന്നതിനാലാുണു് . something is better than nothing എന്നല്ലേ? Of course, nothing is better than nonsense, പക്ഷെ ഇവിടെ അങ്ങിനെയല്ലല്ലോ കാര്യങ്ങള്‍.

    മറ്റു പ്രശ്നങ്ങളെല്ലാം തീരുമ്പോള്‍ ഒരു റെവ് അപ്പ് ചെയ്താല്‍ മതിയല്ലോ...

    64 ബിറ്റ് ലിനക്സിനെക്കൊണ്ട് നേരെ ചൊവ്വേ മലയാളം റെന്‍ഡര്‍ ചെയ്യിക്കാന്‍ ഒരു ദിവസം ശ്രമിച്ചിരുന്നു -- സിസ്റ്റം വേണമെന്നതിനാല്‍, 32-ലെക്ക് ഒതുങ്ങി.

    em64t, amd64bit തുടങ്ങിയവയ്ക്കു വേണ്ടി .so ഫയല്‍ കമ്പയില്‍ ചെയ്യാന്‍ എനിക്കു സൌകര്യമുണ്ട്. താത്പര്യമുണ്ടെങ്കില്‍ സദയം അറിയിക്കുക.

    ReplyDelete
  86. സുറുമ പറഞ്ഞ പ്രശ്നം ഇപ്പോഴത്തെ യുണിക്കോഡ് ഡിസൈനില്‍ സോള്‍വ് ചെയ്യാനാവാത്ത ഒന്നാണെന്ന്‌ ഞാന്‍ പറഞ്ഞിരുന്നുവല്ലോ... ZW(N)J പ്രിസര്‍വ് ചെയ്തതുകൊണ്ട്‌ മാത്രം സംഗതി രക്ഷപ്പെടില്ല. ഉദാഹരണത്തിന്‌ പുതിയലിപി ഫോണ്ടില്‍ എഴുതുന്ന എഴുത്തുകാരനേയും പഴയലിപിയുപയോഗിക്കുന്ന വായനക്കാരനേയും സങ്കല്പിക്കൂ. പുതിയലിപിക്കാരന്‍ ‘ജോസ്‌തോമാസ്/ദൃക്‌‌സാക്ഷി’ എഴുതുമ്പോള്‍ zwnj ഇടാതിരിക്കാനും മതി. അതിടാതെ തന്നെ, അയാല്‍ ടെക്സ്റ്റ് തെറ്റില്ലാതെയാണ് കാണുക. എന്നാല്‍ വായനക്കാരന്‍ ഇതിനെ സുറുമ പറഞ്ഞ പ്രശ്നങ്ങളോടെ തന്നെയാവും വായിക്കുക.

    പഴയലിപിയും പുതിയലിപിയും വേര്‍പെടുത്തുക എന്നൊരു കടുംകയ്യല്ലാതെ വേറേ ഒന്നും എന്റെ മനസ്സിലൊരുപായമായി തെളിയുന്നില്ല.

    ReplyDelete
  87. പഴയലിപിയും പുതിയലിപിയും വേര്‍പെടുത്തുക എന്നൊരു കടുംകയ്യല്ലാതെ വേറേ ഒന്നും എന്റെ മനസ്സിലൊരുപായമായി തെളിയുന്നില്ല.

    ഇവിടെ ഏത് പ്രശ്നമാണ് പുതിയലിപിയും പഴയലിപിയും വേര്‍പെടുത്തുന്നതിലൂടെ പരിഹരിക്കപ്പെടുന്നത്?

    വേര്‍പെടുത്തല്‍ എന്നതു കൊണ്ട് അര്‍ത്ഥമാക്കുന്നത് പുതിയലിപിയുടെയും പരമ്പരാഗതലിപിയുടേയും എഴുത്തു സമ്പ്രദായങ്ങള്‍ നിലനിറുത്തണം എന്നോ ഇവ കലര്‍ത്തി ഉപയോഗിക്കണമെന്നോ എന്നത് വ്യക്തമാകുന്നില്ല.

    പുതിയലിപിക്കായാലും പഴയലിപിക്കായാലും യൂനിക്കോഡിന്റെ കോഡ് പേജ് ഒന്നു തന്നെയല്ലേ. ഇതിന് വെവ്വേറെ കോഡ്‍പേജ് വേണമെന്നല്ല വാദം എന്നു വിശ്വസിക്കുന്നു. എന്നാല്‍ രണ്ട് റെണ്ടറിംഗ് എന്‍ജിനുകള്‍ വേണമെന്നാണോ?

    ചില്ലുകള്‍ എന്‍കോഡ് ചെയ്യുന്നതിലൂടെ പരിഹരിക്കപ്പെടാവുന്നതല്ല മലയാളത്തിന്റെ പ്രശ്നങ്ങള്‍ എന്ന് ചിത്രജകുമാര്‍ ചൂണ്ടിക്കാണിച്ചത് ശരിയെന്നാണോ സിബു പറഞ്ഞു കൊണ്ടുവരുന്നത്?

    ReplyDelete
  88. "പഴയലിപിയും പുതിയലിപിയും വേര്‍പെടുത്തുക എന്നൊരു കടുംകയ്യല്ലാതെ വേറേ ഒന്നും എന്റെ മനസ്സിലൊരുപായമായി തെളിയുന്നില്ല.

    ഇവിടെ ഏത് പ്രശ്നമാണ് പുതിയലിപിയും പഴയലിപിയും വേര്‍പെടുത്തുന്നതിലൂടെ പരിഹരിക്കപ്പെടുന്നത്?"

    തൊട്ടുമുമ്പ്‌ സുറുമ പറഞ്ഞ, ഞാന്‍ ‘ദൃക്‌സാക്ഷി’ പ്രശ്നം എന്ന്‌ വിളിച്ചുപോന്ന ആ പ്രശ്നം തന്നെ.

    “വേര്‍പെടുത്തല്‍ എന്നതു കൊണ്ട് അര്‍ത്ഥമാക്കുന്നത് പുതിയലിപിയുടെയും പരമ്പരാഗതലിപിയുടേയും എഴുത്തു സമ്പ്രദായങ്ങള്‍ നിലനിറുത്തണം എന്നോ ഇവ കലര്‍ത്തി ഉപയോഗിക്കണമെന്നോ എന്നത് വ്യക്തമാകുന്നില്ല.

    പുതിയലിപിക്കായാലും പഴയലിപിക്കായാലും യൂനിക്കോഡിന്റെ കോഡ് പേജ് ഒന്നു തന്നെയല്ലേ. ഇതിന് വെവ്വേറെ കോഡ്‍പേജ് വേണമെന്നല്ല വാദം എന്നു വിശ്വസിക്കുന്നു. എന്നാല്‍ രണ്ട് റെണ്ടറിംഗ് എന്‍ജിനുകള്‍ വേണമെന്നാണോ?“

    അല്ല. എലിയെ കൊല്ലാന്‍ ഇല്ലം ചുടണമെന്നെനിക്കഭിപ്രായമില്ല. എന്നാല്‍ എലിയെകൊല്ലാന്‍ വേരെ വഴിയൊന്നും എനിക്കറിഞ്ഞും കൂടാ. ഇനി ഇല്ലം ചുടേണ്ടതിങ്ങനെയാണ്:

    കൂട്ടക്ഷരം വേണം എന്ന്‌ എന്‍‌കോഡിംഗ് റിക്വസ്റ്റ് ചെയ്യുമ്പോള്‍ ഫോണ്ടില്‍ കൂട്ടക്ഷരമില്ലെങ്കില്‍ ഇപ്പോള്‍ ആകൂട്ടക്ഷരത്തിന്റെ ഘടകങ്ങള്‍ ചന്ദ്രക്കലയിട്ട്‌ പിരിച്ചെഴുതുകയാണ് ചെയ്യുന്നത്‌. അതിന് പകരം ‘glyph not available' ചിഹ്നം (സാധാരണ ഒരു ചതുരക്കട്ട) റെന്‍ഡറിംഗ് എഞ്ചിന്‍ കാണിക്കണം. വിരാമ കൂട്ടക്ഷരം ഉണ്ടാക്കാന്‍ ഉപയോഗിക്കുകയാണെങ്കില്‍, ചന്ദ്രക്കല വേറെയായി എന്‍‌കോഡ് ചെയ്യേണ്ടതുമുണ്ട്‌. ഉ-കാരം ചേര്‍ന്ന കൂട്ടക്ഷരം ഉണ്ടാക്കാനും വിരാമ ഉപയോഗിക്കേണ്ടി വരും.

    “ചില്ലുകള്‍ എന്‍കോഡ് ചെയ്യുന്നതിലൂടെ പരിഹരിക്കപ്പെടാവുന്നതല്ല മലയാളത്തിന്റെ പ്രശ്നങ്ങള്‍ എന്ന് ചിത്രജകുമാര്‍ ചൂണ്ടിക്കാണിച്ചത് ശരിയെന്നാണോ സിബു പറഞ്ഞു കൊണ്ടുവരുന്നത്?“

    ചിത്രജന്‍ കണ്ട പ്രശ്നങ്ങള്‍ ഏതൊക്കെയാണെന്നറിയാതെ ഇതിന് ഞാന്‍ അതിനെന്തു് പറയും..

    ReplyDelete
  89. സിബുവിന്റെ മറുപടി എനിക്ക് മുമ്പില്ലാതിരുന്ന കുറേ കണ്‍ഫ്യൂഷന്‍ ഉണ്ടാക്കുന്നു.

    ൧.ഇപ്പോള്‍ ആകൂട്ടക്ഷരത്തിന്റെ ഘടകങ്ങള്‍ ചന്ദ്രക്കലയിട്ട്‌ പിരിച്ചെഴുതുകയാണ് ചെയ്യുന്നത്‌ എന്നു പറയുന്നത് ശരിയോ?

    വാസ്തവത്തില്‍ റെണ്ടറിംഗ് എന്‍ജിന്‍ പിരിക്കല്‍ നടത്തുന്നില്ലല്ലോ.ഫോണ്ടില്‍ ആവശ്യമായ ലിപിചിഹ്നം ഇല്ലാതെ വരുമ്പോള്‍ ലഭ്യമായത് കാണിക്കുകയല്ലേ ചെയ്യുന്നത്? പിരിക്കല്‍ വാദം തെറ്റായദിശയില്‍ കാര്യങ്ങള്‍ കാണുന്നതിനാലാണ്.

    ഏരിയല്‍ യൂനിക്കോഡ്, കാര്‍ത്തിക, അഞ്ജലി, രചന എന്നിവ ഉദാഹരണമായി എടുത്ത് പരിശോധിച്ചാല്‍ ആര്‍ക്കും മനസ്സിലാക്കാവുന്ന ഇക്കാര്യത്തില്‍ സിബുവിന് കണ്‍ഫ്യൂഷന്‍ ഉണ്ടാവുന്നത് മനസ്സിലാക്കാനാകുന്നില്ല.

    ൨. അതിന് പകരം ‘glyph not available' ചിഹ്നം (സാധാരണ ഒരു ചതുരക്കട്ട) റെന്‍ഡറിംഗ് എഞ്ചിന്‍ കാണിക്കണം എന്നു പറയുന്നതിന്റെ യുക്തി മനസ്സിലായില്ല. എന്താണ് അത് കൊണ്ട് ഉണ്ടാകുന്ന ഗുണം?

    കീ സീക്വന്‍സ് വെച്ച് പറയുകയാണെങ്കില്‍ ഒരാള്‍ ഒരു കൂട്ടക്ഷരമാണ് ഇന്‍പുട്ട് ചെയ്യുന്നത് എന്ന് പറയാവുന്നതാണോ? കൂട്ടക്ഷരം വേണമെന്നുള്ളവര്‍ അത് ലഭ്യമാക്കുന്ന ഫോണ്ട് ഉപയോഗിക്കണം. ഫോണ്ടിന്റെ കാര്യത്തില്‍ യൂനിക്കോഡ് നല്കുന്ന ഈ സ്വാതന്ത്ര്യം ഗ്ലിഫ് നോട്ട് എവൈലബ്ള്‍ എന്നു കാണിച്ച് നശിപ്പിക്കേണ്ടതുണ്ടോ.പുതിയ ലിപി വേണമെന്നും അത് ഇനിയും പുതുക്കണമെന്നും കരുതുന്ന പ്രബോധചന്ദ്രന്‍ നായരെപ്പോലെ ഉള്ളവര്‍ക്ക് വേണ്ടി ഈ സ്വാതന്ത്ര്യം നിലനിറുത്തണം.അവരും ഭാഷാഭിമാനികള്‍ തന്നെ. അവരുടെ താല്പര്യങ്ങളും സംരക്ഷിക്കപ്പെടണം.

    ൩.ചിത്രജന്‍ കണ്ട പ്രശ്നങ്ങള്‍ ഏതൊക്കെയാണെന്നറിയാതെ അതിന് എതിര്‍വാദം ഉന്നയിക്കാനാകില്ലെന്നു ഞാനും സമ്മതിക്കുന്നു.

    ReplyDelete
  90. സിബൂ,

    മലയാളം ഫോണ്ടുകള്‍ക്ക് സ്റ്റാന്‍ഡേര്‍ഡൈസേഷന്‍ വേണമെന്ന് പറഞ്ഞത് അതുകൊണ്ടാണ്.അപ്പോള്‍ ഫോണ്ടുകളില്‍ നിശ്ചയമായും ഉണ്ടായിരിക്കേണ്ട കൂട്ടക്ഷരരൂുപങ്ങള്‍ക്ക് ഒരു നിഷ്കര്‍ഷ ഉണ്ടാക്കാന്‍ കഴിയും.പുതിയ ലിപിയില്‍ കൂട്ടക്ഷരം പിരിഞ്ഞ് തന്നെ കാണണമെന്ന നിര്‍ബന്ധബുദ്ധികള്‍ zwnj ഉപയോഗിച്ചോട്ടെ.ഇതിനായി input method-ല്‍ ചന്ദ്രക്കലയോടോപ്പം zwnj കൂടിവരുന്ന ഒരു സംവിധാനം ഉണ്ടാക്കിയാല്‍ മതി.അതായത് പുതിയ ലിപിയുടെ ഉപയോഗം ഉ(ഊ)കാരങ്ങള്‍ക്ക് മാത്രമായി പരിമിതപ്പെടുത്തിയാല്‍ മതി.വര്‍ഷങ്ങളായി മാതൃഭൂമി പത്രം ഈ രീതിയല്ലേ ഉപയോഗിക്കുന്നത്?

    ഗൌരവപരമായ മറ്റു പ്രശ്നങ്ങള്‍ കിടക്കുമ്പോള്‍ ചില്ല് എന്‍കോഡിങിന് ഇത്ര പ്രാധാന്യം നല്‍കേണമായിരുന്നോ?

    ReplyDelete
  91. “ഇപ്പോള്‍ ആകൂട്ടക്ഷരത്തിന്റെ ഘടകങ്ങള്‍ ചന്ദ്രക്കലയിട്ട്‌ പിരിച്ചെഴുതുകയാണ് ചെയ്യുന്നത്‌ എന്നു പറയുന്നത് ശരിയോ?

    വാസ്തവത്തില്‍ റെണ്ടറിംഗ് എന്‍ജിന്‍ പിരിക്കല്‍ നടത്തുന്നില്ലല്ലോ.ഫോണ്ടില്‍ ആവശ്യമായ ലിപിചിഹ്നം ഇല്ലാതെ വരുമ്പോള്‍ ലഭ്യമായത് കാണിക്കുകയല്ലേ ചെയ്യുന്നത്?“

    മഹേഷേ, മുകളില്‍ പറഞ്ഞത്‌ രണ്ടും ഒന്നല്ലെ? യുണീക്കോഡില്‍ കൂട്ടക്ഷരം ‘ക്ക’ എഴുതുന്നത്‌ ‘ക + വിരാമ + ക’ എന്നാണെന്ന് ഓര്‍ക്കുമല്ലോ.

    “അതിന് പകരം ‘glyph not available' ചിഹ്നം (സാധാരണ ഒരു ചതുരക്കട്ട) റെന്‍ഡറിംഗ് എഞ്ചിന്‍ കാണിക്കണം എന്നു പറയുന്നതിന്റെ യുക്തി മനസ്സിലായില്ല. എന്താണ് അത് കൊണ്ട് ഉണ്ടാകുന്ന ഗുണം?“

    അപ്പോള്‍ ഒരാള്‍ക്ക്‌ അയാളുടെ ഫോണ്ടിലുള്ള കൂട്ടക്ഷരങ്ങളേ എഴുതനാവൂ. അതല്ലെങ്കില്‍ അയാള്‍ കാണുക ചതുരക്കട്ടയാവും. മാത്രവുമല്ല, ഇപ്പോഴുള്ള പിരിച്ചെഴുതുന്ന രൂപത്തിലേയ്ക്കുള്ള ഫാള്‍ ബാക്കില്ലാത്തതിനാല്‍ അയാളെഴുതിയത്‌ വായനക്കാരന്‌ കാണാനാവുന്നെങ്കില്‍ അത്‌ അയാളെഴുതിയ പോലെ തന്നെ ആയിരിക്കും. (ഒരു രഹസ്യം പറഞ്ഞു തരാം.. സത്യത്തില്‍ പഴയലിപി പ്രചരിപ്പിക്കാന്‍ ഇതിലും നല്ല മാര്‍ഗ്ഗമില്ല. ആലോചിച്ചു നോക്കൂ)

    സുറുമ, യുണിക്കോഡ് ഫോണ്ട്‌ കഴിയാവുന്നത്ര ഫ്രീഡം നല്‍കുന്ന രീതിയിലാണ് ഉണ്ടാക്കിയിട്ടുള്ളത്‌. അല്ലെങ്കില്‍ അത്‌ ഇങ്ങനെ പറയാം: യുണീ‍കോഡിന് ഒരു ഫോണ്ടില്‍ ഇന്നതൊക്കെ ഉണ്ടായേ തീരൂ എന്ന്‌ നിഷ്കര്‍ഷിക്കുന്ന ഒന്നുമില്ല. ഒന്നു ചോദിക്കട്ടേ.. സുറുമ ഉണ്ടാക്കുന്ന സ്റ്റാന്റേഡില്‍ ‘ക്സ’ ഉണ്ടാവുമോ? ‘സ്ത’യോ? അല്ലെങ്കില്‍ ഏത്‌ കൂട്ടക്ഷരമാണ് സുറുമയുടെ സ്റ്റാന്റേഡില്‍ ഇല്ലാതിരിക്കുക? ഒരു കൂട്ടക്ഷരമെങ്കിലും ഇല്ലാതിരുന്നാല്‍ ആ കൂട്ടക്ഷരത്തിന് ‘ദൃക്സാക്ഷി’ പ്രശ്നമുണ്ടാവില്ലേ?

    ReplyDelete
  92. സിബൂ,
    മാനകീകരണം കൊണ്ട് ഞാന്‍ ഉദ്ദേശിച്ചത് unicode മലയാളം ഫോണ്ടുകള്‍ക്ക് സ്റ്റാന്‍ഡേര്‍ഡ് ഉണ്ടാക്കണം എന്നല്ല.ഒരു വ്യക്തി അതുണ്ടാക്കണം എന്നതുമല്ല.code point തന്നാല്‍ യൂണികോഡിന്റെ ജോലികഴിഞ്ഞു.എന്നാല്‍ കൂട്ടക്ഷരങ്ങളുടെ കാര്യത്തില്‍ മലയാളഭാഷ ഉപയോഗിക്കുന്ന എല്ലാവരും ചേര്‍ന്ന് ഒരു ഐക്യരൂപ്യം ഉണ്ടാക്കുക എന്നതാണ് സ്റ്റാന്‍ഡേര്‍ഡൈസേഷന്‍ കൊണ്ട് അര്‍ത്ഥമാക്കിയത്.അങ്ങനെയായാല്‍ വ്യത്യസ്ത ഫോണ്ടുകള്‍ ഒരേ ടെക്സ്റ്റിനെ വ്യത്യസ്തമായി കാണിക്കുന്നത് ഒഴിവാക്കാനാകും.'ദൃക്‌സാക്ഷി'പ്രശ്നവും ഒഴിവാകും.അതായത് കൂട്ടക്ഷരങ്ങള്‍ക്ക് ലിപി പഴയതോ പുതിയതോ എന്ന് തീരുമാനിക്കുന്നത് എഴുതുന്ന ആളാകണം,വായിക്കുന്ന ആളാകരുത് എന്നര്‍ത്ഥം.

    ReplyDelete
  93. സാങ്കേതികവിഷങ്ങള്‍ കൈകാര്യം ചെയ്യുമ്പോള്‍ ഉണ്ടാവേണ്ട വ്യക്തതയില്ലായ്മ അപകടകരമാണ്.മാത്രമല്ല വസ്തുതകള്‍ ശരിയായ രീതിയില്‍ പ്രതിപാദിക്കാതിരിക്കുന്നതും ശരിയല്ല.
    റെണ്ടറിംഗ് എന്‍ജിന്‍ ഒരിക്കലും പിരിക്കുന്നില്ല.മറിച്ച് യോജിപ്പിക്കുകയേ ചെയ്യുന്നുള്ളൂ. സ്വരം ചേരുമ്പോള്‍ ചിഹ്നങ്ങള്‍ എവിടെയൊക്കെ നില്ക്കണം,ഏതൊക്കെ സന്ദര്‍ഭത്തില്‍ കൂട്ടക്ഷരത്തിന്‍റെ ഗ്ലിഫ് ലഭ്യമെങ്കില്‍ കാണിക്കണം എന്നൊക്കെ ചെയ്യുന്നുവെന്നല്ലാതെ പിരിക്കുന്നില്ല.വസ്തുത ഇതായിരിക്കെ പിരിക്കുന്നുവെന്നു പറയാവുന്നതല്ലല്ലോ.

    ചതുരക്കട്ട പ്രശ്നം എനിക്ക് മനസ്സിലാക്കാനേ പറ്റുന്നില്ല. ഏരിയല്‍ യൂനിക്കോഡ്, കാര്‍ത്തിക, അഞ്ജലി, രചന എന്നീ ഫോണ്ടുകള്‍ മാറിമാറി ഉപയോഗിക്കേണ്ടി വരുന്നയാളാണ് ഞാന്‍.ചതുരക്കട്ട കിട്ടിയിട്ട് ഇത്തരം ഒരു ഉപയോക്താവിന് എന്താണ് പ്രയോജനം?
    മാത്രമല്ല ഞാന്‍ ഉപയോഗിക്കുന്ന സിസ്റ്റത്തില്‍ ലഭ്യമായ ഗ്ളിഫുകള്‍ കാണിക്കുമെന്നല്ലാതെ ചതുരക്കട്ട കാണിക്കുന്നത് എങ്ങനെ,എന്തിന് എന്ന് മനസ്സിലാക്കാനാകുന്നില്ല.
    പുതിയ ലിപിയോ പഴയലിപിയോ മറ്റെന്തിലും പ്രചരിപ്പിക്കാന്‍ കൌശലം പ്രയോഗിക്കണം എന്നതിനോട് ഒരു രീതിയിലും ഞാന്‍ യോജിക്കില്ല

    ReplyDelete
  94. യൂണി കോഡുമായി ബന്ധമില്ലാത്ത ഒരു സംശയം

    ReplyDelete
  95. എന്റെ ചില നിരീക്ഷണങ്ങൾ ഇവിടെ.

    ReplyDelete
  96. http://unicode.wikia.com/wiki/Malayalam/Problems_of_Chillu_Sign_Proposal
    വായിച്ചു.

    That article is really exposing the danger of encoding CHILLUs. No one will able able identify between na virama zwj and chillu-na, if chillus are encoded. Then spoofing of websites are easier.
    അവൻ & അവന്‍ looks same, but are actually different.
    I was a supporter of encoding chillus. Now I am not.

    ReplyDelete
  97. ചില്ല് എന്‍കോഡിംഗ് തീരുമാനത്തിന്റെ അനൌചിത്യം ഓരോ ദിവസം കഴിയും തോറും കൂടുതല്‍ ബോധ്യമായി വരികയാണ്.
    ഇക്കാര്യത്തില്‍ ചിത്രജകുമാര്‍ ഇന്‍ഡിക്‍ മെയിലിംഗ് ലിസ്റ്റില്‍ കൊടുത്ത കുറിപ്പ് കാണുക.അതോടൊപ്പം ഈ ലിങ്കും:http://www.rachanamalayalam.org/docs/ChilluEncodingIsWrong.pdf
    തര്‍ക്കമല്ല പ്രശ്നത്തിനു പരിഹാരമെന്ത് എന്ന ആലോചനയാണ് വേണ്ടത്.

    ReplyDelete
  98. ഞാന്‍ ഒന്നു് നന്നായി മലയാളം എഴുതാന്‍ പഠിച്ചു. സംവൃതോകാരം ഇട്ടു് എഴുതി ശീലിച്ചാല്‍ അര്‍ത്ഥം മാറിപ്പോവുമോയെന്ന ഭയവും വേണ്ട.
    ചില്ലു് എന്‍കോഡ് ചെയ്യേണ്ട ആവശ്യമില്ല.

    പക്ഷേ ന് ന്‍ ആണെന്നു് വന്നാല്‍ അതും ബുദ്ധിമുട്ടാണു്.

    ReplyDelete
  99. This comment has been removed by a blog administrator.

    ReplyDelete
  100. മഹേഷ്, ‘ദൃക്സാക്ഷി‘പ്രശ്നം പരിഹരിക്കാനുള്ള വിവിധമാര്‍ഗ്ഗങ്ങളെ കുറിച്ചാണല്ലോ നമ്മള്‍ സംസാരിക്കുന്നത്‌. ഞാന്‍ മുന്നോട്ടുവച്ച സൊല്യൂഷന്‍ സ്വീകരിച്ചാലേ ചതുരക്കട്ടകള്‍ പ്രത്യക്ഷപ്പെടൂ. ഈ ചതുരക്കട്ടകള്‍ ഇപ്പോഴത്തെ യുണിക്കോഡ് സ്റ്റാന്റേഡ് പ്രകാരം ഉണ്ടാവുന്നതല്ല.

    ചതുരക്കട്ട കിട്ടിയാല്‍ അതിനര്‍ഥം പ്രസ്തുത എന്‍‌കോഡിങ് സീക്വന്‍സ് വരക്കാന്‍ കയ്യിലുള്ള ഫോണ്ട് അപര്യാപ്തമാണ് എന്നാണ്. അപ്പോള്‍ അത്‌ വരയ്ക്കാന്‍ പ്രാപ്തമായ ഫോണ്ട്‌ കൊണ്ടുവന്ന്‌ സിസ്റ്റത്തില്‍ ചേര്‍ക്കണം. അതായത്‌, പഴയലിപിയിലെഴുതിയത്‌ കാണാന്‍ പഴയലിപിഫോണ്ട് തന്നെ വേണ്ടിവരും; കാര്‍ത്തിക മതിയാവുകയില്ല. എങ്കില്‍ മാത്രമേ, ‘ദൃക്സാക്ഷി’ പ്രശ്നം ഒഴിവാവൂ. അങ്ങനെ, പുതിയലിപി ഫോണ്ടുകള്‍ അന്യം നിന്നുപോവും. ഇതൊരു കൌശലമല്ല; മറിച്ച്‌, ദൃക്സാക്ഷി പ്രശ്നം ഒഴിവാക്കാനുള്ള സൊല്യൂഷന്റെ സൈഡ് ഇഫറ്റാണ്. അത്‌ ഇഷ്ടമായില്ലെങ്കില്‍, ഇങ്ങനെ സൈഡിഫക്റ്റില്ലാത്ത ഒരു സൊല്യൂഷന്‍ പ്രപ്പോസ് ചെയ്യൂ.

    മഹേഷ്, ചിത്രജന്റെ പുതിയ ഡോക്യുമെന്റില്‍ അപ്പടി പൊളിറ്റിക്സ് ആണല്ലോ. ഇതൊക്കെ വായിക്കാനുള്ള ക്ഷമ യുണിക്കോഡുകാര്‍ കാണിക്കുമോ? അതില് നിന്നും ഉള്ള ടെക്നിക്കല്‍ കണ്ടന്റ് മാത്രം ഒരു പേജിലാക്കി കിട്ടിയാല്‍ നന്നായിരുന്നു. അതില്‍ റിവ്യൂചെയ്തിരിക്കുന്നത്‌ ഗവണ്മെന്റിന്റെ l2/06-186 എന്ന ഡോക്യുമെന്റാണ്. എന്നാല്‍ റിവ്യൂചെയ്യേണ്ടിയിരുന്നത്‌ എറിക്കിന്റെ l2/06-207 ആയിരുന്നു. ആ ഡോക്യുമെന്റാണ് റിവ്യൂകമ്മിറ്റി വായിച്ചു നോക്കിയിട്ടുണ്ടാവുക. l2/06-186 എറിക്കേ വായിച്ചിട്ടുണ്ടാവൂ.

    സുറുമ, വ്യത്യസ്ത ഫോണ്ടുകള്‍ ഒരേ ടെക്സ്റ്റിനെ വ്യത്യസ്തമായി കാണിക്കുന്നത് ഒഴിവാക്കാന്‍ pr37-ലെ ഫാള്‍ബാക്കുകള്‍ ഇല്ലാതിരിക്കുകയാണ് വേണ്ടത്‌. അതുതന്നെയാണ് ഞാന്‍ പറഞ്ഞ സൊല്യൂഷനും. ഫാള്‍ബാക്കുള്ളിടത്തോളം എല്ലാ മലയാളികളും ചേര്‍ന്ന്‌, ചന്ദ്രക്കല വേണ്ടിടത്തൊക്കെ zwnj ഉപയോഗിക്കാം എന്ന്‌ തീരുമാനിച്ചത്‌ കൊണ്ട്‌ പ്രശ്നങ്ങള്‍ക്ക്‌ പരിഹാരമാവുകയില്ല. ഉദാഹരണത്തിന്, ഞാന്‍ രചനയില്‍ ഗ്ദ്ധ്രൂ എന്നെഴുതിയത്‌ സന്തോഷ്‌ കാര്‍ത്തികയില്‍ കാണുന്നത്‌ ഞാനെഴുതിയപോലെയല്ല; പിരിച്ചാണ്. അതുപോലെ, ‘ദൃക്സാക്ഷി‘യെന്ന്‍ കാര്‍ത്തികയില്‍ എഴുതിയാല്‍ സന്തോഷ്‌ അതിനെ ‘ദൃക്‌സാക്ഷി‘ എന്നാവും കാണുക. അതായത്‌, തെറ്റായ സീക്വന്‍സും ശരിയായ സീക്വന്‍സും ഒരേ റിസള്‍ട്ട് തരുന്നത്‌ കൊണ്ട്‌ തെറ്റുകണ്ടുപിടിക്കാന്‍ എഴുതിയ ആള്‍ക്ക്‌ കഴിയാതെ പോകുന്നു - വേണ്ടിടത്തൊക്കെ zwnj ഉപയോഗിച്ചിട്ടുണ്ടോ എന്ന്‌ കണ്ടുപിടിക്കാന്‍ സന്തോഷിന് പറ്റുന്നില്ല. അങ്ങനെ ഞാനത്‌ രചനയില്‍ തെറ്റായി കാണുകയും ചെയ്യുന്നു.

    റാല്‍മിനോഫ്, IDN-ല്‍ ZW(N)J ഉപയോഗിക്കാന്‍ പാടില്ല. അതിനാല്‍ അവിടെ സ്പൂഫിങ് പ്രശ്നവും ഇല്ല. ചില്ലിന്റെ എന്‍‌കോഡിങ്ങിന് ശേഷം, VIRAMA+ZWJ ചില്ലുണ്ടാക്കാന്‍ ഉപയോഗിക്കുന്നത്‌ സ്റ്റാന്റേഡിന് എതിരാവും. പഴയഡോക്യുമെന്റില്‍ അത്‌ കണ്ടാല്‍ റെന്‍ഡറിങ് എഞ്ചിന്‍ അതിനെ ചില്ലായി കാണിക്കും എന്ന്‌ മാത്രം. ഇതിന് കാനോനിക്കല്‍ ഈക്വിവാലന്‍സ് ഉണ്ടാക്കും എന്നെനിക്ക്‌ തോന്നുന്നില്ല. കൂടുതല്‍ വിവരത്തിന് യുണിക്കോഡിന്റെ ഡിപ്രിക്കേഷന്‍ പോളിസി വായിക്കേണ്ടി വരും (ഞാന്‍ വായിച്ചിട്ടില്ല).

    ReplyDelete
  101. സിബു,
    ജാള്യത രചനയില്‍ , ജാൾയത
    അഞ്ജലിയില്‍ ഒരേ പോലെ. zwj is not used. its a mistake in rachana font, but it can happen.

    ചതുരക്കട്ട ഒരു അബദ്ധമാണെന്നാണു് എനിക്കും തോന്നുന്നതു്. ഒരു ഫോണ്ടുപയോഗിച്ചെഴുതിയതു് വായിക്കാന്‍ ആ ഫോണ്ട് തന്നെ വേണമെന്നു് വന്നാല്‍ കഷ്ടമല്ലേ..

    ReplyDelete
  102. ചതുരക്കട്ട ഒരു പ്രശ്നത്തിനും പരിഹാരമല്ല എന്നാണ് എനിക്ക് തോന്നുന്നത്.
    പല കമ്പ്യൂട്ടറുകളില്‍ പലതരം ഫോണ്ടുകള്‍ ഉപയോഗിക്കേണ്ടി വരുന്ന എന്നെപ്പോലൊരാള്‍ ചതുരക്കട്ടകളുടെ ഇടയില്‍പ്പെട്ട് വിഷമിക്കും എന്നല്ലാതെ എന്ത് കാര്യം.മലയാളത്തിലുള്ള ടെക്‍സ്റ്റുകള്‍ നെറ്റ് വഴി വിനിമയം ചെയ്യാന്‍ ഇന്നത്തെ അവസ്ഥയില്‍ സാധിക്കുന്നുണ്ടല്ലോ.അതെങ്കിലും നാളെയും ഉണ്ടാവണം.ചില്ലുകളും കൂട്ടക്ഷരവും പിരിഞ്ഞും തെറ്റിയുമുള്ള അവസ്ഥ ചതുരക്കട്ടയെക്കാള്‍ നല്ലതാണ്.

    കൂട്ടക്ഷരങ്ങള്‍ക്ക് ലിപി പഴയതോ പുതിയതോ എന്ന് തീരുമാനിക്കുന്നത് എഴുതുന്ന ആളാകണം,വായിക്കുന്ന ആളാകരുത് എന്ന സുറുമയുടെ അഭിപ്രായത്തോട് യോജിപ്പാണ് എനിക്ക്.

    വിവാദത്തിന്‍റെ കാര്യം: എല്ലാ തര്‍ക്കത്തിലും അഭിപ്രായൈക്യം സാദ്ധ്യമല്ല. സാങ്കേതികമായും പ്രായോഗികമായും ശരിയേതെന്നതിന്‍റെ അടിസ്ഥാനത്തിലാവണം അവിടെ തീരുമാനം.
    പ്രബുദ്ധകേരളം എന്നു പറയുന്ന കേരളത്തിലെ ജനങ്ങളില്‍ മഹാഭൂരിപക്ഷവും അറിഞ്ഞിട്ടില്ലാത്ത പ്രശ്നത്തിന് നറുക്കിട്ട് തീര്‍പ്പുകല്പിക്കുന്നതു പോലെ അസംബന്ധം വേറൊന്നില്ല

    ReplyDelete
  103. ആറ്റോമിക് ക്യാരക്ടേഴ്സ് ചില്ലക്ഷരത്തിനു നല്‍കുന്നതു ചില്ലക്ഷരത്തിന്റെ മൂലരൂപവുമായി ചില്ലിനുള്ള ബന്ധത്തെ ദുര്‍ബലമാക്കുന്നതാണു് ഒരു വശത്തെ വാദമെങ്കില്‍ പലപ്പോഴും ആറ്റോമിക് സ്വഭാവം കാണിക്കുന്ന ചില്ലക്ഷരങ്ങളെ IDN ഉം മിക്ക അപ്ലിക്കേഷനുകളും ‘തള്ളുന്ന’ ZW(N)J ഉപയോഗിച്ചു എഴുതുന്ന അസംബന്ധത്തിനെതിരെ പ്രതികരിക്കുകയാണു മറുകൂട്ടര്‍.

    യൂണികോഡിനു മുമ്പില്‍ ഇരു വാദവും ഒട്ടനവധി കാലമായി അവതരിപ്പിച്ചു കാണുന്നു, ഇത്രയും കാലമായി ഇതിനൊരു തീര്‍പ്പുകണ്ടെത്താനാവാഞ്ഞതിനു നമ്മളെ തന്നെ പഴിപറയേണ്ടിയിരിക്കുന്നു.

    ഇന്നു മൈക്രോസോഫ്റ്റിലെ പീറ്റര്‍ വിമര്‍ശിച്ചതു പോലെ അവസാന നിമിഷം മുഖ്യമന്ത്രി പറഞ്ഞൂന്ന് പറഞ്ഞൊരു പേപ്പറും പൊക്കിപ്പിടിച്ചു വരുന്നത് മലയാള സിനിമയില്‍ കാണുന്ന തരം വളിപ്പാണു്. സിബു പറഞ്ഞതു പോലെ രചനയുടെ ഡോക്യുമെന്റില്‍ രാഷ്ട്രീയമാണു് അധികം കാണുന്നതു്, IDN ഉദാഹരണം മാത്രം ഉപയോഗിച്ചു ZW(N)J -ല്‍ സെക്യൂരിറ്റി ഇഷ്യൂസ് ഇല്ലെന്ന് സമര്‍ഥിക്കുന്നതില്‍ സാധാരണ യൂണികോഡ് ഉപഭോക്താവിന്റെ കണ്ണില്‍ illogical ആണു്. സേര്‍ച്ചിലും മറ്റു അപ്ലിക്കേഷനുകളിലും ZW(N)J നഷ്ടപ്പെടുന്നതു മൂലമുള്ള പ്രശ്നങ്ങള്‍ക്കു് ആരു പരിഹാരമൊതുക്കും. രചന അക്ഷരവേദി പോലുള്ള മെല്ലെപ്പോക്കു സംഘമാണു മലയാളം യൂണികോഡിനു വേണ്ടി നിലകൊള്ളുന്നവരെങ്കില്‍ അതിനുവേണ്ടിയുള്ള ചര്‍ച്ചയും പരിശ്രമങ്ങളും ചത്ത കുഞ്ഞിന്റെ ജാതകം നോക്കുന്നതു പോലുള്ള ഏര്‍പ്പാടാകും.

    ReplyDelete
  104. സിബു ‘ചതുരക്കട്ട’ എന്നു പറഞ്ഞത് കാര്യമായി തെറ്റിദ്ധരിച്ചിട്ടുണ്ടെന്നു തോന്നുന്നു മഹേഷ് സാറും മറ്റും.

    ആഴത്തില്‍ ആലോചിച്ചുനോക്കുമ്പോള്‍ അതൊരു നല്ല ഉപായമാണ്.
    പുതിയലിപിയുടെ രൂപകല്പനയില്‍ സാങ്കേതികമായി തെറ്റുകള്‍ കടന്നുകൂടിയിട്ടുണ്ടെന്നു നമുക്കിപ്പോള്‍ അനുമാനിക്കേണ്ടി വരും. അങ്ങനെയുണ്ടെങ്കില്‍ ഇന്നല്ലെങ്കില്‍ നാളെ നമുക്കതു തിരുത്തേണ്ടിയും വരും. എന്നാല്‍ പെട്ടെന്നൊരു ദിവസം ഉപേക്ഷിക്കാനും പറ്റില്ല അത്. അതേ സമയം രണ്ടു പ്രത്യേക യുണികോഡ് പേജുകള്‍ ഉണ്ടാക്കുക എന്നതും സ്വീകാര്യമല്ല.

    അപ്പോള്‍ പിന്നെ ബാക്കിയുള്ള വഴി ഇതുതന്നെ!

    ചതുരക്കട്ട എന്നത് കാണുവാന്‍ രസമില്ലെങ്കിലും നല്ലൊരു യുണികോഡ് ഉപായമാണ്. ഉള്ളിലടങ്ങിയിട്ടുള്ള തെറ്റുകള്‍ തെറ്റുകളാണെന്നു തിരിച്ചറിയുക എന്നതാണ് ആദ്യത്തെ ശരി. യുണികോഡ് ഒരു ചതുരക്കട്ട കാണിക്കുമ്പോള്‍ നമ്മോടു പറയുന്നത്, “നോക്കൂ, ഇവിടെ ഏതോ ഒരു ഭാഷയിലെ ഒരക്ഷരം എഴുതിയിട്ടുണ്ട്. പക്ഷേ അതു കാണിക്കാനുള്ള ഗ്ലിഫ് എന്റെ കയ്യിലില്ലാട്ടോ, സോറി. പക്ഷേ ഞാന്‍ അതിനെ ശല്യമൊന്നും ചെയ്യില്ല. അങ്ങനെത്തന്നെ കൊണ്ടുനടന്നോളാം” എന്നാണ്. (അതേ സമയം ഒരു ചോദ്യചിഹ്നമാണെന്നു വരികില്‍ യുണികോഡിന് ആ ക്യാരക്റ്ററിനെയോ അതിന്റെ ഭാഷയേയോ തിരിച്ചറിയാന്‍ പോലുമായില്ലെന്നര്‍ത്ഥം. അല്ലെങ്കില്‍ ആ പേജ്/അക്ഷരം യുണികോഡിനെ തിരിച്ചറിഞ്ഞില്ലെന്നും പറയാം. പ്രസ്തുത ക്യാരക്റ്റര്‍ കൂടുതല്‍ പ്രോസസ്സിംഗിന് ഉപയുക്തമാവാതെ എന്നെന്നേക്കുമായി നശിച്ചുപോയി എന്നു കരുതാം.)

    ഒരുദാഹരണത്തിന് പഴയ അഞ്ജലി ഉപയോഗിച്ചെഴുതിയ ചില വെബ് പേജുകളിലെ ഒളിച്ചിരിക്കുന്ന തെറ്റുകള്‍ നോക്കിയാല്‍ മതി. ആ തെറ്റുകള്‍ കാണണമെങ്കില്‍ അഞ്ജലി പോര. കാര്‍ത്തിക തന്നെ വേണം. (അഞ്ജലി വെച്ചു വായിച്ചാല്‍ ടോര്‍ച്ചടിച്ചുനോക്കി ഇവിടെയൊന്നും ഇരുളില്ലല്ലോ എന്നു പറയുന്ന പോലെയിരിക്കും!)

    കാലക്രമത്തില്‍ പഴയലിപിയിലേക്കുതന്നെ നാം എല്ലാവരും ഒരുമിച്ചു മടങ്ങിപ്പോവുക എന്നത് ഒരു തെറ്റാണോ? ഉപയോഗസ്വാതന്ത്ര്യം എന്ന അളവുകോല്‍ വെച്ചുനോക്കിയാല്‍, അതുവെച്ച് രണ്ടോ അതിലധികമോ വ്യവസ്ഥ നടന്നു പോകട്ടേ എന്നു സമ്മതിച്ചുകൊടുത്താല്‍ പിന്നെ വീണ്ടും മാനകീകരണത്തിനെന്തു പ്രസക്തി?

    ചതുരക്കട്ട ഉപായം വാസ്തവത്തില്‍ നിര്‍ബന്ധപൂര്‍വ്വമല്ലാത്ത, സമരാത്മകമല്ലാത്ത സ്വയംസ്വീകാര്യമായ എങ്കിലും സാവകാശമായ ഒരു സംക്രമണത്തിനു വഴിയൊരുക്കും എന്നാണെനിക്കു തോന്നുന്നത്.

    ReplyDelete
  105. ചതുരക്കട്ട?

    ക്ക എന്നതു് ക ് ക എന്നാണു് ഇപ്പോള്‍ എഴുതുന്നതു്. സിബുവിനു് ക്ക എന്നു് തന്നെ കോഡ്പോയന്റ് നല്‍കണമോ ?
    മനസ്സിലായില്ല....

    എന്നാല്‍ മാത്രമേ ക്ക എന്ന ഗ്ലിഫില്ലാത്ത ഫോണ്ട് ചതുരക്കട്ട കാണിക്കുകയുള്ളൂ..

    ReplyDelete
  106. ഇല്ലാത്ത ഗ്ലിഫിനു പകരം 'ഇഷ്ടിക' നിരത്തുന്ന റെന്‍ഡറിങ് സമ്പ്രദായം ഒട്ടും അങ്ങട് ദഹിക്കുന്നില്ല.ZW(N)J ന് മാന്യമായ സ്ഥാനം നല്‍കുകയാണ് ഭേദപ്പെട്ട മാര്‍ഗ്ഗം എന്ന് തോന്നുന്നു.വെറും ഫോര്‍മാറ്റിങിന് അപ്പുറത്തേയ്ക്ക് ഇവയ്ക്ക് പ്രസക്തി ഉണ്ട്.

    ReplyDelete
  107. മുല്ലപ്പെരിയാറുപോലെയാവില്ലേ ഇതും? രചനയുടെ പുതിയ വാദം കേട്ട്‌ യൂണിക്കോട്‌ ഇപ്പോഴുള്ള തീരുമാനത്തില്‍നിന്നും പിന്മാറുകയോ തീരുമാനം വൈകിക്കുകയോ ചെയ്യുമോ?
    കഷ്ടം! മലയാളം! മാധ്യമങ്ങള്‍ വിവാദങള്‍ടെ പുറകേയാണ്. ആര്‍ക്കും ഒന്നും സോള്‍വ് ചെയ്യണ്ട, കഷ്ടം! -സു-

    ReplyDelete
  108. zw(n)j യെ പറ്റി രചനയുടെ അഭിപ്രായം അറിഞ്ഞാല്‍ കൊള്ളാം. ഇങ്ങനെത്തന്നെ പോയാല്‍ മതിയെന്നാണോ ? ഫാര്‍സി,അറബിക് ഫോറങ്ങളിലും ഇവയെപ്പറ്റി നല്ല അഭിപ്രായമല്ല.

    ReplyDelete
  109. റാല്‍മിനോഫ്: "ഒരു ഫോണ്ടുപയോഗിച്ചെഴുതിയതു് വായിക്കാന്‍ ആ ഫോണ്ട് തന്നെ വേണമെന്നു് വന്നാല്‍ കഷ്ടമല്ലേ.."
    റാല്‍മിനോഫ്: "ക്ക എന്നതു് ക ് ക എന്നാണു് ഇപ്പോള്‍ എഴുതുന്നതു്. സിബുവിനു് ക്ക എന്നു് തന്നെ കോഡ്പോയന്റ് നല്‍കണമോ ?“

    റാല്‍മിനോഫ് പറഞ്ഞ രണ്ടും ശരിയല്ല. ഞാന്‍ നേരത്തെ പറഞ്ഞത്‌ തന്നെ, റൂളുപയോഗിച്ച്‌ എഴുതിയിരിക്കുന്നു. മനസ്സിലാകുമോ എന്ന്‌ നോക്കൂ:
    consonant + virama + consonant => conjunct ligature if available in the font
    .notdef glyph if not available in the font

    consonant + chandrakkala => consonant with chandrakkala above right top corner

    Notes:

    * PR 37 becomes obsolete
    * chandrakkala has to be encoded new
    * no fall backs
    * no zwj and zwnj

    സുറുമ: ഇല്ലാത്ത ഗ്ലിഫിനു പകരം 'ഇഷ്ടിക' നിരത്തുന്ന റെന്‍ഡറിങ് സമ്പ്രദായം ഒട്ടും അങ്ങട് ദഹിക്കുന്നില്ല.

    ഇല്ലാത്തിടത്ത്‌ ഇഷ്ടിക വച്ചുതന്നെയാണ് എല്ലാഭാഷകളിലേയും ഫോണ്ടുകള്‍ പ്രവര്‍ത്തിക്കുന്നത്‌. പ്രധാനമായും ഇന്ത്യന്‍ ലിപികള്‍ക്ക് മാത്രമേ ജോയിനറുകളും ഫാള്‍ബാക്കുകളും ഉള്ളത്‌. അതുണ്ടാക്കിയ പ്രശ്നമായിരുന്നു ‘ദൃക്സാക്ഷി’.

    സുറുമ: ZW(N)J ന് മാന്യമായ സ്ഥാനം നല്‍കുകയാണ് ഭേദപ്പെട്ട മാര്‍ഗ്ഗം എന്ന് തോന്നുന്നു.
    ഉദ്ദേശിച്ചത്‌ ഒരു റൂളായി പറയൂ. എന്നാലേ വിശകലനം ചെയ്യാനാവൂ.

    മഹേഷ്‌: ചതുരക്കട്ട ഒരു പ്രശ്നത്തിനും പരിഹാരമല്ല എന്നാണ് എനിക്ക് തോന്നുന്നത്. പല കമ്പ്യൂട്ടറുകളില്‍ പലതരം ഫോണ്ടുകള്‍ ഉപയോഗിക്കേണ്ടി വരുന്ന എന്നെപ്പോലൊരാള്‍ ചതുരക്കട്ടകളുടെ ഇടയില്‍പ്പെട്ട് വിഷമിക്കും എന്നല്ലാതെ എന്ത് കാര്യം.
    മഹേഷ്‌: കൂട്ടക്ഷരങ്ങള്‍ക്ക് ലിപി പഴയതോ പുതിയതോ എന്ന് തീരുമാനിക്കുന്നത് എഴുതുന്ന ആളാകണം,വായിക്കുന്ന ആളാകരുത് എന്ന സുറുമയുടെ അഭിപ്രായത്തോട് യോജിപ്പാണ് എനിക്ക്.

    ഈ രണ്ട്‌ വാചകങ്ങളും കോണ്ട്രഡിക്റ്റിങ് ആണ്. ഒന്നുകില്‍ എഴുതുന്ന ആള്‍ തീരുമാനിക്കുന്നു ലിപി പഴയതോ പുതിയതോ ആവണമെന്ന്‌; അപ്പോള്‍ കൂട്ടക്ഷരമില്ലാത്ത ഫോണ്ടുപയോഗിച്ചാണ് കാണുന്നതെങ്കില്‍ ഇഷ്ടിക കാണും. അല്ലെങ്കില്‍ വായിക്കുന്ന ആള്‍ തീരുമാനിക്കുന്നു ഏത്‌ ഫോണ്ടില്‍ കാണണമെന്ന്‌; അപ്പോള്‍ ‘ദൃക്സാക്ഷി’ വരും. ഇതുരണ്ടില്‍ ഏതെങ്കിലും ഒന്ന്‌ തിരഞ്ഞെടുക്കുകയേ നിവൃത്തിയുള്ളൂ.

    പെരിങ്ങൊടര്‍: മിക്ക അപ്ലിക്കേഷനുകളും ‘തള്ളുന്ന’ ZW(N)J ഉപയോഗിച്ചു എഴുതുന്ന അസംബന്ധത്തിനെതിരെ പ്രതികരിക്കുകയാണു മറുകൂട്ടര്‍.
    ഇത്‌ ഒരു കാരണം മാത്രമാണ്.. മുമ്പ്‌ ഡിസ്കസ് ചെയ്ത ‘ഞായര്‍’ പ്രശ്നവും യുണീക്കോഡിന്റെ തീരുമാനത്തെ സ്വാധീനിച്ച കാര്യം തന്നെ.

    വിശ്വം: അതുവെച്ച് രണ്ടോ അതിലധികമോ വ്യവസ്ഥ നടന്നു പോകട്ടേ എന്നു സമ്മതിച്ചുകൊടുത്താല്‍ പിന്നെ വീണ്ടും മാനകീകരണത്തിനെന്തു പ്രസക്തി?
    സ്റ്റാന്റേഡൈസേഷന്‍ പല ലയറുകളില്‍ നടത്താവുന്ന ഒന്നാണ്. യുണീക്കോഡ് സ്റ്റാന്റേഡൈസ് ചെയ്യുന്ന ലെയറല്ല ഫോണ്ടിലുള്ള സ്റ്റാന്റേഡൈസേഷന്‍. ‘ദൃക്സാക്ഷി‘ പ്രശ്നമില്ലെങ്കില്‍ രണ്ടുവ്യവസ്ഥയ്ക്കും ഒരു പ്രശ്നവുമില്ലാതെ കോ-എക്സിസ്റ്റ് ചെയ്യാമായിരുന്നു. അതായത്‌ ഫോണ്ടില്‍ സ്റ്റാന്റേഡൈസേഷന്‍ ആവശ്യമില്ലായിരുന്നു എന്ന്‌. അതാണോ സാമൂഹികമായി ശരി എന്ന്` കാലം തെളിക്കേണ്ടതാണ്.

    ReplyDelete
  110. ദൃക്‌സാക്ഷി ബോക്സര്‍ എന്നു് കാര്‍ത്തികയില്‍ എഴുതിയാല്‍
    ക്സ യ്ക്കു് പകരം ചതുരമാണോ വരേണ്ടതു് ?

    ഇതിലും നല്ല ഉപായം കാര്‍ത്തികയും മറ്റും നിരോധിക്കുന്നതാണു്.

    ReplyDelete
  111. റാല്മിനോഫ്: "ഇതിലും നല്ല ഉപായം കാര്ത്തികയും മറ്റും നിരോധിക്കുന്നതാണു്."

    കാര്ത്തിക നിരോധിക്കുക എന്ന പോംവഴി റാല്മിനോഫ് നിര്ദ്ദേശിക്കുമ്പോള് ഉദ്ദേശിച്ചത് കാര്ത്തിക എന്ന് പേരുള്ള എല്ലാ ഫോണ്ടുകളും നിരോധിക്കുക എന്നല്ലല്ലോ. മറിച്ച് എന്തെങ്കിലും ചില മാനദണ്ഡങ്ങളനുസരിച്ച് ചില ഫോണ്ടുകളെ സ്റ്റാന്റേഡ് അനുസരിക്കുന്നവയെന്നും മറ്റുചിലവയെ അനുസരിക്കാത്തവയെന്നും തരം തിരിക്കുകയല്ലേ. അതായത്, യുണീക്കോഡ് സ്റ്റാന്റേഡൈസേഷനല്ല, മറിച്ച് ഫോണ്ട് സ്റ്റാന്റേഡൈസേഷനാണ് വേണ്ടത് എന്നാവണം റാല്മിനോഫ് ഉദ്ദേശിച്ചത് (അല്ല, ഇനി ഇത്രയ്ക്കുദ്ദേശിച്ചില്ലെങ്കിലും ആലോചിക്കുമ്പോള് എല്ലാ വശവും ആലോചിക്കണമല്ലോ :)

    ഫോണ്ട്‌ സ്റ്റാന്റേഡൈസേഷന് യുണിക്കോഡ് സ്റ്റാന്റേഡൈസേഷന്‍ എന്ന പോലൊരു ബോഡി ഇതുവരെ നിലവിലില്ല. അല്ലെങ്കിലും, യുണിക്കോഡ് സ്റ്റാന്റേഡൈസേഷന്‍ ശരിയാണെങ്കില്‍ പിന്നെന്തിന് ഫോണ്ട് സ്റ്റാന്റേഡൈസേഷന്‍?

    ഫോണ്ട് സ്റ്റാന്റേഡൈസേഷന് യുണീക്കോഡ് സ്റ്റാന്റേഡൈസേഷനേക്കാള് കോമ്പ്ലെക്സാണ്. യുണീക്കോഡില്‍ ഘടകങ്ങള്‍ മാത്രം വേര്‍തിരിച്ചറിഞ്ഞാല്‍ മതി. ഫോണ്ടിലാവുമ്പോള്‍ അതിന്റെ നാനാവിവിധ കോമ്പിനേഷനുകളും കണ്ടുപിടിച്ച്‌ കാറ്റലോഗ് ചെയ്യേണ്ടതുണ്ട്‌.

    ഫോണ്ട്‌ സ്റ്റാന്റേഡൈസേഷന്‍ സ്റ്റാറ്റിക്കാണ്. അതേ സമയം യുണിക്കോഡ് സ്റ്റാന്റേഡൈസേഷനില്‍, ഉദാഹരണത്തിന് ഗ്ധ എന്നൊരു കൂട്ടക്ഷം ഏതെങ്കിലും താളിയോലയില്‍ കണ്ടാല്‍, ഫോണ്ടില്‍ ചേര്‍ക്കാന്‍ വര്‍ഷങ്ങള്‍ കാത്തിരുന്നുള്ള സ്റ്റാന്റേഡ് തിരുത്ത്‌ വേണ്ട.

    ഇനിയും പലതും അതിനെ പറ്റി എഴുതാം. ഫോണ്ടല്ല; യുണികോഡ് സ്റ്റാന്റേഡൈസേഷനാണ് വേണ്ടത്‌ എന്നതിനെ പറ്റി പൊതുവെ ധാരണയുണ്ട്. തല്‍കാലം നമുക്ക്‌ യുണിക്കോഡിനെ പറ്റി ചിന്തിക്കാം. കാര്‍ത്തിക നിരോധനവും, ഫോണ്ട് സ്റ്റാന്റേഡൈസേഷനും പിന്നെ...

    ReplyDelete
  112. cibu:
    ഉദാഹരണത്തിന് ഗ്ധ എന്നൊരു കൂട്ടക്ഷം ഏതെങ്കിലും താളിയോലയില്‍ കണ്ടാല്‍, ഫോണ്ടില്‍ ചേര്‍ക്കാന്‍ വര്‍ഷങ്ങള്‍ കാത്തിരുന്നുള്ള സ്റ്റാന്റേഡ് തിരുത്ത്‌ വേണ്ട.

    അപ്പോള്‍ ഗ്ധ എന്ന കൂട്ടക്ഷരം ഇല്ലാത്ത രചന ചതുരം കാണിക്കണമോ ?

    I cant get your point. Without standardizing the font, your proposal is void.

    Even if it is standardized, if there are instances where
    consonant + virama + consonant DOESNT form a conjuct as in the above example, we can see blocks only.

    ReplyDelete
  113. സിബു: അല്ലെങ്കിലും, യുണിക്കോഡ് സ്റ്റാന്റേഡൈസേഷന്‍ ശരിയാണെങ്കില്‍ പിന്നെന്തിന് ഫോണ്ട് സ്റ്റാന്റേഡൈസേഷന്‍?

    കൂട്ടക്ഷരങ്ങളെ സംബന്ധച്ചകാര്യം തീരുമാനിക്കുന്നത് മലയാളഭാഷ ഉപയോഗിക്കുന്ന ജനസമൂഹമാണ്.വിവരസാങ്കേതികവിദ്യയുടെ വ്യാപനത്തിന്റെ അടിസ്ഥാനം തന്നെ സ്റ്റാന്‍ഡേര്‍ഡുകളുടെ സാന്നിദ്ധ്യമായിരിക്കെ, മലയാള അക്ഷരങ്ങളും വാക്കുകളും ഒാരോ വ്യക്തിക്കും താനുദ്ദേശിക്കുന്ന രീതിയില്‍ എഴുതാനും സൂക്ഷിക്കാനും വിനിമയം ചെയ്യാനും ഒരു പൊതു മാനദണ്ഡം ആവശ്യവുമെന്നിരിക്കെ,അതൊന്നും ആവശ്യമില്ലെന്ന സിബുവിന്റെ സമീപനം ദുരൂഹമാകുന്നു.അതുപോലെത്തന്നെ കൂട്ടക്ഷരങ്ങളെ പിരിച്ചുകാണിക്കല്‍ വേണ്ടിവരുമെന്നു സമ്മതിക്കുമ്പോള്‍തന്നെ അതിനു ഉപായങ്ങളൊന്നുമില്ലെന്നു കൈ മലര്‍ത്തുന്നു.

    അക്ഷരം അഗ്നിയായി കൊണ്ടുനടക്കുന്നവരും ലക്ഷക്കണക്കിന് ഭാഷാസ്നേഹികളും യൂണിക്കോഡ് ലോകത്തിന് പുറത്ത് കാത്തു നില്ക്കുകയാണ്.അവരെല്ലാമെത്തുമ്പോള്‍ മലയാളം ഇങ്ങനെയൊക്കെ ആയിരുന്നാല്‍ മതിയോ?ആലോചിക്കുക.

    മതി.തല്ക്കാലം ഈ ചര്‍ച്ചയില്‍ നിന്നും പിന്‍വാങ്ങുന്നു.കാഴ്ചക്കാരനായി തുടരും.

    ReplyDelete
  114. റാല്‍മിനോഫ്: സ്റ്റേറ്റ്മെന്റുകള്‍ക്ക്‌ കാര്യകാരണങ്ങള്‍ നിരത്താന്‍ ശ്രമിക്കൂ. ഇല്ലാതെങ്ങനെ ബാക്കിയുള്ളവര്‍ക്ക്‌ അതെങ്ങനെയെന്ന്‌ മനസ്സിലാവും?

    സുറുമ: വസ്തുനിഷ്ഠമായ തര്‍ക്കങ്ങളെങ്ങനെ ഹാനികരമാവും? അതില്ലാതെ നമ്മള്‍ കാര്യങ്ങള്‍ എക്സ്പോര്‍ ചെയ്യുന്നതെങ്ങനെ?

    സ്റ്റാന്റേഡൈസേഷന്‍ ആവശ്യത്തിനേ വേണ്ടൂ. അനാവശ്യത്തിനുള്ള സ്റ്റാന്റേഡൈസേഷന്‍ പുരോഗതിക്ക്‌ വിഘാതമാണ്. ഫോണ്ടില്‍ സ്റ്റാന്റേഡൈസേഷനില്ലെങ്കിലുള്ള ഉപകാരത്തിന് ഒരുദ്ദാഹരണമെഴുതാം:
    മനോരമയ്ക്ക്‌ ഇന്റര്‍നെറ്റ് എഡിഷന് വേണ്ടി കുറച്ച്‌ നല്ല ഫോണ്ടുകള്‍ വേണം. ഫോണ്ട്‌ ഡിസൈന്‍ ചെയ്യുക എളുപ്പമല്ല. എത്ര ചിഹ്നങ്ങളുണ്ടോ അതിനനുസരിച്ചാണ് അതിനെടുക്കുന്ന അധ്വാനം, ചിലവ്, സമയം എല്ലാം. പുതിയലിപിയാണെങ്കില്‍ 100-150 ചിഹ്നങ്ങളേ ഡിസൈന്‍ ചെയ്യേണ്ടതുള്ളൂ. പഴയലിപിയാണെങ്കില്‍ 900-വും. ഫോണ്ട്‌ സ്റ്റാന്റേഡൈസ് ചെയ്തിട്ടുണ്ടെങ്കില്‍ 150 ചിഹ്നങ്ങളുള്ളത്‌ നോണ്‍സ്റ്റാന്റേഡ്‌ ആണ്. യുണീക്കോഡ് സ്റ്റാന്റേഡൈസേഷന്‍ മാത്രമേ ഉള്ളൂവെങ്കില്‍ 150 ചിഹ്നങ്ങളുള്ളതിനും 900 ലിപികളുള്ളതിനും സ്റ്റാന്റേഡ് അനുസരിക്കുന്നതാവാം. അങ്ങനെ, മനോരമയ്ക്ക്‌ ഒരു പഴയലിപി ഫോണ്ടിന് പകരം മൂന്ന്‌ നാല് വിവിധ ഡിസൈനിലുള്ള പുതിയലിപി ഫോണ്ടുകള്‍ ലഭിക്കും. അത്‌ വിവിധതരം ഫോണ്ടുകളുടെ ഡെവലപ്പ്മെന്റിനെ വളരെ സഹായിക്കുന്നു. അതേസമയം ഇന്‍ഫൊര്‍മേഷന്‍ എക്സ്ചേഞ്ചിനെ ഒരുതരത്തിലും ബാധിക്കുന്നുമില്ല.

    ഞാന്‍ നേരത്തെ പറഞ്ഞ ചതുരക്കട്ടയുണ്ടാക്കുന്ന നിയമങ്ങളെ കാര്യമായി മയപ്പെടുത്തി ഇപ്പോഴത്തേതിനോട്‌ വളരെ സാമ്യമുള്ള നിയമങ്ങളാക്കി. ഇവിടെ വായിക്കുമല്ലോ.

    ReplyDelete
  115. cibu:
    "റാല്‍മിനോഫ്, IDN-ല്‍ ZW(N)J ഉപയോഗിക്കാന്‍ പാടില്ല. അതിനാല്‍ അവിടെ സ്പൂഫിങ് പ്രശ്നവും ഇല്ല."

    suppose cibu has a website ഞാൻ.com
    (in new encoded chillu)
    I am trying to spoof this address with
    ഞാന്‍.com (i register my idn as ഞാന്.com , but tells the people its ഞാന്‍.com which is not illegal also, as zwj is not allowed in idn). I can blame cibu for spoofing my address also as mine was the earlier standard)

    ചതുരക്കട്ട വെക്കണമെങ്കില്‍ ഫോണ്ട് സ്റ്റാന്‍ഡേര്‍ഡൈസ് ചെയ്യണം എന്നേ ഞാന്‍ പറഞ്ഞുള്ളൂ.
    പുതിയ നിര്‍ദ്ദേശം തരക്കേടില്ല.പുതിയലിപിക്കാര്‍ ഹാപ്പിയാകും.

    ReplyDelete
  116. വിശ്വത്തിന്റേയും സുനിലിന്റേയും കുറിപ്പുകള്‍ വ്യക്തമാക്കുന്നത്‌ ചില്ല് എന്‍കോഡ്‌ ചെയ്താല്‍ ഭാഷാ കമ്പ്യൂട്ടിങ്ങിനുണ്ടാകുന്ന എണ്ണമറ്റ ഗുണങ്ങളെക്കുറിച്ച്‌ അവര്‍ക്ക്‌ വ്യക്തമായ ബോദ്ധ്യമുണ്ട്‌ എന്നാണ്‌. നിലവിലുള്ള രീതിയില്‍ ZW(N)J ഉപയോഗിച്ച്‌ ചില്ലുകള്‍ ഉല്‍പാദിപ്പിക്കുമ്പോഴുണ്ടാകുന്ന അപകടങ്ങളെകുറിച്ച്‌ അവര്‍ക്ക്‌ അതുകൊണ്ട് സ്വാഭാവികമായും വല്ലാത്ത ഉല്‍ക്കണ്ഠകളുണ്ട്‌. സുറുമയുടേയും റാല്‍മിനോവിന്റേയും (എന്റേയും) സന്നിഗ്ദ്ധതകളുടെ ഹേതു ഈ ബോദ്ധ്യങ്ങളുടെ അഭാവമാണ്‌.

    വിശ്വവും സുനിലും മുന്‍കൈ എടുത്ത്‌ ഉടനെ ഒരു കാര്യം ചെയ്യണം. ചില്ല് എന്‍കോഡ്‌ ചെയ്താല്‍ ഉണ്ടാകുന്ന ഗുണങ്ങള്‍, പ്രയോജനങ്ങള്‍, എളുപ്പങ്ങള്‍ (Merits, and demerits if any) എന്നിവയെ കുറിച്ച്‌
    ഒന്ന്
    രണ്ട്‌
    മൂന്ന്
    നാല്‌
    .......

    എന്നിങ്ങനെ compile ചെയ്ത്‌ അടിയന്തിരമായി ഇവിടെ പ്രസിദ്ധീകരിക്കണം. സിബുവിന്റെ ഫാക്കുകളിലും ഇന്‍ഡിക്‌ ലിസ്റ്റിലെ ചര്‍ച്ചകളിലും എറിക്‌ മുള്ളര്‍, പീറ്റര്‍ കോണ്‍സ്റ്റബിള്‍ എന്നിവരുടെ മെയിലുകളിലും മറ്റുമായി ചിതറികിടക്കുന്ന ആശയങ്ങളെ ക്രോഡീകരിച്ചാലേ ചര്‍ച്ച അര്‍ത്ഥവത്തായി മുന്നേറൂ.

    ചില്ലിനുവേണ്ടിയുള്ള വാദങ്ങളെക്കാളും പ്രതിവാദങ്ങളെക്കാളും രാഷ്ട്രീയങ്ങളെക്കാളും മുന്‍ഗണന കൊടുക്കേണ്ടത്‌ പ്രയോജനങ്ങളെക്കുറിച്ചുള്ള വിലയിരുത്തുകളെയാണ്‌. ഒന്നോ രണ്ടോ അപകടങ്ങളുണ്ടാകാമെങ്കിലും, നൂറ്‌ ഗുണങ്ങളുണ്ടെങ്കില്‍ ചില്ലിന്റെ എന്‍കോഡിംഗ്‌ എന്തുകൊണ്ട്‌ സ്വാഗതം ചെയ്തുകൂടാ?

    ടൈപ്‌ റൈറ്റര്‍ കട്ടകളില്‍നിന്നും മാതൃഭാഷ ഒരുവിധം രക്ഷപ്പെട്ടു വരുന്നതേയുള്ളു. അപ്പോഴേക്കും ചതുരക്കട്ടകള്‍ പ്രത്യക്ഷപ്പെടുകയായി.

    ഹുസൈന്‍, രചന

    ReplyDelete
  117. ഹുസൈന്‍ ഉന്നയിച്ച കാര്യം പ്രസക്തമാണ്.പ്രശ്നപരിഹാരത്തിനുവേണ്ടിയാണ് നാം ശ്രമിക്കുന്നതെങ്കില്‍ അതിന് പ്രതികരണം ഉണ്ടാവേണ്ടതാണ്.ഇത്രയും നേരമായി ഒരു പ്രതികരണവും ഉണ്ടായില്ല എന്നത് സംശയാസ്പദമാണ്.

    പ്രതികരണത്തിനായി അനന്തമായി കാത്തിരിക്കാനാവില്ല.

    ചതുരക്കട്ടകളുടേയും വിചിത്രമായ കൂട്ടക്ഷരങ്ങളുടേയും കാലത്തിലേക്കാണ് നാം പോകേണ്ടതെങ്കില്‍ അക്കൂട്ടത്തിലുള്ള, പ്രബോധചന്ദ്രന്‍ നായരാല്‍ നയിക്കപ്പെടുന്ന മലയാളിയായി ഇതാ ഞാനും.

    ഇരുപത്തിയൊന്നാം നൂറ്റാണ്ടിലെ കേരളീയജീവിതത്തിന്റെ ചരിത്രത്തിന്റെ ഭാഗമാകുവാന്‍ അദ്ദേഹം നടത്തുന്ന പ്രവര്‍ത്തനം വിജയം വരിക്കുന്നെങ്കില്‍ അതിന്റെ ഫലം നമ്മുക്കെല്ലാം അനുഭവിക്കാം.

    ReplyDelete
  118. മാഷേ, നിങ്ങളെപ്പോലുള്ളവര്‍ ഇങ്ങനെ വികാരം കൊണ്ടാല്ലോ, 3-4 കൊല്ലത്തോളം പലരും ഈ വാദങ്ങള്‍ക്കു പുറകേ അലഞ്ഞു തിരിഞ്ഞവരാണു്, അവരുടെ പ്രതികരണം കാത്തിരിക്കാന്‍ ആകെയുള്ള സമയം ഒരു പകലാണോ?

    ഹുസൈന്‍ മാഷ് പറഞ്ഞതു കാര്യം, പക്ഷെ വിശ്വമോ സിബുവോ ഹുസൈന്‍ മാഷിനു തന്നെയോ ഇക്കാര്യം ചെയ്യാവുന്നതാണു്, പൊതുസ്ഥലത്തായതുകൊണ്ടു ആര്‍ക്കും ഫാബ്രിക്കേറ്റ് ചെയ്യാന്‍ പറ്റില്ല, അതുകൊണ്ടു് ആരു ചെയ്താലും സാരമില്ല.

    ReplyDelete
  119. റാല്‍മിനോഫ്, ഇക്കാര്യങ്ങളെ പറ്റി വിശദമായി ഇന്‍ഡിക് ലിസ്റ്റില്‍ ഒരു ചോദ്യം ഉന്നയിക്കൂ. എനിക്ക്‌ പറയാനുള്ള കാര്യങ്ങള്‍ ഇത്രയുമാണ്:
    റാല്‍മിനോഫ് ഉന്നയിച്ച പ്രശ്നം മലയാളം ചില്ലുകള്‍ക്ക്‌ മാത്രമായുള്ളതല്ല; ഡിപ്രിക്കേറ്റ് ചെയ്യപ്പെടുന്ന ഏത്‌ യുണീക്കോഡ് അക്ഷരത്തിനും ബാധകമാണ്. യുണീക്കോഡിന്റെ ഡിപ്രിക്കേഷന്‍ രീതി എന്താണോ അത്‌ തന്നെ, ഇവിടെയും അപ്ലിക്കബിള്‍ ആണ്.
    ചില്ലുള്ള എത്ര IDN-കള്‍ ഇതുവരെ റജിസ്റ്റര്‍ ചെയ്തിട്ടുണ്ടാവാം? ഏതെങ്കിലും ഉണ്ടെങ്കില്‍ തന്നെ, നാമമാത്രമാണെന്ന്‌ എന്റെ ഊഹം.
    അതുകൊണ്ട്‌ തന്നെ, ഇതുവരെ എഴുതിപ്പോയ 100 വാക്കുകള്‍ തെറ്റിപ്പോവുന്നതിലും എനിക്ക്‌ പ്രധാനം, മലയാളത്തില്‍ ഇനിയെഴുതാനിരിക്കുന്ന കോടിക്കണക്കിന് വാക്കുകള്‍ ശരിയാവുന്നതാണ്.

    ഹുസൈന്‍, ആ ഒരുദ്ദേശം വച്ചാണ് ഞാന്‍ http://unicode.wikia.com റജിസ്റ്റര്‍ ചെയ്തത്‌ - ഒരു പ്രശ്നത്തിന്റെ വിവിധ വശങ്ങള്‍ ഒട്ടും വ്യക്തിപരമല്ലാതെ ക്രോഡീകരിക്കുക എന്നത്‌. ഇപ്പോഴും അവിടെ എഴുതുന്നത്‌ ഞാന്‍ മാത്രമാണ്. കൂടുതല്‍ പേര്‍ അവിടം ഉപയോഗിക്കും എന്ന്‌ ഇനിയും ഞാന്‍ ആശിക്കുന്നു. മലയാളം യുണീക്കോഡിന്റെ പ്രശ്നങ്ങളോരോന്നും വെളിവാകുന്ന മുറയ്ക്ക്‌ അവിടെ കാറ്റലോഗ് ചെയ്യണം എന്നതെന്റെ ഒരാശയാണ്. കൂടാതെ അവയ്ക്കുള്ള വിവിധ പരിഹാരമാര്‍ഗ്ഗങ്ങളും. ചില്ലിനെ പറ്റിയുള്ള ചര്‍ച്ച തീര്‍ന്നു എന്ന്‌ തോന്നിയതിനാലാണ് ചില്ലിനെ പറ്റിയുള്ള കാര്യങ്ങള്‍ കൂടുതല്‍ അവിടെ എഴുതാഞ്ഞത്‌. എന്നാല്‍ ഗണേശന്റെ ചില്ല് സൈന്‍ നിര്‍ദ്ദേശത്തെ ഞാ‍ന്‍ വിശദമായി ക്രിട്ടിസൈസ് ചെയ്തിട്ടുണ്ട്‌. ചില്ല് എന്തുകൊണ്ട്‌ എന്‍‌കോഡ് ചെയ്യണം എന്ന എന്റെ വാദങ്ങള്‍ ഞാന്‍ താമസിയാതെ അവിടേയ്ക്ക് കോപ്പി ചെയ്യാന്‍ ശ്രമിക്കാം.

    പിന്നെ, ചതുരക്കട്ട കളഞ്ഞ്‌ പുള്ളിവൃത്തമാക്കിയിട്ടുണ്ട്‌ :) വായിക്കുമല്ലോ.

    മഹേഷ്‌, പലവേദികളിലും ഉന്നയിച്ച എന്നെ പറ്റിയുള്ള വ്യക്തിപരമായ വിമര്‍ശനങ്ങള്‍ ഞാന്‍ ശ്രദ്ധിക്കാതെയല്ല. എന്നാല്‍ ഞാന്‍ എന്ന വ്യക്തിക്കല്ല, വസ്തുനിഷ്ഠവും സാങ്കേതികവുമായ കാര്യങ്ങള്‍ക്കേ ഈ ചര്‍ച്ചയില്‍ ഒരു പ്രാധാന്യമുള്ളൂ എന്നതിനാലാണ് അതിനൊക്കെ മറുപടി പറഞ്ഞ്‌ ഈ ചര്‍ച്ചയുടെ ഫോക്കസ് നഷ്ടപെടുത്താഞ്ഞത്‌‌. ഇനിയും അങ്ങനെ തന്നെ.

    ReplyDelete
  120. ബ്ലോഗില്‍ വന്നതിന് ശേഷം എനിക്കേറ്റവും പ്രയോജനകരമായി തോന്നിയ ചര്‍ച്ച. അറിവുകള്‍ പകര്‍ന്നു തരുന്നവര്‍ക്ക് നന്ദി.

    ReplyDelete
  121. IDN കാരണമാക്കിയാല്‍ എന്‍കോഡിങ്ങ് മാറ്റുന്നതു് അബദ്ധമാവും. കണ്മണി.കോം, കണ്‍മണി.കോം വെവ്വേറെ ആളുകള്‍ റെജിസ്റ്റര്‍ ചെയ്യുന്നതു് നല്ലതല്ലെന്നാണു് എന്റെ (ഇരുമ്പുലക്കയല്ലാത്ത) അഭിപ്രായം.

    ഇന്‍ഡിക് ലിസ്റ്റില്‍ സബ്​സ്ക്രൈബ് ചെയ്യാതെ ഒരു മെയില്‍ അയച്ചു. അതെവിടെപ്പോയോ എന്തോ!!

    ReplyDelete
  122. സിബു: ചില്ല് എന്തുകൊണ്ട്‌ എന്‍‌കോഡ് ചെയ്യണം എന്ന എന്റെ വാദങ്ങള്‍ ഞാന്‍ താമസിയാതെ അവിടേയ്ക്ക് കോപ്പി ചെയ്യാന്‍ ശ്രമിക്കാം.

    വാദങ്ങള്‍ അവിടെ നില്‍ക്കട്ടെ. നൂറെണ്ണം വേണ്ട, ഒരഞ്ചു പ്രയോജനങ്ങള്‍ ഇവിടെ കുറിച്ചിടൂ. 'അവിടേയ്ക്കു' കോപ്പി ചെയ്യേണ്ട.
    വെബും ലിങ്കുകളും മനുഷ്യനെ കുടുക്കാനുള്ള വലയായിതീരുകയാണ്‌.

    ഹുസൈന്‍, രചന

    ReplyDelete
  123. viswaprabha wrote:
    യുണികോഡ് ഒരു ചതുരക്കട്ട കാണിക്കുമ്പോള്‍ നമ്മോടു പറയുന്നത്, “നോക്കൂ, ഇവിടെ ഏതോ ഒരു ഭാഷയിലെ ഒരക്ഷരം എഴുതിയിട്ടുണ്ട്. പക്ഷേ അതു കാണിക്കാനുള്ള ഗ്ലിഫ് എന്റെ കയ്യിലില്ലാട്ടോ, സോറി. പക്ഷേ ഞാന്‍ അതിനെ ശല്യമൊന്നും ചെയ്യില്ല. അങ്ങനെത്തന്നെ കൊണ്ടുനടന്നോളാം” എന്നാണ്. (അതേ സമയം ഒരു ചോദ്യചിഹ്നമാണെന്നു വരികില്‍ യുണികോഡിന് ആ ക്യാരക്റ്ററിനെയോ അതിന്റെ ഭാഷയേയോ തിരിച്ചറിയാന്‍ പോലുമായില്ലെന്നര്‍ത്ഥം. അല്ലെങ്കില്‍ ആ പേജ്/അക്ഷരം യുണികോഡിനെ തിരിച്ചറിഞ്ഞില്ലെന്നും പറയാം. പ്രസ്തുത ക്യാരക്റ്റര്‍ കൂടുതല്‍ പ്രോസസ്സിംഗിന് ഉപയുക്തമാവാതെ എന്നെന്നേക്കുമായി നശിച്ചുപോയി എന്നു കരുതാം.)

    There are factual errors in these statements. Only to put the record straight I intervene.
    1.When we see blocks, we understand that the application supports unicode and the written language, but no font available to show those glyphs.
    2.When we see question mark, the application is unaware of the language itself or its encoding.It doesnt mean however the data has become useless. The data can be read successfully with unicode aware , langauge supported applications.


    And regarding Cibu's new proposal, please read the first comment in this post by Peringodan.

    All the problems will be solved if the joiners are elevated from their format control character status, and in the Input method a key is assigned to virama + zwnj ligature.

    മലയാളം എഴുതി മടുത്തിട്ടല്ല. മലയാളം അറിയാത്തവരും വായിച്ചോട്ടെ എന്നു് കരുതിയാണു്.

    ReplyDelete
  124. റാല്മിനോഫ്, ചില്ലുകള് എന്കോഡ് ചെയ്യുന്നതും എന്കോഡ് ചെയ്യാത്തതും പെര്ഫെക്റ്റ് സൊല്യൂഷന്സ് അല്ല. അതായത് രണ്ടിലും പ്രശ്നങ്ങളുണ്ട്. കൂടുതല് ഗുരുതരമായ പ്രശ്നം സൃഷ്ടിക്കുന്ന സൊല്യൂഷന്, യുണീക്കോഡ് കണ്സോര്ഷ്യം ഒഴിവാക്കി. പ്രശ്നം എന്താണെന്ന് ഹുസൈനിനുള്ള മറുപടിയില്.

    കണ്മണി-കണ്മണി എന്നിവയ്ക്ക് രണ്ട് വ്യത്യസ്ത എന്കോഡിങ് ഉണ്ടാവുന്നു എന്നതായിരുന്നു ചില്ല് എന്കോഡിങ്ങിനെതിരെ രചന ഉന്നയിച്ച വാദം. അത് ശരിയുമാണ്. എന്നാല് പരിഹരിക്കാന് പറ്റാത്തതല്ല. ആവശ്യമെങ്കില് അവ തമ്മിലുള്ള ഈക്വിവാലന്സ് കണ്ടുപിടിക്കേണ്ട ചുമതല ഹയര്‍ ലെവല് ലോജിക്/പ്രോട്ടോക്കോളുകള്ക്കാണ്. ഉദാഹരണത്തിന് IDN-ന് വേണ്ടിയാണ് ഈ രണ്ട് വാക്കുകളെങ്കില്, ഒന്ന് മാത്രം അനുവദിക്കുക, ചില്ലിന്റെ എന്കോഡിങ്ങില് മാത്രം വ്യത്യാസമുള്ള മറ്റേ ഡൊമെയിന് നെയിം റിജക്റ്റ് ചെയ്യുക. യുണീക്കോഡിലെഴുതിയ ഏതുവാക്കും ഡൊമെയിന് നേം ആക്കാനാവില്ല. സെക്യൂരിറ്റിക്ക് വേണ്ടി അനേകം നിബന്ധനകള് IDN അനുവദിക്കുന്നതില് ഉണ്ട്. ആ നിബന്ധനകളാണ് ഇവിടെ ഹയര്‍ ലെവല് ലോജിക്.

    ഹുസൈന്,
    ഇപ്പോഴുള്‍ ചില്ലുണ്ടാക്കുന്ന രീതിക്കുള്ള ഏറ്റവും വലിയ പ്രശ്നം പറയാം. കറക്റ്റ്നെസ്സാണ് അത്‌. ഒരു സീക്വന്‍സ് അതിന്റെ അടിസ്ഥാനഘടകങ്ങളായുള്ള അക്ഷരങ്ങളോട് സത്യസന്ധത പുലര്‍ത്തേണ്ടതുണ്ട്. ഉദാഹരണത്തിന് ‘വാഴ’ എന്നെഴുതാന്‍ ‘വായ’ എന്നെഴുതി രണ്ട് ZWJ ഇട്ടാല്‍ മതി എന്ന രീതിയിലുള്ള എന്‍‌കോഡിങ്ങിനെ യുണീക്കോഡ് റിജക്റ്റ് ചെയ്യുന്നു. ഇതുപോലെയാണ് ഇന്ന് ചില്ലുകളുടെ കാര്യത്തിലും. ഉദാഹരണത്തിന് ‘മലര്‍’, ‘ഞായര്‍’ എന്നിവയില് ഉപയോഗിച്ചിരിക്കുന്ന ഒരേ ചില്ലക്ഷരം പ്രതിനിധാനം ചെയ്യുന്നത്‌ യഥാക്രമം ‘ര’, ‘റ’ എന്നീ വ്യത്യസ്തരണ്ടക്ഷരങ്ങളെ ആണ്. അപ്പോള്‍ ചില്ലുണ്ടാക്കാന്‍ ‘ര + ചന്ദ്രക്കല + ZWJ' ഉപയോഗിക്കണം എന്നു് വയ്ക്കുന്നത്‌ ‘ഞായറിന്റെ’ കാര്യത്തില്‍ കറക്റ്റ്നെസ് വയലേഷനാണ്.

    ReplyDelete
  125. അങ്ങനെയെങ്കില്‍ ചില്ല് സൈന്‍ നിര്‍ദ്ദേശത്തെ ഖണ്ഡിക്കാന്‍ സിബു IDN security issue കൂട്ടു് പിടിച്ചതെന്തിനു്? അവിടേയും higher level logic മതിയായിരുന്നല്ലോ?

    ഒരിക്കല്‍ എന്‍കോഡ് ചെയ്യപ്പെട്ടാല്‍ ആരു് തന്നെ വിചാരിച്ചാലും അതു് മാറ്റാനൊക്കില്ല. അതു് കൊണ്ടു് തന്നെ ചില്ലു എന്‍കോഡ് ചെയ്യപ്പെടുന്നതിനു് മുമ്പു് അപകടമാവില്ല എന്നു് ഉറപ്പു് വരുത്തേണ്ടതുണ്ടു്.

    ReplyDelete
  126. തീര്‍ച്ചയായും അത്‌ എന്റെ തെറ്റാണ്.. എത്രയും പെട്ടെന്ന്‌ തിരുത്താം. ചൂണ്ടിക്കാണിച്ചതിന് നന്ദി.

    IDN പ്രശ്നം, വാദങ്ങളുടെ സീക്വന്‍സില്‍ സെക്കന്ററി ഇഷ്യു ആയതിനാല്‍ മുഖ്യവാദങ്ങള്‍ക്കും പ്രപ്പോസലിനും കാര്യമായ വ്യത്യാസമുണ്ടാക്കില്ല എന്ന്‌ ശ്രദ്ധിച്ചുവല്ലോ.

    ReplyDelete
  127. സിബു ഹുസൈനോട് പറയുന്നു:
    ഇപ്പോഴുള്‍ ചില്ലുണ്ടാക്കുന്ന രീതിക്കുള്ള ഏറ്റവും വലിയ പ്രശ്നം പറയാം. കറക്റ്റ്നെസ്സാണ് അത്‌. ഒരു സീക്വന്‍സ് അതിന്റെ അടിസ്ഥാനഘടകങ്ങളായുള്ള അക്ഷരങ്ങളോട് സത്യസന്ധത പുലര്‍ത്തേണ്ടതുണ്ട്.

    ചില്ലിന്റെ കാര്യത്തില്‍ വ്യാകരണപണ്ഡിതന്മാരും ഭാഷാശാസ്ത്രജ്ഞരും നടത്തിയ ചര്‍ച്ചകള്‍ വായിച്ചു പഠിക്കാന്‍ അവസരമുണ്ടായിട്ടുണ്ട്. അവിടെയൊന്നും ലിപിചിഹ്നം അടിസ്ഥാനഘടകങ്ങളോട് നീതിപുലര്‍ത്തണം എന്ന് ആരും വാദിക്കുന്നതു കേട്ടിട്ടില്ല. ഏത് സൈദ്ധാന്തികനിലപാടില്‍ നിന്നാണ് ഈ വാദം എന്ന് അറിയാന്‍ താല്പര്യമുണ്ട്.

    ഇനി കമ്പ്യൂട്ടറില്‍ ചില്ലിന്റെ ലിപിചിഹ്നം രൂപപ്പെടുന്നതിന്റെ കാര്യത്തിലാണെങ്കില്‍, ഇക്കാര്യത്തെപ്പറ്റി നന്നായി മനസ്സിലാക്കിയവരാണ് CDACല്‍ അതിന്റെ വ്യവസ്ഥ നിശ്ചയിച്ചിട്ടുള്ളത്. പ്രായോഗികമായും താത്വികമായും ISFOC കോഡും അതിന്റെ പ്രയോഗരീതിയും ശരിയാണ്.വിരാമ എന്ന സംജ്ഞയോട് എനിക്ക് വിപ്രതിപത്തിയുണ്ട്.എന്നാല്‍, ഇന്ത്യന്‍ ഭാഷകളെ ഒരു കോഡിനു കീഴില്‍ കൊണ്ടുവന്ന മഹത്തായ പ്രവര്‍ത്തനം ആദരവോടെ അംഗീകരിക്കുവാന്‍ ആര്‍ക്കും സാധിക്കും എന്നാണ് എന്റെ വിശ്വാസം.ചില്ലിന്റെ അടിസ്ഥാനഘടകങ്ങളോട് സത്യസന്ധത പുലര്‍ത്തണം എന്ന് സീബുവിന് തോന്നുന്നതു പോലെ അവര്‍ക്ക് തോന്നാതിരുന്നത് എന്തു കൊണ്ടായിരിക്കാം?

    സാങ്കല്പികപ്രശ്നങ്ങള്‍ക്ക് യുക്തിരഹിതമായ പരിഹാരം കല്പിച്ച് അതിന് സൈദ്ധാന്തികസാധൂകരണം കണ്ടെത്താന്‍ ശ്രമിക്കുന്നത് ശാസ്ത്രീയമായ അടിത്തറയുള്ള വിഷയങ്ങളില്‍ എളുപ്പമല്ല.അറിവുള്ളവര്‍ക്ക് അത് എളുപ്പത്തില്‍ തിരിച്ചറിയാനാകും

    ReplyDelete
  128. എന്റെ ശരിക്കുള്ള പേരിനു് മൂന്നു് ചില്ലാണുള്ളതു്. ആറു് (6) ഞാന്‍ IDN register ചെയ്യണമല്ലോ ചില്ല് എന്‍കോഡ് ചെയ്താല്‍ !!!
    It'll take time to standardize and implement any high level logic in IDN procedure, as it is termed as 'secondary' argument. By that time there may be lot of IDNs using the deprecated method. Then the only way before the IDN will be to EXCLUDE the newly encoded characters from using in IDN (this also will be debated thoroughly).

    ഞായറിന്റെ ഉദാഹരണം വാദത്തിനു് കൊള്ളാം.

    സിബുവിന്റെ proposal ആദ്യം പറഞ്ഞ വെട്ടിമുറിയിലെത്തിയതു് സിബു ശ്രദ്ധിച്ചോ എന്തോ ! These meta joiners also will be removed by the applications resulting in Tamil like Malayalam.

    ReplyDelete
  129. To Ramilov,

    Presently there is no method by which the so called chillu characters can be represented in IDN and hence no question of IDN's with deprecated Chillu sequences. As far as I know, Malayalam IDN is not yet acitivated. The Indian authorities were trying to solve the Chillu issue before launching Malayalam IDN.
    Nimmy.

    ReplyDelete
  130. എല്ലാരുടേയും വാദങ്ങള്‍ വായിയ്ക്കുന്നുണ്ടു്. രണ്ടുകൊല്ലത്തോളം ഇതേ കാര്യങ്ങള്‍ തന്നെ വാദിച്ചുവാദിച്ചു കൊതിതീര്‍ന്നതാണു്. അതുകൊണ്ടാ ഇപ്പോ ഒന്നും എഴുതാതെ വിടുന്നതു്, താല്പര്യം നശിച്ചിട്ടാണെന്നു കരുതരുതു്. എല്ലാവര്‍ക്കും വാദിയ്ക്കാന്‍ അവസരം കൊടുക്കണമല്ലോ. പിന്നെ പറഞ്ഞതു് തന്നെ പറഞ്ഞുകൊണ്ടിരിക്കുന്നതിലെ മടുപ്പും.
    സസ്നേഹം കെവി

    ReplyDelete
  131. Malayalam IDN is active. Try കേരളം.com in Firefox. Some browsers doesn't allow IDN because of the security issue. If we write സര്‍ക്കാര്‍.com , it'll be changed to its punycode (xn--bwca3fc0b1bygbd.com) in the browser.

    There were people saying around there is no ZWJ in IDN, so inorder to get Chillu, we should encode Chillu. I also believed so initially.
    Now I will say, its simply absurd and it adds convenience of having less trouble in registering IDN. I can register റാല്മിനോവ്.കോം , nobody will prevent me from using റാല്‍മിനോവ്.കോം either.

    ReplyDelete
  132. ഞാന്‍ നേരത്തെ പറഞ്ഞ ചതുരക്കട്ടയുണ്ടാക്കുന്ന നിയമങ്ങളെ കാര്യമായി മയപ്പെടുത്തി ഇപ്പോഴത്തേതിനോട്‌ വളരെ സാമ്യമുള്ള നിയമങ്ങളാക്കി. ഇവിടെ വായിക്കുമല്ലോ.

    സിബുവിന്റെ സ്വപ്നത്തിലെ യുണീക്കോഡ് വായിച്ചു. താത്ത്വികമായി എനിക്കൊരെതിര്‍പ്പുണ്ടു്. യാതൊരുതരം ഫോര്‍മാറ്റിങ്ങും കൂടാതെയുള്ള മലയാളം ടെക്സ്റ്റ് എന്നതു് ഇപ്രകാരമൊരു രീതിയല്‍ അസാധ്യമാകും. പഴയലിപിയില്‍ എഴുതാന്‍ ജോയിനറുകള്‍ ടിപ്പര്‍ലോറിയില്‍ ഇറക്കേണ്ടിവരും. ജോയിനറുകള്‍ ഉപയോഗിച്ചു് പഴയലിപിയില്‍ എഴുതിയ ടെക്സ്റ്റ്, ഒരുപഴയലിപിഫോണ്ടുപയോഗിക്കാന്‍ പറ്റാത്ത അവസ്ഥയില്‍ (ഉദാഹരണത്തിനു്: മൊബൈല്‍ഫോണ്‍ ഡിസ്പ്ലേ, എയര്‍പോര്‍ട്ടിലെ ഫ്ലൈറ്റ് ഇന്‍ഫൊര്‍മേഷന്‍ ഡിസ്പ്ല) കുത്തുവട്ടങ്ങളുമായി വൃത്തികേടാവും. പിന്നെയുള്ള പ്രശ്നം, ഒരായിരം പേജുള്ള ഒരു ഗ്രന്ഥം ഏതോ കാരണവശാല്‍ ജോയിനറുകള്‍ നഷ്ടമായ അവസ്ഥയില്‍ അതിനെ പഴയലിപിയില്‍ അച്ചടിക്കണമെങ്കില്‍ എന്തുചെയ്യും? അത്രയും കൂട്ടക്ഷരങ്ങള്‍ ഉണ്ടാക്കാന്‍ വീണ്ടും ആ ആയിരം പേജിലും പോയി ജോയിനറുകള്‍ കേറ്റണ്ടേ? അതു നടക്കണ കാര്യമാണോ?

    ഇത്തരം ഒരു മാറ്റം ഞാന്‍ സിബുവിന്റെ സ്വപ്നത്തിനു നിര്‍ദ്ദേശിക്കുന്നു. ജോയിനറിനു പകരം അണ്‍ജോയിനര്‍ ഉപയോഗിക്കുക. ഒരു സ്വാഭാവിക മലയാളം ടെക്സ്റ്റ്, ഫോര്‍മാറ്റിങ്ങ് ഇല്ലാതെ, ഉപയോഗിക്കുന്ന ഫോണ്ടിനനുസൃതമായി കാണണം. യാതൊരു കുഴപ്പങ്ങളും കുത്തുവട്ടങ്ങളുമില്ലാതെ. പിരിച്ചുകാണിക്കണമെന്നു എഴുത്തുകാരനു നിര്‍ബന്ധമുള്ളവയ്ക്കു് ഒരു അണ്‍ജോയിനര്‍ ഉപയോഗിച്ചു് പിരിക്കാം. എഴുത്തുകാരനു കൂട്ടക്ഷരമായി കാണണമെന്നു നിര്‍ബന്ധമുണ്ടെങ്കില്‍ വായനക്കാരനോടു ഉപദേശിക്കാം, ഒരു പഴയലിപിയുള്ള ഫോണ്ടുപയോഗിക്കാന്‍, പക്ഷേ എല്ലാ അവസരങ്ങളിലും അതു പ്രായോഗികമാണെന്നു കരുതരുതു്. പഴയലിപി കാണിക്കാന്‍ കഴിയാത്ത, സ്ഥലസൌകര്യവും റെസലൂഷന്‍ സൌകര്യവും മറ്റും ഇല്ലാത്ത അവസരങ്ങളില്‍ പുതിയ ലിപിതന്നെ ശരണം. അപ്പോ പഴയലിപിയില്‍ എഴുതിയ മലയാളം ടെക്സ്റ്റിനു കുഴപ്പമൊന്നും പറ്റരുതു്.

    ReplyDelete
  133. റാല്മിനോഫ്: All the problems will be solved if the joiners are elevated from their format control character status, and in the Input method a key is assigned to virama + zwnj ligature

    ഞാന് നേരത്തെ പറഞ്ഞത് പോലതന്നെ, ഇത്തരം സ്റ്റേറ്റുമെന്റുകള് പറയുമ്പോള്, തെളിവ് വേണം.

    ഫോണ്ട് സ്റ്റാന്റേഡൈസേഷനെ പറ്റി പറഞ്ഞതു തന്നെ, ഇന്പുട്ട് മെത്തേഡ് സ്റ്റാന്റേഡൈസേഷനെ പറ്റി പറയാനുള്ളതും.

    ചില സീക്വന്സുകള് പ്രശ്നങ്ങളുണ്ടാക്കുമെങ്കില് അത് യുണീക്കോഡില് തന്നെയാണ് നിവൃത്തിയുണ്ടെങ്കില് ഫിക്സ് ചെയ്യേണ്ടത്. മുകളിലെ അപ്ലിക്കേഷനുകളിലല്ല. ഇതൊന്നും കൂടാതെ ഈ നിര്ദ്ദേശത്തിന് പ്രശ്നങ്ങളുണ്ട്. ഈ പറഞ്ഞ പ്രകാരം കീബോര്ഡില് എത്ര ചന്ദ്രക്കലയുണ്ടാവും? രണ്ടെണ്ണം വേണ്ടിവരില്ലേ? 1) virama 2) virama + zwnj. ഇല്ലെങ്കില് കൂട്ടക്ഷരം 'ക്ക' എങ്ങിനെയുണ്ടാക്കും? രണ്ടെണ്ണമുണ്ടെങ്കില് കാര്ത്തികയുപയോഗിക്കുന്ന ആള് ദൃക്സാക്ഷി എന്ന് തെറ്റായി എഴുതിയാല് അതെങ്ങനെ തിരിച്ചറിയും?


    മഹേഷ്: അവിടെയൊന്നും ലിപിചിഹ്നം അടിസ്ഥാനഘടകങ്ങളോട് നീതിപുലര്ത്തണം എന്ന് ആരും വാദിക്കുന്നതു കേട്ടിട്ടില്ല. ഏത് സൈദ്ധാന്തികനിലപാടില് നിന്നാണ് ഈ വാദം എന്ന് അറിയാന് താല്പര്യമുണ്ട്.

    ഇതെനിക്ക് ഇഷ്ടമായി. ശ്രദ്ധിച്ചുവായിക്കൂ.. മഹേഷ് പറഞ്ഞുവരുന്നത് പണ്ഡിതര് ചില്ലുകളെ അവയുടെ അടിസ്ഥാന അക്ഷരങ്ങളുമായി ബന്ധപ്പെടുത്തിയല്ല കാണുന്നത്‌; മറിച്ച് അവയെ പ്രത്യേക ഒരു എന്റിറ്റി ആയിട്ടാണ്. അതുതന്നെയാണ് ഞാനും പറഞ്ഞത്. ചില്ലുകള് പലകാര്യങ്ങളിലും പ്രത്യേക എന്റിറ്റി ആയി ആണ് പ്രവര്ത്തിക്കുന്നത്; അതുകൊണ്ട് അവയെ എന്കോഡ് ചെയ്യണം.

    അക്ഷരങ്ങളെ എന്കോഡ് ചെയ്യേണ്ടതിന്റെ മാനദണ്ഡങ്ങള് UTR#17: Character Encoding Model എന്ന ഡോക്യുമെന്റിലാണ് എഴുതിയിരിക്കുന്നത്. പക്ഷെ, ആ ഡോക്യുമെന്റ് പോരാ എന്നത് ഞാനും സമ്മതിക്കുന്നു.. കുറച്ചുകൂടി കൃത്യമായി കാര്യങ്ങള് എഴുതേണ്ടതുണ്ട്. എന്തായാലും ഈ ചോദ്യം ഇന്ഡിക് ഫോറത്തില് ചോദിക്കൂ.

    പിന്നെ, കഴിഞ്ഞ ദിവസം ബൂലോഗക്ലബ്ബില് കമന്റുവന്നില്ല അതുകൊണ്ട് ചില്ല് എന്കോഡ് ചെയ്യരുത് എന്നിങ്ങനെ പോകുന്ന വാദങ്ങള് ഇന്ഡിക് ലിസ്റ്റില് കണ്ടു. ഞാനിവിടെ ഒന്നു രണ്ട് ദിവസം കൂടുമ്പോള് ഒരിക്കലേ കമന്റെഴുതൂ. അത് കാര്യങ്ങള് ആലോചിച്ച് എഴുതാനും, ചര്ച്ച ആവശ്യത്തില് കൂടുതല് ഹീറ്റഡായി പോവാതിരിക്കാനുമാണ്.

    റാല്മിനോഫ്: എന്റെ ശരിക്കുള്ള പേരിനു് മൂന്നു് ചില്ലാണുള്ളതു്. ആറു് (6) ഞാന് IDN register ചെയ്യണമല്ലോ ചില്ല് എന്കോഡ് ചെയ്താല് !!!

    വേണ്ടിവന്നേക്കാം. എന്നാല് അതൊക്കെ യുണീക്കോഡിന്റേതിനേക്കാള് അതാത് ഭാഷയുടെ പ്രശ്നമാണ്. ഉദാ: color & colour. അല്പ്പം & അല്പം. ഇവിടെയൊക്കെ സ്പെല്ലിംഗ് വ്യത്യാസമുണ്ട്, അതുകൊണ്ട് എന്കോഡിങ് വ്യത്യാസവുമുണ്ട്.

    റാല്മിനോഫ്: സിബുവിന്റെ proposal ആദ്യം പറഞ്ഞ വെട്ടിമുറിയിലെത്തിയതു് സിബു ശ്രദ്ധിച്ചോ എന്തോ ! These meta joiners also will be removed by the applications resulting in Tamil like Malayalam.

    അത് സ്വപ്നലോകത്തെ യുണീക്കോഡല്ലേ.. അവിടെ നിയമങ്ങളെല്ലാം നമ്മളുണ്ടാക്കുന്നതല്ലെ. ആ പ്രപ്പോസലിലെ വിരാമജോയിനറിനെ കളയാന് പാടില്ല എന്നുപറഞ്ഞാല് കളയാന് പാടില്ല. അത്രേ ഉള്ളൂ.

    കെവിനേ, കുത്തുവട്ടത്തിനെ ഒരു വാണിങ്ങായി കണക്കാക്കണം. അത്‌ ഏതെങ്കിലും രീതിയില്‍ ഡിസേബിള്‍ ചെയ്താല്‍ ‘ദൃക്സാക്ഷി’ വരും; ജോസ്തോമസ് തീര്‍ച്ചയായും വരും. കാര്‍ത്തികയിലെഴുതിയത്‌ അഞ്ജലിയില്‍ വായിക്കുന്നതാണ് പ്രോബ്ലമാറ്റിക് സിനാരിയോ.

    ReplyDelete
  134. സിബുവിന്റെ അഭിപ്രായം വ്യക്തതയില്ലായ്മയും അതിന്റെ ഭാഗമായ തെറ്റിദ്ധാരണകളുമാണ് കാണിക്കുന്നത്.

    വ്യാകരണപണ്ഡിതന്മാര്‍,ഭാഷാശാസ്ത്രജ്ഞര്‍ എന്നിവര്‍ വ്യത്യസ്ത തലത്തിലാണ് ഭാഷാപഠനം നടത്തുന്നത്. അവയ്ക്ക് വ്യത്യസ്തങ്ങളായ ലക്ഷ്യങ്ങളും രീതിശാസ്ത്രവുമാണെന്ന് കാര്യവിവരമുള്ളവര്‍ക്കറിയാം.
    ഭാഷാ കമ്പ്യൂട്ടിംഗന്റെ കാര്യത്തില്‍ പ്രസക്തമായ ഉള്‍ക്കാഴ്ചകള്‍ മേല്പറഞ്ഞ വിജ്ഞാനശാഖകളില്‍ നിന്ന് കൈക്കൊള്ളുന്നത് മനസ്സിലാക്കാം.
    അതിനു പകരം വ്യാകരണപണ്ഡിതന്മാര്‍ ചില്ലിനെ പ്രത്യേക എന്റിറ്റിയായി കണക്കാക്കിയെന്നെല്ലാം വാദിക്കുന്നത് അസംബന്ധമാണ്.

    എന്റെ ചോദ്യത്തിന് ഉത്തമം പറയണമെന്നില്ല. എന്റെ ചോദ്യത്തെ തെറ്റായി വ്യാഖ്യാനിച്ച് ഉത്തരമാണ് പറയുന്നത് എന്ന് നടിക്കാതിരിക്കുക.

    ചില്ല് എന്‍കോഡ് ചെയ്യണമെന്നതാണ് സിബുവിന്റെ പക്ഷം എന്ന കാര്യത്തില്‍ എനിക്ക് സംശയമേതുമില്ല. അതിന്റെ യുക്തിയായി ഇത്തമം ദുര്‍വ്യാഖ്യാനങ്ങളേയുള്ളൂ എന്നു വരുന്നത് കഷ്ടമാണ്.

    ReplyDelete
  135. സിബൂ,
    താങ്കള്‍ കുറച്ചുകൂടി തുറന്ന സമീപനം എടുുത്തിരുന്നെങ്കില്‍ വല്ലാതെ ആഗ്രഹിച്ചുപോകുന്നു. ചില്ല് എന്‍കോഡിങ് താങ്കള്‍ക്ക് ഒരു fixation ആയിട്ടുണ്ടെന്നുവേണം കരുതാന്‍. കാരണം chillu sign എന്ന പ്രപ്പോസല്‍ വന്നപ്പോള്‍(അത് നിര്‍ദ്ദേശിച്ചത് ഒരു തമിഴനായിരുന്നിട്ടുകൂടി) താങ്കള്‍ അതിനെ എതിര്‍ത്തത് 'ക'-യുടെ ചില്ല് എല്ലാ ഫോണ്ടുകളും ഉപയോഗിച്ചുകൊള്ളണമെന്നില്ല എന്ന ന്യായം പറഞ്ഞാണ്.അതേ സമയം ചില്ല് എന്‍കോഡ് ചെയ്യുമ്പോള്‍ 'ക'-യുടെ ചില്ല് ഉള്‍പ്പെടുത്തുകയും ചെയ്യുന്നു! സന്ദര്‍ഭം അനുസരിച്ച് താങ്കള്‍ വാദമുഖങ്ങള്‍ മാറ്റുന്നു.

    ചില്ല് എന്‍കോഡിങിനെ ആരും എതിര്‍ക്കില്ല,അത് ഏറെ പ്രയോജനകരമാണെന്നു വരുകില്‍. നേരത്തെ ഹുസൈന്‍ പറഞ്ഞപോലെ രണ്ടു വാദങ്ങളുടെയും merits and demerits ഒന്നു വിശദമായി പറയൂ.

    ReplyDelete
  136. cibu said:
    അത് സ്വപ്നലോകത്തെ യുണീക്കോഡല്ലേ.. അവിടെ നിയമങ്ങളെല്ലാം നമ്മളുണ്ടാക്കുന്നതല്ലെ. ആ പ്രപ്പോസലിലെ വിരാമജോയിനറിനെ കളയാന് പാടില്ല എന്നുപറഞ്ഞാല് കളയാന് പാടില്ല. അത്രേ ഉള്ളൂ.

    ഞാന്‍ സമാനമായ നിര്‍ദ്ദേശമാണു് വെച്ചതു്. സ്പെഷല്‍ ജോയിനേര്‍സ്. അതിനെപ്പറ്റി ഒന്നും പറഞ്ഞു്കണ്ടില്ല. താങ്കളുടെ നിര്‍ദ്ദേശങ്ങള്‍ താങ്കള്‍ തന്നെ എതിര്‍ക്കുന്ന വിചിത്രമായ ഒരു സ്ഥിതിവിശേഷമാണു് ഇപ്പോള്‍ !!
    The STABILITY policy of Unicode doesn't allow to remove Codepoints once they are encoded. So all the problems the proposed Chillus might create must be well debated and the solutions for those problems must be identified, since there wont be any going back option available..

    ReplyDelete
  137. സുരേഷ് ചില്ലക്ഷരങ്ങള്‍ എന്‍‌കോഡ് ചെയ്യുന്നതിനെ കുറിച്ചു ഇന്‍‌ഡിക് ലിസ്റ്റില്‍ നടന്ന ചര്‍ച്ചയെ ക്രോഡീകരിച്ചു എറിക് മുള്ളര്‍ തയ്യാറാക്കിയ ഡോക്യുമെന്റ് കണ്ടു കാണുമെന്നു വിശ്വസിക്കുന്നു. ഇല്ലെങ്കില്‍ ഇതാ: http://std.dkuug.dk/jtc1/sc2/wg2/docs/N3126.pdf

    merit & demerits ഇനി നമുക്കെല്ലാവര്‍ക്കും ഒരുമിച്ചു ചേര്‍ന്നു തയ്യാറാക്കാം.

    (We all are making this whole discussion more complicated with every new comment)

    ReplyDelete
  138. Extract from Eric's Document:
    "While one could think of changing the ignorable status of joiners, this is now becoming more difficult, as the IDN machinery
    has already adopted the ignorable status. In other words, it’s not just Unicode we need to change, but IDN as well."

    Earlier Cibu was claiming IDN discussion is secondary in discussion pipeline. Anyway, even if the ignorable status of joiners are changed in Unicode, its advisable to preserve the ignorable status in IDN, so that people need not register 6 domain names if their domain name happen to contain 3 chillus. So Eric's argument that change should be made in IDN as well is void.

    I am one of those "ones" in Eric's observation.
    The van_yavanika etc are very rarely used. Even if we take those arguments, there are lot of words with "nanaarthas"(different meaning with same spelling) . We normally read the sentence in context.
    The manushyan example will not arise if people use samvruthokaram properly.
    I can't understand how the Unicode consortium accepted these trivial arguments and decided to encode new codepoints, knowing there is no chance for removing those characters later.

    ReplyDelete
  139. റാല്‍മിനോവ് പറഞ്ഞു: The van_yavanika etc are very rarely used. Even if we take those arguments, there are lot of words with "nanaarthas"(different meaning with same spelling) . We normally read the sentence in context.

    ഇപ്പോഴുള്ള ചില്ലുരീതി സൃഷ്ടിക്കുന്ന പ്രശ്നങ്ങളെ ഒന്നടങ്കം are very rarely used എന്നു പറഞ്ഞു് തള്ളുകയാണു് റാല്മിനോവ് ചെയ്യുന്നതു്. ഈ പ്രശ്നത്തിനു പരിഹാരം പറയുക ആദ്യം. ഇതു് നാനാര്‍ത്ഥമുള്ള വാക്കുകളല്ല. രണ്ടു വേറേവേറെ അര്‍ത്ഥമുള്ള വ്യത്യസ്തരീതിയില്‍ എഴുതേണ്ടുന്ന വാക്കുകളാണു്. അവ എഴുതാന്‍ ഒരു zwjയുടെ മാത്രം വ്യത്യാസം എന്നതാണു് ഇപ്പോഴത്തെ ചില്ലിലെ പ്രശ്നം. ഒരു idn രജിസ്റ്റര്‍ ചെയ്യുമ്പോള്‍, ഇപ്പോഴത്തെ ചില്ലിന്റെ രീതിക്കാണു് അപകടം ഉള്ളതു്. വന്‍യവനിക എന്നും വന്യവനിക എന്നും ഉള്ള രണ്ടുവാക്കുകള്‍ തമ്മില്‍ ഒരു zwj യുടെ വ്യത്യാസമേ ഉള്ളൂ. IDN രജിസ്റ്റ്രേഷനില്‍ zwj പുറത്താവും. അപ്പോള്‍ വ്യത്യസ്ത അര്‍ത്ഥമുള്ള ഈ രണ്ടുവാക്കുകള്‍ ഒന്നാവും. വന്‍യവനിക.com എന്നു ലിങ്കു് കൊടുത്താല്‍ തന്നെ വന്യവനിക.com എന്നിടത്തേയ്ക്കാണു് അതുപോവുക. മറിച്ചു് ചില്ലിനു് കോഡുകൊടുത്താല്‍, ഈ രണ്ടുവാക്കുകളും വ്യത്യസ്തമായി തന്നെ നില്ക്കും. പിന്നൊന്നു് ഓര്‍മ്മിക്കുവാനുള്ളതു്, യുണീക്കോഡില്‍ കോഡുകൊടുക്കുന്നതു് ലിപിയിലെ അടിസ്ഥാനഎഴുത്തുരൂപങ്ങള്‍ക്കാണു്, അല്ലാതെ അക്ഷരങ്ങള്‍ക്കല്ല. അങ്ങിനെ അല്ലായിരുന്നെങ്കില്‍, കെവി എന്നെഴുതുമ്പോള്‍, ക് യുടെ കൂടെ എന്ന സ്വരം ചേര്‍ന്നുണ്ടാവുന്ന കെ എഴുതാന്‍ ക് യുടെ കൂടെ അല്ലേ ചേരേണ്ടതു്. മറിച്ചു് എയുടെ പുള്ളിയ്ക്കെന്തിനു കോഡു കൊടുത്തു? അതിനാര്‍ക്കും ഒരു പ്രശ്നവുമില്ലാത്തതെന്തുകൊണ്ടു്?

    ReplyDelete
  140. dear ralminov,
    zwj is not only used by the malayalam language. It has got a common
    use as format control for all the international languages. If zwj is
    given a special status in relation to malayalam, the whole lot of of
    programs which deals with unicode text has to take this special case
    into consideration while writing code. ex: a database. while storing
    the unformated text, a database will strip the format control
    characters. if malayalam alone is given a special postion for zwj,
    database has to be rewritten as if to check if the text is in
    malayalam then donot strip the zwj/else strip zwj. all the future high
    level programs which deals with international unformated text will
    face this problem. if international programmers dont take the
    speciality of malayalam language, then the malayalam text will get
    corrupted. to look for the speciality of zwj in every other languages
    to write an international progarm is not practical.

    having different status for zwj in unicode and idn will create more
    problems. if status of zwj is not going to change in idn, then the security threat I mentioned above will appear.

    and to change the usage status of zwj only in view of this problem is malayalam language is not going to happen.

    ReplyDelete
  141. "വന്‍യവനിക.com എന്നു ലിങ്കു് കൊടുത്താല്‍ തന്നെ വന്യവനിക.com എന്നിടത്തേയ്ക്കാണു് അതുപോവുക. മറിച്ചു് ചില്ലിനു് കോഡുകൊടുത്താല്‍, ഈ രണ്ടുവാക്കുകളും വ്യത്യസ്തമായി തന്നെ നില്ക്കും."

    വന്‍യവനിക.com എന്നു ലിങ്കു് കൊടുത്താല്‍ അതിന്റെ പുണിക്കോഡാണു് ബ്രൌസര്‍ കാണിക്കുക. വന്യവനിക.com റെജിസ്റ്റര്‍ ചെയ്യുന്ന ആള്‍ക്കു് തന്നെ വന്‍യവനിക.com ഉപയോഗിക്കാം എന്ന അധികസൌകര്യമാണു് ഇതു് വഴി ഉണ്ടാവുന്നതു്.

    IDN മാനദണ്ഡമാക്കിയാല്‍ ചില്ലു എന്‍കോഡ് ചെയ്യുന്നതു് അബദ്ധമാവും. സര്‍ക്കാര്‍.കോം റെജിസ്റ്റര്‍ ചെയ്യുന്നയാള്‍ നാലു് IDN റെജിസ്റ്റര്‍ ചെയ്യേണ്ടിവരും.

    ReplyDelete
  142. റാല്മിനോവു് പറഞ്ഞു: വന്‍യവനിക.com എന്നു ലിങ്കു് കൊടുത്താല്‍ അതിന്റെ പുണിക്കോഡാണു് ബ്രൌസര്‍ കാണിക്കുക. വന്യവനിക.com റെജിസ്റ്റര്‍ ചെയ്യുന്ന ആള്‍ക്കു് തന്നെ വന്‍യവനിക.com ഉപയോഗിക്കാം എന്ന അധികസൌകര്യമാണു് ഇതു് വഴി ഉണ്ടാവുന്നതു്.
    ഈ അധികസൌകര്യമാണു് അപകടം. idn സ്പൂഫ് ചെയ്യാന്‍ ഉതകുന്നതാണു് ഇത്തരം അധികസൌകര്യം. ഒരാള്‍ വന്‍യവനിക.com എന്നു രജിസ്റ്റര്‍ ചെയ്യുന്നു. മറ്റൊരാള്‍ക്കു് ഇവിടെ വന്യവനിക.com എന്നു ലിങ്കു് കൊടുത്തു് ഉപയോക്താക്കളെ തെറ്റിദ്ധരിപ്പിക്കാമെന്ന അധികസൌകര്യമാണുള്ളതു്. ഇതാണു് ഇപ്പോഴുള്ള ചില്ലിന്റെ പ്രശ്നം. പകരം ചില്ലിനു് കോഡുകൊടുത്താല്‍, സര്‍ക്കാര്‍.com എന്നെഴുതിയാല്‍ ചില്ലിനു പകരം വേറൊന്നും സ്വീകാര്യമല്ലാത്തതിനാല്‍, യാതൊരു വിധ സ്പൂഫിങ്ങിനും സാധ്യതയില്ല.

    ReplyDelete
  143. kevi:
    ഈ അധികസൌകര്യമാണു് അപകടം. idn സ്പൂഫ് ചെയ്യാന്‍ ഉതകുന്നതാണു് ഇത്തരം അധികസൌകര്യം. ഒരാള്‍ വന്‍യവനിക.com എന്നു രജിസ്റ്റര്‍ ചെയ്യുന്നു. മറ്റൊരാള്‍ക്കു് ഇവിടെ വന്യവനിക.com എന്നു ലിങ്കു് കൊടുത്തു് ഉപയോക്താക്കളെ തെറ്റിദ്ധരിപ്പിക്കാമെന്ന അധികസൌകര്യമാണുള്ളതു്.

    വന്‍യവനിക.com രജിസ്റ്റര്‍ ചെയ്യാന്‍ പറ്റില്ല.വന്യവനിക.com പറ്റും. ഇദ്ദേഹത്തിനു് അഡ്രസ്സ് വന്‍യവനിക.com എന്നാണെന്നു് പറയാനും പറ്റും. ഇവിടെ എവിടെയാണു് spoofing ? സര്ക്കാര്.കോം എന്നു് രജിസ്റ്റര്‍ ചെയ്യാം. സര്‍ക്കാര്‍.കോം ആണെന്നും പറയാം. ഇവിടെ എവിടെയാണു് spoofing ? വ്വെബ്​സൈറ്റ് ഒന്നല്ലേയുള്ളൂ.

    ReplyDelete
  144. if you are talking about some mischiefs trying to make fun of our site name, please see the real world examples of mispronunciation at
    http://domainrookie.com/hilarious-domain-name-mispronouncings

    Your 'spoofing' example is nothing.

    ReplyDelete
  145. റാല്മിനോവ് പറഞ്ഞു: വന്‍യവനിക.com രജിസ്റ്റര്‍ ചെയ്യാന്‍ പറ്റില്ല.വന്യവനിക.com പറ്റും
    എന്റെ കര്‍ട്ടനുണ്ടാക്കുന്ന കമ്പനിക്കു് വന്‍യവനിക.com എന്നു രജിസ്റ്റര്‍ ചെയ്യണം. പക്ഷേ വന്യവനിക.com എന്ന പേരില്‍ മറ്റൊരാള്‍ മറ്റൊരു സംഗതിയ്ക്കുവേണ്ടി രജിസ്റ്റര്‍ ചെയ്തുപോയി. അയാള്‍ അയാളുടെ സംഗതി വന്യവനിക.com എന്നു് രജിസ്റ്റര്‍ ചെയ്തതിനു് ഞാനെന്തുപിഴച്ചു? എന്റെ കര്‍ട്ടന്‍ കമ്പനിയ്ക്കു് ഞാനെങ്ങിനെ ഇനി വന്‍യവനിക.com എന്നു രജിസ്റ്റര്‍ ചെയ്യും? ഈ ചില്ലു കാരണം എനിക്കിഷ്ടപ്പെട്ട പേരു് ഉപയോഗിക്കാന്‍ പറ്റാതെ വരുന്നു. അങ്ങിനെ എത്രയോ വാക്കുകള്‍ മലയാളത്തില്‍ രജിസ്റ്റര്‍ ചെയ്യപ്പെടാന്‍ പറ്റാതെ വരും. ഇനി ഭാവിയില്‍ സൃഷ്ടിക്കപ്പെടാനിരിക്കുന്ന എത്രയോ വാക്കുകള്‍ ഇങ്ങനെ രണ്ടാംതരക്കാരായി തീരും. അതിനാരു സമാധാനം പറയും?

    ReplyDelete
  146. റാല്മിനോവിന്റെ അഭിപ്രായമനുസരിച്ചു് പൊന്‍വീണ.com എന്നു രജിസ്റ്റര്‍ ചെയ്യാനേ പറ്റില്ല മലയാളത്തില്‍. അതു പൊന്വീണ യായിപോകും. ഇതില്‍ പരം ഒരു ഗതികേടു് മലയാളത്തിനു വരാനില്ല. ചില്ലെഴുതിയാല്‍ ചില്ലുതന്നെ വേണം അവിടെ. അതിനുപകരം അതിന്റെ അടിസ്ഥാന അക്ഷരം ഏതുരൂപത്തിലും വയ്ക്കാന്‍ പറ്റില്ല. അതു തെറ്റിദ്ധാരണയാണു്. പൊന്‍മാന്‍ എന്നെഴുതുന്നതും പൊന്മാന്‍ എന്നെഴുതുന്നതും രണ്ടാണു്. മന്‍തന്‍ എന്നെഴുതുന്നയാള്‍ ഒരിക്കലും അതു മന്തന്‍ എന്നുവായിയ്ക്കപ്പെടാന്‍ ആഗ്രഹിയ്ക്കില്ല. കാരണം അതു ഒന്നല്ല. രണ്ടാണു്.

    ReplyDelete
  147. കെവി,
    zwj/zwnj പാടില്ലെങ്കില്‍ എന്തുകൊണ്ട് chillu sign-നെ എതിര്‍ക്കുന്നു?എന്തുകൊണ്ട് zwj/zwnj ന് പകരമായി indic-specific ആയി രണ്ട് പുതിയ characters ആയിക്കൂടാ?ISCII-യിലെ nuktha യും Unicode -ലെ zwj ഉം സമാനമല്ലല്ലോ?

    ReplyDelete
  148. സുറുമ: "chillu sign എന്ന പ്രപ്പോസല് വന്നപ്പോള്(അത് നിര്ദ്ദേശിച്ചത് ഒരു തമിഴനായിരുന്നിട്ടുകൂടി) താങ്കള് അതിനെ എതിര്ത്തത് 'ക'-യുടെ ചില്ല് എല്ലാ ഫോണ്ടുകളും ഉപയോഗിച്ചുകൊള്ളണമെന്നില്ല എന്ന ന്യായം പറഞ്ഞാണ്.അതേ സമയം ചില്ല് എന്കോഡ് ചെയ്യുമ്പോള് 'ക'-യുടെ ചില്ല് ഉള്പ്പെടുത്തുകയും ചെയ്യുന്നു!"

    ചില്ല് ക ഉള്പ്പെടുത്തണോ വേണ്ടയോ എന്നുള്ളതായിരുന്നില്ല ചില്ല് സൈനിന്റെ ഇഷ്യൂ. അവിടത്തെ പ്രശ്നം ഏതാണ് ന്യായമായ ഫാള്ബാക്ക് എന്നതാണ്. അങ്ങനെ ഒന്നില്ല എന്നായിരുന്നു ഞാന് പറയാന് ശ്രമിച്ചത്. ( http://unicode.wikia.com/wiki/Malayalam/Problems_of_Chillu_Sign_Proposal) ചില്ല് എന്കോഡ് ചെയ്തശേഷം ഫാള്ബാക്ക് എന്നൊന്ന് സ്വാഭാവികമായി തന്നെ ഇല്ല. ഫോണ്ടില് ക ചില്ലില്ലെങ്കില് ചതുരക്കട്ട (അഥവാ വാണിങ് ) എഴുത്തുകാരനും വായനക്കാരനും കിട്ടും. പ്രശ്നമുണ്ടെന്ന് എപ്പോഴും മനസ്സിലാവുകയും ചെയ്യും.

    എന്നാല് ഇതല്ല പരമമായ പ്രശ്നം. അത് ഞാന് ഹുസൈനിനോട് പറഞ്ഞപോലെ, ചില്ലുകളുടെ സന്നിഗ്ദതയാണ്. (ഉദാ: ര് എന്നത് 'ര'യുടേയോ 'റ'യുടേയോ?) ഈ പ്രശ്നം zwj ഉപയോഗിച്ചുള്ള സൊല്യൂഷനും, ചില്ല് സൈന് ഉപയോഗിച്ചുള്ളതിനും ഉണ്ട്.

    സുറുമ: "ചില്ല് എന്കോഡിങിനെ ആരും എതിര്ക്കില്ല,അത് ഏറെ പ്രയോജനകരമാണെന്നു വരുകില്. നേരത്തെ ഹുസൈന് പറഞ്ഞപോലെ രണ്ടു വാദങ്ങളുടെയും merits and demerits ഒന്നു വിശദമായി പറയൂ."

    പെരിങ്ങോടന് പറഞ്ഞപോലെ, ഏറിക്കിന്റെ ഡോക്യുമെന്റ് വായിക്കുകയാണ് എളുപ്പം. ഓരോ പ്രപ്പോസലിന്റേയും വിവിധ ഗുണങ്ങള്‍ എന്തൊക്കെ എന്ന്‌ കാണിച്ച്‌ ഞാനൊരു ടേബിള്‍ ഉണ്ടാക്കിയിട്ടുണ്ട്‌.


    റാല്മിനോഫ്: "...ഞാന് സമാനമായ നിര്ദ്ദേശമാണു് വെച്ചതു്. സ്പെഷല് ജോയിനേര്സ്. അതിനെപ്പറ്റി ഒന്നും പറഞ്ഞു്കണ്ടില്ല."

    ഇതായിരുന്നോ സ്പെഷല് ജോയിനേഴ്സ് സൊല്യൂഷന്: "All the problems will be solved if the joiners are elevated from their format control character status, and in the Input method a key is assigned to virama + zwnj ligature"

    ആയിരുന്നെങ്കില് ഞാന് ഉത്തരം പറഞ്ഞിരുന്നു. അത് ചുവടെ:

    "ഞാന് നേരത്തെ പറഞ്ഞത് പോലതന്നെ, ഇത്തരം സ്റ്റേറ്റുമെന്റുകള് പറയുമ്പോള്, തെളിവ് വേണം.

    ഫോണ്ട് സ്റ്റാന്റേഡൈസേഷനെ പറ്റി പറഞ്ഞതു തന്നെ, ഇന്പുട്ട് മെത്തേഡ് സ്റ്റാന്റേഡൈസേഷനെ പറ്റി പറയാനുള്ളതും. കൂടാതെ ഈ നിര്ദ്ദേശത്തിന് പ്രശ്നങ്ങളുണ്ട്. ഈ പറഞ്ഞ പ്രകാരം കീബോര്ഡില് എത്ര ചന്ദ്രക്കലയുണ്ടാവും? രണ്ടെണ്ണം വേണ്ടിവരില്ലേ? 1) virama 2) virama + zwnj. ഇല്ലെങ്കില് കൂട്ടക്ഷരം 'ക്ക' എങ്ങിനെയുണ്ടാക്കും? രണ്ടെണ്ണമുണ്ടെങ്കില് കാര്ത്തികയുപയോഗിക്കുന്ന ആള് ദൃക്സാക്ഷി എന്ന് തെറ്റായി എഴുതിയാല് അതെങ്ങനെ തിരിച്ചറിയും?"

    ഇല്ലെങ്കില് വിശദമാക്കൂ.

    ReplyDelete
  149. ഒരു ചെറിയ സംശയം ചോദിച്ചോട്ടെ. മലയാളത്തിലെ അമ്പത്താറക്ഷരത്തില്‍ നിന്നു് ചില്ലുകളെ മാത്രം തിരഞ്ഞുപിടിച്ചു പുറത്താക്കാന്‍ എന്താണിത്ര വ്യഗ്രത. ഈ പറയുന്ന ന്യായം പ്രബോധചന്ദ്രന്‍നായരുടേതെന്നു പറയുന്നതു് തന്നെയല്ലേ? വെട്ടിമുറിച്ചില്ലാതാക്കല്‍. ഈ ന്യായത്തിന്റെ പുറത്താണെങ്കില്‍ സ്വരങ്ങള്‍ക്കും ഇങ്ങിനെയാകാമായിരുന്നു. ഒരു ദീര്‍ഘപ്പുള്ളിയുപയോഗിച്ചു് എല്ലാ സ്വരങ്ങളുടെയും ദീര്‍ഘം എഴുതാമായിരുന്നു. ആ, ഈ,ഊ,ഓ എന്നിവ വെവ്വേറെ എന്‍കോഡു ചെയ്യേണ്ട ആവശ്യമുണ്ടായിരുന്നില്ല. അ+ാ = ആ ഇ+ാ = ഈ, ഉ+ാ = ഊ, എന്നു മതിയായിരുന്നല്ലോ. ഇ എന്ന സ്വരമല്ലേ ഈ എന്നതിന്റെ അടിസ്ഥാനം. അവിടെ ഒരു ഡൈവോര്‍സിന്റെ പ്രശ്നം ഉദിയ്ക്കുന്നില്ലേ?

    സുറുമ ചോദിച്ചു: zwj/zwnj പാടില്ലെങ്കില്‍ എന്തുകൊണ്ട് chillu sign-നെ എതിര്‍ക്കുന്നു?
    മറുപടി സിബു തയ്യാറാക്കിയ ടേബിളില്‍ വിശദമായി പ്രതിപാദിച്ചിരിക്കുന്നു. ഇവിടെ ഇനി കൂടുതല്‍ വിശദീകരിയ്ക്കേണ്ടി വരുമെന്നു തോന്നുന്നില്ല.

    ReplyDelete
  150. സിബു: എന്നാല് ഇതല്ല പരമമായ പ്രശ്നം. അത് ഞാന് ഹുസൈനിനോട് പറഞ്ഞപോലെ, ചില്ലുകളുടെ സന്നിഗ്ദതയാണ്. (ഉദാ: ര് എന്നത് 'ര'യുടേയോ 'റ'യുടേയോ?)
    അപ്പോള്‍ ഇതാണ് ചില്ലിന്റെ കാര്യത്തില്‍ core issue.നന്ദി സിബൂ,വ്യക്തമാക്കിയതിന്.

    എന്റെ അഭിപ്രായത്തില്‍/അറിവില്‍ ഇതെല്ലാം മുമ്പേ തന്നെ പരിഹരിച്ചുകഴിഞ്ഞതാണ്.(ചില്ല് 'ര' യുടെ തന്നെ).കാരണം ലൈബ്രറി കാറ്റലോഗുകള്‍ തയ്യാറാക്കാന്‍ ഇത്തരം സന്നിഗ്ദതകള്‍‍ ഒഴിവാക്കേണ്ടത് അത്യാവശ്യമാണ്.

    നേരത്തെ സൂചിപ്പിച്ച ലിഗേച്ചറുകളുടെ സ്റ്റാന്‍ഡേര്‍ഡൈസേഷന്‍(ഒരു minimum level compliance)കൊണ്ട് ചില്ലുകളുടെ മറ്റു പ്രശ്നങ്ങള്‍കൂടി പരിഹരിക്കാവുന്നതാണ്.

    ReplyDelete
  151. ചില്ല് ര-യുടെത് തന്നെ എന്ന് തീര്‍ത്ത് പറയാമോ സുറുമേ? സിബു തന്നെ തയ്യാറാക്കിയ ഈ തെളിവുകള്‍ ശ്രദ്ധിച്ചിരുന്നുവോ?

    ReplyDelete
  152. കെവി: മലയാളത്തിലെ അമ്പത്താറക്ഷരത്തില്‍ നിന്നു് ചില്ലുകളെ മാത്രം തിരഞ്ഞുപിടിച്ചു പുറത്താക്കാന്‍ എന്താണിത്ര വ്യഗ്രത.

    കെവി അക്ഷരങ്ങളെ 51ല്‍ നിന്ന് 56 ആക്കി.ഞാനത് കൂട്ടക്ഷരങ്ങളെയെല്ലാം ചേര്‍ത്ത് 900+ ആക്കി, അതേ ചോദ്യംആവര്‍ത്തിച്ചാലോ?

    "മലയാളഭാഷയിലെ ചില്ലക്ഷരങ്ങളെയെല്ലാം യൂണികോഡില്‍നിന്ന് ഒഴിവാക്കാന്‍ ഗൂഢശ്രമം നടക്കുന്നു" എന്ന് പ്രചാരണം നടത്താനാണോ പരിപാടി?

    ReplyDelete
  153. "കെവി അക്ഷരങ്ങളെ 51ല്‍ നിന്ന് 56 ആക്കി."

    മലയാള അക്ഷരമാലയില്‍ 56 അക്ഷരങ്ങള്‍ തന്നെയല്ലേ ഉള്ളത്. ഈ 51 എവിടെനിന്നു വന്നു?

    ReplyDelete
  154. ദൈവമേ ബാക്കി അഞ്ചക്ഷരങ്ങള്‍ ആരടിച്ചുമാറ്റി??

    (“ദക്ഷിണേന്ത്യയില്‍ പ്രചാരത്തിലുണ്ടായിരുന്ന ഒരു പ്രധാന രൂപമായിരുന്നു ഗ്രന്ഥലിപി. സംസ്കൃത ഗ്രന്ഥങ്ങല്‍ എഴുതാനായിരുന്നു ഈ ലിപി ഉപയോഗിച്ചിരുന്നത്. സംസ്കൃതം എഴുതാന്‍ ആവശ്യമായ 51 വര്‍ണ്ണങ്ങളും അതുള്‍ക്കൊണ്ടിരുന്നൂ.” ഇതാണോ ഉദ്ദേശ്ശിച്ചതു? [വായിച്ചറിവ്] )

    ReplyDelete
  155. kevi,
    from my mail to indic list:
    Any one will be able to register പൊന്വീണ.com and use www.പൊന്‍‌വീണ.com or whatever subdomain he prefer. Its a false perception that we cannot use chillu words in domain names. The browser will correctly display www.പൊന്‍‌വീണ.com and direct it to our original site.

    കർട്ടൻ കമ്പനിക്കാരനു് ഒരു ഹൈഫൻ കൂടി ഉപയാഗിച്ചാൽ വൻ-യവനിക.കോം കിട്ടും. നല്ലതും അതാണു്. PenisLand കാരൻ PenIsland കൊണ്ടു്പോയി എന്ന തരത്തിൽ പരിഭവിച്ചിട്ടെന്താ കാര്യം ?

    cibu,
    Apart from your latest MAIN issue,
    will all the problems in your examples be solved if ZWJ/ZWNJ were not FORMAT CONTROL characters? This was what I understood from your logics and examples.

    My only complaint in the present system is the stripping of these joiners. I suggest a solution to avoid that. I dont know what "evidence" I must provide to support that.

    I am going a bit awkward here, what earthquake will happen if people decide RA is the base character? Why the proponents of change hung to some old texts to bring "proof" to claim otherwise.

    Atomic chillu encoding must be considered as a possible "solution" and discussed, not as an "obsession"

    ReplyDelete
  156. ..and regarding the input method
    I suggest replacing the virama sign with zwnj + virama in the present inscript keyboard layout. The virama sign could be put with the Alt_Gr Modifier at the same place.

    This method is far better than Cibu's proposal of using joiners instead of unjoiners. Old script users can have another layout with the keys interchanged.

    ReplyDelete
  157. "മലയാളഭാഷയിലെ ചില്ലക്ഷരങ്ങളെയെല്ലാം യൂണികോഡില്‍നിന്ന് ഒഴിവാക്കാന്‍ ഗൂഢശ്രമം നടക്കുന്നു" ഇതൊരു നല്ല നിരീക്ഷണമാണു്. ഇതിനു പ്രചാരണം കൊടുക്കാന്‍ പക്ഷേ നമ്മളുടെ കൈയില്‍ പത്രക്കാരോ മുഖ്യമന്ത്രിയോ ഒന്നുമില്ല. ചില്ലക്ഷരങ്ങള്‍ക്കു കോഡുകൊടുക്കുന്നതിനെതിരെയുള്ള പ്രത്യേകിച്ചു കാരണമൊന്നുമില്ലാത്ത പ്രവര്‍ത്തനത്തെ ഇപ്പോള്‍ ഈ രീതിയിലാണു് നോക്കിക്കാണേണ്ടതെന്നു സാമാന്യബുദ്ധിയുള്ള ആര്‍ക്കും തോന്നാം. പിന്നെ മലയാളത്തില്‍ എത്ര അക്ഷരങ്ങളുണ്ടെന്നതില്‍ സുറുമയ്ക്കു് യാതൊരു സംശയവുമില്ല. പക്ഷേ ഭാഷാവിദഗ്ദ്ധന്മാര്‍ പലതരത്തില്‍ പറഞ്ഞിരിക്കുന്നു.
    REv. പീറ്റര്‍ - 56
    ഗുണ്ടര്‍ട്ട് - 49
    ഗ്യോര്‍ജ് മാത്തന്‍ - 48
    എ ആര്‍ രാജരാജവര്‍മ്മ - 53
    ശേഷഗിരി പ്രഭു - 53 (1904)
    c.മാധവന്‍പിള്ള‍ 57
    ഡോ.അയ്യപ്പപ്പണിക്കരുടേ മലയാളം തെസ്സറസില്‍ 59
    രവി ഡീസിയുടെ മലയാളം -ഇംഗ്ലീഷ് നിഘണ്ടുവില്‍ - 60
    ചില്ലക്ഷരങ്ങളുടെ പ്രത്യേകതകള്‍ മൂലം അവയെ സ്വതന്ത്ര അക്ഷരങ്ങളായി തന്നെ ഗണിച്ചിരുന്നു പല മഹാരഥന്മാരും. ഭാഷയ്ക്കുവേണ്ടി കമ്പ്യൂട്ടര്‍ ഒരുങ്ങിയ ഈ അവസരത്തില്‍ ചില്ലുകളെയും അവയുടെ പ്രത്യേകതകളെയും ഒഴിവാക്കാതെ തന്നെ ഭാഷാകമ്പ്യൂട്ടിങ് സാധ്യമായിരിക്കെ, എന്തിനുവേണ്ടിയാണു് ചില്ലക്ഷരങ്ങള്‍ക്കെതിരെ വാദിക്കുന്നതു്?

    റാല്മിനോവ് പറഞ്ഞു: കർട്ടൻ കമ്പനിക്കാരനു് ഒരു ഹൈഫൻ കൂടി ഉപയാഗിച്ചാൽ വൻ-യവനിക.കോം കിട്ടും. എന്തിനുവേണ്ടി ഹൈഫന്‍ ഉപയോഗിയ്ക്കണം? ഭാഷയെ എന്തിനങ്ങിനെ ബലികഴിക്കണം? വന്‍യവനിക.com ഉം, വന്യവനിക.com ഉം വേറെ വേറെ സൈറ്റായി ഉപയോഗിക്കാതിരിക്കാന്‍ തക്ക തെറ്റെന്താണു് മലയാളികള്‍ ചെയ്തതു്?

    ReplyDelete
  158. http://chintyam.blogspot.com/2006/02/blog-post_02.html#c114250106244580934

    ബെന്നിയുടെ ഈ കമന്റില്‍ ചില്ലക്ഷരത്തിനു കോഡില്ലാത്തതിനാല്‍ ബെന്നി നേരിടുന്ന ഒരു പ്രശ്നം വിശദീകരിച്ചിരിക്കുന്നതു കാണാം.

    ReplyDelete
  159. Remarks on Cibu's Table:

    1.IDN cannot be spoofed in the present scenario. The example given for spoofing is incorrect.

    My version of joiners are not discussed in the table. They are semantically same as the present joiners, but they are not just format control characters. They cannot be stripped by the applications. The IDN can restrict their inclusion, the search application can choose to exclude them from searching, but the result set must include them.
    In no place, these joiners should be stripped.

    May be I will get STUPID OF THE YEAR award for this proposal. So be it.

    ReplyDelete
  160. kevi, did u mention this:
    "1) ള് + യ = ള്യ
    2) ന്‍റ് + യ = ന്‍റ്യ
    3) ക്ഷ് + യ = ക്ഷ്യ
    4) ഴ് + യ = ഴ്യ
    5) റ് + യ = റ്യ
    6) ണ് + ട = ണ്ട
    7) ന് + റ്റ + ന്റ
    "
    I couldn't follow the link. It's broken.
    From the list I find, its not related to Chillu issue

    ReplyDelete
  161. റാല്മിനോവിന്റെ ചോദ്യം മനസ്സിലായില്ല.
    ശേഷം ചിന്ത്യത്തിലെ കമന്റിനു കൊടുത്ത ലിങ്കു് ശരിയാണു്, പക്ഷേ ഈ കമന്റു പേജില്‍ അതു മുഴുവനും കാണുന്നില്ല. ബ്ലോഗുപോസ്റ്റിന്റെ പേജില്‍ പോയി നോക്കിയാല്‍ അതു മുഴുവനും കാണാം.

    ReplyDelete
  162. ശേഷം ചിന്ത്യത്തിലെ " പുതിയ ലാംഗ്വേജ് ഇന്‍റര്‍ഫേസ് പായ്ക്ക്" എന്ന ലേഖനത്തിലെ, 19-മത്തെ കമന്റിലെ രണ്ടാമത്തെ ഖണ്ഡിക.

    ReplyDelete
  163. കെവി,
    അതില്‍ ആപ്ലിക്കേഷന്റെ പിടിപ്പുകേടിനെപ്പറ്റിയാണു് പരാമര്‍ശം എന്നാണു് ഞാന്‍ മനസ്സിലാക്കിയതു്.

    Coming back to Van-Yavinika. Suppose a person registered VanyaVanika.com for his site. And consider later when atomic chillus are allowed in IDN and our Curtain company registered VanYavanika.com.
    Now the owner of VanyaVanika can claim his site is VanYavanika (he can easily make it using joiners - for backward compatiblity the older domain names should be protected, correct me if I am wrong) and he is the original owner of it and the matters might lead to litigation regarding spoofing. As VanyaVanika was registered first, priority will be given to him I believe. So even if it becomes possible to register IDNs using atomic Chillus, it is better to avoid them.
    No harm ever happen to English language when sites like Experts-Exchange.com were registered, rather it made sitename distinguishable and clear.

    Only after I read Cibu's document regarding security issues in IDN, I became concerned about it and really thought about it. What I could infer was Atomic Chillus can bring more harm to IDN security than any other proposal.

    ReplyDelete
  164. Ralminov said:
    **There were people saying around there is no ZWJ in IDN, so inorder to get Chillu, we should encode Chillu. I also believed so initially.
    Now I will say, its simply absurd and it adds convenience of having less trouble in registering IDN.**

    I also believe that zwj is not allowed in IDN. I tried to type the word "sarkar" in Malayalam on the address bar and was not getting the chillu. Instead, I got RA + Chandrakkala.I assume this is because IDN is rejecting the zwj.

    Nimmy David

    ReplyDelete
  165. കെവി,
    അക്ഷരങ്ങളുടെ എണ്ണത്തിന്റെ കാര്യത്തില്‍ താങ്കളു‍ടെ ഉറപ്പുതന്നെയാണ് എന്റെയും ഉറപ്പ്. പ്രചാരമുള്ള 5 ചില്ലുകള്‍ ചേര്‍ത്ത് താങ്കള്‍ അത് 56 (51+5)ആക്കി എന്ന ധാരണയില്‍ നിന്നാണ് 51 എന്ന് പറഞ്ഞത്. ചില്ലുകളും മറ്റു കൂട്ടക്ഷരങ്ങളും മലയാളത്തില്‍ ഏറ്റവും ആവശ്യം തന്നെയാണ്. ചില്ല് എന്‍കോഡിങ് ഒരിക്കലും പാടില്ല എന്നു് എവിടെയും പറഞ്ഞിട്ടില്ല. ഇപ്പോള്‍ അടിയന്തിര സാഹചര്യം ഇല്ല എന്നാണ് ഉദ്ദേശിച്ചത്.

    ചില്ല് എന്‍കോഡിങ് വേണമോ വേണ്ടയോ എന്നത് സൈബര്‍ലോകത്തില്‍ മാത്രം ഒതുങ്ങേണ്ട ചര്‍ച്ചയല്ല. മലയാളത്തില്‍ ഗ്രന്ഥസൂചി തയ്യാറാക്കുന്നത് ഇപ്പോള്‍ തന്നെ സങ്കീര്‍ണ്ണതകള്‍ നിറഞ്ഞതാണെന്ന് ആ രംഗത്ത് പ്രവര്‍ത്തിക്കുന്നവര്‍ പറയുന്നു. വിവരശേഖരണത്തില്‍ sorting ന്റെ പ്രാധാന്യം വളരെ വലുതാണ്. ഈ കാര്യങ്ങളില്‍ ചില്ല് എന്‍കോഡിങ് കൂടുതലായി യാതൊരു സങ്കീര്‍ണ്ണതകളും ഉണ്ടാക്കുകയില്ലെന്ന താങ്കള്‍ക്ക് ഉറപ്പുതരാന്‍ കഴിയുമോ?

    മേല്‍പറഞ്ഞ കാര്യവുമായി തട്ടിച്ചു നോക്കുമ്പോള്‍ വന്യവനിക/വന്‍യവനിക യെല്ലാം ചെറിയ പ്രശ്നമാണെന്നു കരുതുന്നു.ഇതു പോലെ പ്രശ്നകാരകങ്ങളായ എത്ര വാക്കുകള്‍ ഉണ്ട്? വന്യ, വന്‍, വനിക, യവനിക എന്നിവയ്ക്ക് വേറിട്ട് നിലനില്‍ക്കാന്‍ കഴിയുന്നതുകൊണ്ട് റാല്‍മിനോവ് പറ‍ഞ്ഞപോലെ hyphenനോ മറ്റോ കൊണ്ട് ഇവയെ വേര്‍തിരിച്ച് കാണിക്കുന്നത് വലിയ പാതകമാണെന്ന് കരുതുന്നില്ല.
    duplication IDN ല്‍ അസാധ്യമായതുകൊണ്ട് എത്രയോ ഡൊമൈനുകള്‍ hyphen ഉപയോഗിച്ച് നാമം രെജിസ്റ്റര്‍ ചെയ്യുന്നുണ്ട്.

    ReplyDelete
  166. This comment has been removed by a blog administrator.

    ReplyDelete
  167. വന്‍യവനിക.com ഉം, വന്യവനിക.com ഉം വേറെ വേറെ സൈറ്റായി ഉപയോഗിക്കാതിരിക്കാന്‍ തക്ക തെറ്റെന്താണു് മലയാളികള്‍ ചെയ്തതു്?

    നന്‍മ.കോം, നന്മ.കോം എന്നിങ്ങനെ രണ്ടു് സൈറ്റുണ്ടായാലത്തെ സ്ഥിതിയാവും കൂടുതല്‍ അപകടകരമാണെന്നാണു് എന്റെ നിരീക്ഷണം.

    ReplyDelete
  168. I also believe that zwj is not allowed in IDN. I tried to type the word "sarkar" in Malayalam on the address bar and was not getting the chillu. Instead, I got RA + Chandrakkala.I assume this is because IDN is rejecting the zwj.

    I didnt say ZWJ is ALLOWED in IDN. Infact the restriction of these joiners doesnt prevent us from using sarkar.com. Whether you use sar_kar_.com or sarkar.com or sarkar_.com or sar_kar.com in the browser you'll reach the registered sarkar.com domain. Is it not a convenience? The non-display of chillu in browser has nothing to do with IDN restriction, it is a browser specific problem.

    ReplyDelete
  169. റാല്‍മിനോവ്: നന്‍മ.കോം, നന്മ.കോം എന്നിങ്ങനെ രണ്ടു് സൈറ്റുണ്ടായാലത്തെ സ്ഥിതിയാവും കൂടുതല്‍ അപകടകരമാണെന്നാണു് എന്റെ നിരീക്ഷണം.

    ഈ അഭിപ്രായത്തോടു യോജിക്കുന്നു. കാരണം മലയാളത്തില്‍ സാധാരണ നാം spelling പറയാറില്ല. 'താങ്കളുടെ സൈറ്റിന്റെ പേരെന്താ?' എന്നു ചോദിച്ചാല്‍ സാധാരണഗതിയില്‍ മറുപടി 'നന്‍മ'.കോം' എന്നായിരിക്കും.

    ReplyDelete
  170. നന്‍മ.കോം, നന്മ.കോം എന്നിങ്ങനെ രണ്ടു് സൈറ്റുണ്ടായാലത്തെ സ്ഥിതിയാവും കൂടുതല്‍ അപകടകരമാണെന്നാണു് എന്റെ നിരീക്ഷണം.
    idn സുരക്ഷയെ സംബന്ധിച്ചിടത്തോളം ഈ വാദം നിലനില്ക്കുന്നതല്ല. കാരണം ഇതു് color.com ഉം colour.com തമ്മിലുള്ള പ്രശ്നത്തിനു തുല്യമാണു്. ഒരു സൈറ്റിന്റെയും ഇമെയിലിന്റെയും വിലാസം എപ്പോഴും അതിന്റെ കൃത്യമായ സ്പെല്ലിങ്ങിലാണു് ഇരിക്കുന്നതു്. അല്ലാതെ അതു കേട്ടെഴുതുവാന്‍ സാധ്യമല്ല തന്നെ. കളര്‍.കോം എന്നു് ഒരാള്‍ പറഞ്ഞാല്‍ അയാള്‍ കളറിന്റെ ഏതു സ്പെല്ലിങ്ങാണു് ഉദ്ദേശിച്ചതെന്നു് എങ്ങിനെ അറിയും? അത്തരുണത്തില്‍ കൃത്യമായ സ്പെല്ലിങ് ചോദിയ്ക്കേണ്ടി വരും. അതുപോലൊരു പ്രശ്നമേ നന്‍മ.കോം ഉം നന്മ.കോം തമ്മിലുള്ളൂ. പക്ഷേ zwj ഉപയോഗിച്ചു ചില്ലെഴുതുമ്പോള്‍, നന്‍മ.കോം എന്നു രജിസ്റ്റര്‍ ചെയ്യാനേ പറ്റില്ല. അതിനുള്ള കാരണമോ, നന്മ.കോം രജിസ്റ്റര്‍ ചെയ്തതിനാല്‍. ഒരു വാക്കു രജിസ്റ്റര്‍ ചെയ്തതിനാല്‍ മറ്റൊരു വാക്കു ഉപയോഗിക്കാന്‍ പറ്റാതെ വരുന്നതു് എന്തു ഭാഷാകമ്പ്യൂട്ടിങ്ങാണു്?

    ReplyDelete
  171. color/colour എന്നതും നന്മ/നന്‍മ എന്നതും താരതമ്യം ചെയ്യാമോ? ഭാഷാ പണ്ഡിതര്‍ അഭിപ്രായം പറയേണ്ട വിഷയമാണ്.

    IMHO, അങ്ങനെ/അങ്ങിനെ എന്നത് സ്പെല്ലിങ് വ്യതാസമാണ്. അതുപോലെയാണോ നന്മ/നന്‍മ?

    ReplyDelete
  172. I fully agree with KV. Only visual look alikes are to be considered as spoofed sites. This is primarily because we can access sites by clicking on links.

    Nimmy

    ReplyDelete
  173. IMHO, അങ്ങനെ/അങ്ങിനെ എന്നത് സ്പെല്ലിങ് വ്യതാസമാണ്. അതുപോലെയാണോ നന്മ/നന്‍മ?
    "ന്മ" എന്ന കൂട്ടക്ഷരം പുതിയലിപിയുടെ ആവിഷ്കാരത്തോടെ "ന്‍മ" എന്നെഴുതേണ്ടി വന്നു. പുതിയലിപിയ്ക്കുവേണ്ടി സൃഷ്ടിച്ച പുതിയ സ്പെല്ലിങ് മാത്രമാണു് നന്‍മ. ശരിയായ സ്പെല്ലിങ് നന്മ എന്നാണു്. സ്ഥിരമായ ഉപയോഗത്തിലൂടെ രണ്ടും സ്വീകാര്യമായിരിക്കുകയാണു് ഇപ്പോള്‍. അങ്ങിനെ/അങ്ങനെ, color/colour എന്നിവകളെപ്പോലെ.

    ReplyDelete
  174. കെവി,
    പുതിയ ലിപിയില്‍ എഴുതുന്ന 'നന്‌മ' യും പുതിയ സ്പെല്ലിങ് ആണോ?

    ReplyDelete
  175. dn സുരക്ഷയെ സംബന്ധിച്ചിടത്തോളം ഈ വാദം നിലനില്ക്കുന്നതല്ല. കാരണം ഇതു് color.com ഉം colour.com തമ്മിലുള്ള പ്രശ്നത്തിനു തുല്യമാണു്.

    അല്ല.I believe ഇതു് നമ്മുടെ "ദൃക്സാക്ഷി" പ്രശ്നം പോലെയാണു്.
    ചില്ലുകാർക്കു് മാത്രം മതിയോ സൈറ്റ്. നമ്മുടെ ജോസ്തോമസിനും ഒന്നു് വേണ്ടേ? അവിടെ ഹൈഫനിടാം അല്ലേ !!!

    ReplyDelete
  176. ചില്ലക്ഷരങ്ങളെ കുറിച്ചുള്ള ചര്‍ച്ചയില്‍ ജോസ്തോമസിനെന്തു കാര്യം? പിന്നെ ജോസ്തോമസിന്റെ കുഴപ്പം എന്നുപറയുന്നതു്, ശുദ്ധമലയാളംയുണീക്കോഡ് ടെക്സ്റ്റില്‍ ഒരു കുഴപ്പവുമില്ലാത്ത സംഗതിയാണു്. ഉപയോഗിക്കുന്ന ഫോണ്ടിനനുസൃതമായി അക്ഷരങ്ങള്‍ കൂടിച്ചേരുന്നതു് വേണ്ടെന്നു വെയ്ക്കുകയാണെങ്കില്‍ പിന്നെ പഴയലിപിയേ വേണ്ടെന്നു വയ്ക്കുകയാണു് നല്ലതു്. പുതിയലിപിയില്‍ വായിച്ചാല്‍ ജോസ്തോമസിനു കുഴപ്പമില്ലെന്നു കരുതുന്നുവെങ്കില്‍, പഴയലിപിയിലും അതിനുകുഴപ്പമൊന്നുമില്ല. ജോസ്തോമസെന്നു് എഴുതിയതു് ഒരുകാരണവശാലും എവിടെയും മാറിപ്പോകുന്നില്ല. കമ്പ്യൂട്ടര്‍ വിനിമയങ്ങളില്‍പ്പെട്ടു് അതിനു് അര്‍ത്ഥമാറ്റമോ രൂപമാറ്റമോ സംഭവിക്കാത്തിടത്തോളം കാലം അതിനു് ഒരു കുഴപ്പവുമുണ്ടെന്നു പറയാവതല്ല. ജോസ്തോമസ് എന്നെഴുതുമ്പോള്‍ സയും തയും കൂടിച്ചേരരുതു്, കസ്തൂരി എന്നെഴുതുമ്പോള്‍ കൂടിച്ചേരുകയും വേണം.

    ReplyDelete
  177. ഞാന്‍ പറയാനുദ്ദേശിച്ചതു് നന്മ, നന്‍മ Presentation difference മാത്രമേയുള്ളൂ എന്നാണു്, ദൃക്സാക്ഷി, ജോസ്തോമസ് എന്നിവരെപ്പോലെ..color, colour പോലെ spelling change ഇല്ല എന്നാണു്.

    In my solution of joiners, the presentation of these joiners should be retained, not stripped by any applications. It doesnt bring any spelling change. But chillu encoding brings spelling change.

    ReplyDelete
  178. Another thing, why no concern about the inability of registering Jos_Thomas (with zwnj). If you are much worried about the presentation issue in IDNs, you should worry about non-joiners also. Koirala is another example. Normally people register their names and company names in IDN, not original malayalam and the words like Jos_Thomas will be more frequent than the theoretical Van_Yavanika and Kan_Valayam.

    ReplyDelete
  179. zwnj യുടെ ആവശ്യമില്ലാതെ തന്നെ ജോസ്തോമസ് വളരെ വൃത്തിയായി എനിക്കു കാണാം. അതങ്ങിനെത്തന്നെ രജിസ്റ്റര്‍ ചെയ്യുകയും ചെയ്യാം. കൂട്ടത്തില്‍ പറയട്ടെ, ഞാനുപയോഗിക്കുന്ന ഫോണ്ടുകള്‍ കാര്‍ത്തികയും നിളയും. ജോസ്തോമസും കസ്തൂരിയും മറ്റും ഏതു പ്രോഗ്രാമിലും ഏതു ഫോണ്ടിലും യാതൊരു അര്‍ത്ഥവ്യത്യാസവും കൂടാതെ എഴുതിയ ആളിനും വായിയ്ക്കുന്ന ആളിനും കിട്ടും. ജോസ്തോമസിലെ സ്ത കൂടിച്ചേരരുതു്, പക്ഷേ കസ്തൂരിയിലെ സ്ത കൂടിച്ചേരണം എന്നൊക്കെ വിചാരിച്ചാല്‍ അതിനാണു് ഇഷ്ടമുള്ള രീതിയില്‍ ഫോണ്ടുകള്‍ പണിയാന്‍ സൌകര്യമുള്ളതു്. ജോസ്തോമസിനു പ്രശ്നമുണ്ടെന്നു പറയുമ്പോള്‍, നിങ്ങള്‍ ഇല്ലാത്ത ഒരു പ്രശ്നം ഉണ്ടെന്നു സങ്കല്പിക്കുകയാണു്.

    ReplyDelete
  180. I too dont have any problem with JosThomas. Similarly I dont have any problem with Ralminov, Ponveena, Nanma either. Though it would be nicer to see Ral_minov, Pon_veena etc , it is better to have ANY ONE of those versions (not both) allowed in IDN to avoid spoofing, phishing and what not.

    Do you know about classic example of paypal? Do a googling if you dont.

    Another classical example with Antony. ആന്റണി.കോം , ആന്‍റണി.കോം. Now as joiner is not allowed both are same. If chillu is encoded and allowed in IDN, the sites are distinct.

    ReplyDelete
  181. ഇപ്പോള്‍ തന്നെ IDN Spoofable ആണു്.
    ഉദാ:
    തളള.കോം (ThaLaLa.com) , തള്ള.കോം (ThaLLa.com)
    തെററ്.കോം (TheRaR.com), തെറ്റ്.കോം (TheRR.com pron Thett_.com)

    The first ones without virama, second ones with virama

    ഈ എരിതീയിലേക്കു് എണ്ണയും കൂടി ഒഴിക്കണോ?

    Rules should be implemented to prevent these, if not yet done.

    ReplyDelete
  182. ചില്ലുകള്‍ encode ചെയ്യുന്നതിലൂടെ ZWJ ഒഴിവായിക്കിട്ടും എന്നൊരു വലിയ ഗുണമുണ്ട്‌. നൂറുശതമാനം Unicode compliancy ഇല്ലാത്ത IDN ന്റെ പോരായ്മകളെ അങ്ങനെ മറികടക്കുകയും ചെയ്യാം. അപ്പോഴും വേണ്ടാത്തിടത്ത്‌ കൂട്ടക്ഷരങ്ങള്‍ ഉണ്ടാകുന്നത്‌ ഒഴിവാക്കാന്‍ ZWNJ ഉപയോഗിക്കേണ്ടിവരും. ഇല്ലെങ്കില്‍ ജോസ്തോമസ്‌-ദൃക്സാക്ഷി പ്രശ്നം പിന്നെയും പരിഹരിക്കപ്പെടാതെകിടക്കും; IDN പ്രശ്നമുണ്ടാക്കുകയും ചെയ്യും. ZWNJ നെ പൂര്‍ണ്ണമായി ഒഴിവാക്കാനും ഭാഷാകമ്പ്യൂട്ടിങ്ങിലുള്ള അവശേഷിക്കുന്ന പ്രശ്നങ്ങള്‍ പരിഹരിക്കാനും താഴെപറയുന്ന ടെക്നിക്‌ നിര്‍ദ്ദേശിക്കുന്നു:

    സ്ത, ക്സ, യ്‌ല, വ്സ, സ്ക പോലെ വളരെക്കുറച്ച്‌ കൂട്ടക്ഷരങ്ങള്‍ അപൂര്‍വ്വം അവസരങ്ങളില്‍ മാത്രമേ പിരിഞ്ഞു വരുന്നുള്ളൂ. അത്തരം കൂട്ടക്ഷരങ്ങളെ കണ്ടുപിടിച്ച്‌ ചില്ലുകളെപോലെ ENCODE ചെയ്യുക.

    ഈ പരിഹാരമാര്‍ഗ്ഗത്തെകുറിച്ച്‌ സിബു, കെവി, റാല്‍മിനോവ്‌, സുറുമ, മയ്യഴി, രചന, പെരിങ്ങോടര്‍ മുതലായവരുടെ അഭിപ്രായങ്ങള്‍ / വിമര്‍ശനങ്ങള്‍ അറിഞ്ഞാല്‍ കൊള്ളാമെന്നുണ്ട്‌

    (താര്‍ക്കോവ്സ്കി എന്ന എന്റെ പേരില്‍ ZW(N)J പ്രശ്നം കൂട്ടത്തോടെ കടന്നുവരുന്നു.)

    ReplyDelete
  183. ചര്‍ച്ചകളില്‍ തീപാറുന്നുണ്ടെങ്കിലും കൂടുതല്‍ ആളുകള്‍ മലയാളത്തിന്റെ യുണീകോഡ് എന്‍‌കോഡിങ്ങിനെ പറ്റി ചിന്തിക്കുന്നത്‌ വളരെ നല്ലൊരു കാര്യം.

    തര്‍ക്കോവ്സ്കി... ചുരുക്കം ചില വാക്കുകള്‍ക്ക്‌ മാത്രമല്ല, ഏത്‌ കൂട്ടക്ഷരത്തിനും ജോസ്തോമസിന്റെ ഗതി വരാം. ഒരാളുടെ പേര് ഇന്ന അക്ഷരത്തിലേ തുടങ്ങാവൂ എന്നൊന്നുമില്ലല്ലോ. പിന്നെ, കൂട്ടക്ഷരങ്ങള്‍ക്കാണൊ മലയാളത്തില്‍ ക്ഷാമം? ഈ പ്രശ്നം ഇന്നത്തെ zw(n)j -ഉം ഫാള്‍ബാക്കും വച്ചുള്ള ഇന്നത്തെ യുണീക്കോഡിന്റെ ആര്‍ക്കിടക്ചറില്‍ ഒഴിച്ചുകൂടാനാവാത്തതാണെന്നാണ് എന്റെ പക്ഷം.

    റാല്‍മിനോഫ്, ‘തളള’, ‘തെററ്’ ഒക്കെ IDN അനുവദിക്കുമ്പോള്‍ പരിഗണിക്കേണ്ട പ്രശ്നങ്ങള്‍ തന്നെ. ഇതൊക്കെ ആര് എവിടെ ചെയ്യുന്നു എന്ന്‌ എനിക്ക്പോഴും ഒരു പിടിയുമില്ല. സിഡിറ്റിലെ സുലോചന കുറെ പ്രപ്പോസലുകള്‍ വച്ചിരുന്നു.

    റാല്‍മിനോഫ് പറഞ്ഞ നിര്‍ദ്ദേശങ്ങളനുസരിച്ച്‌ ഞാന്‍ എന്റെ ടേബിള്‍ പുതിക്കിയിട്ടുണ്ട്‌.

    രണ്ടാമത്തെ പ്രപ്പോസലാണ് റാല്‍മിനോഫിന്റെ നിര്‍ദ്ദേശത്തെ പറ്റിയുള്ള കമ്പാരിസണ്‍.

    ReplyDelete
  184. Please read about Spoofing here (from wikipedia)

    quote

    URL spoofing and phishing

    Another kind of spoofing is "webpage spoofing," also known as phishing. In this attack, a legitimate web page such as a bank's site is reproduced in "look and feel" on another server under control of the attacker. The intent is to fool the users into thinking that they are connected to a trusted site, for instance to harvest user names and passwords.

    This attack is often performed with the aid of URL spoofing, which exploits web browser bugs in order to display incorrect URLs in the browsers location bar; or with DNS cache poisoning in order to direct the user away from the legitimate site and to the fake one. Once the user puts in their password, the attack-code reports a password error, then redirects the user back to the legitimate site.

    unquote

    In the present method and in my proposed method THIS KIND of ATTACK is not possible.And if IDN doesnt care about URL mirroring of the new proposed encoded chillus, it is very easy to spoof. If IDN implements mirrored URLs, then there cannot exist VanYavanika.com and VanyaVanika.com independently, so the very argument of encoding Chillus (for the sake of IDN) becomes void. It is a either-or condition. We cant have both the worlds together. A security trade-off must be done, if we must have VanYavanika.com and VanyaVanika.com separately registered. The Anrony.com and Antony.com is another example.

    So it is incorrect to say IDN is "spoofable" if two or more names are permitted to point to a single website. It is similar to URL redirection or URL mirroring.
    Those kind of "attacks" can be termed as "trademark attacks", not spoofing for sure.
    Ofcourse through my ളള, ററ etc examples , IDN is presently spoofable. Also , considering most of us cannot visually distinguish R-sign and YA-sign, it is advisable not to use these in IDNs.

    If we need Chillu encoding for some reasons, we can have a non joining chandrakkala also to eliminate the ZWNJ as well.

    I just presented my concerns about encoding Chillus. Also I suggested an alternative(my proposal is flexible, it could be just similar to present joiners everywhere, the only change being NOT FORMAT CONTROL characters, so VanYavanika and VanyaVanika is same for me EVERYWHERE , not just in IDN and ALL the MINUSes and PLUSes in present encoding will be applicable PLUS WhatYouWriteIsWhatYouSee !!!).


    Also I dont support any DELAYING tactics in solving the present problems in Unicode Malayalam. Sooner the better.

    ReplyDelete
  185. Ralminov: If we need Chillu encoding for some reasons, we can have a non joining chandrakkala also to eliminate the ZWNJ as well.

    Then, how can one visually distinguish between normal chandrakkala and non-joining chandrakkala? I think an appended non-joining character would be a better option.

    ReplyDelete
  186. Please note my first preference is to have replacements for ZW(N)J.. I see that I share your opinion.

    Why should we have a visual distinction ? In the keyboard (input method) we can have both of them at the same key (one with the Alt_Gr modifier, I speak with WinXP SP2 in hand) and the other as normal. We can also have another keyboard (if needed, with keys reversed) and the user can choose whatever he prefer. Now I have four keyboards, one phonetic, one default from MS, one with joiners and conjuncts using AltGr, and the last with the proposed chillus...

    It doesn't make any difference with the present system other than instead of two key sequence, we use only one.. Spoofing problem should be taken care of, by domain mirroring or whatever..
    The search applications should treat both chandrakkalas as same..
    If encoding Chillu is possible without any problem, this is also possible easily.

    ReplyDelete
  187. സിബു,
    കൂട്ടക്ഷരങ്ങള്‍ക്ക്‌ മലയാളത്തില്‍ ക്ഷാമമില്ലെങ്കിലും, കൂട്ടക്ഷരങ്ങളുണ്ടാകുന്ന ഘടകവ്യഞ്ജനങ്ങളെ എളുപ്പത്തില്‍ നിജപ്പെടുത്താന്‍ കഴിയും.

    കൂട്ടക്ഷരങ്ങളുണ്ടാകാത്ത വ്യഞ്ജനങ്ങളെ ഒഴിവാക്കി ചില്ലക്ഷരങ്ങളെപ്പോലെ encode ചെയ്യേണ്ടവയെ താഴെ പട്ടികയില്‍ ചേര്‍ക്കുന്നു (ഖ, ഝ, ഠ, ര എന്നിവ ഒഴിവാക്കിയിരിക്കുന്നു.)

    ക് , ഗ് , ഘ് , ങ്
    ച് , ഛ് , ജ് , ഞ്
    ട് , ഡ് , ഢ് , ണ്
    ത് , ഥ് , ദ് , ധ് , ന്
    പ് , ഫ് , ബ് , ഭ് , മ്
    യ് , ല് , വ്
    ശ് , ഷ് , സ് , ഹ്
    ള് , ഴ് , റ്

    ആകെ 32 കള്ളികളേ ഇതിനാവശ്യമുള്ളു. ചില്ലുകള്‍ endode ചെയ്തു കഴിഞ്ഞാലും Malayalam Code Page ല്‍ പിന്നെയും 44 കള്ളികള്‍ ഒഴിഞ്ഞു കിടപ്പുണ്ട്‌. അവയില്‍ ഇവയെ encode ചെയ്തു കേറ്റാവുന്നതേയുള്ളു. Shift, ALT, CTRL എന്നിവ കൂട്ടമായോ ഒറ്റക്കോ ഉപയോഗിച്ച്‌ ഇവയൊക്കെ കീബോഡില്‍ നിസ്സാരമായി ഘടിപ്പിക്കാവുന്നതേയുള്ളു.

    ക്ഷ, ത്സ മുതലായവയുമായി വരുന്ന കൂട്ടക്ഷരങ്ങളെ ഇവവെച്ചു ഉല്‍പാദിപ്പിച്ചാല്‍, പിന്നീടുവരുന്നവയുമായി കൂടിചേരാതെ നിലനിന്നുകൊള്ളും.
    ക + ് + ഷ് + ണ --> ക്ഷ് ണ (please read the last product ommitting space)
    ത + ് + സ് + ന --> ത്സ് ന (read the rectangle as chandrakkala)

    'ര' കൂടിച്ചേര്‍ന്നുണ്ടാകുന്ന റകാരങ്ങളേയും ഇങ്ങനെ വേര്‍തിരിച്ചു നിര്‍ത്താം
    ക + ് + ക് + ര --> ക്ക് ര
    സ + ് + ത് + ര --> സ്ത് ര

    ഇതിനായി ക്ഷ്, ത്സ്, ക്ക്, സ്ത് മുതലായ ഗ്ലിഫുകള്‍ കൂട്ടക്ഷരങ്ങളെപോലെ ഡിസൈന്‍ ചെയ്യേണ്ടിവരും. ഏറിയാല്‍ നാല്പതെണ്ണം.

    ZWNJ നെ ഒഴിവാക്കാന്‍ വേറെ ഒരുവഴിയും ഞാന്‍ കാണുന്നില്ല. ചില്ലക്ഷരങ്ങളെ മാത്രം Encode ചെയ്യുന്നതിലൂടെ ജോസ്തോമസ്‌ പ്രശ്നം പരിഹരിക്കാനും പോകുന്നില്ല. ജോസ്തോമസ്‌ പ്രശ്നം പരിഹരിക്കാന്‍ ചില്ലിനുവേണ്ടി വാദിക്കുന്നവര്‍ (സിബുവും പെരിങ്ങോടരും, കെവിയും വിശ്വവും സുനിലുമടക്കം) ആരുംതന്നെ ഇതുവരെ ഒരു പരിഹാരവും നിര്‍ദ്ദേശിച്ചു കണ്ടില്ല.

    പട്ടികയില്‍ കൊടുത്തിട്ടുള്ള അക്ഷരങ്ങള്‍ക്ക്‌ വേറിട്ട ഒരു നിലനില്‍പ്‌ വേണമെന്നു ആദ്യമായി ബോദ്ധ്യപ്പെട്ടത്‌ Microsoft നാണ്‌. Service Pack 2 വിന്റെ കൂടെ അവര്‍ മലയാളത്തിനായി ഡിസൈന്‍ ചെയ്ത കാര്‍ത്തിക ഫോണ്ടില്‍ മുകളിലത്തെ പട്ടികയില്‍ കൊടുത്ത മിക്കവാറും അക്ഷരങ്ങള്‍ ഗ്ലിഫുകളായി ഉണ്ട്‌. ചില്ലുകള്‍ പോലെയുള്ള അവയുടെ വേറിട്ട വ്യക്തിത്വം നാം കാണാന്‍ വൈകിയിരിക്കുന്നു. ZWJ ഒഴിവാക്കിയതുപോലെ ZWNJ ഒഴിവാക്കാന്‍ എല്ലാ പഴുതുകളും അടച്ച് നാം ഉടനടി സ്റ്റെപ്പുകളെടുത്തേ പറ്റൂ. ഇക്കാര്യത്തില്‍ വലിയ അനാസ്ഥയാണു കാണിച്ചിരിക്കുന്നത്. ഇത്‌ ഇപ്പോല്‍ തന്നെ യൂണികോഡിന്റെ ശ്രദ്ധയില്‍ കൊണ്ടുവന്ന് ചില്ലിനോടൊപ്പം തന്നെ encode ചെയ്യാനുള്ള തീര്പ്പുകള്‍ എടുപ്പിക്കാന്‍ സിബുവും കൂട്ടരും യത്നിക്കണം.

    Sorting ല്‍ ചില്ലിന്റെ encoding പ്രശ്നങ്ങള്‍ ഉണ്ടാക്കാത്തതുപോലെ, ഈ 32 വ്യഞ്ജനം+ Chandrakkala യുടെ encoding ഉം യാതൊരു പ്രശ്നവും ഉണ്ടാക്കില്ല.

    ReplyDelete
  188. തര്‍ക്കോവ്സ്ക്കി, ടൈപ്പ്‌ ചെയ്യുന്നവന് ‘സ്‌‘ എന്നെഴുതാനിപ്പോള്‍ രണ്ട്‌ ഓപ്ഷന്‍സില്ലേ? അതിലേത്‌ ഉപയോഗിക്കണമെന്ന്‌ അവനെങ്ങനെ തീരുമാനിക്കും? രണ്ടെഴുതിയാലും കാണുന്നത്‌ ഒന്നാവുന്നത്‌ കൊണ്ട്‌ ഒരുപോലെ ഡിസ്‌പ്ലേ ചെയ്യപ്പെടുന്ന ഒരു വാക്കിന് രണ്ട്‌ സ്പെല്ലിംഗ് ഉണ്ടാവില്ലേ? അത്‌ നന്നല്ല.

    ReplyDelete
  189. തര്‍ക്കോവ്സ്ക്കിയുടെ അഭിപ്രായം വായിച്ചു മനസ്സിലാക്കാന്‍ ശ്രമിക്കുന്നു. ഒരു സംശയം:

    ക്ഷ, ത്സ മുതലായവയുമായി വരുന്ന കൂട്ടക്ഷരങ്ങളെ ഇവവെച്ചു ഉല്‍പാദിപ്പിച്ചാല്‍, പിന്നീടുവരുന്നവയുമായി കൂടിചേരാതെ നിലനിന്നുകൊള്ളും.
    ക + ് + ഷ് + ണ --> ക്ഷ് ണ (please read the last product ommitting space)
    ത + ് + സ് + ന --> ത്സ് ന (read the rectangle as chandrakkala)


    ഈ ഉദാഹരണങ്ങള്‍ തീര്‍ത്തും സ്വീകാര്യമായി തോന്നുന്നില്ല. തീക്ഷ്ണം, ജ്യോത്സ്ന, മുതലായ വാക്കുകളില്‍ ക്ഷ്ണ, ത്സ്ന മുതലായ കൂട്ടക്ഷരങ്ങള്‍ക്കു് എന്താണു് കുഴപ്പമെന്നു മനസ്സിലായില്ല. വായിയ്ക്കുന്ന ആള്‍ക്കു് അങ്ങിനെ അധികം കൂട്ടക്ഷരങ്ങള്‍ ഇഷ്ടമല്ലെങ്കില്‍ ചുമ്മാ ഇഷ്ടമുള്ളൊരു പുതിയലിപി ഫോണ്ടുപയോഗിച്ചാല്‍ പോരേ. അതുകൊണ്ടു തീരുന്ന പ്രശ്നമല്ലേ അതിലുള്ളൂ. ജോസ്തോമസ് എന്ന വാക്കില്‍ ദൃശ്യപരമായ പ്രശ്നമല്ലേ ഉള്ളൂ, അല്ലാതെ സയും തയും കൂടിച്ചേരുന്നതുകൊണ്ടു് വാക്കിന്റെ അര്‍ത്ഥമോ ശബ്ദമോ മാറിപ്പോകുന്നുണ്ടോ? ഇതു് എന്‍കോഡിങ് തലത്തില്‍ പരിഹരിക്കേണ്ട പ്രശ്നമല്ലെന്നാണു് എന്റെ അഭിപ്രായം. ജോസ്തോമസ് വായിയ്ക്കുമ്പോള്‍‍ സ്ത എന്ന കൂട്ടക്ഷരം സൃഷ്ടിക്കുന്ന അരോചകത്വം മാറ്റാന്‍ രണ്ടു വഴികളുണ്ടു്. 1. വായിയ്ക്കുമ്പോള്‍ സ്ത എന്ന കൂട്ടക്ഷരമില്ലാത്ത ഫോണ്ടുപയോഗിക്കുക. 2. എഴുതുമ്പോള്‍ സ് കഴിഞ്ഞിട്ടു് ഒരു zwnj ഉപയോഗിക്കുക
    ഇതല്ലാതെയുള്ള പരിഹാരം ഒരിക്കലും സ്തനം, കസ്തൂരി മുതലായ വാക്കുകളെ സ്ത എന്ന കൂട്ടരക്ഷത്തോടെ തന്നെ എഴുതാനും വായിയ്ക്കാനും പറ്റാതാക്കുന്ന തരത്തിലാകരുതെന്നും അഭിപ്രായമുണ്ടു്.

    ReplyDelete
  190. "2. എഴുതുമ്പോള്‍ സ് കഴിഞ്ഞിട്ടു് ഒരു zwnj ഉപയോഗിക്കുക"

    ഈ ജോയിനറുകള്‍ മാഞ്ഞു് പോകുന്നതാണല്ലോ പ്രശ്നം..പിന്നെ ചിലയിടങ്ങളില്‍ അനുവദിക്കാത്തതും !!! ഈ പ്രശ്നമല്ലേ ചില്ലുകള്‍ക്കുമുള്ളൂ, ഗവേഷണകുതുകിയല്ലാത്ത ഒരു സാധാരണ ബ്ലോഗനു്..

    ReplyDelete
  191. ജോസ് തോമസിനെ വിടാം..(can be written/read better with a space, like all of those van yavanika examples) കൊയ്രാളയേയോ ?
    (I mean KoiraaLa- കൊയ്‍രാള)...

    ReplyDelete
  192. ഇനി അതു് പേരല്ലേ , മലയാളമല്ലല്ലോ എന്നു് വയ്ക്കാം.. അപ്പോള്‍ -സമ്പദ്രംഗത്തെ- എന്നു് വായിക്കുമ്പോഴോ ?

    -സമ്പദ്‍രംഗത്തെ- എന്നാണു് ഉദ്ദേശിച്ചതു്..

    ReplyDelete
  193. I didnt refer any grammar texts to fin d these examples. Just used Firefox + Padma combination to read Malayalam newspapers online ! As Padma uses ZWJ correctly we dont see any problems in Chillus. But it is not possible to put ZWNJ in a ascii-unicode converter, so it is very easy to find the unnecessary joining real world problems in malayalam if we use the above said method.
    You can find the stripping of ZWNJ is as serious as stripping of ZWJ. So we should give equal preference to both these issues.

    ReplyDelete
  194. ഈ പ്രശ്നത്തിനു് ഒരു പോംവഴിയും സ്വീകാര്യമല്ലെന്നു് ഞാന്‍ പറഞ്ഞില്ല. തര്‍ക്കോവ്സ്ക്കി മുന്നോട്ടു വച്ച പോംവഴിയെക്കുറിച്ചു് മനസ്സിലാക്കാന്‍ ശ്രമിക്കുന്നതേയുള്ളൂ. തര്‍ക്കോവ്സ്ക്കി സൂചിപ്പിച്ച ഉദാഹരണങ്ങളെക്കുറിച്ചു് ആദ്യം മനസ്സില്‍ വന്ന സംശയം പ്രകടപ്പിച്ചുവെന്നു മാത്രം. ക്ഷ, ത്സ തുടങ്ങിയവയ്ക്കു് zwnj ഒരു നല്ല പരിഹാരമാര്‍ഗ്ഗം തന്നെയാണു്, കാരണം അഥവാ zwnj ഈ വാക്കുകള്‍ക്കിടയില്‍ നിന്നു് നഷ്ടപ്പെട്ടാലും വാക്കിന്റെ അര്‍ത്ഥത്തിനോ ശബ്ദത്തിനോ യാതൊരു മാറ്റവും സംഭവിക്കുന്നുല്ല. കൊയ്രാള പക്ഷേ മറ്റൊരു പ്രശ്നമാണു്. അതിനു് പരിഹാരം കണ്ടെത്തേണ്ടതുണ്ടു്. തര്‍ക്കോവ്സ്ക്കിയുടെ നിര്‍ദ്ദേശത്തെക്കുറിച്ചു അഭിപ്രായം പറയൂ റാല്മിനോവു്. അതിന്റെ ഗുണവശങ്ങളും ദോഷവശങ്ങളും കണ്ടെത്തേണ്ടതുണ്ടു്. എല്ലാതും എല്ലാവര്‍ക്കും മനസ്സില്‍ തോന്നണമെന്നില്ല. മറ്റു വലിയ ദോഷങ്ങളൊന്നും കൂടാതെ ഈ നിര്‍ദേശത്തിനു പ്രശ്നപരിഹരം‍ സാധ്യമെങ്കില്‍ ഇതൊരു formal proposal ആയി utc യ്ക്കു സമര്‍പ്പിക്കണം. അവിടെ ഇതു വീണ്ടും ചര്‍ച്ചചെയ്യപ്പെടും. അതിനുമുമ്പു് ഇവിടൊരു ചര്‍ച്ച നല്ലതാണു്, കൂടുതല്‍ മെച്ചപ്പെട്ട ഒരു പ്രൊപ്പോസല്‍ തയ്യാറാക്കാന്‍ അതിനാല്‍ സാധിക്കും. അതുകൊണ്ടു് തര്‍ക്കോവ്സ്ക്കിയുടെ നിര്‍ദ്ദേശത്തെക്കുറിച്ചുള്ള അഭിപ്രായങ്ങള്‍ കേള്‍ക്കട്ടെ എല്ലാവരില്‍ നിന്നും.

    ReplyDelete
  195. ചില്ലുകളേപ്പോലെത്തന്നെ അനാവശ്യ Proposal ആണിതും. zwnj/zwj preserve ചെയ്യുകയാണു് solution. തീരെ നിവൃത്തിയില്ലങ്കില്‍ malayalam specific special joiners ആവാം..

    ReplyDelete
  196. "How to avoid ZWNJ from Malayalam computing" is the sole purpose of proposing my solution. Those who advocate the encoding of Cillus and there by discarding ZWJ should show the responsibility to suggest ways to eliminate the occurrence of ZWNJ. Both ZWJ and ZWNJ are two sides of the same coin and one cannot simply ignore ZWNJ when strong points are put against ZWJ in the name of Cillu encoding.

    Where are those Cillu encoders? Where are those enemies of ZWJ? Why are you hiding on the problems of ZWNJ? Can you suggest a better solution than mine to circumvent ZWNJ?

    Whatever logics hold for the prevention of ZWJ equally hold for ZWNJ also. Or otherwise come with reasons to justify the occurrence of ZWNJ while standing against ZWJ.

    ReplyDelete
  197. A non-joining candrakkala and Ganesan's chillu sign are also the proposals that could very well be considered, if for some reason everyone hates the joiners !!!

    ReplyDelete
  198. വന്‍യവനികയും കൊയ്​രാളയും സമ്പദ്​രംഗവും പൊന്‍വീണയും ഒരേ പോലെ കൈകാര്യം ചെയ്യാന്‍ ഗണേശന്റെ ചില്ല് സൈനിനു് പറ്റും !!
    തര്‍ക്കോവ്സ്കിയുടെ വഴിയിലൂടെ പോകാമെങ്കില്‍ ജോസ്​തോമസും അങ്ങനെ എന്തും പറ്റും !!!

    രണ്ടു് ചന്ദ്രക്കല പ്രശ്നവും വരുന്നില്ല..

    ReplyDelete
  199. This is the first time I’m coming across the Ganesan Solution. I’m really wonderstruck seeing the simplicity of the solution. It can really reduce all my 32-slot solution to a single slot remedy.

    Following the path Mr. Ganesan explored I ventured to fathom more and at last found a ‘real Malayalam way’ to kill both ZW(N)J by a single shot.

    I’m proposing THREE CHANDRAKKALAS

    First Order Chandrakkala (MALAYALAM CHANDRAKKALA):
    Whenever this Chandrakkala comes in between two consonants, possible conjuncts are formed. If the conjuncts are not formed (because of the non-availability of the glyph in the font) this First Order Chandrakkala will act as the Third Order Chandrakkala (see below)

    Second Order Chandrakkala (CIBU CHANDRAKKALA):
    Whenever this Chanrdakkala comes after NA, NNA, LA, LLA, RA or KA the respective Cillu is produced. Otherwise it will act as the First Order Chanrdakkala. If the Cillu of KA is not needed use Third Order Chandrakkala.

    Third Order Chandrakkala (GANESAN CHANDRAKKALA):
    Whenever this Chandrakkala comes in between two consonants where a possible conjunct formation is imminent, it will prevent the disaster. If the conjunct formation is not a possibility this Chandrakkala will be transformed to First Order Chandrakkala.


    To tell the truth, this ultimate reductionism derives from the thoughts of Ralminov and Suruma who are more inventive and pragmatic than any one participating in this debate. One can easily trace out the origins of Cibu Chanrakkala (CC) and Ganesan Chadrakkala (GC) in their proposal for unique Malayalam ZW(N)J. But restructuring and re-christening their concepts to CC and GC I find following merits:

    1. We can permanently avoid strange terminologies like MALAYALAM ZERO WIDTH (NON) JOINERS, which always evoke the feeling of ‘മായാവി’ or ‘കുട്ടിച്ചാത്തന്‍’ – invisible and fearsome.
    2. On the other hand, Chandrakkala is visible and always reminiscent of Great Changampuzha. Moon Sign is the dearest for all human beings, whether Resident or Non-resident Keralites. I’m sure any form of CHANDRAKKALA will be wholeheartedly welcome by all Malayalees. He will be happier to have 3 chanrakkalas instead of a single one. He will be more romantic and dreamy in future.
    3. Simply with two keystrokes we can produce Cillus. In the case of Malayalam/European ZWJ three keystrokes are inevitable to produce Cillus. Since only Chandrakkala as the component in the Cillu and no other alien component called ZW(N)J is there will give immense pleasure and sigh of relief to all Malayalam grammarians and lingusticians
    4. We can very conveniently assign Collation order to these different Chanrakkalas so that the sorting order among different forms of the same word can easily be fixed.(eg. വെണ്മ, വെണ്‌മ, വെണ്‍മ)
    5. Finally, naming these devices after thinkers like Mr. Cibu will be a fitting tribute to their relentless efforts to save our language.

    ReplyDelete
  200. This is the mail I sent to the Indic mailing list:

    I would like to review and analyse the proposed Chillu Sign by N.Ganesan

    First of all, I find it more than a substitute for Atomic chillu characters for various reasons
    1. No need to encode 6+ chillu forms, also solves the ZWJ problem.
    2. No need to encode a non-joining-candrakkala, also solves the ZWNJ problem

    The fallback of the chillu sign, if no corresponding combining glyph should be cons + dotted circle + cs
    Chillus derived as
    RA cs as chillu_R
    NA cs as chillu_N
    NNA cs as chillu_NN
    LA cs as chillu_L
    LLA cs as chillu_LL
    KA cs as chillu_K

    all consonants including RRA will have a corresponding glyph with a visible virama
    so
    RRA cs will be a glyph with RRA and a visible virama, if this glyph is not present in the font, fall back is RRA dotted circle and cs
    RRA virama can remain as RRA virama.

    koirala can be written as KA vowelsg_O YA cs RA vowelsg_A LLA
    the dr in sambadrangam can be separated by cs not virama , creating a nonjoining sambad_rangam

    The IDN can handle the spoofing threat by creating an equivalence mapping from virama to cs
    The search engines also can create an equivalence mapping if they prefer so.

    The same weightage can be given to virama and cs in sorting, collation etc

    If , later a graphic for chillu_YA is found, the glyph of YA with a visible virama can be replaced with the new glyph.
    In short, we will be having Chillus for every consonant in Malayalam..If we have distinct graphical representation, we can use that, else use a visible virama with the consonant as the glyph.



    I welcome comments from Unicode lovers..

    ReplyDelete