ARAVINDA VISHWANATHAPURA

ಕನ್ನಡಕ್ಕೆ ASCII to Unicode Converter

May 3, 2012
1 minute read.
kannada ascii2unicode ascii unicode kannadablog

ASCII/ANSI ಕನ್ನಡದಲ್ಲಿ ಬರೆದದ್ದನ್ನು ಯುನಿಕೋಡ್ ಗೆ ಹೇಗೆ ಬದಲಾಯಿಸೋದು ಎಂದು ಬಹಳ ಗೆಳೆಯರ ಪ್ರಶ್ನೆಯಾಗಿತ್ತು, ಅಂದಕ್ಕೆಂದೇ ASCII2Unicode ಕನ್ವರ್ಟರ್ ತಂತ್ರಾಂಶ ಬರೆದಿದ್ದೆ, ಎರಡನೇ ಆವೃತ್ತಿ ಇವತ್ತು ಬಿಡುಗಡೆಗೊಂಡಿದೆ, ಬಹಳಷ್ಟು ತೊಂದರೆಗಳನ್ನು ಸರಿಪಡಿಸಿದ್ದೇನೆ. Source code ಅನ್ನು ಓದಲು/ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಸುಲಭವಾಗುವಂತೆ ಬದಲಾಯಿಸಿದ್ದೇನೆ, ಕೋಡ್ ಕಮೆಂಟ್ ಗಳನ್ನು ಸೇರಿಸಿದ್ದೇನೆ.

ಉಪಯೋಗಿಸಿ ಹಾಗೂ ಗೆಳೆಯರೊಡನೆ ಹಂಚಿಕೊಳ್ಳಿ. Online ಆವೃತ್ತಿ ಇಲ್ಲಿದೆ.

ASCII2Unicode

ಈಗಿನ ಆವೃತ್ತಿಯಲ್ಲಿ ಸರಿಪಡಿಸಿದ ತೊಂದರೆಗಳು

  1. ಶ್ರೀನಿಧಿ. ಟಿಜಿ ಹೇಳಿದ ಜ್ಞ ಅಕ್ಷರದ ತೊಂದರೆ.

    The new converter is cool. Thanks. ಆದರೆ ನಾನು ಪ್ರಯತ್ನಿಸಿದಾಗ ಆಸ್ಕಿಯ 'ಜ್ಞ' ಸರಿಯಾಗಿ ಕನ್‌ವರ್ಟ್ ಆಗಲಿಲ್ಲ. '«eÁÕ£À' ಎಂದಿರುವುದು 'ವಿಜಾÕನ' ಅಂತ ಬರ್ತಿದೆ.

  2. ರಾಕೇಶ್ ಶೆಟ್ಟಿಯವರು ಹೇಳಿದ "ಪು" ಅಕ್ಷರ ಹಾಗೂ ಅರ್ಕಾವತ್ತಿನ ತೊಂದರೆ.

    ಅರ್ಕ ಒತ್ತುಗಳು ಸರಿಯಾಗಿ ’ರ’ ಒತ್ತುಗಳಾಗುತ್ತಿವೆ.ಉದಾ : ’ಅರ್ಕ’ ಅನ್ನುವುದು ’ಅಕ್ರ’ ಅಂತಾಗುತ್ತಿದೆ. "ಪುಸ್ತಕ" ಅನ್ನುವುದು "ಪAಸ್ತಕ" ವಾಗುತ್ತಿದೆ - Rakesh

  3. Naveen Viegas ಹಾಗೂ Nagendra K, BizVant Solutions ಕೂಡ ಅರ್ಕಾವತ್ತಿನ ತೊಂದರೆಯ ಬಗ್ಗೆ ತಿಳಿಸಿದ್ದರು

    I have a problem. When I Convert a word that contains Arka vottu (ರ್ವ) that typed using nudi, converts into (ವ್ರ) - Naveen Viegas

  4. ಎಂ.ಎಸ್. ಮುರಳಿಧರ್, ಶಿರಾ. ರವರು ಹೇಳಿದ ತೊಂದರೆಗಳು.

    ನಾನು ಗುರುತಿಸಿದ ಪ್ರಮುಖ ತಪ್ಪೆಂದರೆ, ಅರ್ಕಾವತ್ತುಗಳು, ’ರ’ ವತ್ತುಗಳಾಗುತ್ತವೆ. ಪು ಹೋಗಿ ಪ ಆಗಿರುತ್ತದೆ. ಯಿ ಎಂಬುದು ಒಂದೊಂದುಸಾರಿ ಸರಿಯಾಗಿ ಬರುವುದಿಲ್ಲ. ದಯವಿಟ್ಟು ಇದರ ಕುರಿತು ತಾವು ಕ್ರಮ ಕೈಗೊಂಡರೆ ತುಂಬಾ ಅನುಕೂಲವಾಗುತ್ತದೆ.

  5. ಪದಗಳ ಕೊನೆಯಲ್ಲಿ ಒತ್ತಕ್ಷರ ಬಂದಾಗ ಸರಿಯಾಗಿ ಬರುತ್ತಿರಲಿಲ್ಲ. ಅದನ್ನು ಸರಿಪಡಿಸಿದ್ದೇನೆ.

  6. IE browser ನಲ್ಲಿ ಸರಿಯಾಗಿ ಕೆಲಸ ಮಾಡುತ್ತಿರಲಿಲ್ಲ, ಬಹುಷಃ ಈಗ ಕೆಲಸ ಮಾಡಬಹುದು :P

Command line tool

ಲಿನಕ್ಸ್ ಬಳಸುವವರಿಗೊಂದು ಸಿಹಿಸುದ್ದಿ :) ಈಗ ಈ ಕನ್ವರ್ಟರ್ command line application ಆಗಿಯೂ ಲಭ್ಯ. ಇಲ್ಲಿರುವ "knconverter" download ಮಾಡಿಕೊಂಡು /usr/local/bin ಗೆ ಕಾಪಿ ಮಾಡಿಕೊಳ್ಳಿ.(sudo cp ~/Downloads/knconverter /usr/local/bin/). ಇದನ್ನು ರನ್ ಮಾಡಲು Python 3 ಬೇಕಾಗುತ್ತದೆ.

ವಿವಿಧ ರೀತಿಯಲ್ಲಿ ಇದನ್ನು ಬಳಸಬಹುದು.

cat my_ascii_file.txt | knconverter > output.txt
knconverter my_ascii_file.txt
knconverter my_ascii_file.txt -o output.txt

ಇದನ್ನು ಬರೆದಿರುವುದು Python programming language(Python 3) ನಲ್ಲಿ. Python install ಆಗಿದ್ದರೆ Windows ನಲ್ಲೂ ಬಳಸಬಹುದು, ಆದರೆ ವಿಂಡೋಸ್ ನಲ್ಲಿ command line applications ನ ಎಷ್ಟು ಜನ ಉಪಯೋಗಿಸುತ್ತಾರೆ ಗೊತ್ತಿಲ್ಲ.

ಮುಂದಿನ ಕೆಲಸಗಳು

ಬಹಳಷ್ಟು ಜನ ಈಮೈಲ್ ಬರೆದು ಕನ್ವರ್ಟ್ ಮಾಡಲು ತಮಗಿದ್ದ ತೊಂದರೆಗಳನ್ನು ತಿಳಿಸಿದ್ದಾರೆ, ಅದರಂತೆ ಕೆಲವು ಯೋಜನೆಗಳ ಬಗ್ಗೆ ಯೋಚಿಸುತ್ತಿದ್ದೇನೆ. ಬನ್ನಿ ಎಲ್ಲ ಸೇರಿ ಮುಗಿಸೋಣ.

  1. Macro for LibreOffice or Microsoft Word, ಸೋಮಯಾಜಿಯವರು ನಡೆಸಿಕೊಂಡು ಹೋಗುತ್ತಿರುವ http://www.freeganita.com/ ಅಂತರ್ಜಾಲ ಪುಟ ನೀವೆಲ್ಲಾ ನೋಡಿರಬಹುದು, ಅದರಲ್ಲಿರುವ ಪಾಠಗಳು Microsoft Word ಉಪಯೋಗಿಸಿ ಬರೆದು HTML ಗೆ ಬದಲಿಸಲಾಗಿದೆ, ಅದರಲ್ಲಿ ಇಂಗ್ಲಿಷ್ ಮತ್ತು ಕನ್ನಡ ಎರಡೂ ಒಟ್ಟಿಗಿದೆ. ಕಾಪಿ ಮಾಡಿ ಈಗಿನ ಕನ್ವರ್ಟರ್ ನಲ್ಲಿ ಉಪಯೋಗಿಸಿದಾಗ ಜೊತೆಗೆ ಇರುವ ಇಂಗ್ಲಿಷ್ ಅಕ್ಷರಗಳು ಗಣಿತ ಸೂತ್ರಗಳು ಎಲ್ಲಾ ಸರಿಯಾಗಿ ಬರೋದಿಲ್ಲ. ಹಾಗೇ ಇರುವ format ಹೋಗಿ ಬಿಡುತ್ತದೆ. ಈತರಹದಲ್ಲಿ ಇರುವ ಲೇಖನಗಳಿಗೆ ನನ್ನ ಕನ್ವರ್ಟರ್ ಉಪಯೋಗಕ್ಕೆ ಬರೋದಿಲ್ಲ. ಒಂದು ಡಾಕುಮೆಂಟ್ ಅಲ್ಲಿ ಅಕ್ಷರಗಳನ್ನು ಬದಲಾಯಿಸಿ ಇರುವ ಜಾಗದಲ್ಲೇ ಮತ್ತೆ ಇಡಬೇಕು ಅದೇ format ನೊಂದಿಗೆ.

  2. Desktop application, ಇಂಟರ್ ನೆಟ್ ಇಲ್ಲದಿದ್ದಾಗಲೂ ಉಪಯೋಗಿಸುವ install ಮಾಡಿಕೊಳ್ಳಬಹುದಾದ ತಂತ್ರಾಂಶ. ನನಗೆ ಇದರ ಬಗ್ಗೆ ಹೆಚ್ಚಿನ ಮಾಹಿತಿ ಇನ್ನೂ ಇಲ್ಲ.

  3. Unicode to ASCII - ಇದು ಏಕೆ ಎಂದು ನೀವು ಯೋಚಿಸುತ್ತಿರಬಹುದು. ನಾನೂ ಹಾಗೇ ಯೋಚಿಸಿದ್ದೆ, ಎಲ್ಲರೂ ಯುನಿಕೋಡ್ ಅನ್ನೇ ಬಳಸುವಂತಾಗಬೇಕು ASCII ಗೆ ಇರುವ facility ಗಳು ಕಡಿಮೆಯಾಗಬೇಕು ಎಂದು. ಆದರೆ ಇನ್ನೂ ಬಹಳಷ್ಟು ತಂತ್ರಾಂಶಗಳಲ್ಲಿ(Scribus, Android) ಯುನಿಕೋಡ್ ಸಪೋರ್ಟ್ ಇಲ್ಲ ಹಾಗೂ ಯುನಿಕೋಡ್ ಗೆ ಜಾಸ್ತಿ ಫಾಂಟ್ ಗಳು ಇಲ್ಲ. ಹಾಗಾಗಿ ಎಲ್ಲ ತಂತ್ರಾಂಶಗಳಲ್ಲಿ ಕನ್ನಡ ಯುನಿಕೋಡ್ ಸಪೋರ್ಟ್ ಆಗುವ ವರೆಗೆ ASCII ಯನ್ನೇ ಬಳಸಬಹುದು. ಅಂತರ್ಜಾಲ ಪುಟಗಳಲ್ಲಿ ಹೇಗಿದ್ದರೂ ಯುನಿಕೋಡ್ ನ ಬಳಕೆ ಹೆಚ್ಚುತ್ತಿದೆ, DTP ಗಾಗಿ ಇನ್ನೂ ASCII ಯ ಮೇಲೆ ಅವಲಂಬನೆ ಇದೆ.

ನಾನು ಬರೆದ converter GPL v3 ಲೈಸೆನ್ಸ್ ನಲ್ಲಿ ಇರೋದ್ರಿಂದ ನೀವೂ ಕೂಡ ಈ ತಂತ್ರಾಂಶವನ್ನ ಬದಲಾಯಿಸಬಹುದು, Source code ಹಾಗೂ License ವಿವರಗಳು ಇಲ್ಲಿವೆ.

ಏನಾದರೂ ತೊಂದರೆ ಕಂಡುಬಂದರೆ ಖಂಡಿತ ತಿಳಿಸಿ.

About Aravinda Vishwanathapura

Co-Founder & CTO at Kadalu Technologies, Creator of Sanka, Creator of Chitra, GlusterFS core team member, Maintainer of Kadalu Storage
Contact: Linkedin | Twitter | Facebook | Github | mail@aravindavk.in