अगर आप कम्प्यूटर में अलग-अलग भाषाओं में काफ़ी ज़्यादा टाइपिंग करते हैं, तो कभी-न-कभी यूनिकोड का नाम सुना ही होगा। Unicode काफ़ी लोकप्रिय font है, जो आपको एक easy typing experience देता है। तो आज हम इसी के बारे में डिटेल में बात करेंगे कि Unicode Font Kya Hai? यूनिकोड में टाइपिंग कैसे करते हैं?
शायद आपको पता न हो, लेकिन आप प्रतिदिन कई सारे Unicode fonts का प्रयोग करते होंगे। जैसे कि Arial, Arial Unicode MS, Microsoft Sans Serif, Noto, Lucida Sans Unicode, Tahoma, Times New Roman, etc. ये तो कुछ सबसे ज़्यादा इस्तेमाल होनेवाले यूनिकोड फोंट्स हैं, लेकिन इसके अलावा और भी कई सारे ऐसे फोंट्स हैं जो यूनिकोड के अंतर्गत आते हैं।
Unicode Font Kya Hai?
यूनिकोड एक computer font है, जिसमें सभी अक्षर के लिए एक विशेष संख्या दिया जाता है। इसकी मदद से आप काफ़ी आसानी से अलग-अलग भाषाओं में टाइपिंग कर सकते हैं। उदाहरण के लिए, जिस तरह आप Smartphone me Hindi Typing करते हैं वैसा ही कम्प्यूटर में हिंदी टाइपिंग करने के लिए यूनिकोड का इस्तेमाल कर सकते हैं।
आज के समय में इसे HP, IBM, Microsoft, Oracle जैसी काफ़ी बड़ी-बड़ी कम्पनियाँ भी यूज़ करती हैं। यह लगभग सभी लोकप्रिय Web Browsers & devices में काम करता है। चूँकि यह letters को दिए गए संख्या पर आधारित है, इसलिए यह विभिन्न देशों और भाषाओं में काफ़ी आसानी से उपयोग किया जा सकता है। यह प्रत्येक अक्षर के लिए एक संख्या निर्धारित करके अक्षर व वर्ण संग्रहित करता है।
यूनिकोड की विशेषताएँ
Unicode font के संबंध में आपको यह ध्यान रखना है कि यूनिकोड केवल एक कोड-सारणी है। इन लिपियों को लिखने-पढ़ने के लिए input method editor और first files ज़रूरी हैं। यूनिकोड 16 bits को एक इकाई के रूप में लेकर चलता था। अब इसे 32 bit का दिया गया है। इस समय दुनिया का कोई संकेत नहीं है जिसे 32 bit के कोड में कहीं पर कहीं जगह न मिल गई हो।
- यह विश्व की सभी लिपियों से सभी संकेतों के लिए एक अलग कोड बिंदु प्रदान करता है।
- यह वर्णों को एक कोड देता है, न कि glyph को।
- यूनिकोड भाषाओं को एकीकरण का प्रयत्न करता है।
- इस नीति के कारण सभी पश्चिमी यूरोपीय भाषाओं को लैटिन के अंतर्गत समाहित किया गया है।
- सभी स्लाविक भाषाओं को सिरिलिक (Crilic) के अंतर्गत रखा गया है।
- हिंदी, संस्कृत, मराठी, नेपाली, कश्मीरी, सिंधी आदि के लिए देवनागरी नाम से एक ही ब्लॉक दिया गया है।
- चीनी, जापानी, वियतनामी, कोरियाई भाषाओं को ‘यूनिहान’ (Unihan) नाम से एक ब्लॉक में रखा गया है और अरबी, फ़ारसी, उर्दू आदि को एक ही ब्लॉक में रखा गया है।
- बाएँ से दाएँ लिखी जाने वाली लिपियों के अतिरिक्त दाएँ से बाएँ लिखी जाने वाली लिपियाँ (अरबी, फ़ारसी, हिब्रू, आदि) को भी इसमें शमिल किया गया है।
यूनिकोड फोंट के प्रकार
यूनिकोड के तीन रूप हैं: UTF-8, UTF-16, UTF-32. मान लीजिए कि आपके पास दस पृष्ठों का कोई पथ है जिसमें रोमन, देवनागरी, अरबी आदि के कुछ चिन्ह हैं। इन चिन्हों के यूनिकोड अलग-अलग होते हैं। कुछ चिन्हों के 32 bit के यूनिकोड में शुरुआत में शून्य है। इसलिए यदि शुरुआती शून्य को हटा दें तो सिर्फ 8 bit के द्वारा इन्हें निरूपित किया जा सकता है।
इसी प्रकार रूसी, अरबी, हिब्रू आदि के यूनिकोड है जिसमें शून्य को छोड़ देने पर उन्हें प्रायः 16 bit = 2 bytes से निरूपित किया जा सकता है। देवनागरी, चीनी, जापानी, आदि को प्रारम्भिक शून्य हटा देने के बाद प्रायः 24 bit 3byte से निरूपित किया जा सकता है। परंतु ऐसे संकेत होंगे जिनमें शून्य नहीं होंगे तब उन्हें निरूपित करने के लिए चार byte ही लगेंगे।
- UTF-8, UTF-16 और UTF-32 के काम भिन्न-भिन्न ढंग से होते हैं। UTF-8 कुछ लिपि चिन्हों के लिए। बाइट, कुछ के लिए 2 बाइट, कुछ के लिए 3 या 4 बाइट इस्तेमाल करता है।
- UTF-16 इसी काम के लिए 16 न्यूनतम बिटों का इस्तेमाल करता है, अर्थात् जो चीजें UTF-8 में केवल 1 बाइट जगह लेती थी वे अब 16 bit = 2 byte के द्वारा निरूपित होंगी। जो UTF-8 में 2 byte लेती थी वह UTF-16 में भी 2 बाइट लेंगी।
- इससे स्पष्ट है कि प्रायः UTF-8 में इनकोडिंग करने से UTF-16 की अपेक्षा काम बिट्स लगेंगे। UTF-16 की अपेक्षा UTF-8 को अधिक प्रयोग किया जाता है।
- UTF-16 और UTF-32 में यह विशेषता है कि अब कम्प्यूटर का हार्डवेयर 32 bit या 64 bit का हो गया है। इसलिए UTF-8 की फ़ाइलों को प्रॉसेस करने में UTF-16, UTF-32 वाली फ़ाइलों की अपेक्षा अधिक समय लगेगा।
इसे भी पढ़ें: Blog Website Kaise Banate Hai?
Conclusion: Benefits of Unicode in Hindi
यह तो अब आपको समझ में आ गया होगा कि Unicode Font Kya Hai? अब बात करते हैं कि यूनिकोड के लाभ क्या-क्या हैं? सभी फोंट्स को छोड़कर आखिर हम यूनिकोड का प्रयोग क्यों करें? तो यूनिकोड फोंट से कई सारे benefits हो सकते हैं।
एक ही दस्तावेज में अनेक भाषाओं के पाठ लिखे जा सकते हैं। पाठ को एक निश्चित उपाय से संस्चजकारित करने की जरुरत पड़ती है जिससे विकास-खर्च काम लगते हैं। किसी सोफ्टवेयर उत्पाद का एक ही संस्करण पूरे विश्व में चलाया जा सकता है।