अफ्रीकी भाषाएं डिजिटल कैसे जा रही हैं

कैसे बॉलीवुड अकेले ही हॉलीवुड को टक्कर दे सकता है? (जुलाई 2019).

Anonim

अफ्रीकी भाषाओं को डिजिटाइज करना एक जटिल लेकिन आवश्यक प्रक्रिया है। अब, दुनिया भर से शिक्षाविदों और सूचना प्रौद्योगिकी कंपनियां विभिन्न भाषाओं के सॉफ्टवेयर और प्रौद्योगिकी में नई भाषाओं को एकीकृत करने के लिए मिलकर काम कर रही हैं।

यद्यपि दुनिया भर में हजारों भाषाएं बोली जाती हैं (इनमें से कई अकेले अफ्रीका में), कुछ अंग्रेजी की तरह, अभी भी सर्वव्यापी हैं - खासकर जब डिजिटल टूल्स और टेक्नोलॉजी की बात आती है। हाल ही में, अनुवाद, वर्तनी और व्याकरण के लिए उपकरण प्राथमिक रूप से मुख्यधारा के पश्चिमी भाषाओं की ओर तैयार किए गए थे। यह फोकस धीरे-धीरे, अफ्रीकी भाषाओं को डिजिटल बनाने के लिए, हालांकि, शिफ्ट करना शुरू कर रहा है।

मानव भाषा प्रौद्योगिकी का विकास

तकनीकी एकीकरण के समय स्वदेशी अफ्रीकी भाषाओं को ऐतिहासिक रूप से वही मान्यता प्राप्त नहीं हुई थी। हालांकि, चूंकि प्रौद्योगिकी नए अफ्रीकी बाजारों में प्रवेश करती रही है, इसलिए अधिक कंपनियां महाद्वीप पर मानव भाषा प्रौद्योगिकी (एचएलटी) में सुधार की आवश्यकता को देख रही हैं। यह चल रहे तकनीकी विकास, और डिजिटल युग में संस्कृतियों के आधारशिला के संरक्षण दोनों के लिए महत्वपूर्ण है।

एरिजोना विश्वविद्यालय के अनुसार, भाषा और सूचना प्रौद्योगिकी नियमित आधार पर पूरी दुनिया में मिलती है, इसलिए कुशल अनुसंधान और विकास की आवश्यकता: "कहीं भी भाषा सूचना प्रौद्योगिकी के संपर्क में आती है, या जहां मनुष्यों को कंप्यूटर, भाषा की ज़रूरतों के साथ बातचीत करने की आवश्यकता होती है (संगठित) होने के लिए ताकि इसे कम्प्यूटेशनल माध्यमों से संभाला जा सके और संसाधित किया जा सके। इसे अक्सर भाषाविज्ञान और भाषाएं कैसे काम करती हैं, बल्कि कंप्यूटर विज्ञान और संबंधित क्षेत्रों के बारे में भी व्यापक ज्ञान की आवश्यकता होती है। "

अफ्रीकी भाषाओं में निवेश करने वाले टेक दिग्गजों

इसके परिणामस्वरूप, फेसबुक और Google जैसे तकनीकी दिग्गजों समेत कई बड़े निगम अफ्रीकी भाषाओं के लिए एचएलटी में निवेश कर रहे हैं (यदि केवल उनकी बाजार पहुंच और मुनाफे में वृद्धि हो)। पहले उल्लेखनीय परिवर्तन विभिन्न अफ्रीकी भाषाओं में Google का उपयोग करने की क्षमता के रूप में आए थे। माइक्रोसॉफ्ट जैसी कुछ कंपनियां अफ्रीकी भाषाओं को वर्तनी जांचकर्ताओं और व्याकरण उपकरणों में भी शामिल कर रही हैं।

हालांकि, अभी भी गंभीर कमीएं हैं और बहुत सारे काम किए जाने की जरूरत है। शोधकर्ता मारिया कीट बताते हैं कि तकनीक के साथ नई भाषाओं को एकीकृत करने के लिए सटीक और अर्थपूर्ण रूप से एक स्विच फिसलने से कहीं अधिक है, और इसके बजाय एक एकीकृत दृष्टिकोण की आवश्यकता है: "वेब पर खोज करने का क्या मतलब है, कहें, (दक्षिण अफ़्रीकी भाषा) isiXhosa IsiXhosa में केवल कुछ ऑनलाइन दस्तावेज़ हैं और खोज इंजन एल्गोरिदम शब्दों को ठीक तरह से संसाधित नहीं कर सकते हैं, इसलिए, जो परिणाम आप खोज रहे हैं उन्हें वापस नहीं लौटा रहे हैं? "

ऐसा लगता है उससे अधिक जटिल

केट ने वर्ड प्रोसेसिंग टूल्स की आवश्यकता को हाइलाइट किया है ताकि वे इस तरह की भाषाओं को वर्तनी जांचकर्ताओं में शामिल कर सकें ताकि स्कूल की बच्चों से पेशेवरों तक - उनकी मूल भाषा में कागजात, दस्तावेज, संदेश और ईमेल लिख सकें।

किसी भी भाषा को डिजिटाइज करना जटिल है, और इसे स्वचालित कार्यान्वयन के चरण तक पहुंचने से पहले व्यापक शोध और परीक्षण की आवश्यकता होती है। अफ्रीकी भाषाओं को अंग्रेजी की तुलना में काफी अधिक काम की आवश्यकता होती है।

जबकि अंग्रेजी भाषा को डिजिटाइज करने के लिए बुनियादी वाक्यविन्यास नियमों का उपयोग किया गया है, कई अफ्रीकी भाषाओं में वाक्यों के संदर्भ पर अत्यधिक निर्भर हैं, जटिल क्रियाएं और वाक्य संरचनाएं हैं, और इस प्रकार संरचित डेटा का उपयोग करके स्वचालित उपकरण के लिए आसानी से खुले नहीं होते हैं।

नतीजतन, शोधकर्ताओं को मूल वाक्य उत्पन्न करने के लिए व्याकरण इंजन बनाना चाहिए। ये जटिल ग्रंथों से निकलने वाले जटिल एल्गोरिदम चलाते हैं, और इससे अतिरिक्त मुद्दों की एक श्रृंखला सामने आती है।

मौजूदा ग्रंथों को खिलााना

सभी डिजिटल भाषा सीखने के मूल में मौजूदा ग्रंथ हैं और इन एल्गोरिदम इन पर फ़ीड करते हैं। ढूंढने और एकत्रित करने के लिए, इन ग्रंथों को कई अफ्रीकी भाषाओं के लिए मुश्किल है, जब प्रकाशन की बात आती है तो पश्चिमी भाषाओं की ओर ऐतिहासिक पूर्वाग्रह दिया जाता है।

कठिनाइयों के बावजूद, महाद्वीप के आसपास के संगठन उच्च गुणवत्ता वाले मूल-भाषा दस्तावेजों को पहचानने और पूल करने शुरू कर रहे हैं जिनमें न केवल सटीक वर्तनी और व्याकरण शामिल है, बल्कि आधुनिक भी माना जा सकता है। इस सांस्कृतिक संदर्भ के बिना, सॉफ़्टवेयर एल्गोरिदम सर्वोत्तम रूप से गलत और असंवेदनशील होने का जोखिम चलाते हैं, और सबसे खराब रूप से नस्लवादी हैं।

बड़ा डेटा और संयुक्त प्रयास

इसलिए, अधिकांश प्रक्रियाएं शोधकर्ताओं से तकनीकी दिग्गजों तक बड़े डेटा और कई अलग-अलग पार्टियों के संयुक्त प्रयास पर निर्भर करती हैं। चूंकि कुछ संगठन प्रासंगिक ग्रंथों की पहचान करते हैं, अफ्रीकी भाषा विशेषज्ञ एल्गोरिदम पर काम करते हैं जो उन्हें सही तरीके से अनुवाद कर सकते हैं। टेक कंपनियां इन्हें मौजूदा परियोजनाओं में एकीकृत करती हैं, और उन लोगों की सहायता के लिए नए उपकरण विकसित करने में मदद करती हैं, जिन्हें उन्हें सबसे अधिक आवश्यकता होती है।

और वे पहले से ही प्रगति कर रहे हैं - एक अध्ययन के मुताबिक, कुछ अफ्रीकी भाषा वर्तनी जांचकर्ता अब 80% तक शुद्धता दर हासिल कर रहे हैं।

हालांकि अफ्रीकी भाषाओं को डिजिटाइज करने की प्रक्रिया जटिल है, और कई महत्वपूर्ण व्यक्तियों और संगठनों के सहयोग की आवश्यकता है, लेकिन प्रभाव बहुत दूर है। हालांकि यह निश्चित रूप से सांस्कृतिक संरक्षण, स्कूली शिक्षा और डिजिटल उपकरणों का उपयोग करने वाले लोगों के दैनिक जीवन में एक महत्वपूर्ण भूमिका निभाएगा, इसके सबसे बुनियादी स्तर पर रैमिकेशन भी बहुत बड़ा है - इसका जीवन की गुणवत्ता पर विशेष प्रभाव होगा, खासकर खेतों में जैसे हेल्थकेयर, क्योंकि तकनीकी प्रगति डॉक्टरों और मरीजों के बीच भाषा बाधाओं को तोड़ने में मदद कर सकती है।