कोलकाता में एशियाटिक सोसाइटी अपने अभिलेखागार में प्राचीन पांडुलिपियों को समझने और उन्हें दुनिया भर के विद्वानों के लिए सुलभ बनाने के लिए एआई ट्रांसक्रिप्शन और मशीन लर्निंग का उपयोग कर रही है।

ब्रिटिश औपनिवेशिक शासन के दौरान 1784 में स्थापित, एशियाटिक सोसाइटी भारत की सबसे पुरानी शोध संस्थाओं में से एक है और यह इतिहास, संस्कृति और भाषाओं के अध्ययन और संरक्षण के लिए समर्पित है।

सोसाइटी की 52,000 से अधिक दुर्लभ पांडुलिपियों और ऐतिहासिक दस्तावेजों में से कई को पहले नहीं पढ़ा जा सका है। सोसाइटी ने उन्हें डिजिटाइज़ करने और प्राचीन लिपियों के लिए भाषा मॉडल विकसित करने के लिए दिसंबर में अपनी विधवानिका (“ज्ञान को डिकोड करना”) परियोजना शुरू की।

कोलकाता में एशियाटिक सोसाइटी के प्रशासक अनंत सिन्हा ने अरब न्यूज़ को बताया, “अधिकांश पांडुलिपियों पर काम करने की ज़रूरत है।” “हम तीन वैज्ञानिकों के साथ काम कर रहे हैं। इसके अलावा, स्कैनिंग में मेरी रिप्रोग्राफी टीम शामिल है, और फिर विशेषज्ञ टीम है, जिसमें विभिन्न भाषाओं, लिपियों और विषयों के विशेषज्ञ शामिल हैं।” इस परियोजना को भारत के प्रमुख आईटी अनुसंधान और विकास संगठन सेंटर फॉर डेवलपमेंट ऑफ एडवांस्ड कंप्यूटिंग द्वारा भी समर्थन दिया जा रहा है।

सोसायटी के पांडुलिपि संग्रह में कई तरह के विषय शामिल हैं – जिसमें भारतीय इतिहास, साहित्य, दर्शन, धर्म, खगोल विज्ञान, गणित, चिकित्सा और कला शामिल हैं – और भाषाओं के संग्रह में संस्कृत, अरबी, फारसी, तमिल, बंगाली और भारत की अन्य क्षेत्रीय भाषाएँ शामिल हैं।

पांडुलिपियों को समझने के लिए लिपियों, उनकी भाषा, ऐतिहासिक दस्तावेजों में इस्तेमाल की जाने वाली शैलियों, ऐतिहासिक संदर्भ और विषय-वस्तु की समझ की आवश्यकता होती है। भारत में ही नहीं बल्कि दुनिया भर में इस तरह का काम और शोध करने वाले बहुत कम सक्रिय, विशेषज्ञ पुरातत्ववेत्ता और पांडुलिपि विद्वान हैं।

“इस परियोजना के पीछे का उद्देश्य बहुत सरल और स्पष्ट है: भाषा, लिपि और विषय – आम तौर पर आपको किसी पांडुलिपि को समझने के लिए इन तीनों के ज्ञान की आवश्यकता होती है, (और) जिन लोगों के पास (यह) ज्ञान है, वे बहुत कम हैं। हम मशीन भाषा (मॉडल) विकसित कर रहे हैं, ताकि आप पांडुलिपियों को पढ़ने के लिए सॉफ़्टवेयर या ऐप का उपयोग कर सकें,” सिन्हा ने कहा।

उन्होंने अनुमान लगाया कि मॉडल की वर्तमान सटीकता लगभग 40 प्रतिशत है, क्योंकि मशीन लर्निंग प्रक्रिया जारी है।

सिन्हा ने कहा, “हमारी योजना इसे 90 प्रतिशत से 95 प्रतिशत तक ले जाने की है। इसमें कभी भी 100 प्रतिशत सटीकता नहीं होगी।” “यह एक मशीन है, यह कोई इंसान नहीं है। यह वही सीख रहा है जो आप इसे सिखा रहे हैं, इसलिए आपको यह छूट देनी होगी … यह एक सतत प्रक्रिया होगी क्योंकि मशीन भाषा (मॉडल) खुद को बेहतर बनाती रहती है।”

विध्वनिका परियोजना को जेम्स प्रिंसेप की 225वीं जयंती पर लॉन्च किया गया था, जो एक अंग्रेजी विद्वान और सोसायटी के पूर्व सचिव थे, जिन्हें प्राचीन भारत की खरोष्ठी और ब्राह्मी लिपियों को समझने का श्रेय दिया जाता है।

उस उपलब्धि ने प्राचीन मौर्य साम्राज्य के इतिहास को उजागर करने में महत्वपूर्ण भूमिका निभाई, जिसने चौथी शताब्दी ईसा पूर्व के दौरान भारतीय उपमहाद्वीप के अधिकांश हिस्से पर शासन किया था।

सिन्हा का मानना ​​है कि विध्वनिका उन अन्य भाषाओं को बचाने में मदद कर सकती है जिन्होंने इस क्षेत्र के इतिहास में भूमिका निभाई थी।

उन्होंने कहा, “हमें यह समझने का प्रयास करना चाहिए कि उन पांडुलिपियों में क्या है और हमारे पूर्वजों ने हमारे लिए क्या छोड़ा है।” “ब्राह्मी और खरोष्ठी इस महाद्वीप की भाषाएँ हैं, और हम खुद इसे भूल गए हैं। अगर हमें (फिर से) कोई लिपि या कोई भाषा खोने का खतरा है, तो हमें इसे समझने के लिए किसी दूसरे जेम्स प्रिंसेप की आवश्यकता होगी।”

स्रोत लिंक