एआय कोश : भारताची गरुडझेप Pudhari File Photo
बहार

एआय कोश : भारताची गरुडझेप

‘एआय कोश’ हा एक ओपन सोर्स प्लॅटफॉर्म

पुढारी वृत्तसेवा
डॉ. योगेश प्र. जाधव

भारतात डिजिटल क्रांतीला गतिमान करण्यामध्ये एआयची भूमिका अत्यंत महत्त्वाची ठरणार आहे. भारत सरकारच्या इलेक्ट्रॉनिक्स आणि माहिती-तंत्रज्ञान मंत्रालयांतर्गत विकसित करण्यात आलेला ‘एआय कोश’ हा एक ओपन सोर्स प्लॅटफॉर्म आहे. ‘एआय फॉर ऑल’ हे धोरण प्रभावीपणे अंमलात आणण्यासाठीचे एक क्रांतिकारी पाऊल म्हणून याकडे पाहावे लागेल. या व्यासपीठाचा वापर करून आपण कृत्रिम बुद्धिमत्तेच्या क्षेत्रातील जागतिक महाशक्ती बनू शकतो.

अथांग समुद्रात ज्याप्रमाणे लाटांचा पाठशिवणीचा खेळ निरंतर सुरू असतो, तसेच काहीसे अलीकडील काळात मानवाच्या बुद्धिमत्तेतून अवतरलेल्या कृत्रिम बुद्धिमत्ता अर्थात एआयबाबत घडत आहे. विशेषतः, चॅट जीपीटी, डीपसेक, गुगल जेमिनी, ग्रोक यासारखे टूल्स विकसित झाल्यानंतर एआयच्या वापराला आणि विस्ताराला नवी गती आणि नवी दिशा लाभली आहे. भारतात डिजिटल क्रांतीला गतिमान करण्यामध्ये एआयची भूमिका अत्यंत महत्त्वाची ठरणार आहे. डिजिटल इंडिया, स्टार्टअप इंडिया, मेक इन इंडिया आणि आत्मनिर्भर भारत अशा योजनांच्या माध्यमातून भारताने तंत्रज्ञानाचा अंगीकार करत एक मजबूत डिजिटल पायाभूत संरचना उभारली आहे. या प्रवासात आरोग्य, शिक्षण, शेती, बँकिंग, न्यायव्यवस्था आणि सार्वजनिक वितरण प्रणाली यासारख्या विविध क्षेत्रांत एआयचा वापर सुरू केला आहे. आता केंद्र सरकारने ‘एआय कोश’ या नव्या व्यासपीठाचा शुभारंभ करून एआयच्या विकासाला स्वदेशी कोंदण देण्याचा प्रयत्न केला आहे.

‘एआय कोश’ हा भारत सरकारच्या इलेक्ट्रॉनिक्स आणि माहिती-तंत्रज्ञान मंत्रालयांतर्गत विकसित करण्यात आलेला एक डेटा आणि एआय मॉडेल व ज्ञानाचा सार्वजनिक संग्रह आहे. यामध्ये भारतात विविध क्षेत्रांत तयार झालेली एआय मॉडेल्स, डेटासेटस्, अल्गोरिदम्स आणि ‘एपीआय’ इत्यादींचा समावेश आहे. या सर्व गोष्टी देशातील प्रतिभावंत संशोधक, स्टार्टअप्स, सार्वजनिक संस्था, शिक्षण संस्था यांना विनामूल्य किंवा किफायतशीर दरात उपलब्ध करून देण्यात येणार आहेत. ‘एआय कोश’ हा एक ओपन सोर्स प्लॅटफॉर्म आहे. ‘एआय फॉर ऑल’ हे धोरण प्रभावीपणे अंमलात आणण्यासाठीचे एक क्रांतिकारी पाऊल म्हणून याकडे पाहावे लागेल. भारतीयसंदर्भात उपयुक्त असणारी, भाषिक विविधतेला समजणारी आणि विविध सामाजिक समस्या सोडविण्यास मदत करणारी एआय प्रणाली विकसित करणे, हा या उपक्रमाचा प्रमुख हेतू आणि उद्दिष्ट आहे.

‘जीपीयू’चे महत्त्व

केंद्रीय मंत्रिमंडळाने इंडिया एआय मिशनसाठी मार्च 2023 मध्ये 10,371.92 कोटी रुपयांच्या बजेटला मंजुरी दिली होती. यातील सुमारे 45 टक्के निधीतून 18,693 ग्राफिक्स प्रोसेसिंग युनिटस् म्हणजेच ‘जीपीयू’ स्थापित केले जाणार आहेत. त्यानंतर भारतात जगातील सर्वात मोठी संगणकीय पायाभूत सुविधा विकसित होईल. ही सुविधा चिनी एआय मॉडेल डीपसेकपेक्षा नऊपटींनी मोठी असेल, असे सांगण्यात येत आहे.

‘जीपीयू’ म्हणजे संगणकाच्या आकडेवारीची, प्रतिमा आणि मॉडेल्सची उच्च गतीने प्रक्रिया करणारी यंत्रणा. पूर्वी ही यंत्रणा गेमिंगसाठी वापरली जात होती; पण आज ती कृत्रिम बुद्धिमत्ता, मशिन लर्निंग आणि डेटा सायन्ससाठी अत्यावश्यक झाली आहे. ‘एआय कोश’मध्ये भारतीय भाषांतील मोठ्या प्रमाणावर डेटा मॉडेल्स तयार केली जात आहेत. या मॉडेल्सना प्रशिक्षणाच्या टप्प्यावर ‘जीपीयू’ची आवश्यकता सर्वाधिक असते. ‘सीपीयू’च्या तुलनेत ‘जीपीयू’ एकाच वेळी अनेक थ्रेडस्मध्ये डेटा प्रक्रिया करू शकते. त्यामुळे प्रशिक्षणासाठीचा वेळ तब्बल 70 टक्क्यांपेक्षा कमी होतो. ‘एआय कोश’सारख्या राष्ट्रीय प्रकल्पात हा वेग निर्णायक ठरतो. भारत सरकार सीडॅक, आयआयटी आणि डीआरडीओ यांच्या सहकार्याने राष्ट्रीयस्तरावरील ‘जीपीयू’ क्लस्टर्स उभारण्याच्या तयारीत आहे. हे क्लस्टर्स ‘एआय कोश’ला पाठबळ देतील. याखेरीज केंद्र सरकारने ‘एनव्हीडिया’सारख्या आघाडीच्या ‘जीपीयू’ उत्पादकांशी चर्चा केली आहे. देशातील काही राज्य सरकारे ‘एनव्हीडिया’च्या ‘डीजीएक्स एच 100’सारख्या प्रणालीसाठी प्रस्तावही पाठवत आहेत. याखेरीज ‘मेक इन इंडिया’अंतर्गत भारतात ‘जीपीयू’सारखी प्रक्रिया यंत्रणा स्थानिक पातळीवर विकसित करण्याचे प्रयत्न सुरू आहेत. यातील यश भविष्यासाठी निर्णायक ठरू शकते.

डेटासेटस्चे महत्त्व

‘एआय कोश’ हे व्यासपीठ भारतीय भाषांमधील मजबूत एआय प्रणाली तयार करण्यासाठी सुरू करण्यात आले आहे. यामध्ये भाषा मॉडेल्स तयार करणे, भाषांतर, वाचन, ओळख, चित्र विश्लेषण आणि संभाषणासारखी कामे करता यावीत, म्हणून मोठ्या प्रमाणात डेटासेटस् संकलित करावे लागणार आहेत. डेटासेट म्हणजे विशिष्ट उद्देशाने संकलित केलेल्या माहितीचा समूह. उदाहरणार्थ, हजारो मराठी वाक्ये आणि त्यांचे हिंदी भाषांतर, हा एक भाषांतर डेटासेट होईल. विविध बोलींतील मराठी संभाषण ध्वनिफिती, व्हॉईस टू टेक्स्टसाठी मराठी वाक्ये आणि त्यांच्या ध्वनी नोंदी, मराठीत लिहिलेल्या हस्ताक्षरांची स्कॅन केलेली प्रतिमा अशा अनेक प्रकारातून हे डेटासेट तयार होणार आहेत. यासाठी मंत्रालयातील नोटिसा, भाषणे यासारखे सरकारी दस्तावेज, आयआयटी, आयआयआयटी, सीडॅक यासारख्या शैक्षणिक संस्था, विविध भाषांमधील वृत्तपत्रे, आकाशवाणी यासह देशातील ओपन डेटा प्लॅटफॉर्म्स यांचा स्रोत म्हणून वापर करण्यात येणार आहे. ‘एआय कोश’मध्ये डेटासेट हा सर्वात मूलभूत घटक आहे. तो जितका व्यापक, सर्वसमावेशक आणि शुद्ध असेल, तितकी भारताची एआय क्षमता मजबूत होईल. सर्वात महत्त्वाचे म्हणजे, हे डेटासेटस् भारतीय लोकजीवनाशी संबंधित असून, स्थानिक भाषांमध्ये भाषांतरित केले जाणार आहेत. त्यामुळे ‘एआय कोश’मधून निर्माण होणारी एआय मॉडेल्स हिंदी, मराठी, तमिळ, बंगाली, तेलुगू अशा प्रमुख भारतीय भाषांमध्ये कार्यक्षम असतील. परिणामी, स्थानिक प्रशासन, ग्रामपंचायती, प्राथमिक आरोग्य केंद्रे यांनाही एआयचा लाभ मिळणार आहे. या कोशमध्ये संकलित होणारा सर्व डेटा भारतीय डेटा सुरक्षेच्या कायद्यांनुसार व्यवस्थापित केला जाणार असल्याने यामध्ये नागरिकांची गोपनीयता अबाधित राहील. तसेच, संवेदनशील माहिती पूर्णतः एन्क्रिप्टेड स्वरूपात वापरली जाणार आहे.

अशा स्थानिक माहितीने आणि स्थानिक भाषांनी समृद्ध असणार्‍या डेटासेटस्मुळे ‘एआय कोश’ 60 सेकंदांत ऑटोमॅटिक ट्रान्झॅक्शन मॅचिंग करू शकेल. आर्थिक क्षेत्रात यामुळे 30-40 टक्क्यांपर्यंत बॅक ऑफिस खर्चात बचत होईल, असा अंदाज आहे. कोश डॉट एआय प्रणाली वापरून आज अनेक भारतीय कंपन्या आपली आर्थिक कामे जलद, अचूक आणि सुरक्षितपणे पार पाडत आहेत.

भारत एक बहुभाषिक, बहुसांस्कृतिक देश आहे. येथे एआय प्रणाली विकसित करताना केवळ इंग्रजी भाषेवर आधार ठेवता येणार नाही. म्हणूनच ‘एआय कोश’ स्थापनेबाबतचे धोरण राष्ट्रीयत्वाच्या द़ृष्टीने उचललेले महत्त्वाचे पाऊल आहे. याच्या मदतीने प्रत्येक राज्यातील आणि भाषिक क्षेत्रातील एआय उपाययोजना अधिक प्रभावी बनतील. उदाहरणार्थ, मराठी भाषेतील हेल्थबॉट ग्रामीण महाराष्ट्रातील रुग्णांना, रुग्णालयांना मदत करू शकतो. स्थानिक डेटावर आधारित एआय मॉडेल्स सहज उपलब्ध करून दिल्यास नवउद्योजकांना आपले सॉफ्टवेअर उत्पादन लवकर विकसित करता येऊ शकेल. यातून भारतीय स्टार्टअप्सना जागतिक स्पर्धेत टिकण्यास मदत होईल. ‘एआय कोश’द्वारे शासकीय विभागांना ट्रान्झॅक्शन रिकन्सिलिएशन, नागरिकांच्या अर्जांची स्क्रूटीनी, न्यायप्रणालीतील कागदपत्रांचे विश्लेषण यासारखी कामे स्वयंचलित करता येतात. यामुळे नागरिकांना सेवा वेगाने मिळेल. ‘एआय कोश’ हे शिक्षण व संशोधन क्षेत्रासाठी सुवर्णसंधी आहे. आयआयटी, आयआयएम यासारख्या संस्था यावर आधारित संशोधन प्रकल्प राबवत आहेत. त्यातून विद्यार्थ्यांना रिअल डेटा आणि मॉडेल्सवर काम करता येणार आहे; अन्यथा सामान्य संशोधक, विद्यार्थी किंवा छोट्या स्टार्टअप्ससाठी माहितीचा संग्रह करून, विश्लेषण करून आणि त्यावरील प्रशिक्षित एआय मॉडेल्स तयार करणं हे अत्यंत खर्चिक आणि अवघड ठरते; पण ‘एआय कोश’ ही पोकळी भरून काढणार आहे. सरकारने अधिकृतपणे हे डेटासंच खुल्या स्वरूपात उपलब्ध करून दिल्यामुळे संशोधनासाठी एक सशक्त आधारभूत रचना निर्माण झाली आहे.

‘एआय कोश’वर सध्या 300 हून अधिक डेटासेटस् आणि 80 हून अधिक एआय मॉडेल्स उपलब्ध आहेत. हे डेटासेटस् केवळ संख्यात्मक नाहीत, तर विषयवैविध्याने संपन्न आहेत. यात जनगणना माहिती, हवामान आकडेवारी, कृषी विभागाचे निरीक्षण, जलशक्ती मंत्रालयाचे डेटासेटस्, खाणखनिज विभागाची आकडेवारी आणि अधिकृत राज्यस्तरीय माहितीचा समावेश आहे. तेलंगणा सरकारचा ‘ओपन डेटा तेलंगणा’ हा उपक्रम याचे एक उत्कृष्ट उदाहरण आहे, ज्यामधून राज्यस्तरावरील मुद्देसूद माहिती ‘एआय कोश’मध्ये समाविष्ट केली आहे. या डेटासंचांमुळे भारतातील सामाजिक, भौगोलिक, आर्थिक आणि भाषिक विविधतेचे अचूक प्रतिबिंब अभ्यासासाठी उपलब्ध होत आहे. त्यामुळे भारतात विकसित होणारी अख मॉडेल्स परदेशी डेटावर आधारित गृहितकांवर अवलंबून न राहता स्थानिक वास्तवाशी सुसंगत ठरतील.

कृत्रिम बुद्धिमत्ता ही फक्त शहरी भारतापुरती मर्यादित न राहता, ग्रामीण भागातही पोहोचणे आवश्यक आहे. एआय कोश शहरे आणि ग्रामीण भाग यांच्यात सध्या असणारी दरी मिटवण्यासाठी प्रयत्नशील आहे. उदाहरणार्थ, मराठी किंवा हिंदी भाषा ओळखणार्‍या एआय हेल्पलाइन्स ग्रामपंचायतींना, कृषी सेवांना उपयुक्त ठरतील. भविष्यात या कोशाच्या आधारे सरकार शालेय व महाविद्यालयीन विद्यार्थ्यांसाठी एआय साक्षरता कार्यक्रम राबवण्याची शक्यता आहे. यावर आधारित मॉडेल्स न्यायालयीन निर्णयांचा अभ्यास करून न्याय प्रक्रियेतील विलंब कमी करू शकतात. तसेच एआय कोशकडून हवामान, कीटकनाशके, खत वापर इत्यादी माहिती मिळाल्यास नवी कृषीसाहाय्यक मॉडेल्स तयार होतील. त्यामुळेच एआय कोष हा भारताच्या डिजिटल भविष्यासाठी एक निर्णायक टप्पा आहे. या माध्यमातून एआयचे फायदे सर्वसामान्य नागरिकांपर्यंत पोहोचावेत, हे खरे उद्दिष्ट आहे. या व्यासपीठाचा वापर करून भारत कृत्रिम बुद्धिमत्तेच्या क्षेत्रातील जागतिक महाशक्ती बनू शकतो.

जगभरामध्ये अमेरिका, इंग्लंड, युरोपियन देशांकडे अशा प्रकारची व्यासपीठे आधीपासून उपलब्ध आहेत. चीनने एआय विकासासाठी 15+ एआय ओपन इनोव्हेशन प्लॅटफॉर्म्स स्थापन केले आहेत. हे प्लॅटफॉर्म्स उद्योग-शोधसंस्था सहकार्याने कार्यान्वित आहेत. यामागचा हेतू चीनला 2030 पर्यंत जागतिक एआय महाशक्ती बनवणे हा आहे. भारताने तयार केलेले एआय कोश हे व्यासपीठ केवळ माहिती पुरवण्यापुरते मर्यादित नाहीये. त्यात एआय सँडबॉक्ससारखी सुविधा आहे जिच्या माध्यमातून संशोधक, विद्यार्थी, स्टार्टअप्स आणि छोट्या कंपन्या कमी खर्चात प्रोटोटाइप्स तयार करून प्रयोगशील संशोधन करू शकतात.यामधील राष्ट्रीयीकरणाचा मुद्दा सर्वांत महत्त्वाचा असून तो समजून घेतल्यास एआय कोषचे महत्त्व लक्षात येईल. आज आपल्याला दिसणारी अनेक चॅटबॉट्स, भाषांतर यंत्रणा, शिफारसी प्रणाली, चेहरा ओळखणारी तंत्रज्ञाने किंवा अगदी सामाजिक माध्यमांवरचे फीड्सही एखाद्या ना एखाद्या एआय मॉडेलवर आधारित असतात. पण एक गंभीर बाब अनेकदा दुर्लक्षित केली जाते, ती म्हणजे ही बहुतांश एआय मॉडेल्स अमेरिकी किंवा पाश्चात्य देशांतील डेटावर आधारित असतात. या मॉडेल्सना शिकवण्यासाठी जेव्हा भरपूर डेटा वापरला जातो, तेव्हा तो डेटा मॉडेलच्या आकलनाची दिशा ठरवतो. गूगल, मेटा (फेसबुक), मायक्रोसॉफ्ट, ओपनएआय अशा कंपन्यांनी विकसीत केलेली मॉडेल्स प्रामुख्याने इंग्रजी भाषेतील आणि पाश्चिमात्य देशातील डेटा वापरून तयार झालेली असतात. यात तिथल्या बातम्या, ब्लॉग्स, शैक्षणिक दस्तऐवज, समाजमाध्यमांवरील संभाषणं, वैद्यकीय अभिलेखे, आणि सांस्कृतिक नमुने मोठ्या प्रमाणावर समाविष्ट असतात. त्यामुळे या एआय मॉडेल्सची समज, भाकीते आणि प्रतिक्रिया ही त्या सांस्कृतिक चौकटीतूनच येतात.

भारतीय किंवा दक्षिण आशियाई समाजरचनेतील अनेक संदर्भ, बोली, स्थानिक समस्या किंवा वर्तनपद्धती या मॉडेल्सना समजण्यास कठीण जाते. तसेच या मॉडेल्समध्ये पूर्वग्रह ही एक मोठी समस्या आहे. उदाहरणार्थ, पाश्चिमात्य डेटावर प्रशिक्षण घेतलेल्या मॉडेलला गाव, शेतकरी, सरपंच किंवा पंचायत यांसारख्या शब्दांचे अर्थ समजण्यात अडचण येते. हे केवळ भाषेपुरते मर्यादित नाही; त्या संकल्पनांमागील सामाजिक आणि व्यवहारिक अर्थही मॉडेलला समजत नाहीत. म्हणूनच एखादा चॅटबॉट भारतीय वापरकर्त्याशी संवाद साधताना अयोग्य उत्तरं देतो, विनाकारण इंग्रजी शब्दप्रयोग वापरतो किंवा चुकीच्या सल्ल्यांवर आधारित निर्णय देतो. पाश्चिमात्य डेटावर आधारित मॉडेल्समध्ये इंग्रजी आणि काही युरोपीय भाषांनाच अग्रक्रम दिला जातो. त्यामुळे मराठी, तमिळ, बंगाली, ओडिया, मल्याळम, उर्दू यांसारख्या भाषांतील माहिती फारच कमी प्रमाणात सामावलेली असते. परिणामी, एआय प्रणालींमध्ये भाषिक समतेचा अभाव निर्माण होतो आणि स्थानिक वापरकर्त्यांना उपेक्षा जाणवते. एआय आधारित आरोग्य प्रणालीसुद्धा अमेरिकन रुग्णांच्या डेटावर आधारित असतात. परंतु भारतीय लोकसंख्येतील आनुवंशिकता, आहारपद्धती, आजारांचा प्रकार, रोगप्रतिकारशक्ती, औषधोपचार यामध्ये मोठा फरक असतो. त्यामुळे भारतीय रुग्णांसाठी योग्य निदान किंवा शिफारस करण्याच्या बाबतीत या मॉडेल्समध्ये अचूकतेचा अभाव दिसून येतो. त्यामुळे भारतासारख्या बहुभाषिक देशात एआय मॉडेल्ससाठी स्थानिक भाषांतील डेटा अत्यंत महत्त्वाचा आहे. तो उपलब्ध करून देण्यामध्ये एआय कोश हा क्रांतिकारी भूमिका बजावणार आहे. एआयविश्वातील गरुडझेप म्हणून याकडे पहावे लागेल.

लोकल ते ग्लोबल बातम्यांसाठी डाऊनलोड करा दैनिक पुढारीचे Android आणि iOS मोबाईल App.

'Pudhari' is excited to announce the relaunch of its Android and iOS apps. Stay updated with the latest news at your fingertips.

Android and iOS Download now and stay updated, anytime, anywhere.

SCROLL FOR NEXT