भारतात डिजिटल क्रांतीला गतिमान करण्यामध्ये एआयची भूमिका अत्यंत महत्त्वाची ठरणार आहे. भारत सरकारच्या इलेक्ट्रॉनिक्स आणि माहिती-तंत्रज्ञान मंत्रालयांतर्गत विकसित करण्यात आलेला ‘एआय कोश’ हा एक ओपन सोर्स प्लॅटफॉर्म आहे. ‘एआय फॉर ऑल’ हे धोरण प्रभावीपणे अंमलात आणण्यासाठीचे एक क्रांतिकारी पाऊल म्हणून याकडे पाहावे लागेल. या व्यासपीठाचा वापर करून आपण कृत्रिम बुद्धिमत्तेच्या क्षेत्रातील जागतिक महाशक्ती बनू शकतो.
अथांग समुद्रात ज्याप्रमाणे लाटांचा पाठशिवणीचा खेळ निरंतर सुरू असतो, तसेच काहीसे अलीकडील काळात मानवाच्या बुद्धिमत्तेतून अवतरलेल्या कृत्रिम बुद्धिमत्ता अर्थात एआयबाबत घडत आहे. विशेषतः, चॅट जीपीटी, डीपसेक, गुगल जेमिनी, ग्रोक यासारखे टूल्स विकसित झाल्यानंतर एआयच्या वापराला आणि विस्ताराला नवी गती आणि नवी दिशा लाभली आहे. भारतात डिजिटल क्रांतीला गतिमान करण्यामध्ये एआयची भूमिका अत्यंत महत्त्वाची ठरणार आहे. डिजिटल इंडिया, स्टार्टअप इंडिया, मेक इन इंडिया आणि आत्मनिर्भर भारत अशा योजनांच्या माध्यमातून भारताने तंत्रज्ञानाचा अंगीकार करत एक मजबूत डिजिटल पायाभूत संरचना उभारली आहे. या प्रवासात आरोग्य, शिक्षण, शेती, बँकिंग, न्यायव्यवस्था आणि सार्वजनिक वितरण प्रणाली यासारख्या विविध क्षेत्रांत एआयचा वापर सुरू केला आहे. आता केंद्र सरकारने ‘एआय कोश’ या नव्या व्यासपीठाचा शुभारंभ करून एआयच्या विकासाला स्वदेशी कोंदण देण्याचा प्रयत्न केला आहे.
‘एआय कोश’ हा भारत सरकारच्या इलेक्ट्रॉनिक्स आणि माहिती-तंत्रज्ञान मंत्रालयांतर्गत विकसित करण्यात आलेला एक डेटा आणि एआय मॉडेल व ज्ञानाचा सार्वजनिक संग्रह आहे. यामध्ये भारतात विविध क्षेत्रांत तयार झालेली एआय मॉडेल्स, डेटासेटस्, अल्गोरिदम्स आणि ‘एपीआय’ इत्यादींचा समावेश आहे. या सर्व गोष्टी देशातील प्रतिभावंत संशोधक, स्टार्टअप्स, सार्वजनिक संस्था, शिक्षण संस्था यांना विनामूल्य किंवा किफायतशीर दरात उपलब्ध करून देण्यात येणार आहेत. ‘एआय कोश’ हा एक ओपन सोर्स प्लॅटफॉर्म आहे. ‘एआय फॉर ऑल’ हे धोरण प्रभावीपणे अंमलात आणण्यासाठीचे एक क्रांतिकारी पाऊल म्हणून याकडे पाहावे लागेल. भारतीयसंदर्भात उपयुक्त असणारी, भाषिक विविधतेला समजणारी आणि विविध सामाजिक समस्या सोडविण्यास मदत करणारी एआय प्रणाली विकसित करणे, हा या उपक्रमाचा प्रमुख हेतू आणि उद्दिष्ट आहे.
केंद्रीय मंत्रिमंडळाने इंडिया एआय मिशनसाठी मार्च 2023 मध्ये 10,371.92 कोटी रुपयांच्या बजेटला मंजुरी दिली होती. यातील सुमारे 45 टक्के निधीतून 18,693 ग्राफिक्स प्रोसेसिंग युनिटस् म्हणजेच ‘जीपीयू’ स्थापित केले जाणार आहेत. त्यानंतर भारतात जगातील सर्वात मोठी संगणकीय पायाभूत सुविधा विकसित होईल. ही सुविधा चिनी एआय मॉडेल डीपसेकपेक्षा नऊपटींनी मोठी असेल, असे सांगण्यात येत आहे.
‘जीपीयू’ म्हणजे संगणकाच्या आकडेवारीची, प्रतिमा आणि मॉडेल्सची उच्च गतीने प्रक्रिया करणारी यंत्रणा. पूर्वी ही यंत्रणा गेमिंगसाठी वापरली जात होती; पण आज ती कृत्रिम बुद्धिमत्ता, मशिन लर्निंग आणि डेटा सायन्ससाठी अत्यावश्यक झाली आहे. ‘एआय कोश’मध्ये भारतीय भाषांतील मोठ्या प्रमाणावर डेटा मॉडेल्स तयार केली जात आहेत. या मॉडेल्सना प्रशिक्षणाच्या टप्प्यावर ‘जीपीयू’ची आवश्यकता सर्वाधिक असते. ‘सीपीयू’च्या तुलनेत ‘जीपीयू’ एकाच वेळी अनेक थ्रेडस्मध्ये डेटा प्रक्रिया करू शकते. त्यामुळे प्रशिक्षणासाठीचा वेळ तब्बल 70 टक्क्यांपेक्षा कमी होतो. ‘एआय कोश’सारख्या राष्ट्रीय प्रकल्पात हा वेग निर्णायक ठरतो. भारत सरकार सीडॅक, आयआयटी आणि डीआरडीओ यांच्या सहकार्याने राष्ट्रीयस्तरावरील ‘जीपीयू’ क्लस्टर्स उभारण्याच्या तयारीत आहे. हे क्लस्टर्स ‘एआय कोश’ला पाठबळ देतील. याखेरीज केंद्र सरकारने ‘एनव्हीडिया’सारख्या आघाडीच्या ‘जीपीयू’ उत्पादकांशी चर्चा केली आहे. देशातील काही राज्य सरकारे ‘एनव्हीडिया’च्या ‘डीजीएक्स एच 100’सारख्या प्रणालीसाठी प्रस्तावही पाठवत आहेत. याखेरीज ‘मेक इन इंडिया’अंतर्गत भारतात ‘जीपीयू’सारखी प्रक्रिया यंत्रणा स्थानिक पातळीवर विकसित करण्याचे प्रयत्न सुरू आहेत. यातील यश भविष्यासाठी निर्णायक ठरू शकते.
‘एआय कोश’ हे व्यासपीठ भारतीय भाषांमधील मजबूत एआय प्रणाली तयार करण्यासाठी सुरू करण्यात आले आहे. यामध्ये भाषा मॉडेल्स तयार करणे, भाषांतर, वाचन, ओळख, चित्र विश्लेषण आणि संभाषणासारखी कामे करता यावीत, म्हणून मोठ्या प्रमाणात डेटासेटस् संकलित करावे लागणार आहेत. डेटासेट म्हणजे विशिष्ट उद्देशाने संकलित केलेल्या माहितीचा समूह. उदाहरणार्थ, हजारो मराठी वाक्ये आणि त्यांचे हिंदी भाषांतर, हा एक भाषांतर डेटासेट होईल. विविध बोलींतील मराठी संभाषण ध्वनिफिती, व्हॉईस टू टेक्स्टसाठी मराठी वाक्ये आणि त्यांच्या ध्वनी नोंदी, मराठीत लिहिलेल्या हस्ताक्षरांची स्कॅन केलेली प्रतिमा अशा अनेक प्रकारातून हे डेटासेट तयार होणार आहेत. यासाठी मंत्रालयातील नोटिसा, भाषणे यासारखे सरकारी दस्तावेज, आयआयटी, आयआयआयटी, सीडॅक यासारख्या शैक्षणिक संस्था, विविध भाषांमधील वृत्तपत्रे, आकाशवाणी यासह देशातील ओपन डेटा प्लॅटफॉर्म्स यांचा स्रोत म्हणून वापर करण्यात येणार आहे. ‘एआय कोश’मध्ये डेटासेट हा सर्वात मूलभूत घटक आहे. तो जितका व्यापक, सर्वसमावेशक आणि शुद्ध असेल, तितकी भारताची एआय क्षमता मजबूत होईल. सर्वात महत्त्वाचे म्हणजे, हे डेटासेटस् भारतीय लोकजीवनाशी संबंधित असून, स्थानिक भाषांमध्ये भाषांतरित केले जाणार आहेत. त्यामुळे ‘एआय कोश’मधून निर्माण होणारी एआय मॉडेल्स हिंदी, मराठी, तमिळ, बंगाली, तेलुगू अशा प्रमुख भारतीय भाषांमध्ये कार्यक्षम असतील. परिणामी, स्थानिक प्रशासन, ग्रामपंचायती, प्राथमिक आरोग्य केंद्रे यांनाही एआयचा लाभ मिळणार आहे. या कोशमध्ये संकलित होणारा सर्व डेटा भारतीय डेटा सुरक्षेच्या कायद्यांनुसार व्यवस्थापित केला जाणार असल्याने यामध्ये नागरिकांची गोपनीयता अबाधित राहील. तसेच, संवेदनशील माहिती पूर्णतः एन्क्रिप्टेड स्वरूपात वापरली जाणार आहे.
अशा स्थानिक माहितीने आणि स्थानिक भाषांनी समृद्ध असणार्या डेटासेटस्मुळे ‘एआय कोश’ 60 सेकंदांत ऑटोमॅटिक ट्रान्झॅक्शन मॅचिंग करू शकेल. आर्थिक क्षेत्रात यामुळे 30-40 टक्क्यांपर्यंत बॅक ऑफिस खर्चात बचत होईल, असा अंदाज आहे. कोश डॉट एआय प्रणाली वापरून आज अनेक भारतीय कंपन्या आपली आर्थिक कामे जलद, अचूक आणि सुरक्षितपणे पार पाडत आहेत.
भारत एक बहुभाषिक, बहुसांस्कृतिक देश आहे. येथे एआय प्रणाली विकसित करताना केवळ इंग्रजी भाषेवर आधार ठेवता येणार नाही. म्हणूनच ‘एआय कोश’ स्थापनेबाबतचे धोरण राष्ट्रीयत्वाच्या द़ृष्टीने उचललेले महत्त्वाचे पाऊल आहे. याच्या मदतीने प्रत्येक राज्यातील आणि भाषिक क्षेत्रातील एआय उपाययोजना अधिक प्रभावी बनतील. उदाहरणार्थ, मराठी भाषेतील हेल्थबॉट ग्रामीण महाराष्ट्रातील रुग्णांना, रुग्णालयांना मदत करू शकतो. स्थानिक डेटावर आधारित एआय मॉडेल्स सहज उपलब्ध करून दिल्यास नवउद्योजकांना आपले सॉफ्टवेअर उत्पादन लवकर विकसित करता येऊ शकेल. यातून भारतीय स्टार्टअप्सना जागतिक स्पर्धेत टिकण्यास मदत होईल. ‘एआय कोश’द्वारे शासकीय विभागांना ट्रान्झॅक्शन रिकन्सिलिएशन, नागरिकांच्या अर्जांची स्क्रूटीनी, न्यायप्रणालीतील कागदपत्रांचे विश्लेषण यासारखी कामे स्वयंचलित करता येतात. यामुळे नागरिकांना सेवा वेगाने मिळेल. ‘एआय कोश’ हे शिक्षण व संशोधन क्षेत्रासाठी सुवर्णसंधी आहे. आयआयटी, आयआयएम यासारख्या संस्था यावर आधारित संशोधन प्रकल्प राबवत आहेत. त्यातून विद्यार्थ्यांना रिअल डेटा आणि मॉडेल्सवर काम करता येणार आहे; अन्यथा सामान्य संशोधक, विद्यार्थी किंवा छोट्या स्टार्टअप्ससाठी माहितीचा संग्रह करून, विश्लेषण करून आणि त्यावरील प्रशिक्षित एआय मॉडेल्स तयार करणं हे अत्यंत खर्चिक आणि अवघड ठरते; पण ‘एआय कोश’ ही पोकळी भरून काढणार आहे. सरकारने अधिकृतपणे हे डेटासंच खुल्या स्वरूपात उपलब्ध करून दिल्यामुळे संशोधनासाठी एक सशक्त आधारभूत रचना निर्माण झाली आहे.
‘एआय कोश’वर सध्या 300 हून अधिक डेटासेटस् आणि 80 हून अधिक एआय मॉडेल्स उपलब्ध आहेत. हे डेटासेटस् केवळ संख्यात्मक नाहीत, तर विषयवैविध्याने संपन्न आहेत. यात जनगणना माहिती, हवामान आकडेवारी, कृषी विभागाचे निरीक्षण, जलशक्ती मंत्रालयाचे डेटासेटस्, खाणखनिज विभागाची आकडेवारी आणि अधिकृत राज्यस्तरीय माहितीचा समावेश आहे. तेलंगणा सरकारचा ‘ओपन डेटा तेलंगणा’ हा उपक्रम याचे एक उत्कृष्ट उदाहरण आहे, ज्यामधून राज्यस्तरावरील मुद्देसूद माहिती ‘एआय कोश’मध्ये समाविष्ट केली आहे. या डेटासंचांमुळे भारतातील सामाजिक, भौगोलिक, आर्थिक आणि भाषिक विविधतेचे अचूक प्रतिबिंब अभ्यासासाठी उपलब्ध होत आहे. त्यामुळे भारतात विकसित होणारी अख मॉडेल्स परदेशी डेटावर आधारित गृहितकांवर अवलंबून न राहता स्थानिक वास्तवाशी सुसंगत ठरतील.
कृत्रिम बुद्धिमत्ता ही फक्त शहरी भारतापुरती मर्यादित न राहता, ग्रामीण भागातही पोहोचणे आवश्यक आहे. एआय कोश शहरे आणि ग्रामीण भाग यांच्यात सध्या असणारी दरी मिटवण्यासाठी प्रयत्नशील आहे. उदाहरणार्थ, मराठी किंवा हिंदी भाषा ओळखणार्या एआय हेल्पलाइन्स ग्रामपंचायतींना, कृषी सेवांना उपयुक्त ठरतील. भविष्यात या कोशाच्या आधारे सरकार शालेय व महाविद्यालयीन विद्यार्थ्यांसाठी एआय साक्षरता कार्यक्रम राबवण्याची शक्यता आहे. यावर आधारित मॉडेल्स न्यायालयीन निर्णयांचा अभ्यास करून न्याय प्रक्रियेतील विलंब कमी करू शकतात. तसेच एआय कोशकडून हवामान, कीटकनाशके, खत वापर इत्यादी माहिती मिळाल्यास नवी कृषीसाहाय्यक मॉडेल्स तयार होतील. त्यामुळेच एआय कोष हा भारताच्या डिजिटल भविष्यासाठी एक निर्णायक टप्पा आहे. या माध्यमातून एआयचे फायदे सर्वसामान्य नागरिकांपर्यंत पोहोचावेत, हे खरे उद्दिष्ट आहे. या व्यासपीठाचा वापर करून भारत कृत्रिम बुद्धिमत्तेच्या क्षेत्रातील जागतिक महाशक्ती बनू शकतो.
जगभरामध्ये अमेरिका, इंग्लंड, युरोपियन देशांकडे अशा प्रकारची व्यासपीठे आधीपासून उपलब्ध आहेत. चीनने एआय विकासासाठी 15+ एआय ओपन इनोव्हेशन प्लॅटफॉर्म्स स्थापन केले आहेत. हे प्लॅटफॉर्म्स उद्योग-शोधसंस्था सहकार्याने कार्यान्वित आहेत. यामागचा हेतू चीनला 2030 पर्यंत जागतिक एआय महाशक्ती बनवणे हा आहे. भारताने तयार केलेले एआय कोश हे व्यासपीठ केवळ माहिती पुरवण्यापुरते मर्यादित नाहीये. त्यात एआय सँडबॉक्ससारखी सुविधा आहे जिच्या माध्यमातून संशोधक, विद्यार्थी, स्टार्टअप्स आणि छोट्या कंपन्या कमी खर्चात प्रोटोटाइप्स तयार करून प्रयोगशील संशोधन करू शकतात.यामधील राष्ट्रीयीकरणाचा मुद्दा सर्वांत महत्त्वाचा असून तो समजून घेतल्यास एआय कोषचे महत्त्व लक्षात येईल. आज आपल्याला दिसणारी अनेक चॅटबॉट्स, भाषांतर यंत्रणा, शिफारसी प्रणाली, चेहरा ओळखणारी तंत्रज्ञाने किंवा अगदी सामाजिक माध्यमांवरचे फीड्सही एखाद्या ना एखाद्या एआय मॉडेलवर आधारित असतात. पण एक गंभीर बाब अनेकदा दुर्लक्षित केली जाते, ती म्हणजे ही बहुतांश एआय मॉडेल्स अमेरिकी किंवा पाश्चात्य देशांतील डेटावर आधारित असतात. या मॉडेल्सना शिकवण्यासाठी जेव्हा भरपूर डेटा वापरला जातो, तेव्हा तो डेटा मॉडेलच्या आकलनाची दिशा ठरवतो. गूगल, मेटा (फेसबुक), मायक्रोसॉफ्ट, ओपनएआय अशा कंपन्यांनी विकसीत केलेली मॉडेल्स प्रामुख्याने इंग्रजी भाषेतील आणि पाश्चिमात्य देशातील डेटा वापरून तयार झालेली असतात. यात तिथल्या बातम्या, ब्लॉग्स, शैक्षणिक दस्तऐवज, समाजमाध्यमांवरील संभाषणं, वैद्यकीय अभिलेखे, आणि सांस्कृतिक नमुने मोठ्या प्रमाणावर समाविष्ट असतात. त्यामुळे या एआय मॉडेल्सची समज, भाकीते आणि प्रतिक्रिया ही त्या सांस्कृतिक चौकटीतूनच येतात.
भारतीय किंवा दक्षिण आशियाई समाजरचनेतील अनेक संदर्भ, बोली, स्थानिक समस्या किंवा वर्तनपद्धती या मॉडेल्सना समजण्यास कठीण जाते. तसेच या मॉडेल्समध्ये पूर्वग्रह ही एक मोठी समस्या आहे. उदाहरणार्थ, पाश्चिमात्य डेटावर प्रशिक्षण घेतलेल्या मॉडेलला गाव, शेतकरी, सरपंच किंवा पंचायत यांसारख्या शब्दांचे अर्थ समजण्यात अडचण येते. हे केवळ भाषेपुरते मर्यादित नाही; त्या संकल्पनांमागील सामाजिक आणि व्यवहारिक अर्थही मॉडेलला समजत नाहीत. म्हणूनच एखादा चॅटबॉट भारतीय वापरकर्त्याशी संवाद साधताना अयोग्य उत्तरं देतो, विनाकारण इंग्रजी शब्दप्रयोग वापरतो किंवा चुकीच्या सल्ल्यांवर आधारित निर्णय देतो. पाश्चिमात्य डेटावर आधारित मॉडेल्समध्ये इंग्रजी आणि काही युरोपीय भाषांनाच अग्रक्रम दिला जातो. त्यामुळे मराठी, तमिळ, बंगाली, ओडिया, मल्याळम, उर्दू यांसारख्या भाषांतील माहिती फारच कमी प्रमाणात सामावलेली असते. परिणामी, एआय प्रणालींमध्ये भाषिक समतेचा अभाव निर्माण होतो आणि स्थानिक वापरकर्त्यांना उपेक्षा जाणवते. एआय आधारित आरोग्य प्रणालीसुद्धा अमेरिकन रुग्णांच्या डेटावर आधारित असतात. परंतु भारतीय लोकसंख्येतील आनुवंशिकता, आहारपद्धती, आजारांचा प्रकार, रोगप्रतिकारशक्ती, औषधोपचार यामध्ये मोठा फरक असतो. त्यामुळे भारतीय रुग्णांसाठी योग्य निदान किंवा शिफारस करण्याच्या बाबतीत या मॉडेल्समध्ये अचूकतेचा अभाव दिसून येतो. त्यामुळे भारतासारख्या बहुभाषिक देशात एआय मॉडेल्ससाठी स्थानिक भाषांतील डेटा अत्यंत महत्त्वाचा आहे. तो उपलब्ध करून देण्यामध्ये एआय कोश हा क्रांतिकारी भूमिका बजावणार आहे. एआयविश्वातील गरुडझेप म्हणून याकडे पहावे लागेल.