साहिल देव
कोव्हिडविरुद्धच्या लढ्यात जगभरातील शास्त्रज्ञ, वैद्यकीय तज्ज्ञ संशोधन करत होते. या संशोधनात आणि कोव्हिडचे संकट शास्त्रीय पद्धतीने समजून घेऊन त्यावर उपाययोजना करण्यात 'डेटा सायन्स' या अद्ययावत ज्ञानशाखेची अभूतपूर्व मदत शास्त्रज्ञांना झाली…
गेल्या जवळपास दोन वर्षांपासून संपूर्ण जग कोरोना विषाणूच्या साथीचा सामना करत आहे. 2019 च्या नोव्हेंबर महिन्यात चीनमधील वुहान या शहरात या विषाणूचा पहिला उद्रेक झाला आणि त्यानंतर जगभरात त्याचा संसर्ग झाला. संसर्गजन्य रोग असल्याने लॉकडाऊनसारखे प्रतिबंधात्मक उपाय अनेक देशांनी अवलंबले. काही काळ संपूर्ण जगाची अर्थव्यवस्था ठप्प झाली. या विषाणूची पहिली लाट संपल्यानंतर कोरोनाची लस भारतात उपलब्ध झाली. जगभरात मोठ्या प्रमाणावर लसीकरण होऊनही कोरोना विषाणूचा 'ओमायक्रॉन' हा नवीन व्हेरियंट काही दिवसांपूर्वी सापडला आणि पुन्हा एकदा हे संकट पूर्णपणे टळले नसल्याची जाणीव झाली. कोव्हिडविरुद्धच्या लढ्यात जगभरातील शास्त्रज्ञ, वैद्यकीय तज्ज्ञ संशोधन करत होते. विषाणूचे डीएनए मॅपिंग, मॉडेलिंग, टेस्टिंगची प्रणाली इथपासून ते थेट त्यावरची लस शोधून काढण्यापर्यंत… इतक्या सर्व बाबतीत हे संशोधन सुरू होते.
या संशोधनात आणि कोव्हिडचे संकट शास्त्रीय पद्धतीने समजून घेऊन त्यावर उपाययोजना करण्यात 'डेटा सायन्स' या अद्ययावत ज्ञानशाखेची अभूतपूर्व मदत शास्त्रज्ञांना झाली. डेटा सायन्स म्हणजे साधारणतः विविध स्वरूपात उपलब्ध होणार्या माहितीचे आकलन, पृथक्करण आणि उपयुक्तताजन्य मांडणी करण्याचे शास्त्र. डेटा सायन्सच्या क्षेत्रात काम करणार्या शास्त्रज्ञांनी कोव्हिडचा प्रादुर्भाव जगभर सुरू असताना प्रत्यक्षात उपलब्ध होत असलेली माहिती समजून घेऊन, त्यातून रोगाच्या प्रतिबंधासाठी प्रभावी उपाययोजना राबवण्यात सरकारांना महत्त्वाचे सहाय्य केले. डेटा सायन्सचा उपयोग कोव्हिडच्या संकटात कसा करण्यात आला, हे जाणून घेण्यासाठी हा लेख…
कोव्हिडच्या संकटादरम्यान डेटा सायन्सचा वापर केला गेला; पण हे तंत्रज्ञान वैद्यकीय क्षेत्रात वापरण्याची ही पहिली वेळ नव्हती.
गेल्या दशकभरापासून डेटा सायन्सच्या क्षेत्रात झालेल्या संशोधनाचा वापर वैद्यकशास्त्रात जेनेटिक्स, मेडिकल इमेजिंग, औषध संशोधन इत्यादींसाठी केला जात आहे. डेटा सायन्सच्या वापरामुळे वैद्यकशास्त्राने अचूकतेची आणि प्रभावीपणाची नवी उंची गाठली आहे. 'मेडिकल सायन्स हल्ली खूप पुढे गेलंय' असं आपण चालताबोलता ऐकतो, त्यात डेटा सायन्सचं आणि त्या क्षेत्रात काम करणार्या लोकांचं मोठं योगदान आहे. कोव्हिडच्या संकटात डेटा सायन्सच्या वापरामुळे हा विषय पुन्हा नव्याने चर्चेत आला. जगभरात कोरोनाचा वेगाने संसर्ग होत असताना क्षणाक्षणाला बदलत जाणारी माहिती संकलित करण्याचं, त्या माहितीचं पृथक्करण करून त्याआधारे अचूक भाकिते व्यक्त करण्यासाठी आणि येणारे संकट किती गंभीर आहे, हे समजून घेऊन त्यासाठी उपाययोजना करण्यासाठी सरकार, आरोग्य व्यवस्था सदैव तयार ठेवण्यासाठी डेटा सायन्सचा वापर यशस्वीपणे केला गेला.
कोव्हिडचा विचार केल्यास जगभरातील बाधित देशांचा, मोठ्या शहरांचा डेटा सार्वजनिक माध्यमांवर उपलब्ध करून दिला गेला. या उपलब्ध माहितीचा वापर करून, त्याचे स्थानिक, आर्थिक आणि सामाजिक परिमाणांशी संबंध जोडून डेटा शास्त्रज्ञांनी कोव्हिडच्या प्रसाराचा सखोल अभ्यास केला. या अभ्यासामुळे जागतिक आपत्तीचे व्यवस्थापन, निदान, विषाणूचे मॉडेलिंग, कॉन्टॅक्ट ट्रेसिंग या गोष्टी करणे आणखी सुलभ झाले. त्याहूनही महत्त्वाचे म्हणजे येणार्या संकटाचा अंदाज घेऊन त्याचा सामना करण्यासाठी भविष्यात आवश्यक असणारी साधने, सुविधा आणि आर्थिक तजवीज या अभ्यासामुळे करता आली. रोगाचा प्रभाव किती प्रमाणात असेल, याचा अंदाज आल्यामुळे शासकीय पातळीवर उपाययोजना करणे आणि त्या राबवण्यासाठीची यंत्रणा उभी करणे सरकारांना शक्य झाले.
या सगळ्यात डेटा सायन्सच्या अंतर्गत येणारा महत्त्वाचा भाग म्हणजे कोव्हिड विषाणूच्या प्रसाराचे सांख्यिकीय विश्लेषण. एखाद्या जागतिक महामारीचा सामना करत असताना विषाणूची सांख्यिकीय प्रगती आणि विषाणूच्या उत्क्रांतीचे शास्त्र – ज्याला इंग्रजीत 'एपिडेमोलॉजी' असे म्हणतात – या दोन्हींची सांगड घालावी लागते. उपलब्ध झालेल्या डेटाची तक्ते, आलेख यांच्या स्वरूपात सुलभ मांडणी करून विषाणूचा प्रसार समजून घेणे आणि त्यावरून पुढील संभाव्य संकटांचा, प्रसाराच्या तीव्रतेचा अचूक अंदाज बांधणे ही प्रक्रिया या कामात अंतर्भूत असते. कोव्हिडच्या बाबतीत सांख्यिकीय विश्लेषणाचा कोव्हिड चाचणीची अचूकता वाढवण्यासाठीही उपयोग करून घेण्यात आला. सार्वजनिक माध्यमांवर उपलब्ध झालेल्या डेटाचा आधार घेऊन, त्याच्या लोकसंख्येशी – लागण झालेल्या रुग्णांच्या वयाशी असलेल्या परस्परसंबंधांचा अभ्यास करून कोव्हिडचा मृत्यू दरावर कसा परिणाम होतो, याचा सखोल अभ्यास करण्यात आला. आर्थिक आणि सामाजिक घटकांचा तसेच वातावरणात होणार्या बदलांचा कोव्हिडच्या प्रसारावर कसा प्रभाव पडतो, हे अभ्यासण्यासाठी डेटा सायन्सचा वापर करण्यात आला. विशिष्ट प्रदेशात लोकसंख्येची घनता किती आहे, यावरून तिथे कोव्हिडचा संसर्ग झालेले रुग्ण वाढण्याचा दर किती असू शकतो, याचा अचूक अंदाज बांधण्यात आला. लोकसंख्या, लोकसंख्येचा वयोगट, लोकसंख्येची घनता, वातावरणात होणारे बदल, प्रत्यक्ष संसर्ग झालेल्या रुग्णांचा उपलब्ध होत जाणारा डेटा, टेस्ट केलेल्या एकूण रुग्णांपैकी बाधित आढळलेल्या रुग्णांची संख्या या सर्व घटकांचा एकत्रित विचार करून कोव्हिडच्या प्रसाराची दिशा समजून घेण्यात आणि त्यानुसार भविष्यलक्षी उपाययोजना राबवण्यात डेटा सायन्स क्षेत्राने सरकारांना आणि आरोग्य यंत्रणांना मोठी मदत केली.
कोव्हिड विषाणूची उत्क्रांती, पुनर्निर्मिती आणि प्रसार कसा होऊ शकतो, हे समजून घेण्याचे मोठे आव्हान शास्त्रज्ञांसमोर होते. यावर डेटा सायन्सच्या मदतीने एक गणितीय मॉडेल प्रथमच तयार करण्यात आले. विषाणूच्या उत्क्रांतीचा अभ्यास उच्च पातळीवर घेऊन जाण्यात या नव्या मॉडेलने महत्त्वाची भूमिका बजावली.
Susceptible, Undetected, Tested (Positive) and Removed Approach (SUTRA) असे नाव या मॉडेलला देण्यात आले होते. या मॉडेलचा वापर करून एखादे शहर किंवा देश रोगमुक्त होण्यासाठी किती काळ लागेल याचा अंदाज बांधण्यात आला. या प्रणालीचा उपयोग अंतिमतः रोगाची तीव्रता समजून घेण्यात, आपण आणखी किती काळ विषाणूच्या प्रभावाखाली राहणार आहोत, हे जाणून घेऊन त्यासाठी यंत्रणा तयार ठेवण्यासाठी झाला. वर उल्लेख केलेली एक प्रणाली ही कोव्हिडच्या प्रसाराच्या विश्लेषणासाठी नव्याने तयार करण्यात आली होती. डेटा सायन्समधील यासारख्या इतरही अनेक अभ्यासपद्धती कोव्हिडचा प्रसार समजून घेण्यासाठी वापरण्यात आल्या. याव्यतिरिक्त कॉन्टॅक्ट ट्रेसिंग हा सर्वात महत्त्वाचा कोव्हिड प्रतिबंधक उपाय या काळात अनेक देशांनी अवलंबला.
भारतातही आरोग्य सेतूसारख्या अॅप्लिकेशन विकसित करून कॉन्टॅक्ट ट्रेसिंग करण्याचा प्रयत्न झाला. या अॅप्लिकेशन विकसित करण्यासाठी डेटा सायन्सचा अत्यंत प्रभावी वापर करण्यात आला. पायथनसारख्या अद्ययावत तंत्रज्ञानाचा वापर करून विषाणूच्या संसर्ग झालेल्या आणि त्यांच्या संपर्कात आलेल्या लोकांना शोधून त्यांच्या कोव्हिड चाचण्या करण्यात आल्या. यामुळे रोगाचा प्रसार रोखण्यास मदत झाली.
कोव्हिडच्या विषाणूचा उद्रेक, त्याचं जेनेटिक्स आणि प्रसाराची दिशा समजून घेण्यासाठी डेटा सायन्सच्या उपयोग कसा केला गेला हे तांत्रिकदृष्ट्या थोडक्यात समजून घेतले. कोव्हिडविरुद्धच्या जागतिक लढ्यात लसींचे संशोधन, उत्पादन आणि ती प्रत्यक्ष लोकांपर्यंत पोहोचवणे हा सर्वात महत्त्वाचा टप्पा होता. या टप्प्यावर डेटा सायन्सच्या करण्यात आलेला उपयोग हा लसींची वेगवान निर्मिती करण्यात अत्यंत उपयुक्त असल्याचे दिसून आले. कोणत्याही रोगाची लस तयार करताना विशिष्ट शास्त्रीय पद्धतीचा अवलंब करावा लागतो. असंख्य प्रयोग करावे लागतात. यात शास्त्रज्ञांचा वेळ आणि पैसा अमाप प्रमाणात खर्च होतो. संशोधनाची ही प्रक्रिया वेगवान बनवणे आणि लवकरात लवकर लस विकसित करून ती उपलब्ध करून देणे हे जागतिक आव्हान समोर असताना डेटा सायन्सने त्याचा तोडगा समोर आणला. "Design of experiment' ' या डेटा सायन्समधील विशिष्ट पद्धतीचा उपयोग या प्रक्रियेत करण्यात आला, ज्यामुळे लस विकसित करण्यासाठी कराव्या लागणार्या प्रयोगांची संख्या कमी झाली. यातून फक्त वेळच नाही, तर लस बनवण्यासाठी लागणारा खर्चही वाचला. लस शोधल्यानंतर तिचे उत्पादन आणि वितरण करण्यात आले. कोरोनाच्या प्रसारावर लसीकरण कितपत यशस्वी होते, हे अभ्यासण्यासाठीही डेटा सायन्सचा आधार घेण्यात आला. त्यानुसार लसींच्या डोसेसची संख्या, दोन डोसमधील अंतर ठरवण्यात आले.
कोव्हिडदरम्यान डेटा सायन्सचा जो प्रभावी वापर झाला, त्यानंतर सार्वजनिक आरोग्याच्या क्षेत्रात या शास्त्राचा व्यापकपणे वापर करण्यासाठी नवे मार्ग आता खुले होऊ लागले आहेत. उदा., पुणे शहरातील सार्वजनिक आरोग्य समोर ठेवून येत्या काळात आरोग्य व्यवस्थेला तंत्रज्ञानाची जोड देण्यासाठी पावले उचलली जाणार आहेत. हे उद्दिष्ट समोर ठेवून पुणे महानगरपालिकेने 'पुणे पब्लिक हेल्थ इंटेलिजन्स हब' या नवीन संस्थेची स्थापना करण्याचा निर्णय घेतला. या हबच्या माध्यमातून आरोग्यविषयक माहिती संकलन आणि विश्लेषणाचे काम केले जाईल. त्याआधारे नागरिकांच्या आरोग्यविषयक माहितीचे तपशीलवार चित्रण उभे केले जाईल. माहिती विश्लेषणाच्या आधुनिक पद्धतींचा वापर करून ती माहिती सार्वजनिक आरोग्य यंत्रणेला पुरवली जाईल. त्याचबरोबर यातून सार्वजनिक आणि खासगी रुग्णालयांमध्ये समन्वय साधण्याचे कामही केले जाणार आहे. डेटा सायन्स, डेटा अॅनालिटिक्स या विद्याशाखांचा वापर कोरोनाविरुद्धच्या लढ्यात प्रभावीपणे करण्यात आला खरा; पण या वापरातही काही आव्हाने समोर होती.
डेटाचा आधारावर काम करणारी कुठलीही प्रणाली ही त्या डेटाच्या सत्यतेवर आणि अचूकतेवर अवलंबून असते. अचूकता जितकी जास्त, तितके अंदाज काटेकोर येऊ शकतात. या जागतिक महामारीचा सखोल अभ्यास करण्यासाठी उपलब्ध असलेला डेटा तुलनेने कमीच होता. डेटाचे स्रोत अनियंत्रित आणि विस्कळीत असल्यामुळे तो संकलित करून उपयुक्त 'फॉर्म'मध्ये त्याची मांडणी करणे ही मोठी अडचण होती. माहितीच्या उपलब्धतेत आणि अचूकतेत प्रचंड अनिश्चितता आणि गोंधळ असल्यामुळे तिच्या आधारावर एखादे मॉडेल विकसित करण्यासाठी तज्ज्ञांना तारेवरची कसरत करावी लागली; पण एका बाजूला ही असंख्य आव्हाने असूनही डेटा सायन्सने कोव्हिडच्या जागतिक संकटाशी लढण्यात अत्यंत महत्त्वाचा वाटा उचलला. जगभरातील वैद्यकशास्त्रज्ञ, आरोग्य यंत्रणा, लसनिर्मिती करणार्या कंपन्या, वितरण व्यवस्था, सरकारे यांच्या प्रयत्नांमध्ये अचूकता आणि प्रभावीपणा आणणे डेटा सायन्समुळे आणि या क्षेत्रात काम करणार्या तज्ज्ञांमुळे शक्य झाले..
(लेखक डेटा सायन्स क्षेत्रात काम करणार्या 'सीपीसी अॅनालिटिक्स' या कंपनीचे संस्थापक आहेत.)