

न्यूयॉर्क : गुगलने आपले नवीन ऑन-डिव्हाईस एआय मॉडेल ‘Gemma 3 n’ लाँच केले आहे, ज्याची घोषणा पहिल्यांदा मे 2025 मध्ये करण्यात आली होती. हे मॉडेल अत्यंत कमी मेमरी असलेल्या स्मार्टफोन आणि एज डिव्हाईसेसवर इंटरनेट कनेक्शनशिवाय ऑडिओ, इमेज, व्हिडीओ आणि टेक्स्टवर प्रक्रिया करण्यास सक्षम आहे. म्हणजेच, आता असे एआय फीचर्स जे पूर्वी शक्तिशाली क्लाऊड इन्फ्रास्ट्रक्चरवर चालत होते, ते थेट फोन आणि कमी क्षमतेच्या डिव्हाईसेसवर चालवले जाऊ शकतात.
Gemma 3 n ची सर्वात मोठी खासियत म्हणजे ते पूर्णपणे ऑफलाईन काम करू शकते. ज्या ठिकाणी इंटरनेट कनेक्टिव्हिटी नाही किंवा गोपनीयतेला (Privacy) अधिक महत्त्व दिले जाते, अशा ठिकाणी हे तंत्रज्ञान अत्यंत फायदेशीर ठरणार आहे. Gemma 3n च्या केंद्रस्थानी ‘MatFormer' (Matryoshka Transformer) नावाचे नवीन आर्किटेक्चर आहे. हे रशियन नेस्टिंग डॉल्सप्रमाणे (एका बाहुलीत दुसरी बाहुली) काम करते, ज्यामध्ये मोठ्या मॉडेलच्या आत लहान-लहान, पूर्णपणे कार्यक्षम सब-मॉडेल्स असतात. यामुळे डेव्हलपर्सना डिव्हाईसच्या क्षमतेनुसार मॉडेल कमी-जास्त (स्केल) करण्याची सोय मिळते.
Gemma 3 n चे प्रमुख वैशिष्ट : दोन व्हेरिएंट : हे मॉडेल E2 B (2 जीबी रॅम आवश्यक) आणि E4 B (सुमारे 3 जीबी रॅम आवश्यक) या दोन व्हेरिएंटमध्ये उपलब्ध आहे. कार्यक्षम डिझाईन : यात 5 ते 8 अब्ज रॉ पॅरामीटर्स असूनही, त्याचे डिझाईन इतके कार्यक्षम आहे की ते लहान मॉडेल्सप्रमाणेच संसाधने वापरते. याचे श्रेय ‘पर-लेअर एम्बेडिंग’ (PLE) तंत्रज्ञानाला जाते, जे फोनच्या ग्राफिक्स प्रोसेसरवरील (GPU) भार कमी करून CPU वर हस्तांतरित करते, ज्यामुळे मेमरीची मोठी बचत होते. वेगवान प्रोसेसिंग: ‘KV कॅशे शेअरिंग’ फीचरमुळे लांब ऑडिओ आणि व्हिडीओ इनपुटवर प्रक्रिया करण्याचा वेग दुप्पट होतो.
या मॉडेलमध्ये गुगलच्या ‘युनिव्हर्सल स्पीच मॉडेल’ मधून घेतलेला बिल्ट-इन ऑडिओ एन्कोडर आहे. यामुळे फोनवरच स्पीच-टू-टेक्स्ट आणि भाषांतर करणे शक्य होते. विशेषतः इंग्रजीतून स्पॅनिश, फ्रेंच, इटालियन आणि पोर्तुगीज यांसारख्या युरोपियन भाषांमध्ये भाषांतर करताना ते उत्कृष्ट परिणाम देते. व्हिजन क्षमतेसाठी गुगलचा नवीन ‘MobileNet- V5’ लाईटवेट व्हिजन एन्कोडर वापरण्यात आला आहे. हे प्रतिसेकंद 60 फ्रेम्सपर्यंत (60 FPS) व्हिडीओ स्ट्रीम्सवर प्रक्रिया करू शकते, ज्यामुळे Google Pixel सारख्या डिव्हाईसेसवर रिअल-टाईम व्हिडीओ अॅनालिसिस अत्यंत सहजतेने होते. हे मागील व्हिजन मॉडेल्सपेक्षा अधिक वेगवान आणि अचूक आहे.