सुविधाओं और प्रदर्शन की तुलना में Google के नवीनतम AI मॉडल

जेमिनी 3 बनाम जेमिनी 3 प्रो बनाम जेमिनी 3 डीपथिंक: जेमिनी 3 का रोलआउट, Google का नवीनतम लार्ज लैंग्वेज मॉडल (एलएलएम), हाल के महीनों में तकनीकी दिग्गज का सबसे मजबूत एआई डेब्यू प्रतीत होता है क्योंकि इसे उपयोगकर्ताओं और डेवलपर्स से समान रूप से सकारात्मक प्रतिक्रिया मिली है।

शुरुआती समीक्षाओं से पता चलता है कि जेमिनी 3 एक अत्यधिक सक्षम मूलभूत एआई मॉडल है, खासकर जब तर्क-भारी कार्यों को संभालने की बात आती है। यह मॉडल 18 नवंबर को शिप किया गया था, Google ने इसके आगमन को ‘बुद्धिमत्ता के नए युग’ के रूप में प्रचारित किया था।

जेमिनी 3 को पिछले मॉडलों की तुलना में अधिक जटिल प्रश्नों के बेहतर उत्तर प्रदान करने के लिए डिज़ाइन किया गया है। यह सबसे अच्छा मॉडल भी कहा जाता है जिसे Google ने ‘वाइब-कोडिंग’ के लिए बनाया है, यह विवादास्पद प्रथा है जहां उपयोगकर्ता कोड उत्पन्न करने और सॉफ़्टवेयर बनाने के लिए ज्यादातर AI टूल पर भरोसा करते हैं।

Google के अनुसार, जेमिनी 3 के साथ इसकी प्रगति कई बेंचमार्क परीक्षणों में मॉडल के प्रदर्शन में परिलक्षित होती है। कंपनी ने दावा किया कि जेमिनी 3 हर एआई बेंचमार्क पर अपने पूर्ववर्ती से बेहतर प्रदर्शन करता है, एलएम एरिना लीडरबोर्ड में शीर्ष पर है और साथ ही ह्यूमैनिटीज लास्ट एग्जाम और जीपीक्यूए डायमंड पर शीर्ष अंक अर्जित करता है।

हालाँकि, सार्वजनिक बेंचमार्क की वास्तविक दुनिया के एआई प्रदर्शन के अविश्वसनीय संकेतक के रूप में आलोचना की गई है क्योंकि उन्हें खेलना आसान हो सकता है। उदाहरण के लिए, प्रसिद्ध एआई शोधकर्ता लेडी करपैथी ने बताया कि जेमिनी 3 ने यह मानने से इनकार कर दिया कि यह 2025 था क्योंकि इसके पूर्व-प्रशिक्षण डेटा में केवल 2024 तक की जानकारी शामिल थी। लेकिन उन्होंने यह भी स्वीकार किया कि जेमिनी 3 के बारे में उनकी शुरुआती धारणा सकारात्मक थी।

जैसे-जैसे अगले कुछ हफ़्तों में फीडबैक आना जारी रहेगा, आइए जेमिनी 3 परिवार के मॉडलों पर करीब से नज़र डालें और उनमें से प्रत्येक के पास क्या पेशकश है।

मिथुन 3

कहा जाता है कि जेमिनी 3 में मल्टीमॉडल तर्क क्षमताएं हैं, जिसका अर्थ है कि यह दृष्टि और स्थानिक समझ के साथ-साथ बहुभाषी कौशल और एक मिलियन-टोकन संदर्भ विंडो के साथ तर्क क्षमताओं को जोड़ती है, जिससे उपयोगकर्ताओं को लंबे सहित जटिल और सूक्ष्म प्रश्न पूछने की अनुमति मिलती है।

डेवलपर्स के लिए, जेमिनी 3 समृद्ध, अधिक इंटरैक्टिव वेब यूआई प्रस्तुत करने के लिए जटिल संकेतों और निर्देशों को संभालने में सक्षम है। Google के अनुसार, जेमिनी 3 शून्य-शॉट पीढ़ी में ‘असाधारण’ है जिसका अर्थ है कि यह ऐसे तत्वों पर स्पष्ट रूप से प्रशिक्षित किए बिना सॉफ्टवेयर तत्व उत्पन्न कर सकता है।

इस विज्ञापन के नीचे कहानी जारी है

उपयोग के मामलों के संदर्भ में, Google ने कहा कि उदाहरण के लिए, उपयोगकर्ता जेमिनी 3 को विभिन्न भाषाओं में हस्तलिखित व्यंजनों को समझने और एक साझा करने योग्य पारिवारिक कुकबुक में अनुवाद करने के लिए कह सकते हैं। कंपनी ने कहा, “यह आपके पिकलबॉल मैच के वीडियो का विश्लेषण भी कर सकता है, उन क्षेत्रों की पहचान कर सकता है जहां आप सुधार कर सकते हैं और समग्र सुधार के लिए एक प्रशिक्षण योजना तैयार कर सकते हैं।”

Google के अनुसार, चाटुकारिता को कम करने और दुर्भावनापूर्ण शीघ्र इंजेक्शन हमलों के प्रतिरोध में सुधार करने के लिए जेमिनी 3 को कई सुरक्षा परीक्षणों के अधीन किया गया है।

बेंचमार्क मोर्चे पर, जेमिनी 3 ने प्रभावशाली 1487 एलो स्कोर करके वेबडेव एरेना लीडरबोर्ड में शीर्ष स्थान हासिल किया। टर्मिनल-बेंच 2.0 पर भी इसका स्कोर 54.2 प्रतिशत है, जो टर्मिनल के माध्यम से कंप्यूटर को संचालित करने के लिए एक मॉडल की टूल उपयोग क्षमता का परीक्षण करता है। इसने SWE-बेंच वेरिफाइड (76.2 प्रतिशत) पर जेमिनी 2.5 प्रो से बेहतर प्रदर्शन किया, जो एक बेंचमार्क है जो कोडिंग एजेंटों को मापता है।
यह मॉडल वेंडिंग-बेंच 2 लीडरबोर्ड में भी शीर्ष पर है, जो एक सिम्युलेटेड वेंडिंग मशीन व्यवसाय का प्रबंधन करके लंबी क्षितिज योजना का परीक्षण करता है।

मिथुन 3 प्रो

गूगल ने कहा, “जेमिनी 3 प्रो अन्य सीमांत मॉडलों की तुलना में काफी अधिक रिटर्न उत्पन्न करने के लिए बेहतर लंबी-क्षितिज योजना को प्रदर्शित करता है।”

इस विज्ञापन के नीचे कहानी जारी है

इसकी प्रतिक्रियाएँ स्मार्ट, संक्षिप्त और सीधी हैं। कंपनी ने कहा, “यह एक सच्चे विचार भागीदार के रूप में कार्य करता है जो आपको उच्च-निष्ठा विज़ुअलाइज़ेशन के लिए कोड उत्पन्न करके गहन वैज्ञानिक अवधारणाओं का अनुवाद करने से लेकर रचनात्मक विचार-मंथन तक, जानकारी को समझने और खुद को अभिव्यक्त करने के नए तरीके प्रदान करता है।”

जेमिनिन 3 प्रो हर प्रमुख एआई बेंचमार्क पर 2.5 प्रो से बेहतर प्रदर्शन करता है। इसने 1501 एलो के सफल स्कोर के साथ एलएमएरेना लीडरबोर्ड में शीर्ष स्थान हासिल किया। इसे ह्यूमैनिटीज़ लास्ट परीक्षा में शीर्ष अंक (बिना किसी उपकरण के उपयोग के 37.5 प्रतिशत) और जीपीक्यूए डायमंड (91.9 प्रतिशत) प्राप्त हुए।

जेमिनी 3 प्रो को विज्ञान और गणित जैसे विषयों की एक विस्तृत श्रृंखला में जटिल समस्याओं को हल करने में अत्यधिक सक्षम माना जाता है। इसने एक सेट किया MathArena Apex पर नया उच्च स्कोर (23.4 प्रतिशत), गणित पर सीमांत मॉडल के मूल्यांकन के लिए एक बेंचमार्क। इसका मल्टीमॉडल तर्क पाठ से परे फैला हुआ है क्योंकि मॉडल ने एमएमएमयू-प्रो पर 81 प्रतिशत और वीडियो-एमएमएमयू पर 87.6 प्रतिशत स्कोर किया है।

जेमिनी 3 प्रो की प्रतिक्रियाएँ भी तथ्यात्मक रूप से सटीक होने की अधिक संभावना है क्योंकि इसने SimpleQA सत्यापित पर 72.1 प्रतिशत स्कोर किया है।

इस विज्ञापन के नीचे कहानी जारी है

मिथुन 3 गहन विचार करें

जेमिनी 3 डीप थिंक एक उन्नत रीजनिंग मोड है जो जेमिनी 3 की मल्टीमॉडल रीजनिंग क्षमताओं को और भी आगे बढ़ाता है ताकि उपयोगकर्ताओं को अधिक जटिल समस्याओं को हल करने में मदद मिल सके।

परीक्षण में, जेमिनी 3 डीप थिंक ने ह्यूमैनिटीज़ लास्ट एग्जाम (उपकरणों के उपयोग के बिना 41.0 प्रतिशत) और जीपीक्यूए डायमंड (93.8%) पर जेमिनी 3 प्रो के प्रदर्शन को बेहतर प्रदर्शन किया। इसने नई चुनौतियों को हल करने की अपनी क्षमता का प्रदर्शन करते हुए एआरसी-एजीआई-2 (कोड निष्पादन के साथ, एआरसी पुरस्कार सत्यापित) पर 45.1 प्रतिशत हासिल किया।

हालाँकि, Google ने कहा कि जेमिनी 3 डीप थिंक मोड अभी भी सुरक्षा मूल्यांकन के दौर से गुजर रहा है और आने वाले हफ्तों में सुरक्षा परीक्षकों से इनपुट इकट्ठा करने के बाद इसे Google AI अल्ट्रा ग्राहकों के लिए उपलब्ध कराया जाएगा। कंपनी ने यह भी कहा है कि वह जल्द ही जेमिनी 3 सीरीज़ के अतिरिक्त मॉडल जारी करने की योजना बना रही है।

Googleऔरगूगल एआई 2025गूगल नवीनतम एआई मॉडलजेमिनी 3 डीपथिंक मोडजेमिनी 3 प्रो प्रदर्शनजेमिनी 3 बनाम जेमिनी 3 प्रोजेमिनी 3 बनाम डीपथिंकतलननवनतमपरदरशनमडलमिथुन 3 गहन विचारमिथुन 3 तुलनामिथुन 3 बेंचमार्कमिथुन 3 विशेषताएँसवधओ