Openai का कहना है कि इसका अगला बड़ा मॉडल घर के मैथ ओलंपियाड गोल्ड को ला सकता है: एक टर्निंग पॉइंट? | प्रौद्योगिकी समाचार

Author name

20/07/2025

अधिकांश उपयोगकर्ताओं के लिए एआई का मूल्य आज बड़े पैमाने पर डेटासेट के लिए संभाव्यता सिद्धांत को लागू करके सुसंगत, संवादी भाषा उत्पन्न करने की अपनी क्षमता में निहित है। हालांकि, एक भविष्य जहां एआई मॉडल जटिल, बहु-चरण गणितीय समस्याओं को हल करके क्रिप्टोग्राफी और अंतरिक्ष अन्वेषण जैसे क्षेत्रों में आगे बढ़ते हैं, अब वास्तविकता के करीब एक कदम है।

Openai ने शनिवार 19 जुलाई को घोषणा की कि उसके प्रायोगिक AI रीजनिंग मॉडल ने इस साल के अंतर्राष्ट्रीय गणित ओलंपियाड (IMO) पर स्वर्ण पदक जीतने के लिए पर्याप्त अंक अर्जित किए।

1959 में रोमानिया में शुरू किया गया, IMO को व्यापक रूप से हाई-स्कूल के छात्रों के लिए दुनिया में सबसे कठिन, सबसे प्रतिष्ठित गणित प्रतियोगिताओं में से एक माना जाता है। यह दो दिनों में आयोजित किया जाता है। ओलंपियाड के प्रतिभागी दो परीक्षाएं लेते हैं, जहां उन्हें प्रत्येक सत्र में साढ़े चार घंटे के भीतर तीन गणित की समस्याओं को हल करने की उम्मीद की जाती है।

कहानी इस विज्ञापन के नीचे जारी है

Openai के अप्रकाशित AI मॉडल ने IMO 2025 को इन शर्तों के तहत इंटरनेट या बाहरी उपकरण तक पहुंच नहीं लिया। इसने आधिकारिक गणित समस्या के बयानों को पढ़ा और प्राकृतिक भाषा के प्रमाण उत्पन्न किए। मॉडल ने कुल छह समस्याओं में से पांच को हल किया, एक प्राप्त किया स्वर्ण पदक-योग्य स्कोर 35/42ओपनईएआई के तकनीकी कर्मचारियों के सदस्य अलेक्जेंडर वेई के अनुसार।

“यह अंडरस्कोर्स है कि हाल के वर्षों में एआई कितनी तेजी से आगे बढ़ा है। 2021 में, मेरे पीएचडी सलाहकार @jacobsteinhardthad मुझे जुलाई 2025 तक एआई गणित की प्रगति का पूर्वानुमान लगा।

एक पालतू जानवर के मरने के बाद 3 सबसे खराब बातें आप कह सकते हैं, और इसके बजाय क्या कहना है | पालतू जानवरों की खबरें

यह पहली बार नहीं है जब किसी कंपनी ने दावा किया है कि उसका एआई मॉडल आईएमओ स्वर्ण पदक विजेता के प्रदर्शन से मेल खा सकता है। इस साल की शुरुआत में, Google DeepMind ने Alphageometry 2 की शुरुआत की, जो विशेष रूप से एक मानव ओलंपियाड स्वर्ण पदक विजेता के बराबर स्तर पर जटिल ज्यामिति समस्याओं को हल करने के लिए डिज़ाइन किया गया एक मॉडल था।

हालांकि, Openai के प्रायोगिक मॉडल के प्रदर्शन को सामान्य बुद्धिमत्ता के लिए एक कदम के रूप में देखा जाता है, न कि केवल कार्य-विशिष्ट AI सिस्टम के लिए। वेई ने कहा, “हम संकीर्ण, कार्य-विशिष्ट कार्यप्रणाली के माध्यम से नहीं, बल्कि सामान्य-उद्देश्य सुदृढीकरण सीखने और परीक्षण-समय की गणना स्केलिंग में नई जमीन को तोड़कर इस क्षमता स्तर तक पहुंचते हैं।”

https://platform.twitter.com/widgets.js

कहानी इस विज्ञापन के नीचे जारी है

मॉडल की सफलता के निशान पारंपरिक सुदृढीकरण लर्निंग (आरएल) से परे प्रगति करते हैं, जो स्पष्ट, सत्यापन योग्य पुरस्कार और दंड की एक प्रणाली के माध्यम से एआई मॉडल को प्रशिक्षित करने के लिए उपयोग की जाने वाली एक प्रक्रिया है। इसके बजाय, मॉडल संभवतः अधिक लचीला, सामान्य समस्या-समाधान क्षमताओं को प्रदर्शित करता है क्योंकि यह “मानव गणितज्ञों के स्तर पर जटिल, जलप्रपात तर्क को शिल्प कर सकता है।”

वेई ने यह भी स्वीकार किया कि “IMO सबमिशन हार्ड-टू-वेरिफाई, मल्टी-पेज प्रूफ हैं।” गणित के सबूत छोटे, मामूली प्रमेयों से बने होते हैं जिन्हें लेमम्स कहा जाता है। Openai ने कहा कि समस्याओं के लिए AI- जनित प्रमाण स्वतंत्र रूप से तीन पूर्व IMO पदक विजेता द्वारा वर्गीकृत किए गए थे, जिन्होंने मॉडल के स्कोर को सर्वसम्मति से अंतिम रूप दिया था।

https://platform.twitter.com/widgets.js

हालांकि, गैरी मार्कस, न्यूयॉर्क विश्वविद्यालय (एनवाईयू) के एक प्रोफेसर और ओपनईआई के प्रसिद्ध आलोचक, ने बताया कि परिणाम अभी तक आईएमओ के आयोजकों द्वारा स्वतंत्र रूप से सत्यापित नहीं किए गए हैं।

यूएस डिफेंस एडवांस्ड रिसर्च प्रोजेक्ट्स एजेंसी DARPA ने एक नई पहल शुरू करने के महीनों बाद भी Openai के दावे किए, जो एक AI “सह-लेखक” के साथ उच्च-स्तरीय गणित अनुसंधान करने के तरीके खोजने के लिए शोधकर्ताओं को सूचीबद्ध करने के लिए दिखता है। अतीत में, DARPA ड्राइविंग अनुसंधान के लिए जिम्मेदार था, जिसके कारण इंटरनेट के अग्रदूत Arpanet का निर्माण हुआ।

कहानी इस विज्ञापन के नीचे जारी है

एक एआई मॉडल जो मज़बूती से सबूतों की जांच कर सकता है, गणितज्ञों के लिए भारी मात्रा में समय बचाएगा और उन्हें अधिक रचनात्मक होने में मदद करेगा। जबकि इनमें से कुछ मॉडल जटिल समस्याओं को हल करने के लिए सुसज्जित लग सकते हैं, वे भी सरल सवालों पर ठोकर खाने के लिए प्रवण हो सकते हैं जैसे कि 9.11 9.9 से बड़ा है। इसलिए, वे कहा जाता है पास होना ‘दांतेदार बुद्धिमत्ता’जो कि ओपनईएआई के सह-संस्थापक आंद्रेज करपैथी द्वारा गढ़ा गया एक शब्द है।

मॉडल के स्वर्ण पदक-योग्य IMO स्कोर पर प्रतिक्रिया करते हुए, Openai के सीईओ सैम अल्टमैन ने कहा, “यह एक एलएलएम गणित है न कि एक विशिष्ट औपचारिक गणित प्रणाली; यह सामान्य बुद्धिमत्ता की ओर हमारे मुख्य धक्का का हिस्सा है।”

https://platform.twitter.com/widgets.js

हालांकि, चैट-मेकर अपनी गणित क्षमताओं के बावजूद अगले कई महीनों के लिए कम से कम प्रयोगात्मक अनुसंधान मॉडल जारी करने की योजना नहीं बनाता है।