Openai का कहना है कि इसका अगला बड़ा मॉडल घर के मैथ ओलंपियाड गोल्ड को ला सकता है: एक टर्निंग पॉइंट? | प्रौद्योगिकी समाचार

अधिकांश उपयोगकर्ताओं के लिए एआई का मूल्य आज बड़े पैमाने पर डेटासेट के लिए संभाव्यता सिद्धांत को लागू करके सुसंगत, संवादी भाषा उत्पन्न करने की अपनी क्षमता में निहित है। हालांकि, एक भविष्य जहां एआई मॉडल जटिल, बहु-चरण गणितीय समस्याओं को हल करके क्रिप्टोग्राफी और अंतरिक्ष अन्वेषण जैसे क्षेत्रों में आगे बढ़ते हैं, अब वास्तविकता के करीब एक कदम है।

Openai ने शनिवार 19 जुलाई को घोषणा की कि उसके प्रायोगिक AI रीजनिंग मॉडल ने इस साल के अंतर्राष्ट्रीय गणित ओलंपियाड (IMO) पर स्वर्ण पदक जीतने के लिए पर्याप्त अंक अर्जित किए।

1959 में रोमानिया में शुरू किया गया, IMO को व्यापक रूप से हाई-स्कूल के छात्रों के लिए दुनिया में सबसे कठिन, सबसे प्रतिष्ठित गणित प्रतियोगिताओं में से एक माना जाता है। यह दो दिनों में आयोजित किया जाता है। ओलंपियाड के प्रतिभागी दो परीक्षाएं लेते हैं, जहां उन्हें प्रत्येक सत्र में साढ़े चार घंटे के भीतर तीन गणित की समस्याओं को हल करने की उम्मीद की जाती है।

कहानी इस विज्ञापन के नीचे जारी है

Openai के अप्रकाशित AI मॉडल ने IMO 2025 को इन शर्तों के तहत इंटरनेट या बाहरी उपकरण तक पहुंच नहीं लिया। इसने आधिकारिक गणित समस्या के बयानों को पढ़ा और प्राकृतिक भाषा के प्रमाण उत्पन्न किए। मॉडल ने कुल छह समस्याओं में से पांच को हल किया, एक प्राप्त किया स्वर्ण पदक-योग्य स्कोर 35/42ओपनईएआई के तकनीकी कर्मचारियों के सदस्य अलेक्जेंडर वेई के अनुसार।

“यह अंडरस्कोर्स है कि हाल के वर्षों में एआई कितनी तेजी से आगे बढ़ा है। 2021 में, मेरे पीएचडी सलाहकार @jacobsteinhardthad मुझे जुलाई 2025 तक एआई गणित की प्रगति का पूर्वानुमान लगा।

यह पहली बार नहीं है जब किसी कंपनी ने दावा किया है कि उसका एआई मॉडल आईएमओ स्वर्ण पदक विजेता के प्रदर्शन से मेल खा सकता है। इस साल की शुरुआत में, Google DeepMind ने Alphageometry 2 की शुरुआत की, जो विशेष रूप से एक मानव ओलंपियाड स्वर्ण पदक विजेता के बराबर स्तर पर जटिल ज्यामिति समस्याओं को हल करने के लिए डिज़ाइन किया गया एक मॉडल था।

हालांकि, Openai के प्रायोगिक मॉडल के प्रदर्शन को सामान्य बुद्धिमत्ता के लिए एक कदम के रूप में देखा जाता है, न कि केवल कार्य-विशिष्ट AI सिस्टम के लिए। वेई ने कहा, “हम संकीर्ण, कार्य-विशिष्ट कार्यप्रणाली के माध्यम से नहीं, बल्कि सामान्य-उद्देश्य सुदृढीकरण सीखने और परीक्षण-समय की गणना स्केलिंग में नई जमीन को तोड़कर इस क्षमता स्तर तक पहुंचते हैं।”

https://platform.twitter.com/widgets.js

कहानी इस विज्ञापन के नीचे जारी है

मॉडल की सफलता के निशान पारंपरिक सुदृढीकरण लर्निंग (आरएल) से परे प्रगति करते हैं, जो स्पष्ट, सत्यापन योग्य पुरस्कार और दंड की एक प्रणाली के माध्यम से एआई मॉडल को प्रशिक्षित करने के लिए उपयोग की जाने वाली एक प्रक्रिया है। इसके बजाय, मॉडल संभवतः अधिक लचीला, सामान्य समस्या-समाधान क्षमताओं को प्रदर्शित करता है क्योंकि यह “मानव गणितज्ञों के स्तर पर जटिल, जलप्रपात तर्क को शिल्प कर सकता है।”

वेई ने यह भी स्वीकार किया कि “IMO सबमिशन हार्ड-टू-वेरिफाई, मल्टी-पेज प्रूफ हैं।” गणित के सबूत छोटे, मामूली प्रमेयों से बने होते हैं जिन्हें लेमम्स कहा जाता है। Openai ने कहा कि समस्याओं के लिए AI- जनित प्रमाण स्वतंत्र रूप से तीन पूर्व IMO पदक विजेता द्वारा वर्गीकृत किए गए थे, जिन्होंने मॉडल के स्कोर को सर्वसम्मति से अंतिम रूप दिया था।

https://platform.twitter.com/widgets.js

हालांकि, गैरी मार्कस, न्यूयॉर्क विश्वविद्यालय (एनवाईयू) के एक प्रोफेसर और ओपनईआई के प्रसिद्ध आलोचक, ने बताया कि परिणाम अभी तक आईएमओ के आयोजकों द्वारा स्वतंत्र रूप से सत्यापित नहीं किए गए हैं।

यूएस डिफेंस एडवांस्ड रिसर्च प्रोजेक्ट्स एजेंसी DARPA ने एक नई पहल शुरू करने के महीनों बाद भी Openai के दावे किए, जो एक AI “सह-लेखक” के साथ उच्च-स्तरीय गणित अनुसंधान करने के तरीके खोजने के लिए शोधकर्ताओं को सूचीबद्ध करने के लिए दिखता है। अतीत में, DARPA ड्राइविंग अनुसंधान के लिए जिम्मेदार था, जिसके कारण इंटरनेट के अग्रदूत Arpanet का निर्माण हुआ।

कहानी इस विज्ञापन के नीचे जारी है

एक एआई मॉडल जो मज़बूती से सबूतों की जांच कर सकता है, गणितज्ञों के लिए भारी मात्रा में समय बचाएगा और उन्हें अधिक रचनात्मक होने में मदद करेगा। जबकि इनमें से कुछ मॉडल जटिल समस्याओं को हल करने के लिए सुसज्जित लग सकते हैं, वे भी सरल सवालों पर ठोकर खाने के लिए प्रवण हो सकते हैं जैसे कि 9.11 9.9 से बड़ा है। इसलिए, वे कहा जाता है पास होना ‘दांतेदार बुद्धिमत्ता’जो कि ओपनईएआई के सह-संस्थापक आंद्रेज करपैथी द्वारा गढ़ा गया एक शब्द है।

मॉडल के स्वर्ण पदक-योग्य IMO स्कोर पर प्रतिक्रिया करते हुए, Openai के सीईओ सैम अल्टमैन ने कहा, “यह एक एलएलएम गणित है न कि एक विशिष्ट औपचारिक गणित प्रणाली; यह सामान्य बुद्धिमत्ता की ओर हमारे मुख्य धक्का का हिस्सा है।”

https://platform.twitter.com/widgets.js

हालांकि, चैट-मेकर अपनी गणित क्षमताओं के बावजूद अगले कई महीनों के लिए कम से कम प्रयोगात्मक अनुसंधान मॉडल जारी करने की योजना नहीं बनाता है।

Google DeepMind Alphageometry 2IMO 2025 AI स्कोरOpenAIOpenai प्रयोगात्मक ai तर्क मॉडलअगलअंतरिक्ष अन्वेषण में ऐअनुसंधान में एआई का भविष्यअलेक्जेंडर वी ओपनईइसकएआई प्राकृतिक भाषा प्रमाणएआई मैथ ओलंपियाडएआई सबूत सत्यापनएआई सह-लेखक गणित DARPAएकऐ जटिल गणित की समस्याओं को हल करता हैओपनई इमो गोल्ड मेडलओलपयडकहनक्रिप्टोग्राफी में ऐगलडघरटरनगदांतेदार बुद्धि एआईपइटपरदयगकबडमडलमथसकतसमचरसामान्य बुद्धि एआईसुदृढीकरण सीखने एआई प्रगतिसैम ऑल्टमैन जनरल इंटेलिजेंस कमेंट्स