ओपनएआई ने सोमवार को अपना बहुप्रतीक्षित स्प्रिंग अपडेट इवेंट आयोजित किया, जहां उसने चैटजीपीटी के लिए एक नया डेस्कटॉप ऐप, चैटजीपीटी के वेब क्लाइंट में मामूली यूजर इंटरफेस बदलाव और जीपीटी-4ओ नामक एक नए फ्लैगशिप-स्तरीय कृत्रिम बुद्धिमत्ता (एआई) मॉडल की घोषणा की। यह कार्यक्रम यूट्यूब पर ऑनलाइन स्ट्रीम किया गया था और छोटे लाइव दर्शकों के सामने आयोजित किया गया था। इवेंट के दौरान, AI फर्म ने यह भी घोषणा की कि सभी GPT-4 सुविधाएँ, जो अब तक केवल प्रीमियम उपयोगकर्ताओं के लिए उपलब्ध थीं, अब सभी के लिए मुफ्त में उपलब्ध होंगी।
OpenAI का ChatGPT डेस्कटॉप ऐप और इंटरफ़ेस रिफ्रेश
ओपनएआई की मुख्य तकनीकी अधिकारी मीरा मुराती ने कार्यक्रम की शुरुआत की और नया चैटजीपीटी डेस्कटॉप ऐप लॉन्च किया, जो अब कंप्यूटर विज़न के साथ आता है और उपयोगकर्ता की स्क्रीन को देख सकता है। उपयोगकर्ता इस सुविधा को चालू और बंद कर सकेंगे, और एआई जो कुछ भी दिखाया जाएगा उसका विश्लेषण और सहायता करेगा। सीटीओ ने यह भी बताया कि चैटजीपीटी के वेब संस्करण को मामूली इंटरफ़ेस रिफ्रेश मिल रहा है। नया यूआई न्यूनतम स्वरूप के साथ आता है और उपयोगकर्ताओं को वेबसाइट में प्रवेश करते समय सुझाव कार्ड दिखाई देंगे। आइकन भी छोटे होते हैं और पूरे साइड पैनल को छिपा देते हैं, जिससे स्क्रीन का एक बड़ा हिस्सा बातचीत के लिए उपलब्ध हो जाता है। विशेष रूप से, चैटजीपीटी अब वेब ब्राउज़र तक भी पहुंच सकता है और राल-टाइम खोज परिणाम प्रदान कर सकता है।
GPT-4o विशेषताएं
OpenAI इवेंट का मुख्य आकर्षण कंपनी का नवीनतम फ्लैगशिप-ग्रेड AI मॉडल GPT-4o था, जहां ‘o’ का मतलब ओमनी-मॉडल है। मुराती ने इस बात पर प्रकाश डाला कि नया चैटबॉट GPT-4 टर्बो मॉडल की तुलना में दोगुना तेज़, 50 प्रतिशत सस्ता और पांच गुना अधिक दर सीमा वाला है।
GPT-4o प्रतिक्रियाओं की विलंबता में भी महत्वपूर्ण सुधार प्रदान करता है और वाक् मोड में भी वास्तविक समय में प्रतिक्रियाएँ उत्पन्न कर सकता है। एआई मॉडल के लाइव डेमो में, ओपनएआई ने दिखाया कि यह वास्तविक समय में बातचीत कर सकता है और उपयोगकर्ता को प्रतिक्रिया दे सकता है। GPT-4o-संचालित ChatGPT को अब किसी भिन्न प्रश्न का उत्तर देने के लिए भी बाधित किया जा सकता है, जो पहले असंभव था। हालाँकि, अनावरण किए गए मॉडल में सबसे बड़ी वृद्धि भावनात्मक आवाज़ों का समावेश है।
अब, जब चैटजीपीटी बोलता है, तो उसकी प्रतिक्रियाओं में विभिन्न आवाज मॉड्यूलेशन होते हैं, जिससे यह अधिक मानवीय और कम रोबोटिक लगता है। एक डेमो से पता चला कि एआई भाषण में मानवीय भावनाओं को भी पकड़ सकता है और उन पर प्रतिक्रिया कर सकता है। उदाहरण के लिए, यदि कोई उपयोगकर्ता घबराई हुई आवाज में बोलता है, तो वह चिंतित आवाज में बोलेगा।
इसके कंप्यूटर विज़न में भी सुधार किए गए हैं, और लाइव डेमो के आधार पर, यह अब डिवाइस के कैमरे से लाइव वीडियो फ़ीड को संसाधित और प्रतिक्रिया दे सकता है। यह उपयोगकर्ता को गणितीय समीकरण हल करते हुए देख सकता है और चरण-दर-चरण मार्गदर्शन प्रदान कर सकता है। यदि उपयोगकर्ता कोई गलती करता है तो यह उसे वास्तविक समय में सुधार भी सकता है। इसी तरह, यह अब बड़े कोडिंग डेटा को संसाधित कर सकता है और तुरंत इसका विश्लेषण कर सकता है और इसे बेहतर बनाने के लिए सुझाव साझा कर सकता है। अंत में, उपयोगकर्ता अब कैमरा खोल सकते हैं और अपने चेहरे को दृश्यमान रखते हुए बात कर सकते हैं, और एआई उनकी भावनाओं का पता लगा सकता है।
अंत में, एक अन्य लाइव डेमो में इस बात पर प्रकाश डाला गया कि नवीनतम एआई मॉडल द्वारा संचालित चैटजीपीटी, लाइव वॉयस अनुवाद भी कर सकता है और त्वरित उत्तराधिकार में कई भाषाओं में बात कर सकता है। जबकि OpenAI ने GPT-4o मॉडल तक पहुंच के लिए सदस्यता मूल्य का उल्लेख नहीं किया है, लेकिन इस बात पर प्रकाश डाला है कि इसे आने वाले हफ्तों में लॉन्च किया जाएगा और एपीआई के रूप में उपलब्ध कराया जाएगा।
GPT-4 अब निःशुल्क उपलब्ध है
सभी नए लॉन्च के अलावा, OpenAI ने अपनी सुविधाओं सहित GPT-4 AI मॉडल को भी मुफ्त में उपलब्ध कराया है। प्लेटफ़ॉर्म के निःशुल्क स्तर का उपयोग करने वाले लोग जीपीटी (विशिष्ट उपयोग के मामलों के लिए डिज़ाइन किए गए मिनी चैटबॉट), जीपीटी स्टोर, मेमोरी सुविधा जैसी सुविधाओं तक पहुंच सकेंगे, जिसके माध्यम से एआई भविष्य की बातचीत के लिए उपयोगकर्ता और उनसे संबंधित विशिष्ट जानकारी को याद रख सकता है। , और इसके उन्नत डेटा एनालिटिक्स बिना कुछ भुगतान किए।