दुनिया का पहला पूर्णतया एजेंटिक एआई स्मार्टफोन: क्या यह चीन का दूसरा डीपसीक क्षण है? | प्रौद्योगिकी समाचार

AI हथियारों की होड़ में चीन तेजी से आगे बढ़ रहा है। जबकि बाकी दुनिया में एआई-संचालित स्मार्टफोन सुविधाओं की आमद देखी जा रही है, मुख्य रूप से वॉयस असिस्टेंट और ऐप-दर-ऐप इंटरैक्शन, चीन ने एक बड़ी छलांग लगाई है। शेन्ज़ेन स्थित बहुराष्ट्रीय दूरसंचार कंपनी ZTE ने AI एजेंट द्वारा संचालित एक स्मार्टफोन पेश किया है। बाइटडांस के सहयोग से निर्मित, डिवाइस में एक एजेंट होता है जो न केवल ऐप्स के अंदर रहता है बल्कि सीधे ऑपरेटिंग सिस्टम में एकीकृत होता है। इसकी सबसे खास क्षमता यह है कि यह स्मार्टफोन को उसी तरह संचालित कर सकता है जैसे एक इंसान करता है।

शेन्ज़ेन के एक उद्यमी टेलर ओगन ने नूबिया एम153 नामक प्रोटोटाइप को साझा करने के लिए अपने एक्स (पूर्व में ट्विटर) खाते का सहारा लिया। यह स्मार्टफोन बाइटडांस के डौबाओ एआई एजेंट के साथ एकीकृत एंड्रॉइड के एक अनुकूलित संस्करण पर चलता है। शुरुआती लोगों के लिए, डौबाओ बाइटडांस का स्वामित्व वाला बड़े पैमाने पर सामान्य-उद्देश्य वाला एआई मॉडल पारिस्थितिकी तंत्र है जिसे उत्पादकता के लिए चैटबॉट और टूल के रूप में पूरे चीन में व्यापक रूप से तैनात किया गया है।

यह प्रोटोटाइप सामान्य ऑन-डिवाइस असिस्टेंट से कहीं अधिक है। ओगन के डेमो से पता चला कि एआई के पास फोन का फुल-स्टैक नियंत्रण है, जिसका अर्थ है कि यह उपयोगकर्ता इंटरफ़ेस देख सकता है, ऐप खोल सकता है, ऐप डाउनलोड कर सकता है, स्क्रीन पर टैप और टाइप कर सकता है, कॉल कर सकता है और मल्टी-स्टेप कार्यों को निष्पादित कर सकता है, उपयोगकर्ता को यह जाने बिना कि कौन से ऐप की आवश्यकता है। सरल शब्दों में कहें तो, यहां एआई फोन का उपयोग ठीक उसी तरह करता है जैसे एक मानव उपयोगकर्ता करता है, न कि किसी ऐप की तरह।

एजेंटिक एआई स्मार्टफोन क्या करता है?

ओगन ने अपने धागे की शुरुआत करते हुए एआई से अनुरोध किया कि वह उसके लिए लाइन में इंतजार करने के लिए किसी को ढूंढे। हालांकि यह भारत में अभी तक एक आदर्श नहीं है, चीन के गिग इकॉनमी ऐप आमतौर पर अस्पतालों, सरकारी कार्यालयों और उच्च मांग वाले अन्य स्थानों पर लोगों को कतार में खड़े रहने की सेवाएं प्रदान करते हैं। ओगन को एआई से अंग्रेजी में पूछते हुए देखा जाता है, जिसका वह तुरंत जवाब देता है। एआई को कौन सा स्थानीय सेवा ऐप चुनते हुए, कार्य को कॉन्फ़िगर करते हुए, आवश्यक फ़ील्ड भरते हुए और अंतिम पुष्टिकरण स्क्रीन पेश करते हुए देखा जा सकता है। सीईओ ने अपने संक्षिप्त वीडियो में स्वीकार किया कि उन्हें नहीं पता होगा कि कौन सा ऐप उस काम को संभालता है या इसे कैसे सेट अप करना है। वीडियो में एआई एजेंट को पूरी प्रक्रिया स्वायत्त रूप से करते हुए दिखाया गया है।

यह अभूतपूर्व है, क्योंकि स्मार्टफ़ोन पर देखे जाने वाले अधिकांश मौजूदा एआई सहायक कार्यों के बारे में तर्क कर सकते हैं, लेकिन किसी उपयोगकर्ता की ओर से तीसरे पक्ष के ऐप्स के माध्यम से नेविगेट नहीं कर सकते हैं। हालाँकि सैमसंग, ऐप्पल और अन्य तकनीकी दिग्गज एआई कार्यों के साथ प्रयोग कर रहे हैं, लेकिन वे बड़े पैमाने पर अनुमति प्राप्त हैं और केवल भागीदार ऐप्स तक ही सीमित हैं। यहां ZTE-ByteDance प्रोटोटाइप बहुत आगे है, क्योंकि यह अपने AI को ग्राफिकल यूजर इंटरफेस (GUI) के भीतर सीधे कार्य करने की अनुमति देता है जैसे कि वह एक इंसान हो।

एजेंटिक एआई के पीछे का हार्डवेयर

ओगन ने अपने सूत्र में बताया कि प्रोटोटाइप 16 जीबी रैम के साथ क्वालकॉम के नए स्नैपड्रैगन 8 एलीट जेन 5 चिपसेट द्वारा संचालित है। यह महत्वपूर्ण है क्योंकि एजेंट अपने कार्यभार को क्लाउड-आधारित सिमेंटिक रीजनिंग और ऑन-डिवाइस स्क्रीन नियंत्रण के बीच विभाजित करता है। ओपी के अनुसार, स्थानीय स्तर पर ‘स्क्रीन का विजन’ चलाने से एआई को तेजी से आगे बढ़ने और भुगतान प्रवाह और पासवर्ड जैसे संवेदनशील यूआई इंटरैक्शन के लिए गोपनीयता बनाए रखने की अनुमति मिलती है।

जब एआई मॉडल की बात आती है, तो बाइटडांस के डौबाओ का उपयोग वर्तमान में चीन में 175 मिलियन से अधिक लोग कर रहे हैं। यह अनिवार्य रूप से मल्टीमॉडल, अर्थ पाठ और दृष्टि, समर्थन के साथ एक बड़ा, विरल मिश्रण-विशेषज्ञ मॉडल है। दूसरे उदाहरण में, जब ओगन एनआईओ बैटरी-स्वैप स्टेशन की तस्वीर क्लिक करता है और पूछता है, “यह क्या चीज़ है?” मॉडल छवि से स्टेशन की पहचान करता है और इसे एनआईओ के राष्ट्रीय ईवी-चार्जिंग नेटवर्क से जोड़ता है और बताता है कि यह कैसे काम करता है।

क्लाउड + ऑन-डिवाइस आर्किटेक्चर

शायद सबसे अच्छा प्रदर्शन होटल बुक करना है। सीईओ ने होटल के प्रवेश द्वार की एक तस्वीर ली; वह स्टे बुक करने के अपने इरादे से ज्यादा कुछ नहीं कहता है। एआई असाइनमेंट को समझता है और अपने कार्यभार को विभाजित करता है।

इस विज्ञापन के नीचे कहानी जारी है

सबसे पहले, डौबाओ (क्लाउड) शब्दार्थ का अनुवाद करता है, जैसे कि यह कौन सा होटल है, वह आज रात के लिए किसे बुक करना चाहता है, और पालतू नीतियां मायने रखती हैं। दूसरे, नेबुला-जीयूआई (ऑन-डिवाइस), जो कथित तौर पर जेडटीई द्वारा प्रशिक्षित 7-बिलियन-पैरामीटर मॉडल है, सीट्रिप (चीनी बुकिंग ऐप) खोलने, तारीखें दर्ज करने, सर्वोत्तम दर का पता लगाने, पालतू नीतियों के लिए ऐप को देखने और ओगन को सूचित करने जैसे कि कुत्तों को अनुमति है या नहीं, जैसी भौतिक क्रियाओं का ध्यान रखता है।

डेमो के आधार पर, यह दो-परत आर्किटेक्चर कार्य को सुचारू रूप से चलाने की अनुमति देता है। सरल शब्दों में, डौबाओ योजना बनाता है और नेबुला-जीयूआई इसे क्रियान्वित करता है।

ऐप-स्तरीय ज्ञान और अन्य बॉट्स के साथ बातचीत

एक अन्य डेमो में, एजेंट को रोबोटैक्सी बुक करने के लिए कहा जाता है, और डौबाओ जीपीएस डेटा का उपयोग करता है और यह तय करने के लिए स्थानीय राइड-हेलिंग ऐप्स की तलाश करता है कि कौन सा ऑपरेटर विशेष मार्ग पर सेवा प्रदान करता है। ओगन के फोन पर, नेबुला-जीयूआई Baidu अपोलो ऐप खोलता है, इसके मेनू के माध्यम से नेविगेट करता है, पिकअप पॉइंट का चयन करता है, और यात्रा की पुष्टि करता है। कुछ समय बाद, ओगन ने उसे सवारी के बीच में ड्रॉप-ऑफ़ स्थान बदलने के लिए कहा। फिर, एआई सक्रिय अपोलो सत्र को पहचानता है, सही स्क्रीन खोलता है, गंतव्य बदलता है, और फोन पर और रोबोटैक्सी के अंदर एक पुष्टिकरण सक्रिय करता है। यह एआई के ऐप-विशिष्ट ज्ञान का एक अच्छा प्रदर्शन है।

डेमो के दौरान, जब ओगन अपने अपोलो खाते से जुड़ा फोन नंबर भूल जाता है, तो एआई ऐप की सेटिंग्स को नेविगेट करता है और अंतिम चार अंक लाता है। अब, यह कुछ ऐसा है जिसे अधिकांश एआई सहायक तब तक नहीं कर पाएंगे जब तक उनके पास पहुंच और गहरी ओएस-स्तरीय दृश्यता न हो।

इस बीच, एक अन्य परीक्षण में, ओगन एक चीनी टेक कंपनी मीटुआन का उपयोग करता है, जो ऑन-डिमांड ड्रोन डिलीवरी सेवाएं प्रदान करती है। वह एजेंट से दो ड्रिंक ऑर्डर करने के लिए कहता है, और एजेंट उसके कार्ट को अपडेट करता है, भुगतान करता है, और पास के लॉकर में डिलीवरी की व्यवस्था करता है। और, जब मितुआन की स्वचालित प्रणाली एक पुष्टिकरण कॉल करती है, तो डौबाओ उसकी ओर से जवाब देता है और मितुआन के बॉट से बात करता है। इस प्रकार, दोनों बॉट उपयोगकर्ता के हस्तक्षेप के बिना एक्सचेंज को पूरा करते हैं। यह इस बात का उदाहरण है कि कैसे एजेंट किसी उपयोगकर्ता की ओर से अन्य एजेंटों के साथ बातचीत कर सकते हैं।

ओगन स्वीकार करते हैं कि अपने चलने के माध्यम से, वह डिवाइस को खुफिया जानकारी की एक निष्क्रिय परत के रूप में उपयोग करते हैं, यह पहचानते हैं कि क्या कोई स्टोर शेन्ज़ेन ब्रांड नेटवर्क का हिस्सा है, ट्रेडमार्क और व्यवसाय रजिस्ट्री डेटा की जांच करता है, या यह मूल्यांकन करता है कि एनवाईपीडी जैकेट पहने हुए एक राहगीर एक वास्तविक पुलिस अधिकारी है या नहीं। डेमो में, सिस्टम स्थान (शेन्ज़ेन) को सही ढंग से संदर्भित करता है और जैकेट को एक नागरिक फैशन आइटम के रूप में पहचानता है।

इस विज्ञापन के नीचे कहानी जारी है

डेमो में बाइटडांस के छवि निर्माण उपकरण भी दिखाए गए हैं, जो दृश्य को बरकरार रखते हुए फोटो में केवल कपड़ों को संशोधित करते हैं। यह एजेंट को अनुरोध पर व्यक्ति को चीनी पुलिस की वर्दी या एफबीआई जैकेट में फिर से प्रस्तुत करने की अनुमति देता है।

हमारे लिए इसका क्या मतलब है?

यह डिवाइस अनिवार्य रूप से एक ओएस-नेटिव जीयूआई एजेंट है जिसे चीनी मोबाइल यूआई प्रवाह पर प्रशिक्षित किया गया है और यह एक बड़े, मल्टीमॉडल रीजनिंग मॉडल द्वारा समर्थित है। यह ऐप्स, मेनू या वर्कफ़्लो को समझने की आवश्यकता को समाप्त कर देता है। बस फ़ोन को आशय दें; यह निष्पादन को संभालता है।

आज तक, वैश्विक स्मार्टफोन बाज़ार में कोई भी चीज़ इस स्तर की स्वायत्तता प्रदर्शित नहीं करती है। यह देखना बाकी है कि क्या यह एक व्यावसायिक उत्पाद बन जाता है, लेकिन प्रोटोटाइप स्पष्ट रूप से दिखाता है कि एजेंटिक स्मार्टफोन हमारे जीवन को कैसे बदल सकते हैं। इससे यह भी पता चलता है कि पहला सच्चा एजेंटिक स्मार्टफोन सिलिकॉन वैली से नहीं, बल्कि चीन के एकीकृत एआई और मोबाइल पारिस्थितिकी तंत्र से आ सकता है।

ZTE AI एजेंट स्मार्टफोनएआईएआई इंसान की तरह फोन को ऑपरेट करता हैएआई तृतीय-पक्ष ऐप्स को नेविगेट कर रहा हैएआई पुस्तक रोबोटैक्सीएआई यूआई विज़नएजटकएजेंटिक स्मार्टफोन चीनऑन-डिवाइस स्क्रीन नियंत्रण AIओएस-देशी जीयूआई एजेंटकयकषणगिग इकोनॉमी सेवाओं के लिए एआईचनचीन एआई हथियारों की होड़टेलर ओगनडपसकडौबाओ नेबुला-जीयूआई वास्तुकलादनयदसरनूबिया M153 प्रोटोटाइपपरणतयपरदयगकपहलपूर्ण-स्टैक नियंत्रण एआईबड़े विरल मिश्रण-विशेषज्ञ मॉडलबहु-एजेंट वार्ता एआईबाइटडांस डौबाओ एआईमल्टीमॉडल तर्क डौबाओयहसमचरसमरटफनस्नैपड्रैगन 8 एलीट जेन 5 एआईस्नो बुल कैपिटलस्वायत्त कार्य निष्पादन स्मार्टफोन