उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या
ओपनईने मे 2024 मध्ये प्रथम “ओमनी” किंवा एमएस, जीपीटी -4 ओ सोडल्यापासून आम्ही पहिल्या वर्धापन दिनानिमित्त बाहेर जात आहोत, परंतु या जुन्या इच्छेमध्ये अजूनही काही युक्त्या आहेत.
केस-इन-पॉईंट, ओपनई आज अलीकडेच चॅटबॉट चॅटजीपीटीच्या वापरकर्त्यांसाठी अतिरिक्त स्तर, व्यावसायिक, कार्यसंघ आणि विनामूल्य वापर स्तरांवर मूळ जीपीटी -4 ओची क्षमता नुकतीच चालविली आहे, जरी कंपनीने आपल्या एपीआय अनुप्रयोग प्रोग्रामिंग इंटरफेस (एपीआय) च्या माध्यमातून लवकरच संस्था, ईडीयू प्रदान केली असे सांगितले.
चॅटजीपीटी-अपेनाईच्या डॅल-ई 3 मध्ये उपलब्ध असलेल्या पूर्वीच्या कृत्रिम बुद्धिमत्ता प्रतिमा मॉडेलच्या विपरीत, एक क्लासिक अॅडॉप्टर मॉडेल ज्याला पिक्सेल युनिट्समधून आवाज काढून मजकूर दाव्यांमधून प्रतिमा पुनर्बांधणी करण्यास प्रशिक्षित केले गेले होते-हे नवीन प्रतिमा जनरेटर मजकूर आणि प्रतीक प्रसारित करते, जिथे ओपनई या सर्व फॉर्मची ओळख पटविण्यासाठी पूर्णपणे ट्रेन करते.
ओपनई ग्रेग ब्रूकमन अध्यक्षांनी मे २०२24 मध्ये दीर्घ काळापासून हा मूळ जीपीटी -4 ओ होता, परंतु अद्याप सार्वजनिकपणे अज्ञात असलेल्या कारणांमुळे, कंपनीने बर्याच पॉवर वापरकर्त्यांनी जेमिनी एआय स्टुडिओचे समान वैशिष्ट्य म्हणून जेमिमिनी 2 फ्लॅश प्रयत्नशील मॉडेलसह कृत्रिम बुद्धिमत्ता पाहिली आहे.
यामुळे उच्च गुणवत्तेच्या प्रतिमांच्या जनरेटरचा परिणाम झाला आहे ज्याचा परिणाम अधिक स्पष्ट चित्रे आणि अचूक, बेक केलेला मजकूर आणि वापरकर्त्यांद्वारे आधीच प्रभावित झाला आहे – त्यातील एक “वेडा” गुणवत्ता म्हणतो.
त्याच पद्धतीने (श्लेषातून उद्देशाने), ओपनईने जीपीटी -4 ओ प्रतिमा तयार करण्याच्या क्षमतेबद्दल विशेष सांगितले नाही आणि कंपनीच्या इतिहासाच्या दृष्टीने आणि मॉडेल्सच्या सेवा प्रदात्यांचा इतिहास पाहता, हे वेबवरुन मूर्त स्वरुप असलेल्या अनेक कलात्मक कामांचा समावेश असेल, जे त्यांना रागावले गेले आहे, जे त्यांच्याकडे रागावले गेले आहे.
चॅटजीपीटी आणि सोरावर फोटोंची पिढी आणा
ओपनएआयने आपल्या एआय मॉडेल्सची आवश्यक क्षमता बनविण्याचे उद्दीष्ट दीर्घ काळापासून केले आहे. जीपीटी -4 ओ वापरुन, वापरकर्ते आता CHATGPT मध्ये थेट प्रतिमा तयार करू शकतात, संभाषणाद्वारे सुधारित करू शकतात आणि उड्डाण करताना तपशील समायोजित करू शकतात.
मॉडेल व्हिडिओ व्युत्पन्न करण्यासाठी सोरा, एक व्यासपीठ किंवा ओपनईमध्ये विलीन होते, जे मल्टीमीडिया क्षमता वाढवते.
एका जाहिरातीमध्ये, ओपनईने पुष्टी केली की जीपीटी -4 ओ फोटोंची निर्मिती यासाठी डिझाइन केली आहे:
- प्रतिमांच्या आत मजकूर अचूकपणे सबमिट करा, चिन्हे, मेनू, आमंत्रणे आणि आलेख तयार करण्यास अनुमती द्या.
- जटिल दाव्यांचे अचूक अनुसरण करा, तपशीलवार रचनांमध्ये देखील उच्च अचूकता ठेवा.
- मागील प्रतिमा आणि मजकूरावर आधारित आणि एकाधिक प्रतिक्रियांद्वारे व्हिज्युअल सुसंगततेची हमी द्या.
- प्रकाश वास्तववादापासून ते स्पर्श केलेल्या स्पष्टीकरणांपर्यंत विविध कलात्मक नमुन्यांना समर्थन देणे.
वापरकर्ते CHATGPT मधील चित्राचे वर्णन करू शकतात आणि रुंदीची टक्केवारी, रंग प्रणाली (षटकोनी कोड) किंवा पारदर्शकता यासारख्या तपशील निश्चित करू शकतात आणि एका मिनिटात तयार केल्या जातील.
कृत्रिम बुद्धिमत्तेचे स्वतंत्र सल्लागार, एक्सवरील अॅली के. मिलर यांनी लिहिले की ते “मजकूराच्या पिढीत एक जबरदस्त झेप आहे”, जे आपण पाहिलेल्या प्रतिमा व्युत्पन्न करण्यासाठी “चांगले” मॉडेल आहे.

मुख्य क्षमता आणि वापराची प्रकरणे
जीपीटी -4 ओ प्रतिमा आश्चर्यकारक व्हिज्युअल नव्हे तर व्यावहारिक देखील तयार करण्यासाठी डिझाइन केलेले आहे. काही मुख्य अनुप्रयोगांमध्ये हे समाविष्ट आहे:
- डिझाइन आणि ब्रँड – एक नाजूक मजकूरासह लोगो, स्टिकर्स आणि जाहिराती तयार करा.
- शिक्षण आणि समज – वैज्ञानिक योजना, आलेख आणि शिक्षणाची ऐतिहासिक चित्रे तयार करा.
- खेळाचा विकास – वेगवेगळ्या डिझाइन पुनरावृत्तीद्वारे वर्णांची सुसंगतता राखणे.
- विपणन आणि सामग्री निर्मिती – सामाजिक माहिती मालमत्ता, इव्हेंट कॉल आणि डिजिटल दावे वैशिष्ट्यांचे उत्पादन ब्रँड गरजा पूर्ण करण्यासाठी डिझाइन केलेले.
DALL-E वर जीपीटी -4 ओ प्रसूती प्रतिमा कशी सुधारित करावी
एक्स वरील अधिकृत ओपनई थ्रेडनुसार, जीपीटी -4 ओ मागील मॉडेल्समध्ये बर्याच सुधारणा ऑफर करते:
- चांगले मजकूर एकत्रीकरण: मागील कृत्रिम बुद्धिमत्ता मॉडेल्सच्या विपरीत, जे चांगल्या स्थितीत वाचनीय मजकूरासह संघर्ष करतात, जीपीटी -4 ओ आता चित्रांच्या आत शब्दांचा अचूकपणे समावेश करू शकतो.
- वाढीव संदर्भ समजून घेणे: जीपीटी -4 ओ चॅट रेकॉर्डचा फायदा घेण्याचे कार्य करते, वापरकर्त्यांना परस्परसंवादीपणे प्रतिमा सुधारित करण्यास आणि एकाधिक पिढ्यांमध्ये एकरूपता राखण्याची परवानगी देते.
- मल्टी -ऑब्जेक्ट सुधारणे: मागील मॉडेल्सना एका दृश्यात अनेक वेगळ्या वस्तू ठेवण्यात अडचण आली असली तरी जीपीटी -4 ओ आता एकाच वेळी 10-20 पर्यंतच्या जीवांना हाताळू शकते.
- मल्टी -वापर रूपांतर: मॉडेल हातांनी काढलेल्या रेखांकनांपासून उच्च -रेसोल्यूशन रिअलिझमपर्यंत प्रतिमा विविध नमुन्यांमध्ये व्युत्पन्न करू शकते किंवा रूपांतरित करू शकते.
निर्बंध
त्याची प्रगती असूनही, जीपीटी -4 ओला अजूनही काही ज्ञात आव्हाने आहेत:
- अर्थव्यवस्थेचे प्रश्नः स्टिकर्स सारख्या मोठ्या चित्रे कधीकधी घट्ट बोलावल्या जाऊ शकतात.
- नॉन -लॅटिन मजकूर प्रोग्राममधील मजकूराची अचूकता: काही नॉन -एंग्लिश अक्षरे योग्यरित्या सादर करू शकत नाहीत.
- छोट्या मजकूरात तपशील ठेवा: एक अतिशय तपशीलवार किंवा लहान मजकूर स्पष्टता गमावू शकतो.
- मुक्तीची अचूकता: प्रतिमेच्या विशिष्ट भागांमध्ये बदल केल्यास इतर घटकांवर परिणाम होऊ शकत नाही.
ओपनई सतत मॉडेल सुधारणांद्वारे या समस्यांकडे सक्रियपणे लक्ष देत आहे.
सुरक्षा उपाय आणि चिन्हे
अधिकृत एआय विकासासाठी ओपनईच्या वचनबद्धतेचा एक भाग म्हणून, जीपीटी -4 ओ सी 2 पीए डेटाद्वारे तयार केलेल्या सर्व प्रतिमा, वापरकर्त्यांना कृत्रिम बुद्धिमत्तेची उत्पत्ती सत्यापित करण्यास परवानगी देते.
शिवाय, कृत्रिम बुद्धिमत्तेद्वारे तयार केलेल्या प्रतिमा शोधण्यात ओपनईने एक अंतर्गत शोध साधन तयार केले आहे.
हानिकारक सामग्री रोखण्यासाठी आणि गैरवापर रोखण्यासाठी कठोर हमी आहेत, जसे की स्पष्ट, फसव्या किंवा हानिकारक प्रतिमांना प्रतिबंधित करणे.
ओपनई देखील हमी देते की वास्तविक लोक वैशिष्ट्यीकृत प्रतिमा वाढत्या निर्बंधांच्या अधीन आहेत.
ओपनई सॅम ऑल्टमॅनच्या मुख्य कार्यकारी अधिकारी यांनी या आवृत्तीचे वर्णन “सर्जनशील स्वातंत्र्यासाठी नवीन उच्च पाण्याचे चिन्ह” म्हणून केले आणि वास्तविक जगाच्या वापरावर आधारित त्याच्या दृष्टिकोनावर देखरेख किंवा ओपनईसह वापरकर्ते विस्तृत व्हिज्युअल प्रतिमा तयार करण्यास सक्षम असतील यावर लक्ष केंद्रित करून.
कृत्रिम बुद्धिमत्तेद्वारे तयार केलेल्या प्रतिमा अधिक अचूक आणि प्रवेश करण्यायोग्य झाल्यामुळे, जीपीटी -4 ओ संप्रेषण, सर्जनशीलता आणि उत्पादकता यासाठी एक प्रचलित साधन व्युत्पन्न करण्यासाठी मजकूर तयार करण्यासाठी एक महत्त्वपूर्ण पाऊल दर्शवते.
Source link