रेव्ह एआय, इंक. ही एक कृत्रिम बुद्धिमत्ता कंपनी आहे जी कॅलिफोर्नियाच्या पालू अल्टो येथे स्थित आहे, अधिकृतपणे प्रतिमा 1.0 रीव्ह करा, त्वरित वचनबद्धता, सौंदर्यशास्त्र आणि छपाईला मागे टाकण्यासाठी डिझाइन केलेले मजकूर तयार करण्याचे एक मॉडेल. हे भविष्यातील साधनांच्या अपेक्षेने कंपनीच्या पहिल्या आवृत्तीचे प्रतिनिधित्व करते.

रिव्ह इमेज सध्या पूर्वावलोकन वर विनामूल्य पूर्वावलोकनासाठी उपलब्ध आहे.

कंपनीने अद्याप एपीआय किंवा दीर्घकालीन किंमतींच्या योजनांचे आगमन करण्याची घोषणा केलेली नाही, किंवा मॉडेल विशेष किंवा मुक्त स्त्रोत असेल की नाही हे स्पष्ट झाले नाही आणि तसे असल्यास कोणत्याही परवान्याअंतर्गत.

कृत्रिम बुद्धिमत्ता प्रतिमांसाठी एक नवीन दृष्टीकोन

प्रतिमा रीव्ह वापरकर्त्याच्या हेतूबद्दल सखोल समजण्याच्या उद्दीष्टाने ओळखले जाते. वापरकर्त्यांना केवळ मजकूरातून प्रतिमा तयार करण्याची परवानगी नाही तर सोप्या भाषेच्या ऑर्डरसह प्रतिमा सुधारित करण्याची परवानगी आहे.

उदाहरणार्थ, बदलांमध्ये रंग बदलणे, मजकूर सेट करणे आणि दृश्ये बदलणे समाविष्ट आहे. मॉडेल संदर्भ प्रतिमांच्या लोडिंगला देखील समर्थन देते, वापरकर्त्यांना विशिष्ट नमुना किंवा प्रेरणा जुळणार्‍या प्रतिमा तयार करण्यास सक्षम करते.

मजकूराद्वारे सादर केलेल्या मजबूत ग्रंथांची कामगिरी ही एक प्रमुख मॉडेल संभाव्यतेपैकी एक आहे, कारण कृत्रिम बुद्धिमत्तेद्वारे तयार केलेल्या प्रतिमांमधील लोकप्रिय आव्हानाला संबोधित केले आहे-आणि आयडीओग्रामसारख्या प्रतिमा-केंद्रित प्रतिमा मॉडेल्ससह ते अधिक स्पर्धात्मक बनले आहेत, जे घोषणा आणि ब्रँड डिझाइन करतात त्यांच्यासाठी अधिक मौल्यवान आहे.

याव्यतिरिक्त, प्रारंभिक वापरकर्त्याच्या चाचण्या दर्शवितात की रेव्ह इमेज मागील मॉडेल्सपेक्षा एकाधिक दिशानिर्देशांशी अधिक प्रभावीपणे व्यवहार करते.

मानक योजना आधीपासूनच बाह्य पार्टीमध्ये आहेत

एआयच्या तिसर्‍या -पक्षाच्या सेवेच्या कृत्रिम विश्लेषणाद्वारे रेव्ह प्रतिमेचे आधीच मूल्यांकन केले गेले होते.

कृत्रिम फोटो सर्किटमध्ये, जे वापरकर्त्याच्या पुनरावलोकने आणि इतर परिमाणात्मक मानकांवर आधारित विविध फोटो निर्मिती मॉडेलचे वर्गीकरण करते, रेव्हला “फोटो जनरेशन क्वालिटी” मध्ये प्रथम स्थान देण्यात आले आहे, जेथे मिडजॉर्नी व्ही 6.1, गूगलचे इमेजिन 3, रेक्राफ्ट व्ही 3 आणि ब्लॅक फॉरेस्ट लॅब सारख्या प्रतिस्पर्धी फ्लक्स .1.1 (प्रो) पेक्षा श्रेष्ठ आहेत.

रेव्ह इमेजच्या मोजमाप गटाने प्रतिमांमधील स्पष्ट आणि वाचन मजकूर तयार करणे हायलाइट केले आहे, जे कृत्रिम बुद्धिमत्ता मॉडेलसाठी ऐतिहासिकदृष्ट्या कठीण काम आहे.

अधिकृत बुरखा उघडकीस येण्यापूर्वी, रेव्हची प्रतिमा सोशल मीडियावर “हाफमून” या नावाने ओळखली जात होती, जी कृत्रिम बुद्धिमत्ता समुदायामध्ये अनुमान आणि अपेक्षा निर्माण करते.

आयुष्यासारखेच अधिक चांगले आणि उच्च गुणवत्तेच्या प्रतिमा तयार करण्यासाठी मानवी समज आणि एआय विलीन करणे

रीफ स्वत: चे वर्णन करते “भावनिक संशोधक, बांधकाम व्यावसायिक, डिझाइनर आणि उत्कृष्ट कल्पना असलेल्या कथांची एक छोटी टीम.” लिलाव व्हिज्युअलसह वापरकर्ते कसे संवाद साधतात हे वाढविणारी सर्जनशील साधने विकसित करण्यावर कंपनी लक्ष केंद्रित करते.

एक्स वर, मिचेल घरबी, रेव्हमधील सह -फाउंडर आणि रिसर्च सायंटिस्ट, कंपनीच्या दीर्घकालीन दृष्टीक्षेपाचे अंतर्दृष्टी दर्शविले गेले, जे केवळ दृश्यास्पद परवडणारे आउटपुट तयार करण्याऐवजी सर्जनशील हेतू समजणार्‍या अ‍ॅम्नेस्टी आंतरराष्ट्रीय मॉडेल्सच्या उद्दीष्टावर लक्ष केंद्रित करतात.

“सर्जनशील हेतू तयार करण्यासाठी नैसर्गिक भाषा आणि इतर प्रतिक्रियांसाठी प्रगत मशीनची समज आवश्यक आहे,” घरिबी म्हणाले. “आमची दृष्टी एक नवीन सिमेंटिक इंटरमीडिएट प्रतिनिधित्व तयार करण्याची आहे जी प्रत्येक मानवी आणि मशीन त्यावर समजू शकतो आणि त्यावर कार्य करू शकेल.”

इतर कार्यसंघ सदस्य, इंजी. हंटर लव्ह्ट्स आणि टायसन पार्क संशोधक, कृत्रिम बुद्धिमत्तेपासून तयार केलेल्या व्हिज्युअल प्रतिमांवर तर्कशास्त्र आणण्याचे महत्त्व जप केले.

पार्क टेक्स्ट मॉडेलची तुलना प्रारंभिक मोठ्या भाषा मॉडेल्स (एलएलएम) च्या सध्याच्या प्रतिमेशी करते, हे दर्शविते की ते बर्‍याचदा आकर्षक परंतु दृश्यास्पद अनावश्यक परिणाम देतात.

प्रारंभिक वापरकर्ता अहवाल वचन आणि निर्बंध दर्शवितो

सबरेडिट आर/एकवचनी (रेडडिट वर) वरील सुरुवातीच्या वापरकर्त्यांच्या नोट्स मोठ्या प्रमाणात सकारात्मक होत्या, मॉडेलच्या अनेक काळजीपूर्वक अनुयायांची स्तुती करीत, उच्च -गुणवत्तेचा मजकूर आणि वेगवान पिढीचा वेग सादर करतात.

काही वापरकर्त्यांनी एकाधिक सीमा देखावे आणि जटिल वातावरण तयार करण्यात त्याच्या यशाची नोंद केली आहे, ज्या ठिकाणी मागील मॉडेल्स अनेकदा अंमलात आणल्या जातात.

तथापि, काही आव्हाने शिल्लक आहेत. टीप वापरकर्त्यांना ती प्रतिमा:

  • काही जटिल वस्तूंसह संघर्ष (उदाहरणार्थ, पूर्ण वाइन ग्लास सारख्या पारदर्शक सामग्री).
  • विशिष्ट काल्पनिक अक्षरे ओळखणे अवघड आहे (उदाहरणार्थ, व्हिडिओ गेम्समधून व्यक्तिमत्त्व तयार करण्याचा प्रयत्न करणारे वापरकर्ते असे आढळले की मॉडेल अधिक सामान्य परिणाम देते).
  • कधीकधी तपशील मल्टी -ऑब्जेक्ट रचनांमध्ये बनविला जातो.

हे अडथळे असूनही, रेव्हमधील कार्यसंघ वापरकर्त्याच्या समुदायामध्ये सक्रियपणे सामील होता आणि सतत सुधारणांमध्ये टिप्पण्या विलीन केल्या.

या विशिष्ट लेखासाठी मुख्य प्रतिमा तयार करताना आणि तयार करताना माझ्या लहान हातात, मला आढळले की रेव्ह काहीसे अंतर्ज्ञानी आणि वापरण्यास सुलभ आहे, उत्कृष्ट चित्रे आणि त्वरित वचनबद्धतेसह. बर्‍याच एआय-आय-डिमेज जनरेटर प्रमाणेच, तेथे एक निर्देशित प्रविष्टी मजकूर बॉक्स आहे, जरी मिडजॉर्नी आणि आयडोग्राम, साइटच्या तळाशी परत ठेवा आणि बहुतेक जागा भरण्यासाठी वरुन तयार केलेली सामग्री सोडली.

याव्यतिरिक्त, प्रवेश मजकूर बॉक्समध्ये प्रतिमा व्युत्पन्न करण्यासाठी निर्देशित केलेल्या अनुक्रमात अधिक अचूक समायोजन करण्यासाठी त्याच्या अंतर्गत चार बटणे देखील आहेत, ज्यात उंचीवर प्रदर्शन दर अधिकारी (16: 9 (ब्रॉड लँडस्केप) आणि 9:16 (प्रतिमा, स्मार्टफोन सारखी प्रतिमा) दरम्यान प्रमाणित स्केलिंगसह …

आपण प्रत्येक राउटर (1, 2, 4, 8) वरून तयार करू इच्छित असलेल्या प्रतिमांच्या संख्येसाठी निर्दिष्ट केलेले आणखी एक बटण आहे, जे मजकूरावरील मजकूर सुधारित करणे आणि थांबविणे थांबविण्यासाठी एक बटण आहे (हे डीफॉल्टनुसार व्युत्पन्न केले आहे, आणि याचा अर्थ असा आहे की आपण वापरू शकता म्हणून आपण लिहिलेल्या मागील प्रतिमेपासून रेव्ह प्रत्यक्षात सुधारित केले जाईल. “

ते खूपच कमी सेटिंग्ज आहेत आणि मिडजॉर्नी सारख्या कोणत्याही व्हिज्युअल संपादकांचा समावेश नाही, परंतु मूलभूत गोष्टी अस्तित्त्वात आहेत आणि बहुतेक अनधिकृत एआयच्या वापरकर्त्यांसाठी प्रारंभ करण्यासाठी पुरेसे जास्त असावे.

माझ्या संक्षिप्त चाचण्यांवरून असेही दिसून आले आहे की प्रतिमांमध्ये वाचनीय मजकूर (आणि मिडजोरुने पासून उत्कृष्ट), तसेच जीआरओके (पुन्हा, मिडजॉर्नी आणि इतर अनेक फोटो जनरेटर याला मनाई करतात) या प्रतिमांमध्ये वाचनीय मजकूर सादर करणे आयटीएमपेक्षा चांगले किंवा चांगले होते.

रेव्ह प्रतिमेसाठी खालील काय आहे?

मॉडेल सध्या कंपनीच्या वेबसाइटवर उपलब्ध आहे, तरी अनुप्रयोग प्रोग्रामिंग इंटरफेस किंवा संभाव्य मुक्त स्त्रोत पर्यायांमध्ये प्रवेश करण्याची वाढती अपेक्षा आहे.

वापरकर्त्यांनी फॅशन प्रशिक्षण, अ‍ॅनिमेशन नियंत्रण साधने आणि सर्जनशील प्रोग्रामसह एकत्रीकरण यासारख्या अतिरिक्त वैशिष्ट्यांमध्ये त्यांची आवड देखील व्यक्त केली.

सध्या, रीव्ह प्रतिमा पूर्वावलोकनावर मुक्तपणे उपलब्ध आहे. रेव्हने एआय मॉडेल्स सुधारत आणि आपल्या ऑफर विस्तृत केल्यामुळे, कंपनी सर्जनशील साधनांच्या जगातील एक प्रमुख खेळाडू म्हणून स्वत: ला खेळते.


Source link