आपण लिहू किंवा बोलू शकत असल्यास, आपण कदाचित करू शकता vibe कोड. हे खरोखर इतके सोपे आहे. तुम्ही फक्त तुमची कल्पना त्यांना कळवू शकता कृत्रिम बुद्धिमत्ता चॅटबॉट नैसर्गिक भाषेसह तुमच्या आवडीनुसार तुम्हाला काम मिळेल. जरी सर्व प्रकल्प मोत्यासारखे रत्न बनू शकत नाहीत किंवा अगदी पूर्णपणे कार्यक्षम नसतील, तरीही फक्त चॅटसह वेब अनुप्रयोग तयार करण्यात गुंतलेली मेहनत कमी आहे.
मी उत्साही प्रोग्रामिंगसह खूप खेळलो, इकडे तिकडे यादृच्छिक प्रकल्प तयार केले. मी हे मुख्यतः संकल्पनेच्या पुराव्यासाठी किंवा फक्त चॅटबॉट चाचणीच्या हेतूंसाठी वापरून पाहिले आहे, परंतु क्वचितच मी काहीतरी महत्त्वपूर्ण किंवा कार्यात्मक बनवण्याचा प्रयत्न केला आहे जेणेकरुन मी ते दररोज वापरताना पाहू शकेन. मग मी एक ई-रीडर शोधू लागलो आणि त्यांच्यापैकी बरेच जण किती आश्चर्यकारकपणे “मूर्ख” होते, विशेषतः किंडल हे पाहून निराश झालो. त्याबद्दल नंतर अधिक.
प्रेरणेची पर्वा न करता (परंतु बहुतेक ऍमेझॉनच्या अवमानात), यामुळे मला दुरूस्तीसाठी कोड डिझाइन करण्याचा प्रयत्न करण्यास प्रवृत्त केले, परंतु एका वळणाने. मला एक कार्यशील ई-रीडिंग ॲप डिझाइन करता येईल का ते मला पहायचे होते ज्यात मला हवी असलेली सर्व वैशिष्ट्ये आहेत. ही गोष्ट जरी मी चालवली तरी मी कदाचित ती रोज वापरणार नाही हे माहीत असल्याने, पण मला त्यात काही फुंकर घालायची होती.
कोणता चॅटबॉट वापरायचा हा प्रश्न आहे. मी निवडण्याचा प्रयत्न केला नाही. मला जे हवे आहे ते तयार करण्यासाठी मी जेमिनी, क्लॉड आणि चॅटजीपीटी वापरले आणि नंतर त्यांपैकी एक चांगले परिणाम देईल का ते पहा.
दावा
चॅटबॉट्सची तुलना करणे कठीण आहे, विशेषत: समान संभाषण किंवा डायनॅमिक प्रोग्रामिंग प्रकल्पाची नक्कल करण्याचा प्रयत्न करताना. माझ्यावर विश्वास ठेवा, मी प्रयत्न केला. मला खात्री करायची होती की मी चाचणी केलेली सर्व साधने समान राउटर वापरत आहेत, परंतु प्रथम, मला ते राउटर सर्वोत्कृष्ट परिणामांसाठी ऑप्टिमाइझ करायचे होते, म्हणून मी तेथे जाण्यासाठी एक धोरण तयार केले.
प्रथम, मी संपूर्ण प्रकल्प त्याच्या सर्वात मूलभूत स्तरावर मिथुनसह तयार केला. एकदा मला प्रकल्प कुठे आहे हे आवडले (संकल्पनेचा एक यशस्वी, कार्यात्मक पुरावा), मी त्याला प्रॉम्प्ट तयार करण्यास सांगितले जेणेकरून मी ते इतर कोणत्याही चॅटबॉटमध्ये जोडू शकेन. जेमिनीने दावा तयार केला, तो फाइल म्हणून सेव्ह केला आणि क्लॉडवर अपलोड केला. मी पुन्हा या प्रक्रियेतून गेलो, क्लॉडला प्रकल्प आणि मिथुन तयार करताना मी विचार न केलेल्या गोष्टी उचलण्याची आणि निराकरण करण्याची परवानगी दिली. ही प्रक्रिया पूर्ण झाल्यावर, मी त्याला दुसरा प्रॉम्प्ट तयार करण्यास सांगितले जेणेकरुन मी ते ChatGPT मध्ये जोडू शकेन.
तीन चॅटबॉट्सना प्रकल्पाच्या वास्तविक बिल्डवर आणि अशा प्रकारे, अंतिम वेक्टरवर काही इनपुट असावे अशी कल्पना होती. एकदा मी प्रॉम्प्ट तयार केल्यावर, ते किती सातत्यपूर्ण आहे हे पाहण्यासाठी मी ते तीनही चॅटबॉट्सवर वेगळ्या चॅटमध्ये अपलोड केले.
प्रकल्प: टॉमी रीडर
ऍमेझॉनच्या किंडल उपकरणांबद्दल माझ्या निराशेतून हा प्रकल्प वाढला. ज्यांना त्यांची पुस्तके वाचायला आणि ऐकायला आवडतात ते iOS किंवा Android ॲपमध्ये रिअल-टाइम हायलाइटिंगसह करू शकतात, परंतु या सर्व काळानंतर – जवळपास 20 वर्षे – तुम्ही Kindle वर ते करू शकत नाही. खरेतर, सहाय्यक रीडर ऑपरेट करून वापरकर्त्यांना रीअल-टाइम मजकूर हायलाइट करण्याची क्षमता प्राप्त होईपर्यंत फार काळ गेला नाही, जे ॲपच्या कार्यक्षमतेच्या अगदी जवळ आहे. आत्तापर्यंत, तुम्ही Kindle वर फक्त ऑडिओबुक वाचू किंवा ऐकू शकता, दोन्ही नाही, जे हसण्याजोगे आहे, आणि त्यामुळे माझी सर्व पुस्तके Amazon च्या मालकीची होती. मला वाटले की मी फक्त उपाय कोड करू शकतो. मी त्याला टॉमी रीडर म्हणतो.
मजकूर पेस्ट केला गेला असेल किंवा तुमची PDF किंवा EPUB फाइल लोड केली गेली असेल तरीही मला एक इमर्सिव्ह ई-रीडर वेब ॲप तयार करायचा आहे जे तुम्हाला तुमची पुस्तके मोठ्याने वाचू शकेल (अर्थातच रिअल-टाइम मजकूर हायलाइट करून). मजकूर मोठ्याने वाचण्याव्यतिरिक्त, वेब ॲप्लिकेशन श्रेण्यांच्या उपसंचातील मजकूराच्या सामग्रीवर अवलंबून पार्श्वभूमी संगीत व्युत्पन्न करेल (तटस्थ, गॉथिक हॉरर, साय-फाय, निसर्ग, कल्पनारम्य, अंडरवॉटर, वेस्टर्न, मिस्ट्री) आणि काही शब्द रिअल टाइममध्ये बोलले जातात तेव्हा अतिरिक्त ऑडिओ आणि व्हिज्युअल प्रभाव निर्माण करेल. संपूर्ण प्रकल्प एका एचटीएमएल फाइलमध्ये तयार केला गेला आहे ज्यामुळे तो वेब ब्राउझरमध्ये अतिरिक्त अवलंबनाशिवाय चालवला जाऊ शकतो.
चॅटबॉट्ससह बिल्डिंग: फेरी 1
जुळे
मिथुनने मला हवी असलेली सर्व वैशिष्ट्ये टॉम्ब रीडरमधून सापेक्ष सहजतेने तयार केली.
जेमिनीने मला या वेब ऍप्लिकेशनची कार्यक्षमता किती वाढवता येईल हे पाहण्याची परवानगी दिली आहे, त्यामुळे त्याची बहुतांश कार्यक्षमता Google च्या चॅटबॉटमधून येते. याने मला सुरुवातीला काही लहान समस्या सोडवण्याची परवानगी दिली, ज्यामुळे टेक्स्ट-टू-स्पीच (TTS) आवाज लोड होण्यापासून रोखले गेले. त्याऐवजी, त्याने एक कॉन्फिगरेशन स्क्रीन तयार केली जी ॲपच्या “ओपन” स्क्रीनवर टॅप केल्यानंतर आवाज लोड करण्यास भाग पाडेल. या प्रकारची माहिती नसती तर प्रकल्प मार्गी लागला नसता.
हळूहळू पण निश्चितपणे, प्रकल्पाची कार्यक्षमता वाढू लागली. काही शब्दांचे थेट ध्वनी प्रभाव विचलित करणारे असल्याने, मी ते ध्वनी प्रभाव आणि पार्श्वसंगीत बंद करण्याचा पर्याय जोडण्याची खात्री केली. माझ्याकडे ॲप बेस कार्यान्वित झाल्यानंतर, मी जेमिनीला एक प्रॉम्प्ट तयार करण्यास सांगितले जे मी इतर चॅटबॉट्ससह सामायिक करू शकेन जेणेकरून मला हवे असल्यास ते इतरत्र तयार करता येईल, आणि असेच घडले.
क्लॉड
क्लॉड प्रकल्पाने मला काही क्षेत्रांमध्ये सर्वाधिक यश आणि इतरांमध्ये सर्वाधिक त्रास दिला आहे, परंतु तीन चाचणी प्रकल्पांपैकी हा माझा वैयक्तिक आवडता आहे.
क्लॉडने या प्रकल्पातील टीझर्सच्या मूलभूत कार्यक्षमतेमध्ये मोठ्या प्रमाणात सुधारणा केल्या आहेत. क्लॉडने शब्दसंग्रहाचा विस्तार केला आणि जेव्हा उत्तेजक शब्द मोठ्याने उच्चारला गेला तेव्हा व्हिज्युअलायझेशन वाढवले. तथापि, क्लॉडने एक कॉल केला जो मी त्याला विचारला नाही, जरी तर्क प्रत्यक्षात आला.
सुरुवातीला, मला वाटले की प्रकल्प कार्य करत नाही कारण जेव्हा मी त्याच्या कार्यक्षमतेची चाचणी घेण्यासाठी गेलो तेव्हा फक्त पहिला ट्रिगर शब्द सुमारे 10 शब्दांच्या स्ट्रिंगमध्ये इच्छित प्रभाव निर्माण करेल. क्लॉडला शेवटी हे उघड व्हायला थोडा वेळ लागला की वापरकर्त्याला “स्पॅम” होऊ नये म्हणून प्रत्येक वाक्यात फक्त एकदाच ऑडिओ आणि व्हिज्युअल इफेक्ट्स प्ले करण्याची परवानगी देण्याचा निर्णय घेतला होता. यामुळे खूप अर्थ प्राप्त झाला, परंतु हा प्रकल्प फंक्शनल रीडरपेक्षा संकल्पनेचा अधिक पुरावा होता आणि जेमिनी आणि ChatGPT ने प्रत्येक कीवर्डसाठी ध्वनी प्रभाव निर्माण केला, जी अपेक्षित कार्यक्षमता आहे.
तथापि, ऑडिओ आणि व्हिज्युअल उत्तेजना किती वेळा वाजवाव्यात यासाठी प्रॉम्प्टमध्ये कोणतीही विशिष्ट सूचना नव्हती. मला जे हवे होते ते आवश्यक नसले तरी, असे कनेक्शन बनवण्यासाठी एकूण वापरकर्ता अनुभव विचारात घेतल्याबद्दल मी कौतुक केले. या सर्व सुधारणांचे कोडिंग केल्यानंतर, क्लॉडने राउटर अपडेट केले आणि मी ते माझ्यासोबत ChatGPT वर नेले.
चॅटजीपीटी
चॅटजीपीटी अतिरिक्त वैशिष्ट्ये तयार करण्यात अयशस्वी ठरली जेव्हा मी प्रसंगी ते मागितले, परंतु जेव्हा मी अंतिम प्रॉम्प्ट दिला तेव्हा ते प्रकल्पाची पुनर्बांधणी करण्यास सक्षम होते.
मी क्लॉड सोबत अपडेटेड क्लेम तयार केला तोपर्यंत, मी ChatGPT वर अपलोड केल्यावर मी काही करण्याचा विचार करू शकत नव्हते. सुदैवाने, कोड जनरेट करण्यात सर्वात मंद असूनही, OpenAI च्या चॅटबॉटने प्रकल्प सहजपणे तयार केला. मी ChatGPT ला प्रोजेक्टमध्ये जोडण्यासाठी सांगितलेली एक कार्यक्षमता – एक सानुकूल पार्श्वभूमी संगीत स्लाइडर तयार करणे जे एखाद्याला वैयक्तिक ई-रीडिंग अनुभव हवे असल्यास पूर्णपणे बंद केले जाऊ शकते – सातत्याने अयशस्वी झाले. शेवटी, या कार्याची विनंती करण्यासाठी आणि दावा पुन्हा तयार करण्यासाठी मी क्लॉडकडे परत गेलो.
फेरी 2: समान प्रकल्प पुन्हा तयार करा
सुरुवातीला प्रोजेक्ट तयार करण्यासाठी जेमिनी 3 प्रो वापरूनही आणि ChatGPT आणि क्लॉडच्या विनामूल्य आवृत्त्या असूनही, तिघांनी प्रकल्प तयार केला, परंतु समस्यांशिवाय नाही. मी माझा बहुतेक वेळ क्लॉड या प्रकल्पाला परिष्कृत करण्यात घालवला आणि अंतिम आवृत्ती तयार करण्यासाठी तो जबाबदार होता. त्यामुळे नवीन चॅटमध्ये हा प्रॉम्प्ट लोड करताना, प्रकल्प पहिल्या “कॉन्फिगरेशन” पृष्ठाच्या मागे लोड होणार नाही हे जाणून घेणे खूप आश्चर्यकारक होते. जरी मागील पुनरावृत्तीमध्ये अजिबात समस्या नसल्या तरी, काय चालले आहे हे शोधण्यासाठी 11 अतिरिक्त पूर्ण पुनर्बांधणी (होय, खरोखर) घेतली.
Gemini आणि ChatGPT या दोन्हींचा वापर करून प्रकल्पाची पुनर्बांधणी निर्दोषपणे केली. फाईल अपलोड, चाचणी हायलाइटिंग, टेक्स्ट-टू-स्पीच आउटपुट आणि ट्रिगर शब्द मोठ्याने म्हणताना ऑडिओ आणि व्हिज्युअल इफेक्ट्ससह सर्व फंक्शन्स, मूलभूत आणि प्रगत, त्यांनी पाहिजे तसे कार्य केले. मॉडेल्सकडे परत जाताना, प्रत्येक चॅटबॉटला समान प्रॉम्प्ट देताना मला कार्यक्षमता किंवा कार्यक्षमतेत फारच कमी फरक दिसला.
चॅटबॉट विरोधाभास
क्लॉड सोबत चाचणीसाठी फाइल मिळवणे नेहमीच सोपे होते. हे केवळ प्रकल्पाचे पूर्वावलोकन देत नाही म्हणून तुम्हाला कधीही HTML फाइल डाउनलोड करण्याची गरज नाही, परंतु तुम्हाला हवे असल्यास (जे मी अनेकदा चाचणीसाठी केले आहे), ते थेट डाउनलोडसाठी उपलब्ध आहे. काहीवेळा हा पर्याय फक्त ChatGPT सह ऑफर केला जात असे, तर इतर वेळी मी स्वतः HTML कॉपी आणि सेव्ह करू शकलो.
मिथुन राशीमध्ये कमी चुका आणि सामान्य भीती असली तरी, त्यासाठी तुम्हाला नेहमीच लांबचा रस्ता धरावा लागतो आणि ते तसे करावे लागते. हे सर्व बाजूला ठेवून, चॅटजीपीटी अधूनमधून मला थेट एचटीएमएल फाइल डाउनलोड करू देण्याची ऑफर देते ही वस्तुस्थिती विचित्र आणि थोडी निराशाजनक होती.
विजेता: ते अवलंबून आहे
या प्रकारच्या चाचणीचा विजेता निश्चित करणे कठीण आहे, कारण सर्व चॅटबॉट्सचे फायदे आणि तोटे आहेत. एका अर्थाने ते सर्व जिंकतात. त्यापैकी प्रत्येकजण कधीतरी प्रकल्पाची कार्यात्मक आवृत्ती तयार करण्यास सक्षम होता, परंतु त्यासाठी वारंवार प्रयत्नांची आवश्यकता होती.
शेवटी, विजेता वापरकर्ता आहे. हे दर्शविते की कोणतेही मॉडेल वापरले जात असले तरीही, सूचनांचा एक मजबूत संच तुम्हाला खूप दूर नेऊ शकतो. जेमिनी 3 प्रो द्वारे तयार केलेले ऍप्लिकेशन आणि ChatGPT किंवा क्लॉडच्या विनामूल्य आवृत्त्यांमधील कार्यप्रदर्शन किंवा कार्यक्षमतेमधील फरक मी ओळखू शकलो नाही.
प्रो आणि फ्री मिथुन मॉडेल्सशी समान संभाषण करताना मला जे आढळले त्याच्याशी हे खरेतर थेट विरोधाभास आहे. जरी हा दुसरा दिवस, दुसरा प्रकल्प आणि दुसरे मॉडेल असले तरी, हे दर्शविते की एक मजबूत दावा तुम्हाला बायोप्रोग्रामिंगच्या जगात अविश्वसनीयपणे पुढे नेऊ शकतो.
















