उद्योगातील अग्रगण्य कृत्रिम बुद्धिमत्ता कव्हर करण्यासाठी नवीनतम अद्यतने आणि विशेष सामग्री मिळविण्यासाठी दररोज आणि साप्ताहिक वृत्तपत्रांमध्ये सामील व्हा. अधिक जाणून घ्या


ब्रूकलिनमधील एक स्टार्ट -अप कंपनी कृत्रिम बुद्धिमत्ता आणि डेटा विश्लेषणाच्या जगातील सर्वात प्रसिद्ध वेदना बिंदूंपैकी एक आहे: कष्टकरी डेटा तयार करण्याची प्रक्रिया.

स्ट्रक्चरिफाई फॉम मोड स्टील्थ मोड आज दिसू लागला, कारण त्याने 8 व्हीसी, अविभाज्य उद्योजक आणि सामरिक गुंतवणूकदारांच्या सहभागासह बेन कॅपिटल वेंचर्सच्या नेतृत्वात बियाणे वित्तपुरवठा करणा 1 ्या सर्वसाधारण प्रक्षेपणाची घोषणा केली.

कंपनी प्लॅटफॉर्ममध्ये डोरा नावाचे एक विशेष व्हिज्युअल भाषा मॉडेल वापरते आणि डेटा संकलन आणि रचना स्वच्छ करण्यासाठी – ही प्रक्रिया जी सामान्यत: डेटा वैज्ञानिकांच्या 80 % पर्यंत वापरते, असे उद्योग सर्वेक्षणानुसार.

व्हेंचरबीटला दिलेल्या विशेष मुलाखतीत स्ट्रक्चरिफाईचे सह -फोंडर रोनक गांडी म्हणाले, “आज उपलब्ध असलेल्या माहितीचा आकार फुटला आहे.” “आम्ही आशीर्वाद आणि शाप असलेल्या डेटाच्या उपलब्धतेत मोठ्या प्रमाणात वळण गाठले आहे. आपल्याकडे माहितीमध्ये अभूतपूर्व प्रवेश आहे, अर्थपूर्ण व्यावसायिक निर्णय घेण्यासाठी योग्य समन्वयामध्ये रूपांतरित करणे फार कठीण आहे.”

डेटा तज्ञ “बाटली ग्रीवाची तयारी” म्हणतात या सोल्यूशनवरील उद्योग पातळीवरील वाढत्या लक्ष प्रतिबिंबित करते. संशोधन गार्टनर सूचित करते की अपुरी डेटा तयार करणे अद्याप यशस्वी कृत्रिम बुद्धिमत्तेची अंमलबजावणी करण्यात मूलभूत अडथळ्यांपैकी एक आहे, कारण पाचपैकी चार कामांमध्ये कृत्रिम बुद्धिमत्तेचा पूर्णपणे फायदा घेण्यासाठी आवश्यक असलेल्या डेटाचा पाया नसतो.

कृत्रिम बुद्धिमत्ता बुद्धिमत्ता बुद्धिमत्तेसह कार्य करणारे डेटा कसे रूपांतरित करावे हे व्यापकपणे लपलेले आहे

थोडक्यात, स्ट्रक्चरलिस्ट वापरकर्त्यांना डेटा योजना ओळखून, संसाधने निवडून आणि कृत्रिम बुद्धिमत्ता एजंट्स प्रकाशित करून हा डेटा काढण्यासाठी समर्पित डेटा सेट तयार करण्याची परवानगी देतात. व्यासपीठ एसईसी फाइल्स आणि लिंक्डइन डेफिनेशन फाइल्सपासून बातम्या लेख आणि विशेष उद्योग दस्तऐवजांसह लिंक्डइन डेफिनेशन फायलीपासून सुरू होणार्‍या प्रत्येक गोष्टीचा सामना करू शकते.

गांधींच्या म्हणण्यानुसार काय वर्तन आहे, डोरा मॉडेलमधील त्याचे मॉडेल आहे, जे एखाद्या व्यक्तीप्रमाणेच इंटरनेटवर फिरते.

गांधींनी स्पष्ट केले की, “हे उच्च प्रतीचे आहे. ते एखाद्या व्यक्तीप्रमाणेच गोष्टींशी फिरते आणि संवाद साधते.” “म्हणून आम्ही मानवी गुणवत्तेबद्दल बोलत आहोत – डोरामागील तत्त्वांसाठी ही पहिली आणि सर्वात महत्वाची गोष्ट आहे. एखाद्या व्यक्तीला ज्या प्रकारे इच्छा आहे त्याप्रमाणे ते इंटरनेट वाचतात.”

हा दृष्टिकोन स्ट्रक्चरल समर्थनास मुक्त स्तरास समर्थन देण्यास अनुमती देतो, ज्याचा विश्वास आहे की संघटित डेटामध्ये लोकशाही प्रवेश मिळविण्यात गांधींचा विश्वास आहे.

गांधी म्हणाले: “आता तुम्ही डेटाविषयी ज्या पद्धतीने विचार करता, ही खरोखर एक मौल्यवान वस्तू आहे,” गांधी म्हणाले. “ही खरोखर मौल्यवान गोष्ट आहे की आपण काम, भटकंती आणि कुस्ती व्यक्त करण्यासाठी बराच वेळ घालवला आहे आणि जेव्हा आपल्याकडे असेल तेव्हा आपल्याला आवडते,” अरे, जर कोणी ते हटवेल तर मी रडतो. “

स्ट्रक्चरिफाई व्हिजन म्हणजे “डेटा संकलित करणे” – जे हरवले तर ते सहजपणे पुन्हा तयार करते.

वित्तपुरवठा करण्यापासून ते बांधकाम: कंपन्या उद्योगातील आव्हानांचे निराकरण करण्यासाठी समर्पित डेटा सेट कसे प्रकाशित करतात?

कंपनीने यापूर्वीच एकाधिक क्षेत्रांमध्ये दत्तक घेतलेले पाहिले आहे. स्टेडियमच्या मजल्यांमधून माहिती काढण्यासाठी निधी पथक त्यांचा वापर करतात आणि बांधकाम कंपन्या जटिल जिओ -डॉक्युमेंट्स वाचनीय सारण्यांमध्ये रूपांतरित करतात आणि विक्री कार्यसंघ त्यांच्या खात्यांच्या वास्तविक वेळेत संघटनात्मक योजना गोळा करतात.

बेन कॅपिटल व्हेंचर्समधील भागीदार स्लेटर स्टिक यांनी वित्तपुरवठा जाहिरातीमध्ये या विविधतेवर प्रकाश टाकला: “प्रत्येक कंपनीने याबरोबर काम केले आहे की त्याच्याबरोबर काम करण्यासाठी खूप महत्त्वाचे आणि खूप वेदना आहेत, पीडीएफमध्ये ते दफन केले गेले आहेत, शेकडो वेब पृष्ठांवर विखुरलेले आहेत, जे एपीआय धैर्य वगैरे आहेत.”

डेटा तयार करण्याच्या आव्हानांच्या जागतिक निसर्गाच्या संरचनेत लवकर ग्राहक बेसची विविधता प्रतिबिंबित करते. टेकटार्जेट रिसर्चनुसार, डेटा तयार करणे सहसा रोजगारासाठी गहन चरणांची मालिका समाविष्ट करते: असेंब्ली, शोध, साफसफाई, साफसफाई, रचना, परिवर्तन आणि कोणतेही वास्तविक विश्लेषण सुरू होण्यापूर्वी सत्यापन.

कृत्रिम बुद्धिमत्तेच्या अचूकतेसाठी मानवी अनुभव का निर्णायक राहतो: “अंतर्गत” चौपट “सत्यापन प्रणाली

स्ट्रक्चरिंगचा मुख्य फरक म्हणजे “चौकडी सत्यापन” प्रक्रिया, जी कृत्रिम बुद्धिमत्ता मानवी देखरेखीसह जोडते. हा दृष्टिकोन कृत्रिम बुद्धिमत्ता विकसित करण्याच्या चिंतेचा निर्णायक स्त्रोत: अचूकता सुनिश्चित करणे.

गांधींनी स्पष्ट केले की, “जेव्हा जेव्हा वापरकर्ता संशयास्पद दिसतो, किंवा आम्ही काही डेटा शक्य तितक्या परिभाषित करतो तेव्हा आम्ही ते निर्दिष्ट वापराच्या बाबतीत एखाद्या तज्ञास पाठवू शकतो,” गांधींनी स्पष्ट केले. “हा तज्ञ त्याच प्रकारे (डोरा) कार्य करू शकतो आणि योग्य माहितीच्या तुकड्यावर जाऊ शकतो, तो काढू शकतो आणि ते जतन करू शकतो, मग ते खरे आहे की नाही हे सत्यापित करू शकते.”

ही प्रक्रिया केवळ डेटा सुधारत नाही तर प्रशिक्षण उदाहरणे देखील तयार करते जी कालांतराने मॉडेलची कार्यक्षमता सुधारते, विशेषत: इमारत किंवा फार्मास्युटिकल रिसर्चसारख्या विशेष क्षेत्रात.

“या गोष्टी खूप गोंधळलेल्या आहेत,” गांधींनी लक्ष वेधले. “मी माझ्या जीवनाबद्दल कधीही विचार केला नाही, मला भूविज्ञानाविषयी दृढ समज असेल. परंतु तेथे, मी, महान शक्ती – या तज्ञांकडून शिकण्यास सक्षम होण्यासाठी आणि थेट डोरामध्ये ठेवण्यास सक्षम आहोत.”

जेव्हा डेटा काढण्याची साधने अधिक शक्तिशाली बनतात, तेव्हा गोपनीयता चिंता निश्चितपणे तयार केली जाते. या समस्यांकडे लक्ष वेधण्यासाठी स्ट्रिंचिफाईने हमी दिली आहे.

गांधी म्हणाले: “आम्ही प्रमाणीकरण करीत नाही, लॉगिनची आवश्यकता असलेली कोणतीही गोष्ट, जी आपल्याला माहिती अनुभवण्यास अपयशी ठरते – आमचा एजंट असे करत नाही कारण हे गोपनीयतेसाठी चिंतेचे स्रोत आहे.”

कंपनी थेट स्त्रोतांची माहिती देऊन पारदर्शकतेची प्राथमिकता देखील देते. “जर आपल्याला माहितीच्या विशिष्ट भागाबद्दल अधिक जाणून घेण्यास स्वारस्य असेल तर आपण या सामग्रीवर थेट जा आणि हा ब्लॅक बॉक्स जेथे आहे तेथे जुन्या सेवा प्रदात्याऐवजी ते पहाल.”

रचना एका स्पर्धात्मक दृश्यात प्रवेश करते ज्यात सुप्रसिद्ध खेळाडू आणि इतर उदयोन्मुख कंपन्यांचा समावेश आहे जे डेटा तयार करण्याच्या आव्हानाच्या विविध पैलूंचा सामना करतात. अल्मेक्स, इनफॉर्मेटिका, मायक्रोसॉफ्ट आणि झांज यासारख्या कंपन्या डेटा तयार करण्याची क्षमता देतात, तर अलिकडच्या वर्षांत बरेच तज्ञ प्राप्त झाले आहेत.

मुख्य कार्यकारी अधिकारी अ‍ॅलेक्स रेचनाबाच यांच्या मते, एखाद्या संरचनेत जे वेगळे करते ते वेग आणि अचूकतेचे मिश्रण आहे. अलीकडेच रेच्नबाचने दावा केलेल्या लिंक्डइन प्रसिद्धीने असा दावा केला की त्यांनी फॉर्म आणि पायाभूत सुविधा सुधारून त्यांच्या “10x किंमती ~ 16 एक्स” एजंटला गती दिली आहे.

अ‍ॅम्नेस्टी इंटरनॅशनलमध्ये कार्यरत डेटा स्वयंचलित करण्यात स्वारस्य असलेल्या कंपनीचे प्रक्षेपण वाढते. टेकटार्जेटच्या अहवालानुसार, वर्धित डेटा तयार करण्याचे महत्त्व वाढविताना डेटा तयार करण्याचे ऑटोमेशन “डेटा आणि विश्लेषणाचे मुख्य गुंतवणूक क्षेत्रांपैकी एक म्हणून” दिले जाते.

उद्योगात क्रांती घडवून आणण्यासाठी आपण दोन मित्रांसह निराश डेटा तयार करण्याच्या प्रयोगांना कसे प्रेरित केले?

गांधींसाठी, एक रचना समस्या निर्माण करते ज्यामुळे त्याने मागील भूमिकांमध्ये थेट सामना करावा लागतो.

गांधी आठवते: “मंदिराच्या संस्थापक कथेतली मोठी गोष्ट म्हणजे ते एक प्रकारचे वैयक्तिक आणि व्यावसायिक पात्र आहेत,” गांधी आठवते. “मी (अ‍ॅलेक्स) सांगत होतो की जेव्हा मी डेटा विश्लेषक म्हणून काम करत होतो आणि सल्ला आणि सल्लामसलत ऑपरेशन्स करत होतो, ग्राहकांसाठी हे खरोखर विशेष डेटा सेट तयार करीत होतो – सर्व फिटनेस इफेक्ट्स आणि त्यांच्या खालील मानकांच्या याद्या, कंपन्यांच्या याद्या, त्यांनी कोणती कार्ये प्रकाशित केली आहेत, आणि ईस्टर्न किनारपट्टीवरील संग्रहालये … मी त्यांच्या नोकरीसाठी बराच वेळ घालवत होतो,“ या सर्व गोष्टींसह मी त्यांना सोडत होतो, “या सर्व नोकरी,“ या सर्व गोष्टींचा मी खर्च केला होता, “या सर्व गोष्टींसह मी या सर्व कामांचा खर्च केला होता. ”

डेटा सेटपर्यंतच्या कल्पनेपासून द्रुतपणे पुनरावृत्ती करण्यास असमर्थता विशेषतः निराश झाली. गांधी म्हणाले, “मला काय करावे लागेल ते म्हणजे आपण पुनरावृत्ती करू शकत नाही आणि डेटा सेटसाठी एक प्रकारची कल्पना,” गांधी म्हणाले.

सह -फोंडर, अ‍ॅलेक्स रेच्नबाच यांना गुंतवणूक बँकेत काम करताना समान आव्हानांचा सामना करावा लागला, कारण डेटाच्या गुणवत्तेच्या समस्यांमुळे संघटित डेटा संकलनाच्या शीर्षस्थानी मॉडेल तयार करण्याच्या प्रयत्नांना अडथळा निर्माण झाला आहे.

संस्थेची डेटा सेटिंग हस्तांतरित करण्यासाठी 1 4.1 दशलक्ष डॉलर्सच्या बियाणे वित्तपुरवठा करण्यासाठी एखाद्या संरचनेची योजना कशी घ्यावी

नवीन वित्तपुरवठ्याद्वारे, आपल्या कलात्मक कार्यसंघाचा विकास करण्याची आणि स्वत: ला “उद्योगांमधील संक्रमण” म्हणून स्थापित करण्याची योजना तयार करा. स्थानिक प्रकाशन किंवा अत्यंत विशिष्ट डेटा काढणे यासारख्या प्रगत वैशिष्ट्यांची आवश्यकता असलेल्या संस्थांसाठी संस्था पर्यायांसह कंपनी सध्या विनामूल्य आणि सशुल्क स्तर दोन्ही ऑफर करते.

कृत्रिम बुद्धिमत्ता उपक्रमांमध्ये अधिक कंपन्या गुंतवणूकीसह, उच्च -गुणवत्तेच्या संघटित डेटाचे महत्त्व वाढेल. मॅसेच्युसेट्स इन्स्टिट्यूट टेक्नॉलॉजी अ‍ॅसेसमेंट क्वालिफायर्सच्या नुकत्याच झालेल्या अहवालात असे आढळले आहे की पाचपैकी चार कंपन्या खराब डेटा फाउंडेशनमुळे लबाडीच्या बुद्ध्यांकाचा फायदा घेण्यास तयार नाहीत.

गांधी आणि स्ट्रक्चरिफाईसाठी, या मूलभूत आव्हानाचे निराकरण उद्योगांमध्ये एक चांगले मूल्य उघडू शकते.

गांधी म्हणाले: “डेटा गट तयार करण्याच्या जगाची आपण कल्पना देखील करू शकता ही वस्तुस्थिती आमच्या बर्‍याच वापरकर्त्यांसाठी कोडेमध्ये एक प्रकारचे मनाची पुनरावृत्ती करणे आहे,” गांधी म्हणाले. “दिवसाच्या शेवटी, स्टेडियम हे नियंत्रण आणि सानुकूलन मिळविण्याच्या क्षमतेभोवती फिरते.”


Source link