काहीवेळा तुम्हाला एखादी गोष्ट कॉपी करायची असते, पण हॅकरला ते ऑनलाइन लटकवायचे नसते. कदाचित हे तुमच्या डॉक्टरांशी किंवा वकिलाशी संभाषण असेल. कदाचित तुम्ही पत्रकार आहात आणि ही एक संवेदनशील मुलाखत आहे. गोपनीयता आणि नियंत्रण महत्त्वाचे आहे.
गोपनीयतेची ही इच्छा फ्रेंच विकसक मिस्ट्रल एआयने त्याचे नवीनतम क्लोन मॉडेल पुरेसे लहान असण्याचे एक कारण आहे उपकरणांवर चालवा. ते तुमच्या फोनवर, लॅपटॉपवर किंवा क्लाउडमध्ये प्ले केले जाऊ शकते.
Voxtral Mini Transcribe 2, बुधवारी जाहीर केलेल्या नवीन मॉडेलपैकी एक आहे, “खूपच लहान,” पियरे स्टॉक, मिस्ट्रलचे सायन्स ऑपरेशन्सचे उपाध्यक्ष, यांनी मला सांगितले. आणखी एक नवीन मॉडेल, Voxtral Realtime, तेच करू शकते परंतु ते बंद मथळ्यासारखे सरळ आहे.
कंपनी लहान व्यवसाय तयार करू इच्छिते केवळ गोपनीयता हे एकमेव कारण नाही मुक्त स्रोत मॉडेल. तुम्ही वापरत असलेल्या डिव्हाइसवर थेट चालवून, ही मॉडेल्स अधिक वेगाने धावू शकतात. फायली इंटरनेटवरून डेटा सेंटरपर्यंत आणि परत जाण्यासाठी वाट पाहण्याची गरज नाही.
“तुम्हाला जे हवे आहे ते लिप्यंतरण छान केले जावे, तुमच्या अगदी जवळ,” स्टॉक म्हणाला. “आम्ही तुमच्यासाठी सर्वात जवळची गोष्ट शोधू शकतो, उदाहरणार्थ, लॅपटॉप, फोन किंवा स्मार्टवॉच सारखे वेअरेबल डिव्हाइस असे कोणतेही हाय-एंड डिव्हाइस.”
रिअल-टाइम ट्रान्सक्रिप्शनसाठी कमी विलंब (वाचा: उच्च गती) विशेषतः महत्त्वपूर्ण आहे. Voxtral रिअलटाइम मॉडेल 200 मिलीसेकंदांपेक्षा कमी विलंबाने निर्माण करू शकते, स्टॉक म्हणाला. हे स्पीकरचे शब्द जितक्या लवकर वाचता येईल तितक्या लवकर लिप्यंतरण करू शकते. बंद मथळे सुरू ठेवण्यासाठी आणखी दोन किंवा तीन सेकंद प्रतीक्षा करू नका.
हे पहा: चिपचा तुटवडा iPhones, OpenAI गुंतवणूक थांबली, TikTok सेन्सॉरशिपचे आरोप | आज तंत्रज्ञान
Voxtral Realtime मॉडेल Mistral API द्वारे आणि Hugging Face वर उपलब्ध आहे, तसेच एक डेमो जिथे तुम्ही ते वापरून पाहू शकता.
काही संक्षिप्त चाचणीमध्ये, मला ते बऱ्यापैकी पटकन व्युत्पन्न झाल्याचे आढळले (जरी ते डिव्हाइसवर असल्यास तुमच्या अपेक्षेइतके लवकर नाही) आणि मी इंग्रजीमध्ये थोडे स्पॅनिश मिसळून ते अचूकपणे उचलू शकले. मिस्त्राल्यानुसार, या क्षणी ते 13 भाषा हाताळण्यास सक्षम आहे.
Voxtral Mini Transcribe 2 कंपनीच्या API द्वारे देखील उपलब्ध आहे किंवा तुम्ही Mistral च्या AI स्टुडिओमध्ये त्याच्यासोबत खेळू शकता. मी स्टॉकसह माझी मुलाखत नक्कल करण्यासाठी टेम्पलेट वापरला.
मिस्ट्रल एआय (ज्याला मी मिस्टर ले आय म्हणतो) आणि व्हॉक्सट्रल (वोक्सट्रोल) सारखी योग्य नावे वापरण्यात अडचण येत असली तरीही मला ते खूप वेगवान आणि विश्वासार्ह वाटले. होय, एआय मॉडेलला ते चुकीचे समजले. परंतु स्टॉक म्हणाले की वापरकर्ते विशिष्ट कार्यांसाठी वापरत असल्यास विशिष्ट शब्द, नावे आणि संज्ञा अधिक चांगल्या प्रकारे समजून घेण्यासाठी मॉडेल सानुकूलित करू शकतात.
लहान, वेगवान एआय मॉडेल्स तयार करण्याचे आव्हान हे आहे की ते देखील अचूक असले पाहिजेत, स्टॉक म्हणाला. प्रतिस्पर्ध्यांच्या तुलनेत सुधारित त्रुटी दर दर्शविणाऱ्या बेंचमार्कच्या विरूद्ध कंपनीने मॉडेल्सच्या कार्यप्रदर्शनावर जोर दिला.
“ठीक आहे, मी एक लहान मॉडेल बनवतो,” असे म्हणणे पुरेसे नाही,” स्टॉक म्हणाला. “तुम्हाला एक लहान मॉडेल हवे आहे जे मोठ्या मॉडेलसारखेच चांगले आहे, बरोबर?”














