Top Stories

जयपुर के आईआईटी छात्र ने दुनिया का पहला स्पीच टू स्पीच एआई मॉडल बनाया जो गा सकता है, चुपचाप बोल सकता है, और भावना जान सकता है।

जयपुर: जयपुर स्थित 25 वर्षीय संस्थापक स्पर्श अग्रवाल ने बड़े टेक्नोलॉजी इन्फ्रास्ट्रक्चर या वेंचर कैपिटल फंडिंग के बिना एक ऐसे फाउंडेशनल एआई मॉडल का अनावरण किया है जो गाना, छोटी आवाज में बोलना, रुकना और भावनात्मक बुद्धिमत्ता से जवाब दे सकता है। इसके निर्माण के लिए अग्रवाल की स्टार्टअप पिक्सा एआई के तहत लूना एआई को लॉन्च किया गया है। यह मॉडल ऑडियो को सीधे प्रसंस्करण करता है और मानव जैसी बोली उत्पन्न करता है, जिससे बातचीत तेज़, व्यक्तिपूर्ण और भावनात्मक रूप से जागरूक हो जाती है।

इस मॉडल की वास्तुकला की अनुमति देती है कि वह छोटी आवाज में बोले, टोन को समायोजित करे, और यहां तक कि गाना भी करे- जिससे यह अनुभव मशीन से अधिक मानव जैसा हो जाता है, अग्रवाल ने कहा। हाल ही में उन्होंने केंद्रीय आईटी मंत्री अश्विनी वैष्णव से मुलाकात की और उद्योग नेताओं से उनकी उपलब्धि की प्रशंसा प्राप्त की।

अग्रवाल ने एक्स पर लॉन्च के बाद लूना के बारे में लिखा, “भारत का एआई कहां है? हर व्हाट्सएप ग्रुप, हर सम्मेलन हॉल, हर फाउंडर कॉल में यही प्रश्न पूछा जाता है। आज हम इस जवाब को साझा कर रहे हैं। मिलें लूना, दुनिया का पहला स्पीच-टू-स्पीच फाउंडेशनल एआई मॉडल जो ऑडियो, संगीत और भाषा को एकजुट करता है।”

बेंचमार्क परिणामों से पता चलता है कि लूना ग्लोबल सिस्टम जैसे ओपनएआई के जीपीटी-4 टीएसएस और इलेवन लैब्स को पार करता है, जिसमें 50 प्रतिशत कम लेटेंसी और भाषा आउटपुट में अधिक प्राकृतिकता होती है। अग्रवाल ने कहा, “मेरे पास एक अनुसंधान लैब या एक यूएसडी 100 मिलियन रनवे नहीं था।”

इस प्रकार, अग्रवाल ने भारत के एआई के लिए एक महत्वपूर्ण कदम उठाया है, जो दुनिया भर में एक नई दिशा की ओर बढ़ रहा है।

You Missed

Scroll to Top