The first AI model to sing a song: कृत्रिम बुद्धिमत्ता की दुनिया में भारत ने एक और बड़ी उपलब्धि हासिल की है। जयपुर के 25 वर्षीय युवा स्पर्श अग्रवाल ने दुनिया का पहला ऐसा स्पीच-टू-स्पीच एआई मॉडल विकसित किया है, जो न केवल आवाज की नकल कर सकता है बल्कि मानव की तरह गुनगुना और गाना भी गा सकता है। इस एआई मॉडल का नाम लूना एआई है। IIT BHU से ग्रेजुएट स्पर्श ने यह उपलब्धि अपने स्टार्टअप पिक्सा एआई के ज़रिए हासिल की। इस प्रोजेक्ट में उनके साथ नीतीश कार्तिक, अपूर्व सिंह और प्रत्यूष कुमार शामिल रहे।
कैसे काम करता है लूना एआई?
स्पर्श अग्रवाल ने बताया कि सामान्य एआई मॉडल आवाज को पहले टेक्स्ट में और फिर टेक्स्ट को आवाज में बदलते हैं। लेकिन लूना सीधे आवाज को आवाज में प्रोसेस करता है।
इस वजह से यह फुसफुसा सकता है, टोन और भाव बदल सकता है साथ ही गाना गुनगुनाना भी सकता है। यही चीज इसे पारंपरिक एआई मॉडलों से अलग बनाती है और इसे अधिक मानवीय अनुभव देती है।
क्रेडिट कार्ड से लिया कर्ज
स्पर्श ने कहा कि इस प्रोजेक्ट के लिए उन्होंने कई जगहों से संसाधन जुटाए और क्रेडिट कार्ड से कर्ज लेकर इस सपने को पूरा किया। उनका मानना है कि भारत केवल संसाधनों की नहीं, बल्कि कुशलता की ताकत से दुनिया की सर्वश्रेष्ठ तकनीक बना सकता है।
बड़े निवेशकों का समर्थन
स्पर्श के स्टार्टअप पिक्सा एआई को कुणाल शाह, कुणाल कपूर और निखिल कामथ जैसे बड़े नामों का समर्थन मिला है। स्पर्श के मुताबिक गेमिंग कंपनियों, वाहन निर्माताओं और उपभोक्ता एआई कंपनियों से शुरुआती मांग भी मिलनी शुरू हो गई है। उन्होंने कहा, “हमारा लक्ष्य है कि लूना वैश्विक मनोरंजन, हेल्थकेयर और ऑटोमोटिव सेक्टर के लिए वॉयस लेयर बने।”

