
डिजिटल युग में, कृत्रिम बुद्धिमत्ता (एआई) तेजी से व्यापक होती जा रही है और विभिन्न उद्योगों में इसका अनुप्रयोग हो रहा है। हाल ही में, हमने एक साधारण 'प्रॉम्प्ट' से संगीत उत्पन्न करने की Google की परियोजना की प्रगति देखी है। आज, हमें वह भी पता चला मेटा उसने खुद को इस साहसिक कार्य में शामिल किया, बनाने भाषा मॉडल सक्षम हैं पाठ विवरण से शुरू करके ऑडियो उत्पन्न करें. इस क्रांतिकारी उपकरण का नाम है 'ऑडियोक्राफ्ट'.
मेटा ऑडियोक्राफ्ट: हर किसी (या लगभग हर किसी) के लिए उपलब्ध संगीत की पीढ़ी के लिए एक नया क्षितिज
ऑडियोक्राफ्ट एक AI-आधारित टूल है जिसका लाभ उठाया जाता है तीन भाषा मॉडल: AudioGen, EnCodec और MusicGen। इसका लक्ष्य उपयोगकर्ताओं को वे जो सुनना चाहते हैं उसके सरल पाठ विवरण से शुरू करके ऑडियो ट्रैक प्राप्त करने की अनुमति देना है। ऑडियोक्राफ्ट का उपयोग संगीत और ध्वनि दोनों उत्पन्न करने के साथ-साथ संपीड़न कार्यक्षमता प्रदान करने के लिए किया जा सकता है।
तीन मॉडलों में से, MusicGen वह है जिसे पाठ से संगीत उत्पन्न करने के लिए विशेष रूप से प्रशिक्षित किया गया है. ऐसा करने के लिए, मेटा द्वारा लाइसेंस प्राप्त हजारों संगीत ट्रैक का उपयोग किया गया था। सबसे रोमांचक खबर यह है कि सभी तीन मॉडल जारी कर दिए गए हैं खुला स्रोत, जिसका अर्थ है कि कोई भी उनका उपयोग टूल और एप्लिकेशन बनाने के लिए कर सकता है। मेटा के अनुसार, ये टेम्पलेट विशेष रूप से "प्रेरणा प्रदान करने" के लक्ष्य के साथ संगीत कलाकारों और ध्वनि डिजाइनरों के लिए डिज़ाइन किए गए थे।

यह भी पढ़ें: लक्षित विज्ञापन के लिए मेटा की नई रणनीति: उपयोगकर्ता की अनुमति
टेम्प्लेट पहले से ही उपलब्ध हैं और उनके कोड को डाउनलोड किया जा सकता है गले लगना या प्रासंगिक पृष्ठ Github. जबकि, MusicGen का उपयोग संगीत गीतों के AI-जनित स्निपेट प्राप्त करने के लिए किया जा सकता है AudioGen संगीत उत्पादन के लिए उपयोगी ध्वनियाँ प्रदान कर सकता है. दूसरी ओर, EnCodec एक AI-आधारित संपीड़न उपकरण है।
संगीत का एक अंश उत्पन्न करने के लिए, बस इतना ही उस संगीत का वर्णन करें जिसे आप प्राप्त करना चाहते हैं और 'जेनरेट' बटन दबाएँ। इसके अलावा, आप विवरण के साथ एक ऑडियो फ़ाइल या अपने माइक्रोफ़ोन की रिकॉर्डिंग भी जोड़ सकते हैं ताकि मॉडल उस प्रकार के संगीत को अधिक सटीक रूप से संसाधित कर सके जिसे आप उत्पन्न करना चाहते हैं।
उत्पन्न ऑडियो लगभग 12 सेकंड की लंबाई का ट्रैक होगा। ऐसा टूल प्राप्त करने के लिए जो अधिक संपूर्ण स्निपेट उत्पन्न कर सके, हमें इन मॉडलों के आधार पर किसी डेवलपर द्वारा ऐप बनाने की प्रतीक्षा करनी होगी। मेटा प्रदान किया गया उपकरण, अब यह समुदाय पर निर्भर है कि वह खोजे कि उनके साथ क्या किया जा सकता है।