সঙ্গীত এআই কেস স্টাডি
গানের ভয়েস ডেটা সংগ্রহ
EQ এবং কম্প্রেশন অ্যালগরিদম প্রশিক্ষণের জন্য ভয়েস-ভিত্তিক গানের অডিও সংগ্রহ: ভাষাগত এবং সঙ্গীত বৈচিত্র্য ক্যাপচারিং
প্রজেক্ট সারসংক্ষেপ
শাইপ চারটি অগ্রাধিকার দেওয়া ভাষায় বিভিন্ন ধরনের গানের অডিও রেকর্ডিং সংগ্রহ করতে একটি শীর্ষস্থানীয় প্রযুক্তি কোম্পানির সাথে অংশীদারিত্ব করেছে: চীনা, আরবি, স্প্যানিশ এবং রাশিয়ান। প্রকল্পটির লক্ষ্য AI-ভিত্তিক EQ এবং কম্প্রেশন অ্যালগরিদম প্রশিক্ষণের জন্য উচ্চ-মানের ডেটা প্রদান করা, যা স্বয়ংক্রিয় অডিও প্রক্রিয়াকরণের উন্নতির জন্য অপরিহার্য।
সংগ্রহে বিভিন্ন ধরণের মাইক্রোফোন এবং পরিবেশ ব্যবহার করে স্টুডিও-গুণমানের রেকর্ডিংয়ের উপর ফোকাস সহ 40 জন অংশগ্রহণকারী (প্রতি ভাষা প্রতি 10) অন্তর্ভুক্ত ছিল।

মূল পরিসংখ্যান
4টি ভাষা: চাইনিজ, আরবি, স্প্যানিশ, রাশিয়ান
10 গায়ক প্রতি
ভাষা (মোট 40)
20 ঘণ্টা of
গান গাওয়া অডিও
অডিও ফর্ম্যাট: 48 kHz PCM, mono, WAV
অডিও ট্রান্সক্রিপশন স্থানীয় ভাষায়
প্রকল্পের সময়কাল:
18 সপ্তাহ
প্রকল্পের সুযোগ
তথ্য সংগ্রহ
স্কোপটি চারটি টার্গেট করা ভাষায় গাওয়ার অডিওর সংগ্রহকে অন্তর্ভুক্ত করে, যা একাধিক মিউজিক্যাল জেনারে প্রকৃত শিল্পীদের দ্বারা রেকর্ড করা হয়েছে। এআই মডেল প্রশিক্ষণের জন্য উপযুক্ত উচ্চ-মানের রেকর্ডিং নিশ্চিত করতে একটি স্টুডিও পরিবেশ ব্যবহার করা হয়েছিল।
মূল প্রয়োজনীয়তা
- অংশগ্রহণকারী: প্রতি ভাষাতে 10 জন গায়ক, একটি সুষম লিঙ্গ বন্টন সহ (50% পুরুষ, 50% মহিলা)।
- জেনার: বিভিন্ন ধরণের শৈলী, শিল্পীর দ্বারা স্ব-পরিচয়, ধারাবাহিকতার জন্য বৈধ।
- রেকর্ডিং পরিবেশ: স্টুডিও-গুণমান, একাধিক মাইক্রোফোন সেটিংস সহ (গতিশীল, কনডেনসার)।
- অডিও বিন্যাস: 48 kHz PCM, mono, WAV ফাইল, কোন প্রক্রিয়াকরণ ছাড়াই (যেমন, নো কমপ্রেশন, EQ, reverb)।
- প্রতিলিপি: দ্বিভাষিক গানের জন্য বিশেষ নিয়ম সহ গানগুলি যে ভাষায় গাওয়া হয় তাতে প্রতিলিপি করতে হবে।
- ভাষা: চাইনিজ, আরবি, স্প্যানিশ, রাশিয়ান
- প্রতিলিপির গ্রহণ
- ট্রান্সক্রিপশনগুলি রেকর্ডিংয়ের ভাষায় দেওয়া উচিত (যেমন, দেবনাগরীতে হিন্দি লাইন, ইংরেজির পরে)।
- স্পষ্টতা এবং নির্ভুলতার জন্য প্রতিটি সেগমেন্ট 15 সেকেন্ডের বেশি নয় তা নিশ্চিত করুন।
- অডিও রেকর্ডিং প্রয়োজনীয়তা
- প্রতি রেকর্ডিং সেশনে ন্যূনতম 3টি মাইক্রোফোন সেটিংস।
- প্রতি গানে 3 মিনিট, প্রতি গানে 3টি লাগে, প্রতিটি অংশগ্রহণকারীর জন্য বিভিন্ন মাইক্রোফোন রেকর্ডিং নিশ্চিত করে।
- কোনো ব্যাকগ্রাউন্ড নয়েজ ছাড়াই স্টুডিও-মানের অ্যাকোস্টিক পরিবেশ।
চ্যালেঞ্জ
লিঙ্গ, ভয়েস টোন/পিচ এবং মিউজিক্যাল জেনার দ্বারা গায়কদের সুষম বন্টন নিশ্চিত করা একটি জটিল চ্যালেঞ্জ ছিল।
একাধিক ভাষায় বিভিন্ন ভোকাল পারফরম্যান্স ক্যাপচার করার সময় ধারাবাহিক মাইক্রোফোন সেটিংস এবং পরিবেশ বজায় রাখা।
বাহ্যিক শব্দ ছাড়াই স্টুডিও-মানের অডিও নিশ্চিত করা এবং একাধিক ভাষায় সঠিক ট্রান্সক্রিপশন।
সমাধান
Shaip প্রকল্পের প্রয়োজনীয়তা পূরণের জন্য একটি ব্যাপক সমাধান প্রদান করেছে:
- চারটি ভাষায় 40 জন গায়ক নিয়োগ করা এবং লিঙ্গ, পিচ এবং সঙ্গীত শৈলীতে বৈচিত্র্যময় উপস্থাপনা নিশ্চিত করা।
- অডিও ডেটার বিস্তৃত পরিসর ক্যাপচার করার জন্য বিভিন্ন ধরণের মাইক্রোফোন (গতিশীল, কনডেনসার) সহ স্টুডিও-মানের রেকর্ডিং পরিচালনা করা।
- দ্বিভাষিক গানের জন্য নির্দিষ্ট নিয়ম অনুসরণ করে, ব্যবহৃত ভাষায় সঠিকভাবে রেকর্ডিং প্রতিলিপি করা।
- সম্মতি: রেকর্ডিংয়ের আগে সমস্ত অংশগ্রহণকারীদের কাছ থেকে সম্মতি ফর্ম সংগ্রহ করা হবে।
ফলাফল
সংগৃহীত বিভিন্ন গাওয়া অডিও ডেটা ক্লায়েন্টকে স্বয়ংক্রিয় EQ এবং কম্প্রেশন অ্যালগরিদমগুলির জন্য একটি শক্তিশালী প্রশিক্ষণ সেট তৈরি করতে দেয়, যা অডিও প্রক্রিয়াকরণের গুণমান উন্নত করে। উচ্চ-মানের রেকর্ডিং এবং বিস্তারিত মেটাডেটা নিশ্চিত করেছে যে AI মডেলগুলি বিভিন্ন বাদ্যযন্ত্রের জেনার এবং ভাষাগত জটিলতাগুলি পরিচালনা করতে পারে। মূল ফলাফল:
- এআই সিস্টেম প্রশিক্ষণের জন্য উচ্চ-মানের, বৈচিত্র্যময় অডিও ডেটা।
- বিশ্লেষণের জন্য সঠিক ট্রান্সক্রিপশন এবং মেটাডেটা।
- এআই-ভিত্তিক অডিও প্রক্রিয়াকরণ সরঞ্জামগুলির জন্য একটি শক্তিশালী ভিত্তি।
deliverables
- 20 ঘন্টা স্টুডিও-মানের অডিও রেকর্ডিং (48 kHz PCM, mono WAV ফাইল)।
- রেকর্ডিংয়ের ভাষায় ট্রান্সক্রিপশন।
- মেটাডেটা: মাইক্রোফোন মেক/মডেল, DAC/অডিও ইন্টারফেস, গায়ক প্রোফাইল, জেনার তথ্য।
- মেটাডেটা সহ ট্রান্সক্রিপশনের জন্য JSON ফর্ম্যাট।
আমাদের EQ এবং কম্প্রেশন অ্যালগরিদমগুলির বিকাশের জন্য শাইপের সংগীত প্রতিভা এবং ভাষাগত সমৃদ্ধির বৈচিত্র্যকে ক্যাপচার করার ক্ষমতা অমূল্য। তাদের দল নিশ্চিত করেছে যে শিল্পী নিয়োগ থেকে রেকর্ডিং গুণমান পর্যন্ত প্রতিটি দিক নির্ভুলতার সাথে পরিচালনা করা হয়েছে, এটি আমাদের স্বয়ংক্রিয় অডিও প্রসেসিং সিস্টেমগুলিকে পরিমার্জিত করার একটি অপরিহার্য পদক্ষেপ করে তুলেছে।
পুরো প্রক্রিয়া জুড়ে Shaip যে আস্থা ও সহযোগিতা দেখিয়েছে তার জন্য আমরা সত্যিই কৃতজ্ঞ। আমাদের কঠোর এবং চ্যালেঞ্জিং প্রযুক্তিগত প্রয়োজনীয়তা সত্ত্বেও, তাদের উত্সর্গ, কঠোর পরিশ্রম, এবং বিস্তারিত মনোযোগ অসামান্য হয়েছে। শ্রেষ্ঠত্ব প্রদানের জন্য প্রতিশ্রুতিবদ্ধ একটি দলের সাথে কাজ করা একটি আনন্দের বিষয়