মালায়লাম ডেটাসেট
മലയാളം ഡാറ്റാസെറ്റ്
এআই এবং স্পিচ মডেলের জন্য উচ্চমানের মালায়ালাম সাধারণ কথোপকথন এবং পডকাস্ট ডেটাসেট
সংক্ষিপ্ত বিবরণ
শিরোনাম (ভাষা)
মালায়ালাম ভাষার ডেটাসেট
ডেটাসেটের ধরণ
সাধারণ কথোপকথন, মিডিয়া (পডকাস্ট) ডেটা
দেশ
ভারত
বিবরণ
এই ডেটাসেটে একজন এজেন্ট এবং একজন গ্রাহকের মধ্যে অলিখিত সিন্থেটিক টেলিফোনিক কথোপকথন (৫-১৫ মিনিট) এবং লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও বা ভিডিও ফাইল অন্তর্ভুক্ত রয়েছে, যেমন ১ থেকে ৫ জন অংশগ্রহণকারীর সাথে সাক্ষাৎকার এবং পডকাস্ট (১৫-৬০ মিনিট)।
ব্যবহারের ক্ষেত্রে
ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং
ডেটা সেটের বিবরণ
| ডেটাসেটের প্রকার | নমুনা রেট | স্পিকার | চ্যানেল | মোট ঘণ্টা | স্পিকারের মোট সংখ্যা |
|---|---|---|---|---|---|
| সাধারণ কথোপকথন | 8 ২ kHz | 2 স্পিকার | দ্বৈত | 70:46:30 | 576 |
| সাধারণ কথোপকথন | 8 ২ kHz | 2 স্পিকার | দ্বৈত | 149:39:33 | 296 |
| মিডিয়া ডেটা | 16 ২ kHz | একাধিক স্পিকার | মনো | 12:39:24 | 81 |
বৈশিষ্ট্যযুক্ত ক্লায়েন্ট
বিশ্ব-নেতৃস্থানীয় এআই পণ্য তৈরির জন্য দলগুলিকে ক্ষমতায়ন করা।
আপনি যা খুঁজছেন তা খুঁজে পাচ্ছেন না?
নতুন অফ-দ্য-শেল্ফ ডেটাসেটগুলি সমস্ত ডেটা প্রকার জুড়ে সংগ্রহ করা হচ্ছে৷
আপনার অডিও/স্পিচ প্রশিক্ষণ ডেটা সংগ্রহের উদ্বেগ দূর করতে এখনই আমাদের সাথে যোগাযোগ করুন