হিন্দি ডেটাসেট
হিন্দি ডেটাসেট
এআই এবং এএসআর মডেলের জন্য উচ্চমানের হিন্দি কল-সেন্টার, সাধারণ কথোপকথন এবং পডকাস্ট ডেটাসেট
সংক্ষিপ্ত বিবরণ
শিরোনাম (ভাষা)
হিন্দি ভাষার ডেটাসেট
ডেটাসেটের ধরণ
কল সেন্টার, সাধারণ কথোপকথন, মিডিয়া (পডকাস্ট), স্ক্রিপ্টেড মনোলোগ
দেশ
ভারত
বিবরণ
১৫ থেকে ৬০ মিনিটের মধ্যে দু'জনের মধ্যে অলিখিত টেলিফোনিক কথোপকথন পাওয়া যায়, সাথে লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও বা ভিডিও ফাইল যেমন সাক্ষাৎকার এবং পডকাস্ট, যেখানে ১ থেকে ৫ জন অংশগ্রহণকারী একই পরিসরে অংশগ্রহণ করতে পারেন। অতিরিক্তভাবে, একক উচ্চারণের রেকর্ডিং সাধারণত ৫ থেকে ৩০ সেকেন্ড স্থায়ী হয় এবং স্ক্রিপ্টেড মনোলোগ ডেটাও পাওয়া যায়।
ব্যবহারের ক্ষেত্রে
ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং
ডেটা সেটের বিবরণ
| ডেটাসেটের প্রকার | নমুনা রেট | স্পিকার | চ্যানেল | মোট ঘণ্টা | স্পিকারের মোট সংখ্যা |
|---|---|---|---|---|---|
| কল সেন্টার | 8 ২ kHz | 2 স্পিকার | দ্বৈত | 70:45:51 | অনুরোধে |
| কল সেন্টার | 8 ২ kHz | 2 স্পিকার | মনো | 20,000:00:00 | অনুরোধে |
| কল সেন্টার | 16 ২ kHz | 2 স্পিকার | মনো | 29:17:20 | 261 |
| কল সেন্টার | 16 ২ kHz | 2 স্পিকার | দ্বৈত | 400:27:10 | 1200 |
| সাধারণ কথোপকথন | 8 ২ kHz | 2 স্পিকার | দ্বৈত | 47:48:40 | 224 |
| মিডিয়া ডেটা | 16 ২ kHz | একাধিক স্পিকার | মনো | 227:57:43 | 438 |
| লিপিবদ্ধ মনোলোগ | 48 ২ kHz | একক স্পিকার | মনো | 2,866:00:00 | 3,988 |
| লিপিবদ্ধ মনোলোগ | 24 ২ kHz | একক স্পিকার | মনো | 29,000:00:00 | অনুরোধে |
বৈশিষ্ট্যযুক্ত ক্লায়েন্ট
বিশ্ব-নেতৃস্থানীয় এআই পণ্য তৈরির জন্য দলগুলিকে ক্ষমতায়ন করা।
আপনি যা খুঁজছেন তা খুঁজে পাচ্ছেন না?
নতুন অফ-দ্য-শেল্ফ ডেটাসেটগুলি সমস্ত ডেটা প্রকার জুড়ে সংগ্রহ করা হচ্ছে৷
আপনার অডিও/স্পিচ প্রশিক্ষণ ডেটা সংগ্রহের উদ্বেগ দূর করতে এখনই আমাদের সাথে যোগাযোগ করুন