সংক্ষিপ্ত বিবরণ
শিরোনাম (ভাষা)
মার্কিন ইংরেজি ভাষার ডেটাসেট
ডেটাসেটের ধরণ
কল সেন্টার, মিডিয়া (পডকাস্ট), চিকিৎসা
দেশ
মার্কিন যুক্তরাষ্ট
বিবরণ
এই ডেটাসেটে আনস্ক্রিপ্টেড সিন্থেটিক এজেন্ট-গ্রাহক কথোপকথন (৫-১৫ মিনিট), লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও বা ভিডিও ফাইল যেমন ১ থেকে ৫ জন অংশগ্রহণকারীর সাথে সাক্ষাৎকার এবং পডকাস্ট (১৫-৬০ মিনিট), এবং ব্যাপক বক্তৃতা এবং ভাষা গবেষণার জন্য মিডিয়া এবং মেডিকেল ডেটাসেটের ধরণ অন্তর্ভুক্ত রয়েছে।
ব্যবহারের ক্ষেত্রে
ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং
ডেটা সেটের বিবরণ
| ডেটাসেটের প্রকার | নমুনা রেট | স্পিকার | চ্যানেল | মোট ঘণ্টা | স্পিকারের মোট সংখ্যা |
|---|---|---|---|---|---|
| কল সেন্টার | 8 ২ kHz | 2 স্পিকার | মনো | 10,196:00:00 | 1,052 |
| কল সেন্টার | 8 ২ kHz | 2 স্পিকার | দ্বৈত | 597:26:43 | অনুরোধে |
| মিডিয়া ডেটা | 16 ২ kHz | একাধিক স্পিকার | মনো | 620:23:43 | 5,466 |
| মেডিকেল | 8 ২ kHz | 2 স্পিকার | মনো | 1,480:30:33 | 697 |
বৈশিষ্ট্যযুক্ত ক্লায়েন্ট
বিশ্ব-নেতৃস্থানীয় এআই পণ্য তৈরির জন্য দলগুলিকে ক্ষমতায়ন করা।
আপনি যা খুঁজছেন তা খুঁজে পাচ্ছেন না?
নতুন অফ-দ্য-শেল্ফ ডেটাসেটগুলি সমস্ত ডেটা প্রকার জুড়ে সংগ্রহ করা হচ্ছে৷
আপনার অডিও/স্পিচ প্রশিক্ষণ ডেটা সংগ্রহের উদ্বেগ দূর করতে এখনই আমাদের সাথে যোগাযোগ করুন