সংক্ষিপ্ত বিবরণ
শিরোনাম (ভাষা)
চীনা ভাষার ডেটাসেট
ডেটাসেটের ধরণ
কল সেন্টার, সঙ্গীত, স্ক্রিপ্টেড মনোলোগ, মিডিয়া ডেটা (পডকাস্ট ডেটা)
দেশ
চীন
বিবরণ
এই ডেটাসেটে আনস্ক্রিপ্টেড সিন্থেটিক এজেন্ট-গ্রাহক টেলিফোনিক কথোপকথন (৫-১৫ মিনিট), প্রাকৃতিক মানুষ থেকে মানুষ টেলিফোনিক কথোপকথন (১৫-৬০ মিনিট), এবং ট্রান্সক্রিপশন সহ গানের অডিও অন্তর্ভুক্ত রয়েছে, যা বক্তৃতা এবং ভাষা প্রযুক্তির প্রশিক্ষণ এবং মূল্যায়নের জন্য বিভিন্ন বক্তৃতা ডেটা সরবরাহ করে।
ব্যবহারের ক্ষেত্রে
ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং
ডেটা সেটের বিবরণ
| ভাষা | ডেটাসেটের প্রকার | নমুনা রেট | স্পিকার | চ্যানেল | মোট ঘণ্টা | স্পিকারের মোট সংখ্যা |
|---|---|---|---|---|---|---|
| চাইনিজ গান গাওয়া | সঙ্গীত | 48 ২ kHz | একক স্পিকার | মনো | 06:11:32 | 10 |
| প্রথাগত চীনা) | লিপিবদ্ধ মনোলোগ | 48 ২ kHz | একক স্পিকার | মনো | 1,499:00:00 | 1,805 |
| চীনা উচ্চারণযুক্ত ইংরেজি | মিডিয়া ডেটা | 16 ২ kHz | একাধিক স্পিকার | মনো | 306:04:58 | 2,130 |
| সরলীকৃত চীনা | লিপিবদ্ধ মনোলোগ | 48 ২ kHz | একক স্পিকার | মনো | 2,761:00:00 | 3,725 |
| চীনা মার্কিন উচ্চারণযুক্ত ইংরেজি | কল সেন্টার | 8 ২ kHz | 2 স্পিকার | দ্বৈত | 152:18:33 | 2,058 |
| চীনা মার্কিন উচ্চারণযুক্ত ইংরেজি | মিডিয়া ডেটা | 16 ২ kHz | একাধিক স্পিকার | মনো | 245:55:15 | 468 |
বৈশিষ্ট্যযুক্ত ক্লায়েন্ট
বিশ্ব-নেতৃস্থানীয় এআই পণ্য তৈরির জন্য দলগুলিকে ক্ষমতায়ন করা।
আপনি যা খুঁজছেন তা খুঁজে পাচ্ছেন না?
নতুন অফ-দ্য-শেল্ফ ডেটাসেটগুলি সমস্ত ডেটা প্রকার জুড়ে সংগ্রহ করা হচ্ছে৷
আপনার অডিও/স্পিচ প্রশিক্ষণ ডেটা সংগ্রহের উদ্বেগ দূর করতে এখনই আমাদের সাথে যোগাযোগ করুন