থাই ডেটাসেট
ชุดข้อมูลภาษาไทย
এআই এবং স্পিচ মডেলের জন্য উচ্চমানের থাই সাধারণ কথোপকথন, স্ক্রিপ্টেড মনোলোগ এবং মিডিয়া (পডকাস্ট) ডেটাসেট
সংক্ষিপ্ত বিবরণ
শিরোনাম (ভাষা)
থাই ভাষা ডেটাসেট
ডেটাসেটের ধরণ
সাধারণ কথোপকথন, মিডিয়া (পডকাস্ট), স্ক্রিপ্টেড মনোলোগ
দেশ
থাইল্যান্ড
বিবরণ
এই ডেটাসেটে ইসরায়েল থেকে হিব্রু ভাষায় দুজন ব্যক্তির মধ্যে অলিখিত টেলিফোনিক কথোপকথন (১৫-৬০ মিনিট), ১ থেকে ৫ জন অংশগ্রহণকারীর লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও বা ভিডিও ফাইল (১৫-৬০ মিনিট) এবং স্ক্রিপ্টেড মনোলোগ অন্তর্ভুক্ত রয়েছে যেখানে একজন একক বক্তা বক্তৃতা এবং ভাষা মডেল প্রশিক্ষণ এবং মূল্যায়নের জন্য পূর্বনির্ধারিত সামগ্রী সরবরাহ করেন।
ব্যবহারের ক্ষেত্রে
ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং
ডেটা সেটের বিবরণ
| ডেটাসেটের প্রকার | নমুনা রেট | স্পিকার | চ্যানেল | মোট ঘণ্টা | স্পিকারের মোট সংখ্যা |
|---|---|---|---|---|---|
| সাধারণ কথোপকথন | 8 ২ kHz | 2 স্পিকার | দ্বৈত | 211:48:42 | 170 |
| মিডিয়া ডেটা | 16 ২ kHz | একক স্পিকার | মনো | 249:14:31 | 670 |
| লিপিবদ্ধ মনোলোগ | 24 ২ kHz | একক স্পিকার | মনো | 500:00:00 | অনুরোধে |
বৈশিষ্ট্যযুক্ত ক্লায়েন্ট
বিশ্ব-নেতৃস্থানীয় এআই পণ্য তৈরির জন্য দলগুলিকে ক্ষমতায়ন করা।
আপনি যা খুঁজছেন তা খুঁজে পাচ্ছেন না?
নতুন অফ-দ্য-শেল্ফ ডেটাসেটগুলি সমস্ত ডেটা প্রকার জুড়ে সংগ্রহ করা হচ্ছে৷
আপনার অডিও/স্পিচ প্রশিক্ষণ ডেটা সংগ্রহের উদ্বেগ দূর করতে এখনই আমাদের সাথে যোগাযোগ করুন