থাই ডেটাসেট

ชุดข้อมูลภาษาไทย

এআই এবং স্পিচ মডেলের জন্য উচ্চমানের থাই সাধারণ কথোপকথন, স্ক্রিপ্টেড মনোলোগ এবং মিডিয়া (পডকাস্ট) ডেটাসেট

সংক্ষিপ্ত বিবরণ

শিরোনাম (ভাষা)

থাই ভাষা ডেটাসেট

ডেটাসেটের ধরণ

সাধারণ কথোপকথন, মিডিয়া (পডকাস্ট), স্ক্রিপ্টেড মনোলোগ

দেশ

থাইল্যান্ড

বিবরণ

এই ডেটাসেটে ইসরায়েল থেকে হিব্রু ভাষায় দুজন ব্যক্তির মধ্যে অলিখিত টেলিফোনিক কথোপকথন (১৫-৬০ মিনিট), ১ থেকে ৫ জন অংশগ্রহণকারীর লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও বা ভিডিও ফাইল (১৫-৬০ মিনিট) এবং স্ক্রিপ্টেড মনোলোগ অন্তর্ভুক্ত রয়েছে যেখানে একজন একক বক্তা বক্তৃতা এবং ভাষা মডেল প্রশিক্ষণ এবং মূল্যায়নের জন্য পূর্বনির্ধারিত সামগ্রী সরবরাহ করেন।

ব্যবহারের ক্ষেত্রে

ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং

ডেটা সেটের বিবরণ

ডেটাসেটের প্রকার নমুনা রেট স্পিকার চ্যানেল মোট ঘণ্টা স্পিকারের মোট সংখ্যা
সাধারণ কথোপকথন 8 ২ kHz 2 স্পিকার দ্বৈত 211:48:42 170
মিডিয়া ডেটা 16 ২ kHz একক স্পিকার মনো 249:14:31 670
লিপিবদ্ধ মনোলোগ 24 ২ kHz একক স্পিকার মনো 500:00:00 অনুরোধে

বৈশিষ্ট্যযুক্ত ক্লায়েন্ট

বিশ্ব-নেতৃস্থানীয় এআই পণ্য তৈরির জন্য দলগুলিকে ক্ষমতায়ন করা।

মর্দানী স্ত্রীলোক
গুগল
মাইক্রোসফট
Shaip আমাদের সাথে যোগাযোগ করুন

আপনি যা খুঁজছেন তা খুঁজে পাচ্ছেন না?

নতুন অফ-দ্য-শেল্ফ ডেটাসেটগুলি সমস্ত ডেটা প্রকার জুড়ে সংগ্রহ করা হচ্ছে৷

আপনার অডিও/স্পিচ প্রশিক্ষণ ডেটা সংগ্রহের উদ্বেগ দূর করতে এখনই আমাদের সাথে যোগাযোগ করুন

  • এই ক্ষেত্রটি বৈধতা উদ্দেশ্যে হয় এবং অপরিবর্তিত রাখা উচিত।
  • নিবন্ধন করে, আমি শাইপের সাথে একমত গোপনীয়তা নীতি এবং সেবা পাবার শর্ত এবং Shaip থেকে B2B মার্কেটিং যোগাযোগ পেতে আমার সম্মতি প্রদান করুন।