থাই ডেটাসেট
ชุดข้อมูลภาษาไทย
এআই এবং স্পিচ মডেলের জন্য উচ্চমানের থাই সাধারণ কথোপকথন এবং পডকাস্ট ডেটাসেট
সংক্ষিপ্ত বিবরণ
শিরনাম
থাই ভাষা ডেটাসেট
ডেটাসেটের প্রকার
সাধারণ কথোপকথন
বিবরণ
দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) – 15-60 মিনিট, বন্ধুদের মধ্যে ব্যবহৃত একটি অনানুষ্ঠানিক রেজিস্টার।
ব্যবহারের ক্ষেত্রে
ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং
ডেটা সেটের বিবরণ
মোট ঘণ্টা
183
নমুনা হার
8 ২ kHz
অডিও চ্যানেল
দ্বৈত
রেকর্ডিং প্ল্যাটফর্ম
ডেস্কটপ
অডিও ফর্ম্যাট
.ভা
ট্রান্সক্রিপশন ফরম্যাট
.জসন
আমরা (%)
5
ডেটা সেট ডেমোগ্রাফিক্স
দেশ
থাই
ভাষা
থাই
লিঙ্গ
মহিলা 338, পুরুষ 96, অজানা 8
স্পিকার সংখ্যা
442
বয়স
18-50
সংক্ষিপ্ত বিবরণ
শিরনাম
থাই ভাষা ডেটাসেট
ডেটাসেটের প্রকার
পডকাস্ট
বিবরণ
লাইসেন্সযোগ্য পাবলিক ডোমেইন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি – ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট।
ব্যবহারের ক্ষেত্রে
ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং
ডেটা সেটের বিবরণ
মোট ঘণ্টা
173
নমুনা হার
16 ২ kHz
অডিও চ্যানেল
মনো
রেকর্ডিং প্ল্যাটফর্ম
ওয়েব সোর্সিং
অডিও ফর্ম্যাট
.ভা
ট্রান্সক্রিপশন ফরম্যাট
.জসন
আমরা (%)
5
ডেটা সেট ডেমোগ্রাফিক্স
দেশ
থাই
ভাষা
থাই
লিঙ্গ
মহিলা 143, পুরুষ 502, অজানা 26
স্পিকার সংখ্যা
671
বয়স
18-50
বৈশিষ্ট্যযুক্ত ক্লায়েন্ট
বিশ্ব-নেতৃস্থানীয় এআই পণ্য তৈরির জন্য দলগুলিকে ক্ষমতায়ন করা।

আপনি যা খুঁজছেন তা খুঁজে পাচ্ছেন না?
নতুন অফ-দ্য-শেল্ফ ডেটাসেটগুলি সমস্ত ডেটা প্রকার জুড়ে সংগ্রহ করা হচ্ছে৷
আপনার অডিও/স্পিচ প্রশিক্ষণ ডেটা সংগ্রহের উদ্বেগ দূর করতে এখনই আমাদের সাথে যোগাযোগ করুন