ডেনিশ ডেটাসেট
Dansk Datasæt
এআই এবং স্পিচ মডেলের জন্য উচ্চমানের ডেনিশ সাধারণ কথোপকথন, টিটিএস এবং পডকাস্ট ডেটাসেট
সংক্ষিপ্ত বিবরণ
শিরোনাম (ভাষা)
ডেনিশ ভাষা ডেটাসেট
ডেটাসেটের ধরণ
কল সেন্টার, সাধারণ কথোপকথন, মিডিয়া ডেটা (পডকাস্ট ডেটা), স্ক্রিপ্টেড মনোলোগ
দেশ
ডেন্মার্ক্
বিবরণ
দুজন ব্যক্তির মধ্যে অলিখিত টেলিফোনিক কথোপকথন আনুমানিক ১৫ থেকে ৬০ মিনিটের মধ্যে পাওয়া যায়। লাইসেন্সপ্রাপ্ত পাবলিক ডোমেন অডিও বা ভিডিও ফাইল, যেমন ১ থেকে ৫ জন অংশগ্রহণকারীর সাক্ষাৎকার বা পডকাস্ট, ১৫ থেকে ৬০ মিনিটের মধ্যে থাকে। অতিরিক্তভাবে, ডেনমার্ক থেকে ডেনিশ ভাষায় একক উচ্চারণ রেকর্ডিং সাধারণত ৫ থেকে ৩০ সেকেন্ডের মধ্যে থাকে।
ব্যবহারের ক্ষেত্রে
ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং
ডেটা সেটের বিবরণ
| ডেটাসেটের প্রকার | নমুনা রেট | স্পিকার | চ্যানেল | মোট ঘণ্টা | স্পিকারের মোট সংখ্যা |
|---|---|---|---|---|---|
| কল সেন্টার | 8 ২ kHz | 2 স্পিকার | মনো | 2,000:00:00 | অনুরোধে |
| সাধারণ কথোপকথন | 8 ২ kHz | 2 স্পিকার | দ্বৈত | 356:29:47 | 700 |
| মিডিয়া ডেটা | 16 ২ kHz | একাধিক স্পিকার | মনো | 665:16:30 | 1,261 |
| লিপিবদ্ধ মনোলোগ | 48 ২ kHz | একক স্পিকার | মনো | 2,496:00:00 | 2,825 |
বৈশিষ্ট্যযুক্ত ক্লায়েন্ট
বিশ্ব-নেতৃস্থানীয় এআই পণ্য তৈরির জন্য দলগুলিকে ক্ষমতায়ন করা।
আপনি যা খুঁজছেন তা খুঁজে পাচ্ছেন না?
নতুন অফ-দ্য-শেল্ফ ডেটাসেটগুলি সমস্ত ডেটা প্রকার জুড়ে সংগ্রহ করা হচ্ছে৷
আপনার অডিও/স্পিচ প্রশিক্ষণ ডেটা সংগ্রহের উদ্বেগ দূর করতে এখনই আমাদের সাথে যোগাযোগ করুন