হিব্রু ডেটাসেট
ערכת נתונים হিব্রু
এআই এবং স্পিচ মডেলের জন্য উচ্চমানের হিব্রু সাধারণ কথোপকথন এবং পডকাস্ট ডেটাসেট
সংক্ষিপ্ত বিবরণ
শিরোনাম (ভাষা)
হিব্রু ভাষার ডেটাসেট
ডেটাসেটের ধরণ
সাধারণ কথোপকথন, মিডিয়া ডেটা
দেশ
ইসরাইল
বিবরণ
ইসরায়েল থেকে হিব্রু ভাষায় দুজন ব্যক্তির মধ্যে অলিখিত টেলিফোনিক কথোপকথন ১৫ থেকে ৬০ মিনিটের মধ্যে পাওয়া যায়, সেই সাথে লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও বা ভিডিও ফাইল যেমন সাক্ষাৎকার এবং ১ থেকে ৫ জন অংশগ্রহণকারীর পডকাস্ট, ১৫ থেকে ৬০ মিনিটের মধ্যেও পাওয়া যায়।
ব্যবহারের ক্ষেত্রে
ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং
ডেটা সেটের বিবরণ
| ডেটাসেটের প্রকার | নমুনা রেট | স্পিকার | চ্যানেল | মোট ঘণ্টা | স্পিকারের মোট সংখ্যা |
|---|---|---|---|---|---|
| সাধারণ কথোপকথন | 8 ২ kHz | 2 স্পিকার | দ্বৈত | 398:47:10 | 814 |
| মিডিয়া ডেটা | 16 ২ kHz | একাধিক স্পিকার | মনো | 426:14:16 | 885 |
বৈশিষ্ট্যযুক্ত ক্লায়েন্ট
বিশ্ব-নেতৃস্থানীয় এআই পণ্য তৈরির জন্য দলগুলিকে ক্ষমতায়ন করা।
আপনি যা খুঁজছেন তা খুঁজে পাচ্ছেন না?
নতুন অফ-দ্য-শেল্ফ ডেটাসেটগুলি সমস্ত ডেটা প্রকার জুড়ে সংগ্রহ করা হচ্ছে৷
আপনার অডিও/স্পিচ প্রশিক্ষণ ডেটা সংগ্রহের উদ্বেগ দূর করতে এখনই আমাদের সাথে যোগাযোগ করুন
সংক্ষিপ্ত বিবরণ
পণ্যের নাম
হিব্রু ভাষা ডেটাসেট
ডেটাসেটের প্রকার
সাধারণ কথোপকথন
বিবরণ
দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) – 15-60 মিনিট, ইস্রায়েলে হিব্রু।
ব্যবহারের ক্ষেত্রে
ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং
ডেটা সেটের বিবরণ
মোট ঘণ্টা
399
নমুনা হার
8 ২ kHz
অডিও চ্যানেল
দ্বৈত
রেকর্ডিং প্ল্যাটফর্ম
ডেস্কটপ
অডিও ফর্ম্যাট
.ভা
ট্রান্সক্রিপশন ফরম্যাট
.জসন
আমরা (%)
5
ডেটা সেট ডেমোগ্রাফিক্স
দেশ
ইসরাইল
ভাষা
হিব্রু
লিঙ্গ
মহিলা 414, পুরুষ 399, অজানা 1
স্পিকার সংখ্যা
814
বয়স
18-50
সংক্ষিপ্ত বিবরণ
পণ্যের নাম
হিব্রু ভাষা ডেটাসেট
ডেটাসেটের প্রকার
পডকাস্ট
বিবরণ
লাইসেন্সযোগ্য পাবলিক ডোমেইন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি – ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট।
ব্যবহারের ক্ষেত্রে
ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং
ডেটা সেটের বিবরণ
মোট ঘণ্টা
427
নমুনা হার
16 ২ kHz
অডিও চ্যানেল
মনো
রেকর্ডিং প্ল্যাটফর্ম
ওয়েব সোর্সিং
অডিও ফর্ম্যাট
.ভা
ট্রান্সক্রিপশন ফরম্যাট
.জসন
আমরা (%)
5
ডেটা সেট ডেমোগ্রাফিক্স
দেশ
ইসরাইল
ভাষা
হিব্রু
লিঙ্গ
মহিলা 361, পুরুষ 513, অজানা 13
স্পিকার সংখ্যা
887
বয়স
18-50