হিন্দি ডেটাসেট

হিন্দি ডেটাসেট

এআই এবং এএসআর মডেলের জন্য উচ্চমানের হিন্দি কল-সেন্টার, সাধারণ কথোপকথন এবং পডকাস্ট ডেটাসেট

সংক্ষিপ্ত বিবরণ

শিরোনাম (ভাষা)

হিন্দি ভাষার ডেটাসেট

ডেটাসেটের ধরণ

কল সেন্টার, সাধারণ কথোপকথন, মিডিয়া (পডকাস্ট), স্ক্রিপ্টেড মনোলোগ

দেশ

ভারত

বিবরণ

১৫ থেকে ৬০ মিনিটের মধ্যে দু'জনের মধ্যে অলিখিত টেলিফোনিক কথোপকথন পাওয়া যায়, সাথে লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও বা ভিডিও ফাইল যেমন সাক্ষাৎকার এবং পডকাস্ট, যেখানে ১ থেকে ৫ জন অংশগ্রহণকারী একই পরিসরে অংশগ্রহণ করতে পারেন। অতিরিক্তভাবে, একক উচ্চারণের রেকর্ডিং সাধারণত ৫ থেকে ৩০ সেকেন্ড স্থায়ী হয় এবং স্ক্রিপ্টেড মনোলোগ ডেটাও পাওয়া যায়।

ব্যবহারের ক্ষেত্রে

ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং

ডেটা সেটের বিবরণ

ডেটাসেটের প্রকার নমুনা রেট স্পিকার চ্যানেল মোট ঘণ্টা স্পিকারের মোট সংখ্যা
কল সেন্টার 8 ২ kHz 2 স্পিকার দ্বৈত 70:45:51 অনুরোধে
কল সেন্টার 8 ২ kHz 2 স্পিকার মনো 20,000:00:00 অনুরোধে
কল সেন্টার 16 ২ kHz 2 স্পিকার মনো 29:17:20 261
কল সেন্টার 16 ২ kHz 2 স্পিকার দ্বৈত 400:27:10 1200
সাধারণ কথোপকথন 8 ২ kHz 2 স্পিকার দ্বৈত 47:48:40 224
মিডিয়া ডেটা 16 ২ kHz একাধিক স্পিকার মনো 227:57:43 438
লিপিবদ্ধ মনোলোগ 48 ২ kHz একক স্পিকার মনো 2,866:00:00 3,988
লিপিবদ্ধ মনোলোগ 24 ২ kHz একক স্পিকার মনো 29,000:00:00 অনুরোধে

বৈশিষ্ট্যযুক্ত ক্লায়েন্ট

বিশ্ব-নেতৃস্থানীয় এআই পণ্য তৈরির জন্য দলগুলিকে ক্ষমতায়ন করা।

মর্দানী স্ত্রীলোক
গুগল
মাইক্রোসফট
Shaip আমাদের সাথে যোগাযোগ করুন

আপনি যা খুঁজছেন তা খুঁজে পাচ্ছেন না?

নতুন অফ-দ্য-শেল্ফ ডেটাসেটগুলি সমস্ত ডেটা প্রকার জুড়ে সংগ্রহ করা হচ্ছে৷

আপনার অডিও/স্পিচ প্রশিক্ষণ ডেটা সংগ্রহের উদ্বেগ দূর করতে এখনই আমাদের সাথে যোগাযোগ করুন

  • এই ক্ষেত্রটি বৈধতা উদ্দেশ্যে হয় এবং অপরিবর্তিত রাখা উচিত।
  • নিবন্ধন করে, আমি শাইপের সাথে একমত গোপনীয়তা নীতি এবং সেবা পাবার শর্ত এবং Shaip থেকে B2B মার্কেটিং যোগাযোগ পেতে আমার সম্মতি প্রদান করুন।