কন্নড় ডেটাসেট

ಕನ್ನಡ ಡೇಟಾಸೆಟ್

এআই এবং স্পিচ মডেলের জন্য উচ্চমানের কন্নড় কল-সেন্টার, সাধারণ কথোপকথন, স্ক্রিপ্টেড মনোলোগ এবং মিডিয়া (পডকাস্ট) ডেটাসেট

সংক্ষিপ্ত বিবরণ

শিরোনাম (ভাষা)

কন্নড় ভাষার ডেটাসেট

ডেটাসেটের ধরণ

কল সেন্টার, সাধারণ কথোপকথন, মিডিয়া ডেটা, স্ক্রিপ্টেড মনোলোগ

দেশ

ভারত

বিবরণ

এই ডেটাসেটে আনস্ক্রিপ্টেড সিন্থেটিক এজেন্ট-গ্রাহক টেলিফোনিক কথোপকথন (৫-১৫ মিনিট), লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও বা ভিডিও ফাইল যেমন ১ থেকে ৫ জন অংশগ্রহণকারীর সাথে সাক্ষাৎকার এবং পডকাস্ট (১৫-৬০ মিনিট) এবং স্ক্রিপ্টেড মনোলোগ অন্তর্ভুক্ত রয়েছে যেখানে একজন একক বক্তা বক্তৃতা এবং ভাষা মডেল প্রশিক্ষণ এবং মূল্যায়নের জন্য পূর্বনির্ধারিত সামগ্রী সরবরাহ করেন।

ব্যবহারের ক্ষেত্রে

ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং

ডেটা সেটের বিবরণ

ডেটাসেটের প্রকার নমুনা রেট স্পিকার চ্যানেল মোট ঘণ্টা স্পিকারের মোট সংখ্যা
কল সেন্টার 8 ২ kHz 2 স্পিকার দ্বৈত 59:57:02 494
কল সেন্টার 16 ২ kHz 2 স্পিকার মনো 195:26:56 9,504
সাধারণ কথোপকথন 8 ২ kHz 2 স্পিকার দ্বৈত 141:27:15 424
মিডিয়া ডেটা 16 ২ kHz একাধিক স্পিকার মনো 14:19:52 124
লিপিবদ্ধ মনোলোগ 24 ২ kHz একক স্পিকার মনো 500:00:00 অনুরোধে

বৈশিষ্ট্যযুক্ত ক্লায়েন্ট

বিশ্ব-নেতৃস্থানীয় এআই পণ্য তৈরির জন্য দলগুলিকে ক্ষমতায়ন করা।

মর্দানী স্ত্রীলোক
গুগল
মাইক্রোসফট
Shaip আমাদের সাথে যোগাযোগ করুন

আপনি যা খুঁজছেন তা খুঁজে পাচ্ছেন না?

নতুন অফ-দ্য-শেল্ফ ডেটাসেটগুলি সমস্ত ডেটা প্রকার জুড়ে সংগ্রহ করা হচ্ছে৷

আপনার অডিও/স্পিচ প্রশিক্ষণ ডেটা সংগ্রহের উদ্বেগ দূর করতে এখনই আমাদের সাথে যোগাযোগ করুন

  • এই ক্ষেত্রটি বৈধতা উদ্দেশ্যে হয় এবং অপরিবর্তিত রাখা উচিত।
  • নিবন্ধন করে, আমি শাইপের সাথে একমত গোপনীয়তা নীতি এবং সেবা পাবার শর্ত এবং Shaip থেকে B2B মার্কেটিং যোগাযোগ পেতে আমার সম্মতি প্রদান করুন।