মালায়লাম ডেটাসেট

മലയാളം ഡാറ്റാസെറ്റ്

এআই এবং স্পিচ মডেলের জন্য উচ্চমানের মালায়ালাম সাধারণ কথোপকথন এবং পডকাস্ট ডেটাসেট

সংক্ষিপ্ত বিবরণ

শিরোনাম (ভাষা)

মালায়ালাম ভাষার ডেটাসেট

ডেটাসেটের ধরণ

সাধারণ কথোপকথন, মিডিয়া (পডকাস্ট) ডেটা

দেশ

ভারত

বিবরণ

এই ডেটাসেটে একজন এজেন্ট এবং একজন গ্রাহকের মধ্যে অলিখিত সিন্থেটিক টেলিফোনিক কথোপকথন (৫-১৫ মিনিট) এবং লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও বা ভিডিও ফাইল অন্তর্ভুক্ত রয়েছে, যেমন ১ থেকে ৫ জন অংশগ্রহণকারীর সাথে সাক্ষাৎকার এবং পডকাস্ট (১৫-৬০ মিনিট)।

ব্যবহারের ক্ষেত্রে

ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং

ডেটা সেটের বিবরণ

ডেটাসেটের প্রকার নমুনা রেট স্পিকার চ্যানেল মোট ঘণ্টা স্পিকারের মোট সংখ্যা
সাধারণ কথোপকথন 8 ২ kHz 2 স্পিকার দ্বৈত 70:46:30 576
সাধারণ কথোপকথন 8 ২ kHz 2 স্পিকার দ্বৈত 149:39:33 296
মিডিয়া ডেটা 16 ২ kHz একাধিক স্পিকার মনো 12:39:24 81

বৈশিষ্ট্যযুক্ত ক্লায়েন্ট

বিশ্ব-নেতৃস্থানীয় এআই পণ্য তৈরির জন্য দলগুলিকে ক্ষমতায়ন করা।

মর্দানী স্ত্রীলোক
গুগল
মাইক্রোসফট
Shaip আমাদের সাথে যোগাযোগ করুন

আপনি যা খুঁজছেন তা খুঁজে পাচ্ছেন না?

নতুন অফ-দ্য-শেল্ফ ডেটাসেটগুলি সমস্ত ডেটা প্রকার জুড়ে সংগ্রহ করা হচ্ছে৷

আপনার অডিও/স্পিচ প্রশিক্ষণ ডেটা সংগ্রহের উদ্বেগ দূর করতে এখনই আমাদের সাথে যোগাযোগ করুন

  • এই ক্ষেত্রটি বৈধতা উদ্দেশ্যে হয় এবং অপরিবর্তিত রাখা উচিত।
  • নিবন্ধন করে, আমি শাইপের সাথে একমত গোপনীয়তা নীতি এবং সেবা পাবার শর্ত এবং Shaip থেকে B2B মার্কেটিং যোগাযোগ পেতে আমার সম্মতি প্রদান করুন।