ইন্দোনেশিয়ান ডেটাসেট

কুম্পুলান ডেটা ইন্দোনেশিয়া

এআই এবং স্পিচ মডেলের জন্য উচ্চ-মানের ইন্দোনেশিয়ান সাধারণ কথোপকথন এবং পডকাস্ট ডেটাসেট

সংক্ষিপ্ত বিবরণ

শিরোনাম (ভাষা)

ইন্দোনেশিয়ান ভাষার ডেটাসেট

ডেটাসেটের ধরণ

কল সেন্টার, সাধারণ কথোপকথন, সঙ্গীত, স্ক্রিপ্টেড মনোলোগ

দেশ

ইন্দোনেশিয়া

বিবরণ

বাহাসা ইন্দোনেশিয়ান ভাষায় দুজন ব্যক্তির মধ্যে অলিখিত টেলিফোনিক কথোপকথন ১৫ থেকে ৬০ মিনিটের মধ্যে পাওয়া যায়, সেই সাথে লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও বা ভিডিও ফাইল যেমন সাক্ষাৎকার এবং ১ থেকে ৫ জন অংশগ্রহণকারীর পডকাস্ট, যা ১৫ থেকে ৬০ মিনিটের মধ্যেও হতে পারে।

ব্যবহারের ক্ষেত্রে

ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং

ডেটা সেটের বিবরণ

ডেটাসেটের প্রকার নমুনা রেট স্পিকার চ্যানেল মোট ঘণ্টা স্পিকারের মোট সংখ্যা
কল সেন্টার 8 ২ kHz 2 স্পিকার মনো 100,000:00:00 অনুরোধে
সাধারণ কথোপকথন 8 ২ kHz 2 স্পিকার দ্বৈত 453:09:53 890
মিডিয়া ডেটা 16 ২ kHz মাল্টিপাল স্পিকার মনো 640:04:34 2,367

বৈশিষ্ট্যযুক্ত ক্লায়েন্ট

বিশ্ব-নেতৃস্থানীয় এআই পণ্য তৈরির জন্য দলগুলিকে ক্ষমতায়ন করা।

মর্দানী স্ত্রীলোক
গুগল
মাইক্রোসফট
Shaip আমাদের সাথে যোগাযোগ করুন

আপনি যা খুঁজছেন তা খুঁজে পাচ্ছেন না?

নতুন অফ-দ্য-শেল্ফ ডেটাসেটগুলি সমস্ত ডেটা প্রকার জুড়ে সংগ্রহ করা হচ্ছে৷

আপনার অডিও/স্পিচ প্রশিক্ষণ ডেটা সংগ্রহের উদ্বেগ দূর করতে এখনই আমাদের সাথে যোগাযোগ করুন

  • এই ক্ষেত্রটি বৈধতা উদ্দেশ্যে হয় এবং অপরিবর্তিত রাখা উচিত।
  • নিবন্ধন করে, আমি শাইপের সাথে একমত গোপনীয়তা নীতি এবং সেবা পাবার শর্ত এবং Shaip থেকে B2B মার্কেটিং যোগাযোগ পেতে আমার সম্মতি প্রদান করুন।