এখন পেতে 50* কথোপকথনমূলক এআই অফ-দ্য-শেল্ফ ডেটাসেটগুলিতে
চ্যাটবট, ভয়েস সহকারী, স্পিচ-সক্ষম ডিভাইসগুলির জন্য স্পিচ এবং অডিও ডেটাসেট।
*সীমিত মেয়াদের অফার
শিল্প নেতাদের দ্বারা বিশ্বস্ত
বিস্তারিত | কী খুঁজতে হবে | অফ-দ্য-শেল্ফ ভাষা ডেটাসেট | কল সেন্টার কথোপকথন 8khz* | জেনেরিক কথোপকথন 8khz* | মিডিয়া এবং পডকাস্ট 16khz* | উচ্চারণ/লিপিবদ্ধ মনোলোগ 16khz* | ঘন্টায় মোট ভলিউম | উপভাষা আচ্ছাদিত | অডিও ফর্ম্যাট | টেক্সট ট্রান্সক্রিপশন ফরম্যাট | ব্যবহারের ক্ষেত্রে | উৎস | সিটিএ |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
আফ্রিকান্স | আফ্রিকান অডিও ডেটাসেট | 600 | 900 | 1500 | আফ্রিকায় কথ্য আফ্রিকান | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||
আরবি | আরবি অডিও ডেটাসেট | 800 | 1500 | 2300 | উপসাগরীয় দেশ থেকে আরবি | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||
চীনা | চীনা অডিও ডেটাসেট | 2000 | 2000 | চীন থেকে চীনা | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||||
ডেনমার্কের | ডেনিশ অডিও ডেটাসেট | 400 | 600 | 2000 | 3000 | ডেনমার্ক থেকে ডেনিশ | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||
ডাচ | ডাচ অডিও ডেটাসেট | 2000 | 2000 | নেদারল্যান্ড থেকে ডাচ | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||||
ইংরেজি - AAVE অ্যাকসেন্ট | ইংরেজি - AAVE (আফ্রিকান আমেরিকান ভার্নাকুলার ইংরেজি) অডিও ডেটাসেট | 500 | 500 | 1000 | আঞ্চলিক বৈচিত্র্য (কখনও কখনও AAVE নামে পরিচিত, সাধারণত বেশিরভাগ কর্মজীবী এবং মধ্যবিত্ত আফ্রিকান আমেরিকানদের দ্বারা কথিত) এবং আরও মানক বৈচিত্র্য (সাধারণত মধ্যবিত্ত আফ্রিকান আমেরিকানরা আনুষ্ঠানিক এবং জনসাধারণের পরিস্থিতিতে উচ্চারিত হয়) কিন্তু একটি শক্তিশালী জোর দিয়ে স্থানীয় ভাষায় | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||
ইংরেজি - বোস্টন/নিউ ইয়র্ক অ্যাকসেন্ট | ইংরেজি - বোস্টন/নিউ ইয়র্ক অডিও ডেটাসেট | 225 | 225 | 350 | 800 | এটি বোস্টন, নিউ ইয়র্ক এবং ফিলাডেলফিয়া শহরে এবং এর আশেপাশে উচ্চারিত বেশ কয়েকটি আঞ্চলিক উচ্চারণের একটি সংগ্রহ। এই উচ্চারণগুলি অ-স্থানীয়দের মতো শোনাতে পারে, তবে অন্যান্য আমেরিকান উচ্চারণ থেকে আলাদা। কিছু স্থানীয় শব্দভাণ্ডার থাকা সত্ত্বেও যা ইংরেজি-ভাষী বিশ্বের অন্যান্য অংশ থেকে আলাদা, এই উচ্চারণগুলি অন্য কোথাও বলা ইংরেজির সাথে পারস্পরিকভাবে বোধগম্য। | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||
ইংরেজি - চাইনিজ অ্যাকসেন্ট | ইংরেজি - চাইনিজ অ্যাকসেন্টেড অডিও ডেটাসেট | 150 | 300 | 450 | বক্তারা যারা তাদের প্রথম ভাষা হিসেবে চীনা ভাষায় কথা বলে এবং যারা কিশোর/প্রাপ্তবয়স্ক হিসেবে মার্কিন যুক্তরাষ্ট্রে স্থানান্তরিত/অভিবাসী হয়েছে এবং তাদের দ্বিতীয় ভাষা হিসেবে ইংরেজি শিখেছে। | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||
ইংরেজি - গভীর দক্ষিণ অ্যাকসেন্ট | ইংরেজি - গভীর দক্ষিণ অডিও ডেটাসেট | 275 | 275 | 450 | 1000 | (i) টেক্সাস থেকে বক্তারা; (ii) উত্তর ক্যারোলিনা, দক্ষিণ ক্যারোলিনা, জর্জিয়া; (iii) নিউ অরলিন্স; (iv) ফ্লোরিডা প্যানহ্যান্ডেল; (v) টেনেসি, আরকানসাস, মিশিগান। | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||
ইংরেজি - হিস্পানিক অ্যাকসেন্ট | ইংরেজি - হিস্পানিক অ্যাকসেন্টেড অডিও ডেটাসেট | 400 | 400 | 800 | হিস্পানিক ইংরেজি বিভিন্ন জাতীয় ঐতিহ্যের হিস্পানিক আমেরিকানদের দ্বারা উচ্চারিত মার্কিন ইংরেজির বৈচিত্র্যকে বোঝায়। মূল ফোকাস ছিল মেক্সিকান আমেরিকান, বিভিন্ন জাতীয় উত্সের বক্তা (যেমন মেক্সিকো, পুয়ের্তো রিকো, ডোমিনিকান রিপাবলিক, ইকুয়েডর, কিউবা, ইত্যাদি) এবং বিভিন্ন অঞ্চল থেকে (যেমন ক্যালিফোর্নিয়া, নিউ ইয়র্ক, ফ্লোরিডা)। বক্তাদের মধ্যে অন্তর্ভুক্ত ছিল যারা স্প্যানিশকে প্রথম ভাষা হিসেবে বলে এবং সেইসাথে হিস্পানিক বংশোদ্ভূত বক্তা যারা স্প্যানিশ ভাষায় কথা বলে তাদের ঐতিহ্যের ভাষা রয়েছে। | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||
ইংরেজি - নিউজিল্যান্ড অ্যাকসেন্ট | ইংরেজি - নিউজিল্যান্ড অডিও ডেটাসেট | 250 | 750 | 1000 | উভয় দ্বীপের স্পিকার, সমান অনুপাতে কম বয়স্ক স্পিকার (<40 বছর বয়সী) এবং বয়স্ক স্পিকার (>40 বছর বয়সী) এর মিশ্রণ সহ। | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||
ইংরেজি - সিঙ্গাপুর অ্যাকসেন্ট | ইংরেজি - সিঙ্গাপুর অডিও ডেটাসেট | 400 | 600 | 1000 | স্ট্যান্ডার্ড সিঙ্গাপুর ইংলিশ এবং কলোকিয়াল সিঙ্গাপুর ইংলিশ উভয়ই। বিভিন্ন জাতিগত পটভূমি (যেমন চীনা, মালয়, ভারতীয়, ইত্যাদি) এবং বিভিন্ন শিক্ষাগত স্তরের সিঙ্গাপুরবাসী। | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||
ইংরেজি - দক্ষিণ আফ্রিকা অ্যাকসেন্ট | ইংরেজি - দক্ষিণ আফ্রিকা অডিও ডেটাসেট | 400 | 600 | 1000 | বিভিন্ন আর্থ-সামাজিক শ্রেণী এবং নৃতাত্ত্বিক পটভূমির প্রতিনিধি (যেমন ইউরোপীয়, আফ্রিকান, ভারতীয়, বা মিশ্র পটভূমির দক্ষিণ আফ্রিকান)। | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||
ইংরেজি - আইরিশ অ্যাকসেন্ট | ইংরেজি - আইরিশ অডিও ডেটাসেট | 500 | 500 | আয়ারল্যান্ডে ইংরেজি বলা হয় | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||||
ইংরেজি - স্কটিশ অ্যাকসেন্ট | ইংরেজি - স্কটিশ অডিও ডেটাসেট | 800 | 800 | ইংরেজি স্কটিশ দ্বারা কথ্য | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||||
ইংরেজি - ওয়েলশ অ্যাকসেন্ট | ইংরেজি - ওয়েলশ অডিও ডেটাসেট | 800 | 800 | ওয়েলশ ইংরেজি | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||||
ফরাসি কানাডীয় | ফরাসি কানাডিয়ান অডিও ডেটাসেট | 1000 | 1000 | কানাডিয়ান ফরাসি | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||||
হিব্রু | হিব্রু অডিও ডেটাসেট | 750 | 750 | 1500 | ইস্রায়েলে হিব্রু | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||
ইন্দোনেশিয়াসম্বন্ধীয় | ইন্দোনেশিয়ান অডিও ডেটাসেট | 1000 | 1000 | 2000 | বাহাসা ইন্দোনেশিয়ান | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||
জাপানি | জাপানি অডিও ডেটাসেট | 2000 | 2000 | জাপান থেকে জাপানি | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||||
কোরিয়ান | কোরিয়ান অডিও ডেটাসেট | 100 | 200 | 1500 | 1800 | সারা দক্ষিণ কোরিয়ায় ছড়িয়ে পড়ে বক্তারা। | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||
মালে | মালয় অডিও ডেটাসেট | 500 | 500 | 1000 | মালয়েশিয়ায় মালয় | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||
মেক্সিকান স্প্যানিশ | মেক্সিকান স্প্যানিশ অডিও ডেটাসেট | 1250 | 1250 | মেক্সিকো থেকে মেক্সিকান | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||||
পোলিশ | পোলিশ অডিও ডেটাসেট | 250 | 2000 | 2250 | পোল্যান্ড থেকে পোলিশ | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||
রাশিয়ান | রাশিয়ান অডিও ডেটাসেট | 2000 | 2000 | রাশিয়া থেকে রাশিয়ান | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||||
সোয়াহিলি | সোয়াহিলি অডিও ডেটাসেট | 350 | 650 | 1000 | দক্ষিণ আফ্রিকান এবং কেনিয়ান সোয়াহিলি | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||
সুইডিশ | সুইডিশ অডিও ডেটাসেট | 350 | 650 | 1000 | সুইডেনে সুইডিশ | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||
তাইওয়ান চাইনিজ | তাইওয়ান চীনা অডিও ডেটাসেট | 1000 | 1000 | তাইওয়ান থেকে চীনা | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||||
থাই | থাই অডিও ডেটাসেট | 350 | 450 | 800 | বন্ধুদের মধ্যে ব্যবহৃত একটি অনানুষ্ঠানিক রেজিস্টার, | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||
তুর্কী | তুর্কি অডিও ডেটাসেট | 2000 | 2000 | তুরস্ক থেকে তুর্কি | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||||
ভিয়েতনামী | ভিয়েতনামী অডিও ডেটাসেট | 600 | 400 | 1000 | উত্তর (যেমন, হ্যানয়), মধ্য এবং দক্ষিণ (যেমন, হো চি মিন সিটি)। | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||
হিন্দি | হিন্দি অডিও ডেটাসেট | 800 | 2000 | 2800 | ভারতে হিন্দি বিশেষ করে উত্তর, পূর্ব এবং পশ্চিম অঞ্চলে | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||
হিংলিশ | ভারতীয় ইংরেজি অডিও ডেটাসেট | 300 | 500 | 800 | শহুরে ভারতীয় শহরগুলি থেকে সংগৃহীত যা ক্রমবর্ধমান অর্থনৈতিক সুযোগের কারণে দেশের আর্থিক কেন্দ্র। এই ধরনের জায়গা হতে পারে নয়ডা, দিল্লি, দেরাদুন, চণ্ডীগড়, মুম্বাই, কলকাতা, ব্যাঙ্গালোর, পুনে, চেন্নাই, হায়দ্রাবাদ ইত্যাদি। | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||
ইংরেজি | ইংরেজি অডিও ডেটাসেট | 700 | 700 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | |||||
কন্নড | কন্নড় অডিও ডেটাসেট | 60 | 100 | 40 | 200 | ভারতের কর্ণাটক থেকে কন্নড় | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||
মালায়ালম | মালায়লাম অডিও ডেটাসেট | 60 | 100 | 40 | 200 | কেরালা, লক্ষদ্বীপ এবং পুদুচেরি থেকে মালয়ালম | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||
ওড়িয়া | ওড়িয়া অডিও ডেটাসেট | 60 | 100 | 40 | 200 | ওড়িশা, পশ্চিমবঙ্গ, ঝাড়খণ্ড এবং ছত্তিশগড়ের কিছু অংশ থেকে ওড়িয়া | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||
পাঞ্জাবি | পাঞ্জাবি অডিও ডেটাসেট | 60 | 100 | 40 | 200 | পাঞ্জাব, ভারতের পাঞ্জাবি | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||
তামিল | তামিল অডিও ডেটাসেট | 60 | 100 | 240 | 400 | তামিলনাড়ু, ভারতের তামিল | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||
তেলুগু | তেলেগু অডিও ডেটাসেট | 100 | 950 | 950 | 2000 | ভারতের অন্ধ্র প্রদেশ থেকে তেলেগু | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||
বাঙালি | বাংলা অডিও ডেটাসেট | 60 | 100 | 40 | 200 | ভারতের পশ্চিমবঙ্গ থেকে বাঙালি | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||
গুজরাটি | গুজরাটি অডিও ডেটাসেট | 60 | 100 | 40 | 200 | গুজরাটি, ভারতের গুজরাট থেকে | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||
মারাঠি | মারাঠি অডিও ডেটাসেট | 60 | 100 | 40 | 200 | ভারতের মহারাষ্ট্র থেকে মারাঠি | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ | ||
অসমিয়া | অসমীয়া অডিও ডেটাসেট | 60 | 100 | 40 | 200 | ভারতের আসাম থেকে আসামিয়া | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | শিপ | যোগাযোগ যোগাযোগ |
কথোপকথনমূলক এআই-এ গভীর দক্ষতা
কথোপকথনমূলক এআই বা চ্যাটবটস বা ভার্চুয়াল/ডিজিটাল অ্যাসিস্ট্যান্টগুলি তাদের পিছনে থাকা প্রযুক্তি এবং ডেটার মতোই স্মার্ট। Shaip-এ, আমরা আপনাকে প্রাকৃতিক ভাষা প্রক্রিয়াকরণের (NLP) জন্য বহুমুখী অডিও ডেটাসেটের একটি বিস্তৃত সেট অফার করি যা প্রকৃত লোকেদের সাথে কথোপকথনের অনুকরণ করে যা আপনাকে আপনার AI প্রাণবন্ত করতে দেয়। আমাদের গভীর বোধগম্যতার সাথে, আমরা আপনাকে সারা বিশ্ব থেকে একাধিক ভাষায় সমৃদ্ধ এবং কাঠামোগত ডেটাসেটের সাথে অত্যন্ত নির্ভুলতার সাথে AI-সক্ষম স্পিচ মডেলগুলি তৈরি এবং স্থানীয়করণ করতে সহায়তা করি। আমরা আপনার প্রয়োজনীয়তার উপর ভিত্তি করে বহু-ভাষিক অডিও সংগ্রহ, অডিও ট্রান্সক্রিপশন এবং অডিও টীকা পরিষেবাগুলি অফার করি, যখন কাঙ্ক্ষিত অভিপ্রায়, উচ্চারণ এবং জনসংখ্যার বন্টন সম্পূর্ণরূপে কাস্টমাইজ করা হয়।
স্ক্রিপ্টেড বক্তৃতা সংগ্রহ
স্বতঃস্ফূর্ত বক্তৃতা সংগ্রহ
অডিও ডেটা ট্রান্সক্রিপশন
ডেটা লেবেলিং এবং টীকা
Shaip আপনাকে আপনার কথোপকথনমূলক এআই প্ল্যাটফর্মকে সঠিকভাবে প্রশিক্ষণ দিতে দেয় যাতে এটি করতে পারে:
- একাধিক চ্যানেল জুড়ে নির্বিঘ্নে কথা বলুন, পাঠ্য করুন এবং চ্যাট করুন৷
- চ্যাট, ভয়েস ট্রান্সক্রিপ্ট, লেনদেন ইত্যাদির আকারে বিদ্যমান মিথস্ক্রিয়া থেকে শিখুন এবং এই শিক্ষার উপর ভিত্তি করে পরামর্শ ও কথোপকথন করুন।
- মানুষের কথার পেছনের অভিপ্রায় বুঝুন এবং মানুষের ভাষা বোঝার ক্ষেত্রে অস্পষ্টতা দূর করুন।
- একের পর এক ভিত্তিতে আপনার সাথে ইন্টারঅ্যাক্ট করুন এবং ব্যবহারকারীদের সনাক্ত করতে এবং অতীতের কথোপকথনগুলি মনে রাখার জন্য প্রশিক্ষিত হতে পারে৷
কথোপকথনমূলক এআই প্রশিক্ষণ ডেটাতে বিশ্ব নেতা
100+ ভাষায় অডিও ডেটার ঘন্টা - উত্স, প্রতিলিপি এবং টীকা
স্পিচ ডেটা লাইসেন্সিং
20+ ভাষা এবং উপভাষায় 40k+ ঘন্টা স্পিচ ডেটা বিভিন্ন ডোমেন থেকে 55+ বিষয়ের পরিসীমা কভার করে যেমন, কল-সেন্টার, বিতর্ক, সাধারণ কথোপকথন, বক্তৃতা, পডকাস্ট ইত্যাদি।
বক্তৃতা ডেটা সংগ্রহ
আপনার AI প্রয়োজনীয়তা অনুসারে কাস্টমাইজ করা সারা বিশ্ব থেকে 2 টিরও বেশি ভাষায় অডিও এবং স্পিচ ডেটা (একক শব্দ, 100-ব্যক্তি কথোপকথন, মানব-বট চ্যাট) সংগ্রহ করুন।
স্পিচ ডেটা ট্রান্সক্রিপশন
গ্যারান্টিযুক্ত TAT, নির্ভুলতা এবং সঞ্চয় সহ 30,000 সহযোগীদের একটি শক্তিশালী কর্মীর মাধ্যমে খরচ কার্যকর অডিও ট্রান্সক্রিপশন বা অডিও টীকা
অডিও সংগ্রহ এবং অডিও টীকা পরিষেবার সাথে আপনার কথোপকথনমূলক AI অ্যাপ বিকাশকে ত্বরান্বিত করুন
শাইপ অ্যাডভান্টেজ
স্কেল
আমরা আপনার প্রয়োজনীয়তার উপর ভিত্তি করে একাধিক ভাষা এবং উপভাষায় বিশ্বজুড়ে অডিও ডেটা উৎস, স্কেল এবং সরবরাহ করতে পারি।
অভিজ্ঞতা
সঠিক এবং নিরপেক্ষ ডেটা সংগ্রহ, ট্রান্সক্রিপশন, এবং গোল্ড-স্ট্যান্ডার্ড টীকা সম্পর্কিত আমাদের সঠিক দক্ষতা রয়েছে।
নেটওয়ার্ক
30,000+ যোগ্য অবদানকারীদের একটি নেটওয়ার্ক, যাদেরকে এআই প্রশিক্ষণ মডেল এবং স্কেল-আপ পরিষেবাগুলি তৈরি করার জন্য দ্রুত ডেটা সংগ্রহের কাজ দেওয়া যেতে পারে।
প্রযুক্তিঃ
আমাদের কাছে একটি সম্পূর্ণ AI-ভিত্তিক প্ল্যাটফর্ম রয়েছে যার মালিকানাধীন সরঞ্জাম এবং প্রক্রিয়াগুলি 24*7 রাউন্ড ওয়ার্কফ্লো ম্যানেজমেন্টকে কাজে লাগাতে পারে।
তত্পরতা
আমরা খুব দ্রুত গ্রাহকের প্রয়োজনীয়তার পরিবর্তনের সাথে খাপ খাইয়ে নিই এবং প্রতিযোগিতার তুলনায় 5-10 গুণ দ্রুত গুণমানের স্পিচ ডেটা সহ AI বিকাশকে ত্বরান্বিত করতে সাহায্য করি।
নিরাপত্তা
আমরা ডেটা নিরাপত্তা এবং গোপনীয়তাকে সর্বোচ্চ গুরুত্ব দেই এবং অত্যন্ত নিয়ন্ত্রিত সংবেদনশীল ডেটা পরিচালনা করার জন্যও প্রত্যয়িত।
আমরা যা সেরা করি
প্রশিক্ষণ ডেটা
সময়ের একটি ভগ্নাংশে সর্বোচ্চ মানের লেবেলযুক্ত ডেটা পান। এটি স্বর্ণ-মান, নির্ভরযোগ্য এবং পারফরম্যান্সের সর্বোচ্চ স্তর অর্জনের জন্য আপনার AI এবং ML মডেলগুলিকে প্রশিক্ষণ দেওয়ার জন্য প্রস্তুত৷
ডেটা সংগ্রহ, লেবেলিং এবং টীকা
Shaip-এর মাধ্যমে আপনি 15+ বছরের মানের ডেটা সংগ্রহ, প্রতিলিপি এবং টীকা করার ক্ষেত্রে প্রমাণিত দক্ষতা পান। আমাদের বিশ্বব্যাপী শ্রমশক্তির সাহায্যে আমরা সারা বিশ্ব থেকে ডেটা সংগ্রহ করতে পারি, তারপর আপনার ডেটার জন্য প্রয়োজনীয় দক্ষতার স্তর এবং দক্ষতার নিখুঁত পরিমাণ সহ লেবেলিং এবং টীকা পরিষেবা প্রদান করতে পারি।
ডেটা ক্যাটালগ এবং লাইসেন্সিং
আমাদের লক্ষ লক্ষ ডেটাসেটের বিশাল ইনভেনটরি দিয়ে আপনি প্রয়োজন অনুযায়ী সংগ্রহ এবং সংগঠিত করতে পারেন। তারপরে আমরা আপনার নির্দিষ্ট AI এবং ML ব্যবহারের প্রয়োজনীয়তার জন্য সেই গুণমানের ডেটা লাইসেন্স করতে পারি। এছাড়াও, যদি আপনি নিজে এটি তৈরি করেন তবে এই ডেটা খরচের একটি ভগ্নাংশে উপলব্ধ।
আপনার নিজস্ব ডেটা সেট তৈরি করতে চান?
আপনার অনন্য এআই সমাধানের জন্য আমরা কীভাবে একটি কাস্টম ডেটা সেট সংগ্রহ করতে পারি তা জানতে এখনই আমাদের সাথে যোগাযোগ করুন।