আপনার AI এর জন্য সবচেয়ে বিশ্বস্ত স্পিচ ডেটা সংগ্রহ পরিষেবা
আমাদের অডিও এবং স্পিচ ডেটা সংগ্রহ পরিষেবার মাধ্যমে আপনার NLP মডেল, VA, TTS প্রোটোটাইপ এবং আরও অনেক কিছুকে মানসম্পন্ন কথোপকথনমূলক ডেটা দিয়ে প্রশিক্ষণ দিন
কোনো বাধা ছাড়াই অডিও ডেটা পাইপলাইন আবিষ্কার করুন
বৈশিষ্ট্যযুক্ত ক্লায়েন্ট
পেশাদার অডিও / ভয়েস ডেটা সংগ্রহ পরিষেবা
যে কোন বিষয়। কোনো দৃশ্যকল্প.
Shaip-এ, আমাদের দক্ষতা বিভিন্ন AI/ML প্রয়োজনীয়তার জন্য ডিজাইন করা উচ্চ-মানের স্পিচ ডেটাসেট তৈরিতে নিহিত। আমরা আমাদের ডেটাসেটগুলিকে ব্যাপক এবং অভিযোজনযোগ্য করে বিভিন্ন সেটিংসে ভাষা এবং রেকর্ডের একটি বিস্তৃত পরিসর অফার করি। ওসর্বনিম্ন সম্ভাব্য সময়ে কাস্টম স্পিচ ডেটার সর্বোচ্চ ভলিউম সহ মডেলগুলিকে খাওয়ানোর দিকে আপনার ফোকাস। বোর্ডে আমাদের সাথে, আপনি আশা করতে পারেন:
- নির্ভুলতা উন্নত করতে উচ্চ মানের বহুভাষিক অডিও / ভয়েস ডেটা কিউরেট করা হয়েছে
- ডোমেন নির্দিষ্টতার সর্বোচ্চ সম্ভাব্য স্তর টিবিভিন্ন দৃশ্যকল্প arget সেটআপ
- বিভিন্ন জনসংখ্যা এবং উল্লম্ব অনুসারে আপনার ML মডেল স্কেল করুন
- রেকর্ডিং পরিবেশ: স্টুডিও কোয়ালিটি, ন্যূনতম ব্যাকগ্রাউন্ড শব্দ সহ ক্রিস্টাল-ক্লিয়ার অডিও বৈশিষ্ট্যযুক্ত, এবং প্রাকৃতিক পরিবেশ, যেখানে রেকর্ডিং বাস্তব-বিশ্বের পরিস্থিতি অনুকরণ করতে পরিবেষ্টিত শব্দগুলিকে অন্তর্ভুক্ত করে।
100+
55K + +
আওয়ার অফ স্পিচ ডেটা
250+
প্রকল্প
60+
ভাষা (100+ উপভাষা)
8 / 16 / 44 / 48 kHz
নমুনা রেট
আমাদের দক্ষতাঃ
স্মার্ট এনএলপি মডেলের জন্য অডিও ডেটা সারিবদ্ধ করুন
Shaip 100+ টিরও বেশি ভাষায় এন্ড-টু-এন্ড স্পিচ/অডিও ডেটা সংগ্রহ পরিষেবা অফার করে যাতে ভয়েস-সক্ষম প্রযুক্তিগুলি সারা বিশ্ব জুড়ে বিভিন্ন শ্রোতাদেরকে পূরণ করতে সক্ষম করে। আমরা যে কোনও সুযোগ এবং আকারের প্রকল্পগুলিতে কাজ করতে পারি; বিদ্যমান অফ-দ্য-শেল্ফ অডিও ডেটাসেটের লাইসেন্স দেওয়া থেকে শুরু করে কাস্টম অডিও ডেটা সংগ্রহ পরিচালনা করা, অডিও ট্রান্সক্রিপশন এবং টীকা। আপনার বক্তৃতা ডেটা সংগ্রহের প্রকল্প যত বড়ই হোক না কেন, উপভাষা, টোন এবং ভাষাকে লক্ষ্য করে উচ্চ-মানের NLP ডেটাসেট তৈরি করতে আমরা আপনার প্রয়োজন অনুসারে অডিও সংগ্রহ পরিষেবাগুলি কাস্টমাইজ করতে পারি। ভয়েস-সক্ষম বুদ্ধিমান সেটআপের জন্য আমাদের স্পিচ ডেটাসেট এবং অডিও ডেটা সংগ্রহের সংস্থানগুলির বিস্তৃত পরিসর থেকে চয়ন করুন৷
মনোলোগ স্ক্রিপ্টেড এবং স্বতঃস্ফূর্ত বক্তৃতা
এটি একটি একক স্পিকার থেকে বক্তৃতা প্রক্রিয়াকরণের উপর দৃষ্টি নিবদ্ধ করে। একক-চ্যানেল অডিও ফাইলগুলিতে ফিড করার জন্য স্ক্রিপ্টযুক্ত প্রম্পটগুলি ব্যবহার করুন, অনন্য বক্তৃতা প্যাটার্ন, টোন এবং সেই ব্যক্তির জন্য নির্দিষ্ট সূক্ষ্মতাগুলি ক্যাপচার নিশ্চিত করুন৷
সংলাপ স্ক্রিপ্ট এবং স্বতঃস্ফূর্ত বক্তৃতা
দুই-ব্যক্তির মিথস্ক্রিয়া, দ্বৈত-চ্যানেল ফাইল এবং প্রতিলিপিকৃত সংস্থানগুলির মাধ্যমে বহুভাষিক এক্সপোজার সহ বাস্তব-বিশ্বের কথোপকথন এবং সংলাপের প্রতিলিপি করা।
দল/মুতি-দল
কথোপকথন
বহু-ব্যক্তি আলোচনা, গোষ্ঠীগত গতিশীলতা, ওভারল্যাপ এবং বিভিন্ন টোন ক্যাপচার করা যাতে স্পিচ মডেলগুলিকে সঠিকভাবে প্রশিক্ষণ দেওয়া যায়।
জাগ্রত শব্দ / মূল বাক্যাংশ / উচ্চারণ সংগ্রহ৷
উন্নত প্রাকৃতিক ভাষা প্রক্রিয়াকরণ এবং বোঝার জন্য বৈচিত্র্যময়, সমৃদ্ধ এবং প্রামাণিক উচ্চারণ ব্যবহার করে মূল বাক্যাংশগুলি সনাক্ত করতে বা একই অর্থের সাথে শব্দ বা উচ্চারণগুলিকে জাগ্রত করতে প্রশিক্ষণ দিন।
অ্যাকোস্টিক ডেটা
সংগ্রহ
আমরা পেশাদারভাবে স্টুডিও-মানের অডিও ডেটা রেকর্ড করতে পারি তা রেস্তোরাঁ, অফিস, বা বাড়ি বা বিভিন্ন পরিবেশ এবং ভাষা থেকে, যেখানে একটি বিস্তৃত অ্যাকোস্টিক পরিসর (বিস্তৃত সাউন্ড ডেটাসেট) কভার করা হয়।
স্বয়ংক্রিয় স্পিচ রিকগনিশন (ASR)
জনসংখ্যার বিস্তৃত অ্যারের থেকে, অত্যাধুনিক বৈচিত্র্যময় বক্তৃতা/অডিও ডেটাসেটগুলিতে অ্যাক্সেসের মাধ্যমে আপনার স্বয়ংক্রিয় স্পিচ রিকগনিশন (ASR) সিস্টেমগুলির নির্ভুলতা উন্নত করুন৷
বহুভাষিক বক্তৃতা/অডিও প্রশিক্ষণ ডেটা
আমাদের দক্ষ ভাষা পেশাদাররা, সারা বিশ্বে বিভিন্ন ভাষা এবং উপভাষায় বহুভাষিক অডিও/স্পিচ ডেটা অফার করে। এই প্রচেষ্টা বিশ্বব্যাপী যোগাযোগ বৃদ্ধি করে এবং ভাষার বাধা দূর করে, আরও অন্তর্ভুক্তিমূলক এবং কার্যকর AI সমাধানে অবদান রাখে।
পাঠ্য থেকে স্পিচ
(টিটিএস)
আমাদের গ্লোবাল ওয়ার্কফোর্সের সাহায্যে একটি টেক্সট-টু-স্পিচ (TTS) বহুভাষিক মডেল তৈরি করুন, যারা আপনাকে 150+ ভাষা এবং উপভাষায় বক্তৃতা ডেটা সংগ্রহ করতে সাহায্য করে আপনার AI মডেলগুলিকে ইন-কার কন্ট্রোল থেকে চ্যাটবট এবং উচ্চ-সহ শিক্ষার সমাধানগুলি উন্নত করতে। মানের অডিও ডেটা।
কল সেন্টার
কথোপকথন
স্প্যানিশ, জার্মান, আমেরিকান ইংরেজি, বাংলা, জাপানি, চাইনিজ এবং হিন্দির মতো অসংখ্য ভাষা সমর্থন করে এজেন্ট এবং ক্লায়েন্টদের মধ্যে প্রকৃত বিনিময়।
সাফল্যের গল্প
3টি ভাষায় 8k ঘন্টার বেশি ডেটা সহ কথোপকথনমূলক AI ডেটাসেট
ভারতীয় ভাষার জন্য একটি বহুভাষিক প্ল্যাটফর্ম তৈরি করার জন্য, ক্লায়েন্ট একাধিক ভারতীয় ভাষায় বৃহৎ ডেটাসেট সংগ্রহ, সেগমেন্ট এবং প্রতিলিপি করার জন্য Shaip-এর সাথে অংশীদারিত্ব করেছে। এটি কার্যকর বক্তৃতা মডেলগুলি বিকাশে সহায়তা করবে যা ক্লায়েন্টের উদ্ভাবনী নতুন প্ল্যাটফর্মকে শক্তিশালী করতে পারে।
সমস্যা: 3,000টি ভারতীয় ভাষায় 8 ঘন্টার বেশি অডিও ডেটা সংগ্রহ করা হয়েছে, স্বয়ংক্রিয় বক্তৃতা শনাক্তকরণ বিকাশের জন্য বিভক্ত এবং প্রতিলিপি করা হয়েছে।
সমাধান: আমরা ডেটা সংগ্রহ, বিভাজন, ট্রান্সক্রিপশন এবং মেটাডেটা সহ JSON ফাইল সরবরাহ করেছি। আমরা ক্লায়েন্টের বক্তৃতা প্রযুক্তি প্রকল্পের জন্য 3000টি ভারতীয় ভাষায় 8 ঘন্টার অডিও ডেটা সংগ্রহ করেছি।
আপনার বিশ্বস্ত স্পিচ ডেটা কালেকশন পার্টনার হিসেবে Shaip বেছে নেওয়ার কারণ
সম্প্রদায়
নিবেদিত এবং প্রশিক্ষিত দল:
- ডেটা তৈরি, লেবেলিং এবং QA-এর জন্য 30,000+ সহযোগী
- শংসাপত্রযুক্ত প্রকল্প ব্যবস্থাপনা দল
- অভিজ্ঞ পণ্য উন্নয়ন দল
- ট্যালেন্ট পুল সোর্সিং এবং অনবোর্ডিং দল
প্রক্রিয়া
সর্বোচ্চ প্রক্রিয়া দক্ষতা নিশ্চিত করা হয়:
- শক্তিশালী 6 সিগমা স্টেজ-গেট প্রক্রিয়া
- 6টি সিগমা ব্ল্যাক বেল্টের একটি উত্সর্গীকৃত দল - মূল প্রক্রিয়ার মালিক এবং গুণমান সম্মতি
- ক্রমাগত উন্নতি এবং প্রতিক্রিয়া লুপ
প্ল্যাটফর্ম
পেটেন্ট প্ল্যাটফর্ম সুবিধা প্রদান করে:
- ওয়েব-ভিত্তিক এন্ড-টু-এন্ড প্ল্যাটফর্ম
- অনবদ্য গুণমান
- দ্রুত TAT
- বিরামহীন ডেলিভারি
সম্প্রদায়
নিবেদিত এবং প্রশিক্ষিত দল:
- ডেটা তৈরি, লেবেলিং এবং QA-এর জন্য 30,000+ সহযোগী
- শংসাপত্রযুক্ত প্রকল্প ব্যবস্থাপনা দল
- অভিজ্ঞ পণ্য উন্নয়ন দল
- ট্যালেন্ট পুল সোর্সিং এবং অনবোর্ডিং দল
প্রক্রিয়া
সর্বোচ্চ প্রক্রিয়া দক্ষতা নিশ্চিত করা হয়:
- শক্তিশালী 6 সিগমা স্টেজ-গেট প্রক্রিয়া
- 6টি সিগমা ব্ল্যাক বেল্টের একটি উত্সর্গীকৃত দল - মূল প্রক্রিয়ার মালিক এবং গুণমান সম্মতি
- ক্রমাগত উন্নতি এবং প্রতিক্রিয়া লুপ
প্ল্যাটফর্ম
পেটেন্ট প্ল্যাটফর্ম সুবিধা প্রদান করে:
- ওয়েব-ভিত্তিক এন্ড-টু-এন্ড প্ল্যাটফর্ম
- অনবদ্য গুণমান
- দ্রুত TAT
- বিরামহীন ডেলিভারি
অফ-দ্য-শেল্ফ স্পিচ/অডিও ডেটাসেট
বিস্তারিত | কর্পাস আইডি (অনন্য) | কী খুঁজতে হবে | ভাষা ডেটাসেট | ভাষার কোড | নমুনা হার | ডেটাসেটের প্রকার | মোট অডিও ঘন্টা | সংক্ষিপ্ত বিবরণ | ডেটাসেটের বিবরণ | অডিও চ্যানেল | রেকর্ডিং প্ল্যাটফর্ম | আমরা (%) | অডিও ফর্ম্যাট | ট্রান্সক্রিপশন ফরম্যাট | ব্যবহারের ক্ষেত্রে | স্পিকার সংখ্যা | সিটিএ |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
নিউ ইয়র্ক ইংরেজি_GC_8 | নিউ ইয়র্ক ইংরেজি | নিউ ইয়র্ক ইংরেজি | en_US | 8 ২ kHz | সাধারণ কথোপকথন | 107 | নিউ ইয়র্ক ইংরেজি সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 118, পুরুষ 114, অজানা 0 | যোগাযোগ | |
রাশিয়ান_SM_48 | রাশিয়ান | রাশিয়ান | RU-রাবি | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 2,398 | রাশিয়ান লিপিবদ্ধ মনোলোগ | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1689 পুরুষ 1937 অজানা 214 | যোগাযোগ | |
পাঞ্জাবি_এমএ | পাঞ্জাবি | পাঞ্জাবি (পাইপলাইনে) | পাঞ্জাবি | মিডিয়া অডিও | 40 | পাঞ্জাবি (পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
পাঞ্জাবি_জিসি | পাঞ্জাবি | পাঞ্জাবি (পাইপলাইনে) | পাঞ্জাবি | সাধারণ কথোপকথন | 100 | পাঞ্জাবি (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
পাঞ্জাবি_CC_8 | পাঞ্জাবি | পাঞ্জাবি (পাইপলাইনে) | পাঞ্জাবি | কল-সেন্টার | 60 | পাঞ্জাবি (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
পোলিশ পোল্যান্ড_SM_48 | পোলিশ (পোল্যান্ড) | পোলিশ (পোল্যান্ড) | PL-পিএল | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 1,482 | পোলিশ পোল্যান্ড - লিপিবদ্ধ মনোলোগ | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1324 পুরুষ 701 অজানা 24 | যোগাযোগ | |
পোলিশ_MA_16 | পোলিশ | পোলিশ | pl_PL | 16 ২ kHz | মিডিয়া অডিও | 269 | পোলিশ মিডিয়া অডিও | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 173 পুরুষ 354 অজানা 6 | যোগাযোগ | |
ওড়িয়া_এমএ | ওড়িয়া | ওড়িয়া (পাইপলাইনে) | or_IN | মিডিয়া অডিও | 40 | ওড়িয়া (পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
ওড়িয়া_জিসি | ওড়িয়া | ওড়িয়া (পাইপলাইনে) | or_IN | সাধারণ কথোপকথন | 100 | ওড়িয়া (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
ওড়িয়া_CC_8 | ওড়িয়া | ওড়িয়া (পাইপলাইনে) | or_IN | কল-সেন্টার | 60 | ওড়িয়া (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
নিউজিল্যান্ড_MA_16 | নিউজিল্যান্ড ইংরেজি | নিউজিল্যান্ড ইংরেজি | en_NZ | 16 ২ kHz | মিডিয়া অডিও | 400 | নিউজিল্যান্ড ইংলিশ মিডিয়া অডিও | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 367, পুরুষ 678, অজানা 26 | যোগাযোগ | |
নিউজিল্যান্ড_GC_8 | নিউজিল্যান্ড ইংরেজি | নিউজিল্যান্ড ইংরেজি | en_NZ | 8 ২ kHz | সাধারণ কথোপকথন | 148 | নিউজিল্যান্ড ইংরেজি সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 167, পুরুষ 121, অজানা 4 | যোগাযোগ | |
নিউ ইয়র্ক ইংরেজি_MA_16 | নিউ ইয়র্ক ইংরেজি | নিউ ইয়র্ক ইংরেজি | en_US | 16 ২ kHz | মিডিয়া অডিও | 140 | নিউ ইয়র্ক ইংলিশ মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 66, পুরুষ 230, অজানা 11 | যোগাযোগ | |
স্কটিশ_GC_8 | স্কটিশ (ইংরেজি উচ্চারণ) | স্কটিশ (ইংরেজি উচ্চারণ) | en_AB | 8 ২ kHz | সাধারণ কথোপকথন | 292 | স্কটিশ সাধারণ কথোপকথনের ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 285, পুরুষ 260, অজানা 3 | যোগাযোগ | |
নিউ ইয়র্ক ইংরেজি_CC_8 | নিউ ইয়র্ক ইংরেজি | নিউ ইয়র্ক ইংরেজি | en_US | 8 ২ kHz | কল-সেন্টার | 103 | নিউ ইয়র্ক ইংরেজি কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 610, পুরুষ 532, অজানা 0 | যোগাযোগ | |
নেদারল্যান্ডস_এসএম_৪৮ | ডাচ | ডাচ | nl এর-এন এল | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 1,205 | ডাচ স্ক্রিপ্টেড মনোলোগ | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1285 পুরুষ 531 অজানা 3 | যোগাযোগ | |
Mexican_SM_48 | স্পেনীয় (মেক্সিকো) | স্পেনীয় (মেক্সিকো) | স্প্যানিশ ভাষায়-এমএক্স | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 1,492 | মেক্সিকান স্প্যানিশ লিপিবদ্ধ মনোলোগ | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1016 পুরুষ 1069 অজানা 95 | যোগাযোগ | |
মারাঠি_এমএ | মারাঠি | মারাঠি (পাইপলাইনে) | mr_IN | মিডিয়া অডিও | 40 | মারাঠি (পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
মারাঠি_জিসি | মারাঠি | মারাঠি (পাইপলাইনে) | mr_IN | সাধারণ কথোপকথন | 100 | মারাঠি (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
মারাঠি_CC_8 | মারাঠি | মারাঠি (পাইপলাইনে) | mr_IN | কল-সেন্টার | 60 | মারাঠি (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
মালায়লাম_এমএ | মালায়ালম | মালায়লাম (পাইপলাইনে) | ml_IN | মিডিয়া অডিও | 40 | মালায়লাম (পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
মালায়লাম_জিসি | মালায়ালম | মালায়লাম (পাইপলাইনে) | ml_IN | সাধারণ কথোপকথন | 100 | মালায়লাম (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
মালায়লাম_CC_8 | মালায়ালম | মালায়লাম (পাইপলাইনে) | ml_IN | কল-সেন্টার | 60 | মালায়ালাম (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
মালয়_MA_16 | মালে | মালে | ms_MY | 16 ২ kHz | মিডিয়া অডিও | 344 | মালয় মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 236, পুরুষ 626, অজানা 47 | যোগাযোগ | |
মালয়_GC_8 | মালে | মালে | ms_MY | 8 ২ kHz | সাধারণ কথোপকথন | 266 | মালয় সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, মালয়েশিয়ায় মালয় | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 316, পুরুষ 176, অজানা 0 | যোগাযোগ | |
তেলুগু_GC_8 | তেলুগু | তেলুগু | te_IN | 8 ২ kHz | সাধারণ কথোপকথন | 553 | তেলেগু সাধারণ কথোপকথনের ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 574, পুরুষ 564, অজানা 0 | যোগাযোগ | |
ইউকে ইংরেজি_WW_16 | ইউকে ইংরাজী | ইউকে ইংরাজী | en_uk | 16 ২ kHz | জাগ্রত শব্দ | 200 স্পিকার | ওয়েক ওয়ার্ড ইউকে ইংরেজি | তথ্যের মূল বাক্যাংশ সংগ্রহ
| 1 চ্যানেল | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | লিঙ্গ: 50% পুরুষ, 50% মহিলা, +/- 10%। | যোগাযোগ | |
ওয়েলশ_জিসি_8 | ওয়েলশ (ইংরেজি উচ্চারণ) | ওয়েলশ (ইংরেজি উচ্চারণ) | en_WL | 8 ২ kHz | সাধারণ কথোপকথন | 278 | ওয়েলশ সাধারণ কথোপকথন ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 270, পুরুষ 324, অজানা 0 | যোগাযোগ | |
ভিয়েতনামী_MA_16 | ভিয়েতনামী | ভিয়েতনামী | vi_VN | 16 ২ kHz | মিডিয়া অডিও | 257 | ভিয়েতনামী মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 249, পুরুষ 200, অজানা 45 | যোগাযোগ | |
ভিয়েতনামী_GC_8 | ভিয়েতনামী | ভিয়েতনামী | vi_VN | 8 ২ kHz | সাধারণ কথোপকথন | 295 | ভিয়েতনামী সাধারণ কথোপকথন ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, উত্তর (যেমন, হ্যানয়), মধ্য এবং দক্ষিণ (যেমন, হো চি মিন সিটি)। | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 400, পুরুষ 380, অজানা 2 | যোগাযোগ | |
তুর্কি তুরস্ক_SM_48 | তুর্কি তুরস্ক | তুর্কি তুরস্ক | TR-টিআর | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 2,027 | তুর্কি তুরস্ক | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1561 পুরুষ 1241 অজানা 31 | যোগাযোগ | |
থাই_এমএ_৮ | থাই | থাই | th_TH | 16 ২ kHz | মিডিয়া অডিও | 173 | থাই মিডিয়া অডিও | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 143, পুরুষ 502, অজানা 26 | যোগাযোগ | |
থাই_জিসি_8 | থাই | থাই | th_TH | 8 ২ kHz | সাধারণ কথোপকথন | 183 | থাই সাধারণ কথোপকথন | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, বন্ধুদের মধ্যে ব্যবহৃত একটি অনানুষ্ঠানিক রেজিস্টার | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 338, পুরুষ 96, অজানা 8 | যোগাযোগ | |
তেলেগু_এমএ | তেলুগু | তেলেগু (পাইপলাইনে) | te_IN | মিডিয়া অডিও | 20 | তেলুগু (পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
তেলুগু_জিসি | তেলুগু | তেলেগু (পাইপলাইনে) | te_IN | সাধারণ কথোপকথন | 50 | তেলুগু (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
তেলুগু_CC_8 | তেলুগু | তেলেগু (পাইপলাইনে) | te_IN | কল-সেন্টার | 30 | তেলুগু (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
তেলুগু_MA_16 | তেলুগু | তেলুগু | te_IN | 16 ২ kHz | মিডিয়া অডিও | 648 | তেলেগু মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 207, পুরুষ 963, অজানা 2 | যোগাযোগ | |
কোরিয়ান_SM_48 | কোরিয়ান | কোরিয়ান | কো-কে আর | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 1,955 | কোরিয়ান লিপিবদ্ধ মনোলোগ | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1195 পুরুষ 1134 অজানা 122 | যোগাযোগ | |
তামিল_এমএ | তামিল | তামিল (পাইপলাইনে) | ta_IN | মিডিয়া অডিও | 40 | তামিল (পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
তামিল_জিসি | তামিল | তামিল (পাইপলাইনে) | ta_IN | সাধারণ কথোপকথন | 100 | তামিল (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
তামিল_CC_8 | তামিল | তামিল (পাইপলাইনে) | ta_IN | কল-সেন্টার | 60 | তামিল (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
সুইডিশ_MA_16 | সুইডিশ | সুইডিশ | sv_SE | 16 ২ kHz | মিডিয়া অডিও | 278 | সুইডিশ মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 195, পুরুষ 500, অজানা 21 | যোগাযোগ | |
সুইডিশ_CC_8 | সুইডিশ | সুইডিশ | sv_SE | 8 ২ kHz | কল-সেন্টার | 250 | সুইডিশ কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1581, পুরুষ 727, অজানা 2 | যোগাযোগ | |
সোয়াহিলি_MA_16 | সোয়াহিলি | সোয়াহিলি | sw_KE | 16 ২ kHz | মিডিয়া অডিও | 265 | সোয়াহিলি মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 118, পুরুষ 493, অজানা 25 | যোগাযোগ | |
সোয়াহিলি_CC_8 | সোয়াহিলি | সোয়াহিলি | sw_KE | 8 ২ kHz | কল-সেন্টার | 230 | সোয়াহিলি কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 611, পুরুষ 833, অজানা 0 | যোগাযোগ | |
দক্ষিণ আফ্রিকান ইংরেজি_MA_16 | দক্ষিণ আফ্রিকান ইংরেজি | দক্ষিণ আফ্রিকান ইংরেজি | en_ZA | 16 ২ kHz | মিডিয়া অডিও | 251 | দক্ষিণ আফ্রিকান ইংরেজি মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 235, পুরুষ 432, অজানা 36 | যোগাযোগ | |
দক্ষিণ আফ্রিকান ইংরেজি_CC_8 | দক্ষিণ আফ্রিকান ইংরেজি | দক্ষিণ আফ্রিকান ইংরেজি | en_ZA | 8 ২ kHz | কল-সেন্টার | 261 | দক্ষিণ আফ্রিকান ইংরেজি কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1274, পুরুষ 935, অজানা 1 | যোগাযোগ | |
সিঙ্গাপুর_MA_16 | সিঙ্গাপুর ইংরেজি | সিঙ্গাপুর ইংরেজি | en_SG | 16 ২ kHz | মিডিয়া অডিও | 247 | সিঙ্গাপুর মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 160, পুরুষ 455, অজানা 37 | যোগাযোগ | |
সিঙ্গাপুর_CC_8 | সিঙ্গাপুর ইংরেজি | সিঙ্গাপুর ইংরেজি | en_SG | 8 ২ kHz | কল-সেন্টার | 218 | সিঙ্গাপুর কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 2139, পুরুষ 884, অজানা 21 | যোগাযোগ | |
বোস্টন_CC_8 | বোস্টন ইংরেজি | বোস্টন ইংরেজি | en_US | 8 ২ kHz | কল-সেন্টার | 177 | বোস্টন কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 605, পুরুষ: 711, এবং অজানা: 0 | যোগাযোগ | |
ইংরেজি গভীর দক্ষিণ_CC_8 | ইংরেজি ডিপ সাউথ | ইংরেজি ডিপ সাউথ | en_US | 8 ২ kHz | কল-সেন্টার | 151 | ইংরেজি ডিপ সাউথ কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 221, পুরুষ 1004, অজানা 7 | যোগাযোগ | |
ডেনিশ_SM_48 | ডেনমার্কের | ডেনমার্কের | দা-ডিকে | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 2,579 | ডেনিশ স্ক্রিপ্টেড মনোলোগ | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড রেঞ্জের মধ্যে পড়ে, ডেনমার্ক থেকে ডেনিশ | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1551 পুরুষ 1233 অজানা 42 | যোগাযোগ | |
ডেনিশ_MA_16 | ডেনমার্কের | ডেনমার্কের | da_DK | 16 ২ kHz | মিডিয়া অডিও | 664 | ডেনিশ মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 369, পুরুষ: 864, অজানা: 27 | যোগাযোগ | |
ডেনিশ_GC_8 | ডেনমার্কের | ডেনমার্কের | da_DK | 8 ২ kHz | সাধারণ কথোপকথন | 372 | ডেনিশ সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 311, পুরুষ: 417, অজানা: 0 | যোগাযোগ | |
চীনা ঐতিহ্যবাহী_SM_48 | প্রথাগত চীনা | প্রথাগত চীনা | zh-TW | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 1,028 | প্রথাগত চীনা | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1069 পুরুষ 262 অজানা 3 | যোগাযোগ | |
চাইনিজ সরলীকৃত_SM_48 | সরলীকৃত চীনা | সরলীকৃত চীনা | zh-cn | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 2,762 | সরলীকৃত চীনা | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1920 পুরুষ 1535 অজানা 270 | যোগাযোগ | |
চাইনিজ_MA_16 | চাইনিজ ইংরেজি | চাইনিজ ইংরেজি | en_US | 16 ২ kHz | মিডিয়া অডিও | 249 | চীনা মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 126, পুরুষ: 346 এবং অজানা: 6 | যোগাযোগ | |
চাইনিজ_CC_8 | চাইনিজ ইংরেজি | চাইনিজ ইংরেজি | en_US | 8 ২ kHz | কল-সেন্টার | 169 | চাইনিজ কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 1790, পুরুষ: 523 এবং অজানা: 13 | যোগাযোগ | |
কানাডিয়ান_SM_48 | কানাডিয়ান ফরাসি | কানাডিয়ান ফরাসি | FR-সিএ | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 1,222 | কানাডিয়ান ফরাসি | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 974 পুরুষ 631 অজানা 1 | যোগাযোগ | |
বোস্টন_MA_16 | বোস্টন ইংরেজি | বোস্টন ইংরেজি | en_US | 16 ২ kHz | মিডিয়া অডিও | 93 | বোস্টন মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 43, পুরুষ: 181, এবং অজানা: 2 | যোগাযোগ | |
বোস্টন_জিসি_8 | বোস্টন ইংরেজি | বোস্টন ইংরেজি | en_US | 8 ২ kHz | সাধারণ কথোপকথন | 32 | বোস্টন সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 53, পুরুষ: 83, এবং অজানা: 0 | যোগাযোগ | |
ইংরেজি গভীর দক্ষিণ_GC_8 | ইংরেজি ডিপ সাউথ | ইংরেজি ডিপ সাউথ | en_US | 8 ২ kHz | সাধারণ কথোপকথন | 56 | ইংরেজি গভীর দক্ষিণ সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 99, পুরুষ 31, অজানা 0 | যোগাযোগ | |
বাংলা_এমএ | বাঙালি | বাংলা (পাইপলাইনে) | bn_IN | মিডিয়া অডিও | 40 | বাংলা (পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
বাংলা_জিসি | বাঙালি | বাংলা (পাইপলাইনে) | bn_IN | সাধারণ কথোপকথন | 100 | বাংলা (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
বাংলা_CC_8 | বাঙালি | বাংলা (পাইপলাইনে) | bn_IN | কল-সেন্টার | 60 | বাংলা (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
অসমীয়া_এমএ | অসমিয়া | অসমীয়া (পাইপলাইনে) | as_IN | মিডিয়া অডিও | 40 | অসমীয়া (ইন পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
অসমীয়া_জি.সি | অসমিয়া | অসমীয়া (পাইপলাইনে) | as_IN | সাধারণ কথোপকথন | 100 | অসমীয়া (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
অসমীয়া_CC_8 | অসমিয়া | অসমীয়া (পাইপলাইনে) | as_IN | কল-সেন্টার | 60 | অসমীয়া (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
আরবি_এসএম_৪৮ | আরবি | আরবি | আরবী ভাষায়-এসএ | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 1,947 | আরবি লিপিবদ্ধ মনোলোগ | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 838 পুরুষ 1209 অজানা 78 | যোগাযোগ | |
আরবি_GC_8 | আরবি | আরবি | ar_AE | 8 ২ kHz | সাধারণ কথোপকথন | 292 | আরবি সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, উপসাগরীয় দেশ থেকে আরবি | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 171, পুরুষ: 534, এবং অজানা: 1 | যোগাযোগ | |
আফ্রিকান_MA_16 | আফ্রিকান্স | আফ্রিকান্স | af_ZA | 16 ২ kHz | মিডিয়া অডিও | 658 | আফ্রিকান মিডিয়া ফাইল | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 750, পুরুষ: 1278, এবং অজানা: 52 | যোগাযোগ | |
আফ্রিকান_জিসি_৮ | আফ্রিকান্স | আফ্রিকান্স | af_ZA | 8 ২ kHz | সাধারণ কথোপকথন | 368 | আফ্রিকান সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিওর সময়কাল (পরিসীমা) - 15-60 মিনিট, আফ্রিকাতে কথ্য আফ্রিকান | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 502, পুরুষ: 390, এবং অজানা: 2 | যোগাযোগ | |
en_US_MA_16 | আফ্রিকান আমেরিকান ভার্নাকুলার | আফ্রিকান আমেরিকান ভার্নাকুলার | en_US | 16 ২ kHz | মিডিয়া অডিও | 154 | আফ্রিকান আমেরিকান ভার্নাকুলার মিডিয়া ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 151, পুরুষ: 150, এবং অজানা: 10 | যোগাযোগ | |
HINGLISH_MA_16 | হিংলিশ | হিংলিশ | hg_IN | 16 ২ kHz | মিডিয়া অডিও | 216 | HINGLISH মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 75, পুরুষ 380, অজানা 0 | যোগাযোগ | |
কোরিয়ান_MA_16 | কোরিয়ান | কোরিয়ান | ko_KR | 16 ২ kHz | মিডিয়া অডিও | 204 | কোরিয়ান মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 70 পুরুষ 303, অজানা 25 | যোগাযোগ | |
কোরিয়ান_CC_8 | কোরিয়ান | কোরিয়ান | ko_KR | 8 ২ kHz | কল-সেন্টার | 107 | কোরিয়ান কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1086, পুরুষ 210, অজানা 4 | যোগাযোগ | |
কন্নড়_এমএ | কন্নড | কন্নড় (পাইপলাইনে) | kn_IN | মিডিয়া অডিও | 40 | কন্নড় (পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
কন্নড়_জিসি | কন্নড | কন্নড় (পাইপলাইনে) | kn_IN | সাধারণ কথোপকথন | 100 | কন্নড় (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
কন্নড়_CC_8 | কন্নড | কন্নড় (পাইপলাইনে) | kn_IN | কল-সেন্টার | 60 | কন্নড় (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
জাপানিজ_SM_48 | জাপানি | জাপানি | জাপানী ভাষায়-জেপি | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 2,335 | জাপানি লিপিবদ্ধ মনোলোগ | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1460 পুরুষ 1221 অজানা 194 | যোগাযোগ | |
আইরিশ_GC_8 | আইরিশ | আইরিশ | en_IE | 8 ২ kHz | সাধারণ কথোপকথন | 192 | আইরিশ সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 213, পুরুষ 153, অজানা 0 | যোগাযোগ | |
ইন্দোনেশিয়ান_MA_16 | ইন্দোনেশিয়াসম্বন্ধীয় | ইন্দোনেশিয়াসম্বন্ধীয় | আমি করেছিলাম | 16 ২ kHz | মিডিয়া অডিও | 643 | ইন্দোনেশিয়ান মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 746, পুরুষ 1507, অজানা 129 | যোগাযোগ | |
ইন্দোনেশিয়ান_GC_8 | ইন্দোনেশিয়াসম্বন্ধীয় | ইন্দোনেশিয়াসম্বন্ধীয় | আমি করেছিলাম | 8 ২ kHz | সাধারণ কথোপকথন | 496 | ইন্দোনেশিয়ান সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, বাহাসা ইন্দোনেশিয়ান | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 524, পুরুষ 454, অজানা 2 | যোগাযোগ | |
হিস্পানিক_MA_16 | হিস্পানিক ইংরেজি | হিস্পানিক ইংরেজি | en_US | 16 ২ kHz | মিডিয়া অডিও | 155 | হিস্পানিক কল মিডিয়া অডিও | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 140, পুরুষ 219, অজানা 5 | যোগাযোগ | |
হিস্পানিক_CC_8 | হিস্পানিক ইংরেজি | হিস্পানিক ইংরেজি | en_US | 8 ২ kHz | কল-সেন্টার | 212 | হিস্পানিক কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 822, পুরুষ 1262, অজানা 0 | যোগাযোগ | |
en_US_CC_8 | আফ্রিকান আমেরিকান ভার্নাকুলার | আফ্রিকান আমেরিকান ভার্নাকুলার | en_US | 8 ২ kHz | কল সেন্টার | 211 | আফ্রিকান আমেরিকান ভার্নাকুলার কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 612, পুরুষ: 1242, এবং অজানা: 12 | যোগাযোগ | |
HINGLISH_CC_8 | হিংলিশ | হিংলিশ | hg_IN | 8 ২ kHz | কল-সেন্টার | 208 | HINGLISH কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 822, পুরুষ 1262, অজানা 0 | যোগাযোগ | |
হিন্দি_এসএম_৪৮ | হিন্দি | হিন্দি | হাই-ইন | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 2,867 | হিন্দি লিপিবদ্ধ মনোলোগ | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1977 পুরুষ 1864 অজানা 147 | যোগাযোগ | |
হিন্দি_MA_16 | হিন্দি | হিন্দি | hi_IN | 16 ২ kHz | মিডিয়া অডিও | 219 | হিন্দি মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 83, পুরুষ 309, অজানা 0 | যোগাযোগ | |
হিব্রু_MA_16 | হিব্রু | হিব্রু | তিনি_আইএল | 16 ২ kHz | মিডিয়া অডিও | 427 | হিব্রু মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 361, পুরুষ 513, অজানা 13 | যোগাযোগ | |
হিব্রু_সাধারণ কথোপকথন_8 | হিব্রু | হিব্রু | তিনি_আইএল | 8 ২ kHz | সাধারণ কথোপকথন | 399 | হিব্রু সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, ইস্রায়েলে হিব্রু | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 414, পুরুষ 399, অজানা 1 | যোগাযোগ | |
গুজরাটি_এমএ | গুজরাটি | গুজরাটি (পাইপলাইনে) | gu_IN | মিডিয়া অডিও | 40 | গুজরাটি (পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
গুজরাটি_জিসি | গুজরাটি | গুজরাটি (পাইপলাইনে) | gu_IN | সাধারণ কথোপকথন | 100 | গুজরাটি (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
গুজরাটি_CC_8 | গুজরাটি | গুজরাটি (পাইপলাইনে) | gu_IN | কল-সেন্টার | 60 | গুজরাটি (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
জার্মান_IVR_8 | জার্মান | জার্মান | ডি-ডি | 8 ২ kHz | আইভিআর | 200 | জার্মান IVR ডেটা | মানুষ থেকে মেশিন। একটি IVR ধরনের প্রবাহ যেখানে একটি TTS প্রম্পট থাকে (যেমন "আমি আপনাকে কিভাবে সাহায্য করতে পারি") এর পরে একটি স্বতঃস্ফূর্ত মানুষের প্রতিক্রিয়া | মনো | ডেস্কটপ | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 10115 পুরুষ 8750 অজানা 0 | যোগাযোগ | ||
জার্মান_CC_8 | জার্মান | জার্মান | ডি-ডি | 8 ২ kHz | কল-সেন্টার | 64 | জার্মান কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | মনো | ডেস্কটপ | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 478 পুরুষ 1440 অজানা 0 | যোগাযোগ | ||
ইংরেজি গভীর দক্ষিণ_MA_16 | ইংরেজি ডিপ সাউথ | ইংরেজি ডিপ সাউথ | en_US | 16 ২ kHz | মিডিয়া অডিও | 266 | ইংরেজি ডিপ সাউথ মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 204, পুরুষ 356, অজানা 21 | যোগাযোগ |
প্রস্তাবিত সেবাসমূহ
বিস্তৃত AI সেটআপের জন্য বিশেষজ্ঞ অডিও ডেটা সংগ্রহ সব-হ্যান্ড-অন-ডেক নয়। Shaip এ, আপনি মডেলগুলিকে স্বাভাবিকের চেয়ে আরও বিস্তৃত করতে নিম্নলিখিত পরিষেবাগুলি বিবেচনা করতে পারেন:
পাঠ্য তথ্য সংগ্রহ
সেবা
Shaip জ্ঞানীয় ডেটা সংগ্রহ পরিষেবাগুলির প্রকৃত মূল্য হল যে এটি সংস্থাগুলিকে অসংগঠিত ডেটার মধ্যে পাওয়া গুরুত্বপূর্ণ তথ্য আনলক করার চাবি দেয়
ইমেজ ডেটা সংগ্রহ পরিষেবা
নিশ্চিত করুন যে আপনার কম্পিউটার ভিশন মডেল প্রতিটি ছবিকে নির্ভুলভাবে শনাক্ত করে, ভবিষ্যতের পরবর্তী প্রজন্মের AI মডেলগুলিকে নির্বিঘ্নে প্রশিক্ষণ দিতে
ভিডিও ডেটা সংগ্রহ পরিষেবা
বস্তু, ব্যক্তি, প্রতিবন্ধকতা এবং অন্যান্য ভিজ্যুয়াল উপাদানগুলিকে পরিপূর্ণতা শনাক্ত করার জন্য আপনার মডেলগুলিকে প্রশিক্ষণের জন্য NLP-এর সাথে এখন কম্পিউটার দৃষ্টিতে ফোকাস করুন।
প্রস্তাবিত সংস্থানসমূহ
নৈবেদ্য
ইন্টেলিজেন্ট এআই-এর জন্য অডিও টীকা
অডিও টীকা পরিষেবাগুলি শুরু থেকেই শাইপের একটি বিশেষত্ব। আমাদের অত্যাধুনিক অডিও টীকা পরিষেবাগুলির সাথে কথোপকথনমূলক AI, চ্যাটবট এবং স্পিচ রিকগনিশন ইঞ্জিনগুলি বিকাশ, প্রশিক্ষণ এবং উন্নত করুন৷
ক্রেতা এর গাইড
ক্রেতার নির্দেশিকা: কথোপকথনমূলক এআই-এর সম্পূর্ণ নির্দেশিকা
আপনি যে চ্যাটবটটির সাথে কথোপকথন করেছেন তা একটি উন্নত কথোপকথনমূলক AI সিস্টেমে চলে যা প্রশিক্ষিত, পরীক্ষিত এবং প্রচুর স্পিচ রিকগনিশন ডেটাসেট ব্যবহার করে তৈরি করা হয়।
ডেটা ক্যাটালগ
অফ-দ্য-শেল্ফ স্পিচ ডেটা ক্যাটালগ এবং লাইসেন্সিং
এআই প্রকল্পগুলিতে বক্তৃতা ডেটার জন্য বিভিন্ন ধরণের সাধারণ অ্যাপ্লিকেশন রয়েছে। আপনার ভয়েস স্বীকৃতির জন্য আমরা আপনাকে প্রচুর পরিমাণে উচ্চ-মানের ডেটা সরবরাহ করি।
আপনার নিজের অডিও ডেটাসেট তৈরি করতে চান?
একটি অডিও সংগ্রহস্থল সেট আপ করতে আমাদের ইন-হাউস স্পিচ ডেটা সংগ্রহ বিশেষজ্ঞের সাথে সংযোগ করুন যা আপনার প্রয়োজনের সাথে সবচেয়ে উপযুক্ত
প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী (FAQ)
একটি এমএল মডেলের জন্য স্পিচ ডেটা সংগ্রহ বলতে কথ্য ভাষার অডিও রেকর্ডিং সংগ্রহ করার প্রক্রিয়া বোঝায়। এই সংগ্রহটি মেশিন লার্নিং অ্যালগরিদমকে প্রশিক্ষণ এবং পরিমার্জন করতে সাহায্য করে, বিশেষ করে যেগুলি মানুষের কণ্ঠকে বোঝা এবং প্রক্রিয়াকরণের উপর কেন্দ্রীভূত।
স্বয়ংক্রিয় স্পিচ রিকগনিশন (ASR) এর জন্য অডিও ডেটা সংগ্রহ করার লক্ষ্যে, আপনার প্রজেক্টের নির্দিষ্ট প্রয়োজনীয়তাগুলিকে সংজ্ঞায়িত করে শুরু করা উচিত, যার মধ্যে কাঙ্ক্ষিত ভাষা, উচ্চারণ এবং বক্তৃতার ধরন রয়েছে৷ এই প্যারামিটারগুলি সেট করার পরে, ব্যবহারকারীর গোপনীয়তাকে সম্মান করার জন্য আপনি সমস্ত প্রয়োজনীয় অনুমতি পেয়েছেন তা নিশ্চিত করুন৷ তারপরে, পরিষ্কার অডিও নমুনাগুলি ক্যাপচার করতে উপযুক্ত রেকর্ডিং ডিভাইস বা সফ্টওয়্যার ব্যবহার করুন। প্রতিটি রেকর্ডিং এর ট্রান্সক্রিপশন বা অন্যান্য প্রাসঙ্গিক মেটাডেটা দিয়ে সাবধানতার সাথে টীকা করা উচিত এবং সহজে অ্যাক্সেসের জন্য পদ্ধতিগতভাবে সংরক্ষণ করা উচিত।
মেশিন লার্নিং-এ একটি স্পিচ ডেটাসেট কথ্য ভাষাকে চিনতে, প্রতিলিপি বা ব্যাখ্যা করার জন্য তৈরি করা মডেলগুলিকে প্রশিক্ষণ, পরীক্ষা এবং যাচাইকরণের জন্য গুরুত্বপূর্ণ। এই ধরনের ডেটাসেটগুলি ভয়েস সহকারী এবং ট্রান্সক্রিপশন পরিষেবা থেকে ভয়েস বায়োমেট্রিক্স পর্যন্ত অসংখ্য অ্যাপ্লিকেশনের জন্য পথ প্রশস্ত করে।
বিভিন্ন ভাষা এবং উচ্চারণ থেকে সুনির্দিষ্ট তথ্য সংগ্রহের জন্য, কাঙ্ক্ষিত ভাষাগত পটভূমির স্থানীয় ভাষাভাষীদের সাথে সহযোগিতা অত্যাবশ্যক। জনসংখ্যাগত সূক্ষ্মতাগুলির একটি বিস্তৃত বর্ণালী কভার করার জন্য একটি বৈচিত্র্যময় এবং প্রতিনিধিত্বমূলক নমুনার লক্ষ্য করুন৷ অডিও সামঞ্জস্য নিশ্চিত করতে অভিন্ন পরিবেশে প্রমিত রেকর্ডিং সরঞ্জাম নিয়োগ করুন। এবং গুরুত্বপূর্ণভাবে, নির্দিষ্ট ভাষা এবং উচ্চারণ নির্দেশ করে, বিশদ ট্রান্সক্রিপশন এবং মেটাডেটা সহ প্রতিটি ডেটা অংশকে টীকা করুন।