আপনার AI এর জন্য সবচেয়ে বিশ্বস্ত স্পিচ ডেটা সংগ্রহ পরিষেবা
আমাদের অডিও এবং স্পিচ ডেটা সংগ্রহ পরিষেবার মাধ্যমে আপনার NLP মডেল, VA, TTS প্রোটোটাইপ এবং আরও অনেক কিছুকে মানসম্পন্ন কথোপকথনমূলক ডেটা দিয়ে প্রশিক্ষণ দিন
কোনো বাধা ছাড়াই অডিও ডেটা পাইপলাইন আবিষ্কার করুন।
বৈশিষ্ট্যযুক্ত ক্লায়েন্ট
প্রাকৃতিক ভাষা প্রক্রিয়াকরণের জন্য স্পিচ ট্রেনিং ডেটাসেট কেন প্রয়োজন?
আপনি কি কখনো লক্ষ্য করেছেন আপনার স্মার্টফোন VA, অর্থাৎ Siri, Bixby বা অন্য কিছু ইন্টারঅ্যাক্ট করছে? তারা যেভাবে প্রতিটি প্রশ্নের উত্তর দেয় এবং আপনার প্রয়োজনীয়তা অনুযায়ী ফলাফল বিশ্লেষণ করে উপস্থাপন করে!
ঠিক আছে, এই VAগুলি আমাদের যতটা চক্রান্ত করে, এই বুদ্ধিমান সংস্থানগুলি এবং প্রোগ্রামগুলিকে যথাযথভাবে প্রতিক্রিয়া জানাতে সক্ষম হওয়ার জন্য ধীরে ধীরে প্রশিক্ষণ দেওয়া দরকার। এই কারণেই আপনার আউটসোর্সিং স্পিচ/অডিও, এবং ভয়েস ডেটা সংগ্রহকে বিশেষায়িত ডেটা সংগ্রহকারী সংস্থাগুলির কাছে বিবেচনা করা উচিত, পেশাদার দক্ষতা যাচাই করা।
অডিও ডেটা সংগ্রহে বিনিয়োগ করা আপনার কথিত NLP কে বহুভাষিক দর্শকদের জন্য প্রস্তুত করে। শুধু তাই নয়, এনএলপি-র জন্য বক্তৃতা ডেটা সংগ্রহ, যেমন এবং যখন একজন বিশেষজ্ঞ দ্বারা পরিচালনা করা হয়, এমনকি ইন-ফিল্ড সংগ্রহ, শব্দার্থিক বিশ্লেষণ এবং অডিও ট্রান্সক্রিপশনকে বিবেচনায় নেয়। পেশাদার বক্তৃতা ডেটা সংগ্রহের সমাধানগুলির সাথে, আপনি করতে পারেন:
- নির্ভুলতা উন্নত করতে উচ্চ-মানের অডিও ডেটাসেট সংগ্রহ করুন
- লক্ষ্য বৈচিত্র্যময় দৃশ্যকল্প সেটআপ
- বহুভাষিক এআই প্রশিক্ষণের তথ্য সংগ্রহ করুন
- বিভিন্ন জনসংখ্যা এবং উল্লম্ব অনুসারে আপনার ML মডেল স্কেল করুন
NLP-এর জন্য পেশাদার অডিও/ভয়েস ডেটা সংগ্রহ পরিষেবা
যে কোন বিষয়। কোনো দৃশ্যকল্প.
বুদ্ধিমান এনএলপি সিস্টেমগুলি জেনেরিক ছাড়া অন্য কিছু। প্রোগ্রামের কার্যকারিতার উপর নির্ভর করে, আপনাকে স্থানিক এবং বহুভাষিক অডিও ডেটা পরিষেবাগুলিতে ফোকাস করতে হতে পারে, যা শুধুমাত্র নামী ভয়েস/অডিও ডেটা সংগ্রহ সংস্থাগুলি দ্বারা অফার করা যেতে পারে। এখানেই Shaip একটি অত্যন্ত নির্ভরযোগ্য ডেটা সংযোগ পরিষেবা প্রদানকারী হিসাবে জিনিসগুলির পরিকল্পনায় আসে যা আপনার কথিত বুদ্ধিমান এআইগুলির জন্য ভারী উত্তোলন করার জন্য গর্ববোধ করে।
Shaip-এ, আমাদের প্রাথমিক ফোকাস হল ন্যূনতম সম্ভাব্য সময়ে কাস্টম স্পিচ নমুনাগুলির সর্বোচ্চ সম্ভাব্য ভলিউম সহ মডেলগুলিকে খাওয়ানোর উপর। বোর্ডে আমাদের সাথে, আপনি আশা করতে পারেন:
- NLP এর জন্য কিউরেটেড অডিও/ভয়েস ডেটা সংগ্রহ
- দর্জির তৈরি প্রোগ্রাম যা নির্দিষ্ট ব্যবহারের ক্ষেত্রে সাড়া দেয়
- অডিও ডেটাসেট মাইনিং প্রস্তুত করা হচ্ছে
- প্যাটার্ন-নির্দিষ্ট এবং স্বয়ংক্রিয় ডেটা প্রক্রিয়াকরণ
- ডোমেনের নির্দিষ্টতার সর্বোচ্চ সম্ভাব্য স্তর
- ত্বরিত AI মডেলের সাথে বাজার করার জন্য দ্রুত সময়
আমাদের দক্ষতাঃ
স্মার্ট NLP মডেল প্রস্তুত করতে অডিও ডেটা সারিবদ্ধ করুন
Shaip 100+ টিরও বেশি ভাষায় এন্ড-টু-এন্ড স্পিচ/অডিও ডেটা সংগ্রহ পরিষেবা অফার করে যাতে ভয়েস-সক্ষম প্রযুক্তিগুলি সারা বিশ্ব জুড়ে বিভিন্ন শ্রোতাদেরকে পূরণ করতে সক্ষম করে। আমরা যে কোনও সুযোগ এবং আকারের প্রকল্পগুলিতে কাজ করতে পারি; বিদ্যমান অফ-দ্য-শেল্ফ অডিও ডেটাসেটের লাইসেন্স দেওয়া থেকে শুরু করে কাস্টম অডিও ডেটা সংগ্রহ পরিচালনা করা, অডিও ট্রান্সক্রিপশন এবং টীকা। আপনার বক্তৃতা ডেটা সংগ্রহের প্রকল্প যত বড়ই হোক না কেন, উপভাষা, টোন এবং ভাষাকে লক্ষ্য করে উচ্চ-মানের NLP ডেটাসেট তৈরি করতে আমরা আপনার প্রয়োজন অনুসারে অডিও সংগ্রহ পরিষেবাগুলি কাস্টমাইজ করতে পারি। ভয়েস-সক্ষম বুদ্ধিমান সেটআপের জন্য আমাদের স্পিচ ডেটাসেট এবং অডিও ডেটা সংগ্রহের সংস্থানগুলির বিস্তৃত পরিসর থেকে চয়ন করুন৷
মনোলোগ বক্তৃতা সংগ্রহ
একক-চ্যানেল ফাইলের মাধ্যমে স্ক্রিপ্টেড প্রম্পট ফিডিং সহ আপনার টেক্সট-টু-স্পীড প্রোটোটাইপ এবং ট্রান্সক্রিপশন-নির্দিষ্ট প্রয়োজনীয়তার জন্য একটি স্বতন্ত্র স্পিকার সম্পর্কিত বক্তৃতা-ভিত্তিক প্রয়োজনীয়তাগুলি পরিচালনা করুন।
সংলাপ বক্তৃতা
সংগ্রহ
দ্বৈত-চ্যানেল ফাইল এবং প্রতিলিপিকৃত সংস্থানগুলির মাধ্যমে বহুভাষিক এক্সপোজার সহ বুদ্ধিমান ভার্চুয়াল সহকারী, গতি-নির্দিষ্ট চ্যাটবট এবং স্বয়ংক্রিয় স্পিচ রিকগনিশন মডেলগুলি সেট আপ করুন৷
অ্যাকোস্টিক ডেটা
সংগ্রহ
আমরা পেশাদারভাবে স্টুডিও-গুণমানের অডিও ডেটা রেকর্ড করতে পারি তা রেস্তোরাঁ, অফিস, বাড়ি বা বিভিন্ন পরিবেশ এবং ভাষা থেকে, আমাদের সহযোগীদের বিশ্বব্যাপী নেটওয়ার্কের মাধ্যমে, যেখানে একটি বিস্তৃত অ্যাকোস্টিক পরিসর কভার করা হয়
প্রাকৃতিক ভাষা উচ্চারণ সংগ্রহ
সময়মতো AI-কে আরও স্বায়ত্তশাসিত করার জন্য, একই অর্থ সহ ভিন্নভাবে উচ্চারিত গ্রাহক বাক্যাংশগুলি সনাক্ত করতে স্মার্ট বাণিজ্যিক সেটআপগুলিকে প্রশিক্ষণ দিন
ডিজিটাল/ভার্চুয়াল
সহায়ক
মানুষের বক্তৃতা, বহুভাষিক এক্সপোজার, প্রাসঙ্গিক বিশ্লেষণ এবং NLU এর সতর্কতা সহ মডেলদের প্রশিক্ষণের মাধ্যমে আপনার আসন্ন ভার্চুয়াল সহকারী তৈরিতে ফোকাস করুন।
স্বয়ংক্রিয় স্পিচ রিকগনিশন (ASR)
জনসংখ্যার বিস্তৃত অ্যারের থেকে, অত্যাধুনিক বৈচিত্র্যময় বক্তৃতা/অডিও ডেটাসেটগুলিতে অ্যাক্সেসের মাধ্যমে আপনার স্বয়ংক্রিয় স্পিচ রিকগনিশন (ASR) সিস্টেমগুলির নির্ভুলতা উন্নত করুন৷
বহুভাষিক বক্তৃতা/অডিও প্রশিক্ষণ ডেটা
বিশ্বব্যাপী আমাদের অত্যন্ত দক্ষ ভাষা পেশাদাররা, আরবি, ড্যানিশ, চাইনিজ, আফ্রিকান, সিঙ্গাপুর, নিউজিল্যান্ড, হিব্রু, ইন্দোনেশিয়ান, আইরিশ, কোরিয়ান, মালয়, পোলিশ, স্কটিশ, সুইডিশ সহ একাধিক ভাষা এবং উপভাষায় বহুভাষিক অডিও/স্পিচ প্রশিক্ষণ ডেটা অফার করে। , ফরাসি, জার্মান, ভিয়েতনামী, থাই, ইতালীয়, স্প্যানিশ এবং আরও অনেক কিছু।
পাঠ্য থেকে স্পিচ
(টিটিএস)
TTS-এর সাথে একটি ভাল ব্যবহারকারীর অভিজ্ঞতা অফার করার জন্য, স্বাভাবিক শব্দে একটি সিস্টেম তৈরি করা গুরুত্বপূর্ণ। আমাদের গ্লোবাল ওয়ার্কফোর্সের সাহায্যে একটি টেক্সট-টু-স্পিচ (TTS) বহুভাষিক মডেল তৈরি করুন, যারা আপনাকে 150+ ভাষা এবং উপভাষায় বক্তৃতা ডেটা সংগ্রহ করতে সাহায্য করে আপনার AI মডেলগুলিকে ইন-কার কন্ট্রোল থেকে চ্যাটবট এবং উচ্চ-সহ শিক্ষার সমাধানগুলি উন্নত করতে। মানের অডিও ডেটা।
আপনার বিশ্বস্ত স্পিচ ডেটা কালেকশন পার্টনার হিসেবে Shaip বেছে নেওয়ার কারণ
সম্প্রদায়
নিবেদিত এবং প্রশিক্ষিত দল:
- ডেটা তৈরি, লেবেলিং এবং QA-এর জন্য 30,000+ সহযোগী
- শংসাপত্রযুক্ত প্রকল্প ব্যবস্থাপনা দল
- অভিজ্ঞ পণ্য উন্নয়ন দল
- ট্যালেন্ট পুল সোর্সিং এবং অনবোর্ডিং দল
প্রক্রিয়া
সর্বোচ্চ প্রক্রিয়া দক্ষতা নিশ্চিত করা হয়:
- শক্তিশালী 6 সিগমা স্টেজ-গেট প্রক্রিয়া
- 6টি সিগমা ব্ল্যাক বেল্টের একটি উত্সর্গীকৃত দল - মূল প্রক্রিয়ার মালিক এবং গুণমান সম্মতি
- ক্রমাগত উন্নতি এবং প্রতিক্রিয়া লুপ
প্ল্যাটফর্ম
পেটেন্ট প্ল্যাটফর্ম সুবিধা প্রদান করে:
- ওয়েব-ভিত্তিক এন্ড-টু-এন্ড প্ল্যাটফর্ম
- অনবদ্য গুণমান
- দ্রুত TAT
- বিরামহীন ডেলিভারি
সম্প্রদায়
নিবেদিত এবং প্রশিক্ষিত দল:
- ডেটা তৈরি, লেবেলিং এবং QA-এর জন্য 30,000+ সহযোগী
- শংসাপত্রযুক্ত প্রকল্প ব্যবস্থাপনা দল
- অভিজ্ঞ পণ্য উন্নয়ন দল
- ট্যালেন্ট পুল সোর্সিং এবং অনবোর্ডিং দল
প্রক্রিয়া
সর্বোচ্চ প্রক্রিয়া দক্ষতা নিশ্চিত করা হয়:
- শক্তিশালী 6 সিগমা স্টেজ-গেট প্রক্রিয়া
- 6টি সিগমা ব্ল্যাক বেল্টের একটি উত্সর্গীকৃত দল - মূল প্রক্রিয়ার মালিক এবং গুণমান সম্মতি
- ক্রমাগত উন্নতি এবং প্রতিক্রিয়া লুপ
প্ল্যাটফর্ম
পেটেন্ট প্ল্যাটফর্ম সুবিধা প্রদান করে:
- ওয়েব-ভিত্তিক এন্ড-টু-এন্ড প্ল্যাটফর্ম
- অনবদ্য গুণমান
- দ্রুত TAT
- বিরামহীন ডেলিভারি
ভাষা: অডিও ডেটাসেট সংগৃহীত
অফ-দ্য-শেল্ফ স্পিচ/অডিও ডেটাসেট
বিস্তারিত | কর্পাস আইডি (অনন্য) | কী খুঁজতে হবে | ভাষা ডেটাসেট | ভাষার কোড | নমুনা হার | ডেটাসেটের প্রকার | মোট অডিও ঘন্টা | সংক্ষিপ্ত বিবরণ | ডেটাসেটের বিবরণ | অডিও চ্যানেল | রেকর্ডিং প্ল্যাটফর্ম | আমরা (%) | অডিও ফর্ম্যাট | ট্রান্সক্রিপশন ফরম্যাট | ব্যবহারের ক্ষেত্রে | স্পিকার সংখ্যা | সিটিএ |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
en_US_CC_8 | আফ্রিকান আমেরিকান ভার্নাকুলার | আফ্রিকান আমেরিকান ভার্নাকুলার | en_US | 8 ২ kHz | কল সেন্টার | 211 | আফ্রিকান আমেরিকান ভার্নাকুলার কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 612, পুরুষ: 1242, এবং অজানা: 12 | যোগাযোগ | |
en_US_MA_16 | আফ্রিকান আমেরিকান ভার্নাকুলার | আফ্রিকান আমেরিকান ভার্নাকুলার | en_US | 16 ২ kHz | মিডিয়া অডিও | 154 | আফ্রিকান আমেরিকান ভার্নাকুলার মিডিয়া ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 151, পুরুষ: 150, এবং অজানা: 10 | যোগাযোগ | |
আফ্রিকান_জিসি_৮ | আফ্রিকান্স | আফ্রিকান্স | af_ZA | 8 ২ kHz | সাধারণ কথোপকথন | 368 | আফ্রিকান সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিওর সময়কাল (পরিসীমা) - 15-60 মিনিট, আফ্রিকাতে কথ্য আফ্রিকান | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 502, পুরুষ: 390, এবং অজানা: 2 | যোগাযোগ | |
আফ্রিকান_MA_16 | আফ্রিকান্স | আফ্রিকান্স | af_ZA | 16 ২ kHz | মিডিয়া অডিও | 658 | আফ্রিকান মিডিয়া ফাইল | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 750, পুরুষ: 1278, এবং অজানা: 52 | যোগাযোগ | |
আরবি_GC_8 | আরবি | আরবি | ar_AE | 8 ২ kHz | সাধারণ কথোপকথন | 292 | আরবি সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, উপসাগরীয় দেশ থেকে আরবি | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 171, পুরুষ: 534, এবং অজানা: 1 | যোগাযোগ | |
আরবি_এসএম_৪৮ | আরবি | আরবি | আরবী ভাষায়-এসএ | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 1,947 | আরবি লিপিবদ্ধ মনোলোগ | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 838 পুরুষ 1209 অজানা 78 | যোগাযোগ | |
অসমীয়া_CC_8 | অসমিয়া | অসমীয়া (পাইপলাইনে) | as_IN | কল-সেন্টার | 60 | অসমীয়া (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
অসমীয়া_জি.সি | অসমিয়া | অসমীয়া (পাইপলাইনে) | as_IN | সাধারণ কথোপকথন | 100 | অসমীয়া (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
অসমীয়া_এমএ | অসমিয়া | অসমীয়া (পাইপলাইনে) | as_IN | মিডিয়া অডিও | 40 | অসমীয়া (ইন পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
বাংলা_CC_8 | বাঙালি | বাংলা (পাইপলাইনে) | bn_IN | কল-সেন্টার | 60 | বাংলা (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
বাংলা_জিসি | বাঙালি | বাংলা (পাইপলাইনে) | bn_IN | সাধারণ কথোপকথন | 100 | বাংলা (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
বাংলা_এমএ | বাঙালি | বাংলা (পাইপলাইনে) | bn_IN | মিডিয়া অডিও | 40 | বাংলা (পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
বোস্টন_CC_8 | বোস্টন ইংরেজি | বোস্টন ইংরেজি | en_US | 8 ২ kHz | কল-সেন্টার | 177 | বোস্টন কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 605, পুরুষ: 711, এবং অজানা: 0 | যোগাযোগ | |
বোস্টন_জিসি_8 | বোস্টন ইংরেজি | বোস্টন ইংরেজি | en_US | 8 ২ kHz | সাধারণ কথোপকথন | 32 | বোস্টন সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 53, পুরুষ: 83, এবং অজানা: 0 | যোগাযোগ | |
বোস্টন_MA_16 | বোস্টন ইংরেজি | বোস্টন ইংরেজি | en_US | 16 ২ kHz | মিডিয়া অডিও | 93 | বোস্টন মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 43, পুরুষ: 181, এবং অজানা: 2 | যোগাযোগ | |
কানাডিয়ান_SM_48 | কানাডিয়ান ফরাসি | কানাডিয়ান ফরাসি | FR-সিএ | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 1,222 | কানাডিয়ান ফরাসি | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 974 পুরুষ 631 অজানা 1 | যোগাযোগ | |
চাইনিজ_CC_8 | চাইনিজ ইংরেজি | চাইনিজ ইংরেজি | en_US | 8 ২ kHz | কল-সেন্টার | 169 | চাইনিজ কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 1790, পুরুষ: 523 এবং অজানা: 13 | যোগাযোগ | |
চাইনিজ_MA_16 | চাইনিজ ইংরেজি | চাইনিজ ইংরেজি | en_US | 16 ২ kHz | মিডিয়া অডিও | 249 | চীনা মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 126, পুরুষ: 346 এবং অজানা: 6 | যোগাযোগ | |
চাইনিজ সরলীকৃত_SM_48 | সরলীকৃত চীনা | সরলীকৃত চীনা | zh-cn | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 2,762 | সরলীকৃত চীনা | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1920 পুরুষ 1535 অজানা 270 | যোগাযোগ | |
চীনা ঐতিহ্যবাহী_SM_48 | প্রথাগত চীনা | প্রথাগত চীনা | zh-TW | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 1,028 | প্রথাগত চীনা | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1069 পুরুষ 262 অজানা 3 | যোগাযোগ | |
ডেনিশ_GC_8 | ডেনমার্কের | ডেনমার্কের | da_DK | 8 ২ kHz | সাধারণ কথোপকথন | 372 | ডেনিশ সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 311, পুরুষ: 417, অজানা: 0 | যোগাযোগ | |
ডেনিশ_MA_16 | ডেনমার্কের | ডেনমার্কের | da_DK | 16 ২ kHz | মিডিয়া অডিও | 664 | ডেনিশ মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা: 369, পুরুষ: 864, অজানা: 27 | যোগাযোগ | |
ডেনিশ_SM_48 | ডেনমার্কের | ডেনমার্কের | দা-ডিকে | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 2,579 | ডেনিশ স্ক্রিপ্টেড মনোলোগ | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড রেঞ্জের মধ্যে পড়ে, ডেনমার্ক থেকে ডেনিশ | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1551 পুরুষ 1233 অজানা 42 | যোগাযোগ | |
ইংরেজি গভীর দক্ষিণ_CC_8 | ইংরেজি ডিপ সাউথ | ইংরেজি ডিপ সাউথ | en_US | 8 ২ kHz | কল-সেন্টার | 151 | ইংরেজি ডিপ সাউথ কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 221, পুরুষ 1004, অজানা 7 | যোগাযোগ | |
ইংরেজি গভীর দক্ষিণ_GC_8 | ইংরেজি ডিপ সাউথ | ইংরেজি ডিপ সাউথ | en_US | 8 ২ kHz | সাধারণ কথোপকথন | 56 | ইংরেজি গভীর দক্ষিণ সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 99, পুরুষ 31, অজানা 0 | যোগাযোগ | |
ইংরেজি গভীর দক্ষিণ_MA_16 | ইংরেজি ডিপ সাউথ | ইংরেজি ডিপ সাউথ | en_US | 16 ২ kHz | মিডিয়া অডিও | 266 | ইংরেজি ডিপ সাউথ মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 204, পুরুষ 356, অজানা 21 | যোগাযোগ | |
জার্মান_CC_8 | জার্মান | জার্মান | ডি-ডি | 8 ২ kHz | কল-সেন্টার | 64 | জার্মান কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | মনো | ডেস্কটপ | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 478 পুরুষ 1440 অজানা 0 | যোগাযোগ | ||
জার্মান_IVR_8 | জার্মান | জার্মান | ডি-ডি | 8 ২ kHz | আইভিআর | 200 | জার্মান IVR ডেটা | মানুষ থেকে মেশিন। একটি IVR ধরনের প্রবাহ যেখানে একটি TTS প্রম্পট থাকে (যেমন "আমি আপনাকে কিভাবে সাহায্য করতে পারি") এর পরে একটি স্বতঃস্ফূর্ত মানুষের প্রতিক্রিয়া | মনো | ডেস্কটপ | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 10115 পুরুষ 8750 অজানা 0 | যোগাযোগ | ||
গুজরাটি_CC_8 | গুজরাটি | গুজরাটি (পাইপলাইনে) | gu_IN | কল-সেন্টার | 60 | গুজরাটি (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
গুজরাটি_জিসি | গুজরাটি | গুজরাটি (পাইপলাইনে) | gu_IN | সাধারণ কথোপকথন | 100 | গুজরাটি (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
গুজরাটি_এমএ | গুজরাটি | গুজরাটি (পাইপলাইনে) | gu_IN | মিডিয়া অডিও | 40 | গুজরাটি (পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
হিব্রু_সাধারণ কথোপকথন_8 | হিব্রু | হিব্রু | তিনি_আইএল | 8 ২ kHz | সাধারণ কথোপকথন | 399 | হিব্রু সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, ইস্রায়েলে হিব্রু | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 414, পুরুষ 399, অজানা 1 | যোগাযোগ | |
হিব্রু_MA_16 | হিব্রু | হিব্রু | তিনি_আইএল | 16 ২ kHz | মিডিয়া অডিও | 427 | হিব্রু মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 361, পুরুষ 513, অজানা 13 | যোগাযোগ | |
হিন্দি_MA_16 | হিন্দি | হিন্দি | hi_IN | 16 ২ kHz | মিডিয়া অডিও | 219 | হিন্দি মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 83, পুরুষ 309, অজানা 0 | যোগাযোগ | |
হিন্দি_এসএম_৪৮ | হিন্দি | হিন্দি | হাই-ইন | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 2,867 | হিন্দি লিপিবদ্ধ মনোলোগ | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1977 পুরুষ 1864 অজানা 147 | যোগাযোগ | |
HINGLISH_CC_8 | হিংলিশ | হিংলিশ | hg_IN | 8 ২ kHz | কল-সেন্টার | 208 | HINGLISH কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 822, পুরুষ 1262, অজানা 0 | যোগাযোগ | |
HINGLISH_MA_16 | হিংলিশ | হিংলিশ | hg_IN | 16 ২ kHz | মিডিয়া অডিও | 216 | HINGLISH মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 75, পুরুষ 380, অজানা 0 | যোগাযোগ | |
হিস্পানিক_CC_8 | হিস্পানিক ইংরেজি | হিস্পানিক ইংরেজি | en_US | 8 ২ kHz | কল-সেন্টার | 212 | হিস্পানিক কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 822, পুরুষ 1262, অজানা 0 | যোগাযোগ | |
হিস্পানিক_MA_16 | হিস্পানিক ইংরেজি | হিস্পানিক ইংরেজি | en_US | 16 ২ kHz | মিডিয়া অডিও | 155 | হিস্পানিক কল মিডিয়া অডিও | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 140, পুরুষ 219, অজানা 5 | যোগাযোগ | |
ইন্দোনেশিয়ান_GC_8 | ইন্দোনেশিয়াসম্বন্ধীয় | ইন্দোনেশিয়াসম্বন্ধীয় | আমি করেছিলাম | 8 ২ kHz | সাধারণ কথোপকথন | 496 | ইন্দোনেশিয়ান সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, বাহাসা ইন্দোনেশিয়ান | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 524, পুরুষ 454, অজানা 2 | যোগাযোগ | |
ইন্দোনেশিয়ান_MA_16 | ইন্দোনেশিয়াসম্বন্ধীয় | ইন্দোনেশিয়াসম্বন্ধীয় | আমি করেছিলাম | 16 ২ kHz | মিডিয়া অডিও | 643 | ইন্দোনেশিয়ান মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 746, পুরুষ 1507, অজানা 129 | যোগাযোগ | |
আইরিশ_GC_8 | আইরিশ | আইরিশ | en_IE | 8 ২ kHz | সাধারণ কথোপকথন | 192 | আইরিশ সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 213, পুরুষ 153, অজানা 0 | যোগাযোগ | |
জাপানিজ_SM_48 | জাপানি | জাপানি | জাপানী ভাষায়-জেপি | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 2,335 | জাপানি লিপিবদ্ধ মনোলোগ | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1460 পুরুষ 1221 অজানা 194 | যোগাযোগ | |
কন্নড়_CC_8 | কন্নড | কন্নড় (পাইপলাইনে) | kn_IN | কল-সেন্টার | 60 | কন্নড় (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
কন্নড়_জিসি | কন্নড | কন্নড় (পাইপলাইনে) | kn_IN | সাধারণ কথোপকথন | 100 | কন্নড় (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
কন্নড়_এমএ | কন্নড | কন্নড় (পাইপলাইনে) | kn_IN | মিডিয়া অডিও | 40 | কন্নড় (পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
কোরিয়ান_CC_8 | কোরিয়ান | কোরিয়ান | ko_KR | 8 ২ kHz | কল-সেন্টার | 107 | কোরিয়ান কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1086, পুরুষ 210, অজানা 4 | যোগাযোগ | |
কোরিয়ান_MA_16 | কোরিয়ান | কোরিয়ান | ko_KR | 16 ২ kHz | মিডিয়া অডিও | 204 | কোরিয়ান মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 70 পুরুষ 303, অজানা 25 | যোগাযোগ | |
কোরিয়ান_SM_48 | কোরিয়ান | কোরিয়ান | কো-কে আর | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 1,955 | কোরিয়ান লিপিবদ্ধ মনোলোগ | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1195 পুরুষ 1134 অজানা 122 | যোগাযোগ | |
মালয়_GC_8 | মালে | মালে | ms_MY | 8 ২ kHz | সাধারণ কথোপকথন | 266 | মালয় সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, মালয়েশিয়ায় মালয় | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 316, পুরুষ 176, অজানা 0 | যোগাযোগ | |
মালয়_MA_16 | মালে | মালে | ms_MY | 16 ২ kHz | মিডিয়া অডিও | 344 | মালয় মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 236, পুরুষ 626, অজানা 47 | যোগাযোগ | |
মালায়লাম_CC_8 | মালায়ালম | মালায়লাম (পাইপলাইনে) | ml_IN | কল-সেন্টার | 60 | মালায়ালাম (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
মালায়লাম_জিসি | মালায়ালম | মালায়লাম (পাইপলাইনে) | ml_IN | সাধারণ কথোপকথন | 100 | মালায়লাম (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
মালায়লাম_এমএ | মালায়ালম | মালায়লাম (পাইপলাইনে) | ml_IN | মিডিয়া অডিও | 40 | মালায়লাম (পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
মারাঠি_CC_8 | মারাঠি | মারাঠি (পাইপলাইনে) | mr_IN | কল-সেন্টার | 60 | মারাঠি (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
মারাঠি_জিসি | মারাঠি | মারাঠি (পাইপলাইনে) | mr_IN | সাধারণ কথোপকথন | 100 | মারাঠি (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
মারাঠি_এমএ | মারাঠি | মারাঠি (পাইপলাইনে) | mr_IN | মিডিয়া অডিও | 40 | মারাঠি (পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
Mexican_SM_48 | স্পেনীয় (মেক্সিকো) | স্পেনীয় (মেক্সিকো) | স্প্যানিশ ভাষায়-এমএক্স | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 1,492 | মেক্সিকান স্প্যানিশ লিপিবদ্ধ মনোলোগ | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1016 পুরুষ 1069 অজানা 95 | যোগাযোগ | |
নেদারল্যান্ডস_এসএম_৪৮ | ডাচ | ডাচ | nl এর-এন এল | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 1,205 | ডাচ স্ক্রিপ্টেড মনোলোগ | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1285 পুরুষ 531 অজানা 3 | যোগাযোগ | |
নিউ ইয়র্ক ইংরেজি_CC_8 | নিউ ইয়র্ক ইংরেজি | নিউ ইয়র্ক ইংরেজি | en_US | 8 ২ kHz | কল-সেন্টার | 103 | নিউ ইয়র্ক ইংরেজি কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 610, পুরুষ 532, অজানা 0 | যোগাযোগ | |
নিউ ইয়র্ক ইংরেজি_GC_8 | নিউ ইয়র্ক ইংরেজি | নিউ ইয়র্ক ইংরেজি | en_US | 8 ২ kHz | সাধারণ কথোপকথন | 107 | নিউ ইয়র্ক ইংরেজি সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 118, পুরুষ 114, অজানা 0 | যোগাযোগ | |
নিউ ইয়র্ক ইংরেজি_MA_16 | নিউ ইয়র্ক ইংরেজি | নিউ ইয়র্ক ইংরেজি | en_US | 16 ২ kHz | মিডিয়া অডিও | 140 | নিউ ইয়র্ক ইংলিশ মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 66, পুরুষ 230, অজানা 11 | যোগাযোগ | |
নিউজিল্যান্ড_GC_8 | নিউজিল্যান্ড ইংরেজি | নিউজিল্যান্ড ইংরেজি | en_NZ | 8 ২ kHz | সাধারণ কথোপকথন | 148 | নিউজিল্যান্ড ইংরেজি সাধারণ কথোপকথন ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 167, পুরুষ 121, অজানা 4 | যোগাযোগ | |
নিউজিল্যান্ড_MA_16 | নিউজিল্যান্ড ইংরেজি | নিউজিল্যান্ড ইংরেজি | en_NZ | 16 ২ kHz | মিডিয়া অডিও | 400 | নিউজিল্যান্ড ইংলিশ মিডিয়া অডিও | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 367, পুরুষ 678, অজানা 26 | যোগাযোগ | |
ওড়িয়া_CC_8 | ওড়িয়া | ওড়িয়া (পাইপলাইনে) | or_IN | কল-সেন্টার | 60 | ওড়িয়া (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
ওড়িয়া_জিসি | ওড়িয়া | ওড়িয়া (পাইপলাইনে) | or_IN | সাধারণ কথোপকথন | 100 | ওড়িয়া (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
ওড়িয়া_এমএ | ওড়িয়া | ওড়িয়া (পাইপলাইনে) | or_IN | মিডিয়া অডিও | 40 | ওড়িয়া (পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
পোলিশ_MA_16 | পোলিশ | পোলিশ | pl_PL | 16 ২ kHz | মিডিয়া অডিও | 269 | পোলিশ মিডিয়া অডিও | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 173 পুরুষ 354 অজানা 6 | যোগাযোগ | |
পোলিশ পোল্যান্ড_SM_48 | পোলিশ (পোল্যান্ড) | পোলিশ (পোল্যান্ড) | PL-পিএল | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 1,482 | পোলিশ পোল্যান্ড - লিপিবদ্ধ মনোলোগ | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1324 পুরুষ 701 অজানা 24 | যোগাযোগ | |
পাঞ্জাবি_CC_8 | পাঞ্জাবি | পাঞ্জাবি (পাইপলাইনে) | পাঞ্জাবি | কল-সেন্টার | 60 | পাঞ্জাবি (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
পাঞ্জাবি_জিসি | পাঞ্জাবি | পাঞ্জাবি (পাইপলাইনে) | পাঞ্জাবি | সাধারণ কথোপকথন | 100 | পাঞ্জাবি (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
পাঞ্জাবি_এমএ | পাঞ্জাবি | পাঞ্জাবি (পাইপলাইনে) | পাঞ্জাবি | মিডিয়া অডিও | 40 | পাঞ্জাবি (পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
রাশিয়ান_SM_48 | রাশিয়ান | রাশিয়ান | RU-রাবি | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 2,398 | রাশিয়ান লিপিবদ্ধ মনোলোগ | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1689 পুরুষ 1937 অজানা 214 | যোগাযোগ | |
স্কটিশ_GC_8 | স্কটিশ (ইংরেজি উচ্চারণ) | স্কটিশ (ইংরেজি উচ্চারণ) | en_AB | 8 ২ kHz | সাধারণ কথোপকথন | 292 | স্কটিশ সাধারণ কথোপকথনের ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 285, পুরুষ 260, অজানা 3 | যোগাযোগ | |
সিঙ্গাপুর_CC_8 | সিঙ্গাপুর ইংরেজি | সিঙ্গাপুর ইংরেজি | en_SG | 8 ২ kHz | কল-সেন্টার | 218 | সিঙ্গাপুর কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 2139, পুরুষ 884, অজানা 21 | যোগাযোগ | |
সিঙ্গাপুর_MA_16 | সিঙ্গাপুর ইংরেজি | সিঙ্গাপুর ইংরেজি | en_SG | 16 ২ kHz | মিডিয়া অডিও | 247 | সিঙ্গাপুর মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 160, পুরুষ 455, অজানা 37 | যোগাযোগ | |
দক্ষিণ আফ্রিকান ইংরেজি_CC_8 | দক্ষিণ আফ্রিকান ইংরেজি | দক্ষিণ আফ্রিকান ইংরেজি | en_ZA | 8 ২ kHz | কল-সেন্টার | 261 | দক্ষিণ আফ্রিকান ইংরেজি কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1274, পুরুষ 935, অজানা 1 | যোগাযোগ | |
দক্ষিণ আফ্রিকান ইংরেজি_MA_16 | দক্ষিণ আফ্রিকান ইংরেজি | দক্ষিণ আফ্রিকান ইংরেজি | en_ZA | 16 ২ kHz | মিডিয়া অডিও | 251 | দক্ষিণ আফ্রিকান ইংরেজি মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 235, পুরুষ 432, অজানা 36 | যোগাযোগ | |
সোয়াহিলি_CC_8 | সোয়াহিলি | সোয়াহিলি | sw_KE | 8 ২ kHz | কল-সেন্টার | 230 | সোয়াহিলি কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 611, পুরুষ 833, অজানা 0 | যোগাযোগ | |
সোয়াহিলি_MA_16 | সোয়াহিলি | সোয়াহিলি | sw_KE | 16 ২ kHz | মিডিয়া অডিও | 265 | সোয়াহিলি মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 118, পুরুষ 493, অজানা 25 | যোগাযোগ | |
সুইডিশ_CC_8 | সুইডিশ | সুইডিশ | sv_SE | 8 ২ kHz | কল-সেন্টার | 250 | সুইডিশ কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1581, পুরুষ 727, অজানা 2 | যোগাযোগ | |
সুইডিশ_MA_16 | সুইডিশ | সুইডিশ | sv_SE | 16 ২ kHz | মিডিয়া অডিও | 278 | সুইডিশ মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 195, পুরুষ 500, অজানা 21 | যোগাযোগ | |
তামিল_CC_8 | তামিল | তামিল (পাইপলাইনে) | ta_IN | কল-সেন্টার | 60 | তামিল (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
তামিল_জিসি | তামিল | তামিল (পাইপলাইনে) | ta_IN | সাধারণ কথোপকথন | 100 | তামিল (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
তামিল_এমএ | তামিল | তামিল (পাইপলাইনে) | ta_IN | মিডিয়া অডিও | 40 | তামিল (পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
তেলুগু_GC_8 | তেলুগু | তেলুগু | te_IN | 8 ২ kHz | সাধারণ কথোপকথন | 553 | তেলেগু সাধারণ কথোপকথনের ডেটা | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 574, পুরুষ 564, অজানা 0 | যোগাযোগ | |
তেলুগু_MA_16 | তেলুগু | তেলুগু | te_IN | 16 ২ kHz | মিডিয়া অডিও | 648 | তেলেগু মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 207, পুরুষ 963, অজানা 2 | যোগাযোগ | |
তেলুগু_CC_8 | তেলুগু | তেলেগু (পাইপলাইনে) | te_IN | কল-সেন্টার | 30 | তেলুগু (পাইপলাইনে) কল-সেন্টার ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
তেলুগু_জিসি | তেলুগু | তেলেগু (পাইপলাইনে) | te_IN | সাধারণ কথোপকথন | 50 | তেলুগু (পাইপলাইনে) সাধারণ কথোপকথনের ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
তেলেগু_এমএ | তেলুগু | তেলেগু (পাইপলাইনে) | te_IN | মিডিয়া অডিও | 20 | তেলুগু (পাইপলাইনে) মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | যোগাযোগ | ||||
থাই_জিসি_8 | থাই | থাই | th_TH | 8 ২ kHz | সাধারণ কথোপকথন | 183 | থাই সাধারণ কথোপকথন | দুই ব্যক্তির মধ্যে আনস্ক্রিপ্টেড টেলিফোনিক কথোপকথন। প্রায়. অডিও সময়কাল (পরিসীমা) - 15-60 মিনিট, বন্ধুদের মধ্যে ব্যবহৃত একটি অনানুষ্ঠানিক রেজিস্টার | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 338, পুরুষ 96, অজানা 8 | যোগাযোগ | |
থাই_এমএ_৮ | থাই | থাই | th_TH | 16 ২ kHz | মিডিয়া অডিও | 173 | থাই মিডিয়া অডিও | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 143, পুরুষ 502, অজানা 26 | যোগাযোগ | |
তুর্কি তুরস্ক_SM_48 | তুর্কি তুরস্ক | তুর্কি তুরস্ক | TR-টিআর | 48 ২ kHz | লিপিবদ্ধ মনোলোগ | 2,027 | তুর্কি তুরস্ক | একক-উচ্চারণ রেকর্ডিং, যা 5 থেকে 30 সেকেন্ড পরিসরে পড়ে | মনো | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 1561 পুরুষ 1241 অজানা 31 | যোগাযোগ | |
ভিয়েতনামী_GC_8 | ভিয়েতনামী | ভিয়েতনামী | vi_VN | 8 ২ kHz | সাধারণ কথোপকথন | 295 | ভিয়েতনামী সাধারণ কথোপকথন ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, উত্তর (যেমন, হ্যানয়), মধ্য এবং দক্ষিণ (যেমন, হো চি মিন সিটি)। | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 400, পুরুষ 380, অজানা 2 | যোগাযোগ | |
ভিয়েতনামী_MA_16 | ভিয়েতনামী | ভিয়েতনামী | vi_VN | 16 ২ kHz | মিডিয়া অডিও | 257 | ভিয়েতনামী মিডিয়া অডিও ডেটা | লাইসেন্সযোগ্য পাবলিক ডোমেন অডিও/ভিডিও ফাইল যেমন ইন্টারভিউ, পডকাস্ট ইত্যাদি - ১ থেকে ৫ জন। প্রায়. অডিও সময়কাল (পরিসীমা) 1-5 মিনিট | মনো | ওয়েব সোর্সিং | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 249, পুরুষ 200, অজানা 45 | যোগাযোগ | |
ওয়েলশ_জিসি_8 | ওয়েলশ (ইংরেজি উচ্চারণ) | ওয়েলশ (ইংরেজি উচ্চারণ) | en_WL | 8 ২ kHz | সাধারণ কথোপকথন | 278 | ওয়েলশ সাধারণ কথোপকথন ডেটা | "এজেন্ট" এবং "গ্রাহক" এর মধ্যে আনস্ক্রিপ্টেড, সিন্থেটিক টেলিফোনিক কথোপকথন, প্রায়। অডিও সময়কাল (পরিসীমা) 5-15 মিনিট, | দ্বৈত | ডেস্কটপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | মহিলা 270, পুরুষ 324, অজানা 0 | যোগাযোগ | |
ইউকে ইংরেজি_WW_16 | ইউকে ইংরাজী | ইউকে ইংরাজী | en_uk | 16 ২ kHz | জাগ্রত শব্দ | 200 স্পিকার | ওয়েক ওয়ার্ড ইউকে ইংরেজি | তথ্যের মূল বাক্যাংশ সংগ্রহ
| 1 চ্যানেল | মোবাইল অ্যাপ | 5.0 | .ভা | .জসন | ASR, ভার্চুয়াল সহকারী, চ্যাটবট, কথোপকথনমূলক এআই, স্পিচ অ্যানালিটিক্স, টিটিএস, ভাষা মডেলিং | লিঙ্গ: 50% পুরুষ, 50% মহিলা, +/- 10%। | যোগাযোগ |
প্রস্তাবিত সেবাসমূহ
বিস্তৃত AI সেটআপের জন্য বিশেষজ্ঞ অডিও ডেটা সংগ্রহ সব-হ্যান্ড-অন-ডেক নয়। Shaip এ, আপনি মডেলগুলিকে স্বাভাবিকের চেয়ে আরও বিস্তৃত করতে নিম্নলিখিত পরিষেবাগুলি বিবেচনা করতে পারেন:
পাঠ্য তথ্য সংগ্রহ
সেবা
Shaip জ্ঞানীয় ডেটা সংগ্রহ পরিষেবাগুলির প্রকৃত মূল্য হল যে এটি সংস্থাগুলিকে অসংগঠিত ডেটার মধ্যে পাওয়া গুরুত্বপূর্ণ তথ্য আনলক করার চাবি দেয়
ইমেজ ডেটা সংগ্রহ পরিষেবা
নিশ্চিত করুন যে আপনার কম্পিউটার ভিশন মডেল প্রতিটি ছবিকে নির্ভুলভাবে শনাক্ত করে, ভবিষ্যতের পরবর্তী প্রজন্মের AI মডেলগুলিকে নির্বিঘ্নে প্রশিক্ষণ দিতে
ভিডিও ডেটা সংগ্রহ পরিষেবা
বস্তু, ব্যক্তি, প্রতিবন্ধকতা এবং অন্যান্য ভিজ্যুয়াল উপাদানগুলিকে পরিপূর্ণতা শনাক্ত করার জন্য আপনার মডেলগুলিকে প্রশিক্ষণের জন্য NLP-এর সাথে এখন কম্পিউটার দৃষ্টিতে ফোকাস করুন।
প্রস্তাবিত সংস্থানসমূহ
নৈবেদ্য
ইন্টেলিজেন্ট এআই-এর জন্য অডিও টীকা
অডিও টীকা পরিষেবাগুলি শুরু থেকেই শাইপের একটি বিশেষত্ব। আমাদের অত্যাধুনিক অডিও টীকা পরিষেবাগুলির সাথে কথোপকথনমূলক AI, চ্যাটবট এবং স্পিচ রিকগনিশন ইঞ্জিনগুলি বিকাশ, প্রশিক্ষণ এবং উন্নত করুন৷
ক্রেতা এর গাইড
ক্রেতার নির্দেশিকা: কথোপকথনমূলক এআই-এর সম্পূর্ণ নির্দেশিকা
আপনি যে চ্যাটবটটির সাথে কথোপকথন করেছেন তা একটি উন্নত কথোপকথনমূলক AI সিস্টেমে চলে যা প্রশিক্ষিত, পরীক্ষিত এবং প্রচুর স্পিচ রিকগনিশন ডেটাসেট ব্যবহার করে তৈরি করা হয়।
ডেটা ক্যাটালগ
অফ-দ্য-শেল্ফ স্পিচ ডেটা ক্যাটালগ এবং লাইসেন্সিং
এআই প্রকল্পগুলিতে বক্তৃতা ডেটার জন্য বিভিন্ন ধরণের সাধারণ অ্যাপ্লিকেশন রয়েছে। আপনার ভয়েস স্বীকৃতির জন্য আমরা আপনাকে প্রচুর পরিমাণে উচ্চ-মানের ডেটা সরবরাহ করি।
আপনার নিজের অডিও ডেটাসেট তৈরি করতে চান?
একটি অডিও সংগ্রহস্থল সেট আপ করতে আমাদের ইন-হাউস স্পিচ ডেটা সংগ্রহ বিশেষজ্ঞের সাথে সংযোগ করুন যা আপনার প্রয়োজনের সাথে সবচেয়ে উপযুক্ত
প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী (FAQ)
একটি এমএল মডেলের জন্য স্পিচ ডেটা সংগ্রহ বলতে কথ্য ভাষার অডিও রেকর্ডিং সংগ্রহ করার প্রক্রিয়া বোঝায়। এই সংগ্রহটি মেশিন লার্নিং অ্যালগরিদমকে প্রশিক্ষণ এবং পরিমার্জন করতে সাহায্য করে, বিশেষ করে যেগুলি মানুষের কণ্ঠকে বোঝা এবং প্রক্রিয়াকরণের উপর কেন্দ্রীভূত।
স্বয়ংক্রিয় স্পিচ রিকগনিশন (ASR) এর জন্য অডিও ডেটা সংগ্রহ করার লক্ষ্যে, আপনার প্রজেক্টের নির্দিষ্ট প্রয়োজনীয়তাগুলিকে সংজ্ঞায়িত করে শুরু করা উচিত, যার মধ্যে কাঙ্ক্ষিত ভাষা, উচ্চারণ এবং বক্তৃতার ধরন রয়েছে৷ এই প্যারামিটারগুলি সেট করার পরে, ব্যবহারকারীর গোপনীয়তাকে সম্মান করার জন্য আপনি সমস্ত প্রয়োজনীয় অনুমতি পেয়েছেন তা নিশ্চিত করুন৷ তারপরে, পরিষ্কার অডিও নমুনাগুলি ক্যাপচার করতে উপযুক্ত রেকর্ডিং ডিভাইস বা সফ্টওয়্যার ব্যবহার করুন। প্রতিটি রেকর্ডিং এর ট্রান্সক্রিপশন বা অন্যান্য প্রাসঙ্গিক মেটাডেটা দিয়ে সাবধানতার সাথে টীকা করা উচিত এবং সহজে অ্যাক্সেসের জন্য পদ্ধতিগতভাবে সংরক্ষণ করা উচিত।
মেশিন লার্নিং-এ একটি স্পিচ ডেটাসেট কথ্য ভাষাকে চিনতে, প্রতিলিপি বা ব্যাখ্যা করার জন্য তৈরি করা মডেলগুলিকে প্রশিক্ষণ, পরীক্ষা এবং যাচাইকরণের জন্য গুরুত্বপূর্ণ। এই ধরনের ডেটাসেটগুলি ভয়েস সহকারী এবং ট্রান্সক্রিপশন পরিষেবা থেকে ভয়েস বায়োমেট্রিক্স পর্যন্ত অসংখ্য অ্যাপ্লিকেশনের জন্য পথ প্রশস্ত করে।
বিভিন্ন ভাষা এবং উচ্চারণ থেকে সুনির্দিষ্ট তথ্য সংগ্রহের জন্য, কাঙ্ক্ষিত ভাষাগত পটভূমির স্থানীয় ভাষাভাষীদের সাথে সহযোগিতা অত্যাবশ্যক। জনসংখ্যাগত সূক্ষ্মতাগুলির একটি বিস্তৃত বর্ণালী কভার করার জন্য একটি বৈচিত্র্যময় এবং প্রতিনিধিত্বমূলক নমুনার লক্ষ্য করুন৷ অডিও সামঞ্জস্য নিশ্চিত করতে অভিন্ন পরিবেশে প্রমিত রেকর্ডিং সরঞ্জাম নিয়োগ করুন। এবং গুরুত্বপূর্ণভাবে, নির্দিষ্ট ভাষা এবং উচ্চারণ নির্দেশ করে, বিশদ ট্রান্সক্রিপশন এবং মেটাডেটা সহ প্রতিটি ডেটা অংশকে টীকা করুন।