ইন-কার ভয়েস ডেটা সংগ্রহ
কেস স্টাডি: ইন-কার ভয়েস-অ্যাক্টিভেটেড সিস্টেমের জন্য মূল বাক্যাংশ সংগ্রহ
অটো ইন্ডাস্ট্রিতে ইন-কার ভয়েস-অ্যাক্টিভেটেড সিস্টেমের চাহিদা বাড়ছে, আমরা কীভাবে আমাদের গতিশীল যানবাহনের সাথে যুক্ত হই তা পুনরায় সংজ্ঞায়িত করে।
স্বয়ংচালিত শিল্প দ্রুত ভয়েস-অ্যাক্টিভেটেড সিস্টেম গ্রহণ করেছে, ফোর্ড, টেসলা এবং বিএমডব্লিউ-এর মতো প্রধান খেলোয়াড়রা তাদের যানবাহনে উন্নত ভয়েস স্বীকৃতি একীভূত করেছে। 2022 সালের মধ্যে, এটি অনুমান করা হয়েছিল যে 50% এরও বেশি নতুন গাড়িতে ভয়েস শনাক্তকরণ ক্ষমতা বৈশিষ্ট্যযুক্ত। এই ইন্টিগ্রেশনগুলির লক্ষ্য নিরাপত্তা বাড়ানো, ড্রাইভারদের বিভ্রান্তি ছাড়াই নেভিগেশন, বিনোদন এবং যোগাযোগ ফাংশনগুলি পরিচালনা করার অনুমতি দেয়।
অটোতে ভয়েস স্বীকৃতির বাজার মূল্য 1 সালের মধ্যে $2023 বিলিয়ন ছাড়িয়ে যাবে বলে অনুমান করা হয়েছিল, যা হ্যান্ডস-ফ্রি, বুদ্ধিমান ইন-কার ইন্টারঅ্যাকশনের ক্রমবর্ধমান চাহিদা নির্দেশ করে।
স্বয়ংচালিত
গবেষণা পরামর্শ দেয় যে 2022 সালের মধ্যে, 73% ড্রাইভার গাড়ির মধ্যে ভয়েস সহকারী ব্যবহার করবে।
2.01 সালে অটোমোটিভ ভয়েস রিকগনিশন সিস্টেম মার্কেটের মূল্য USD 2021 বিলিয়ন ছিল এবং 3.51 সালের মধ্যে USD 2027 বিলিয়ন এ পৌঁছবে বলে আশা করা হচ্ছে, প্রায় 8.07% এর CAGR নিবন্ধন করা হয়েছে।
বাস্তব বিশ্ব সমাধান
ডেটা যা ভয়েস-অ্যাক্টিভেটেড সিস্টেমকে শক্তি দেয়
গাড়িতে ভয়েস-অ্যাক্টিভেটেড সিস্টেম নিরাপত্তা এবং সুবিধা বাড়ায়। তারা চাকা থেকে হাত না সরিয়ে বা রাস্তা থেকে চোখ না সরিয়ে ড্রাইভারদের নেভিগেশন অ্যাক্সেস করতে, কল করতে, পাঠ্য পাঠাতে এবং সঙ্গীত নিয়ন্ত্রণ করতে দেয়। মৌখিক আদেশে সাড়া দিয়ে, এই সিস্টেমগুলি বিক্ষিপ্ততা হ্রাস করে, মাল্টিটাস্কিংকে উন্নীত করে এবং ড্রাইভিং এর উপর ক্রমাগত ফোকাস নিশ্চিত করে।
ক্লায়েন্ট কথোপকথনমূলক বুদ্ধিমত্তার একজন বিশ্বনেতা যিনি ভয়েস এআই সমাধানগুলি অফার করেন যা ব্যবসাগুলিকে তাদের গ্রাহকদের কাছে অবিশ্বাস্য কথোপকথনের অভিজ্ঞতা প্রদান করতে দেয়। তারা নেতৃস্থানীয় স্বয়ংচালিত কোম্পানিগুলির সাথে তাদের ভয়েস-অ্যাক্টিভেটেড সিস্টেমগুলিকে ব্র্যান্ডেড মূল বাক্যাংশগুলির সাথে প্রশিক্ষণের জন্য কাজ করছিল এবং অডিও ডেটা সংগ্রহে শাইপের দক্ষতার প্রয়োজন ছিল।
চ্যালেঞ্জ
- ক্রাউড সোর্সিং: বিশ্বব্যাপী প্রতি ভাষায় 2800+ নেটিভ স্পিকার নিয়োগ করুন।
- তথ্য সংগ্রহ: নির্ধারিত সময়সীমার মধ্যে 200টি ভাষায় 12k+ প্রম্পট সুরক্ষিত করুন।
- প্রসঙ্গ এবং অভিপ্রায় স্বীকৃতি: ব্যবহারকারীর অনুরোধগুলি সঠিকভাবে বোঝার জন্য, একই মূল বাক্যাংশের জন্য বিভিন্ন বৈচিত্রের উপর সিস্টেমগুলিকে প্রশিক্ষণ দেওয়া দরকার৷
- ব্যাকগ্রাউন্ড নয়েজ হ্যান্ডলিং: ML মডেল নির্ভুলতার জন্য রিয়েল-ওয়ার্ল্ড ব্যাকগ্রাউন্ড নয়েজ অ্যাড্রেস করুন।
- পক্ষপাত কমানো: অন্তর্ভুক্তি নিশ্চিত করতে বিভিন্ন জনসংখ্যা থেকে ভয়েস নমুনা অর্জন করুন.
- অডিও স্পেসিফিকেশন: 16khz 16bits PCM, মনো, একক-চ্যানেল, WAV; কোন প্রক্রিয়াকরণ
- রেকর্ডিং পরিবেশ: পটভূমিতে আওয়াজ বা ঝামেলা ছাড়াই রেকর্ডিংয়ে পরিষ্কার অডিও থাকা উচিত। সাধারণ বক্তৃতা ব্যবহার করে রেকর্ড করা মূল বাক্যাংশ।
- মান পরীক্ষা: সমস্ত বক্তৃতা রেকর্ডিং গুণমান মূল্যায়ন এবং বৈধতার মধ্য দিয়ে যাবে, শুধুমাত্র বৈধ বক্তৃতা রেকর্ডিং প্রদান করা হবে। যদি Shaip সম্মত মান মান পূরণ না করে, Shaip কোনো অতিরিক্ত খরচ ছাড়াই ডেটা পুনরায় বিতরণ করবে
সমাধান
Shaip কথোপকথনমূলক এআই স্পেসে তার দক্ষতার সাথে ক্লায়েন্টকে সক্ষম করেছে:
- তথ্য সংগ্রহ: নির্ধারিত সময়সীমার মধ্যে 208 স্পিকারের কাছ থেকে 12টি বৈশ্বিক ভাষায় 2800k মূল বাক্যাংশ/ব্র্যান্ড প্রম্পট সংগ্রহ করা হয়েছে
- বিভিন্ন উচ্চারণ এবং উপভাষা: বিশ্বজুড়ে বিশেষজ্ঞ নিয়োগ করা হয়েছে, কাঙ্ক্ষিত উচ্চারণ এবং উপভাষায় দক্ষ।
- প্রসঙ্গ এবং অভিপ্রায় স্বীকৃতি: প্রতিটি বক্তাকে 20টি স্বতন্ত্র পরিবর্তনে মূল বাক্যাংশগুলি রেকর্ড করার দায়িত্ব দেওয়া হয়েছিল, এমএল মডেলগুলিকে প্রসঙ্গ এবং অভিপ্রায়ের পরিপ্রেক্ষিতে ব্যবহারকারীর অনুরোধগুলি সঠিকভাবে উপলব্ধি করতে সক্ষম করে৷
- ব্যাকগ্রাউন্ড নয়েজ হ্যান্ডলিং: আদি অডিও গুণমান নিশ্চিত করার জন্য, আমরা নিশ্চিত করেছি যে মূল বাক্যাংশগুলি 40dB-এর নিচে শব্দের মাত্রা সহ একটি শান্ত পরিবেশে ক্যাপচার করা হয়েছে, টিভি, রেডিও, সঙ্গীত, বক্তৃতা বা রাস্তার শব্দের মতো ব্যাকগ্রাউন্ডের ব্যাঘাত ছাড়াই।
- পক্ষপাত কমানো: পক্ষপাত কমানোর জন্য, আমরা বিভিন্ন অঞ্চলের ব্যক্তিদের নিযুক্ত করেছি এবং 50% পুরুষ এবং 50% মহিলার সাথে একটি ভারসাম্যপূর্ণ জনসংখ্যার প্রতিনিধিত্ব বজায় রেখেছি, 18 থেকে 60 বছর বয়সী গোষ্ঠীর মধ্যে।
- রেকর্ডিং নির্দেশিকা: মূল বাক্যাংশগুলি একটি সামঞ্জস্যপূর্ণ, স্বাভাবিক বক্তৃতা প্যাটার্নে ক্যাপচার করা হয়েছিল, দ্রুত বা ধীর গতির মতো কোনও পরিবর্তন ছাড়াই। বক্তৃতার কোন অংশ অসাবধানতাবশত ক্লিপ করা হয়নি তা নিশ্চিত করার জন্য শুরুতে এবং শেষ উভয় দিকে 2-সেকেন্ডের নীরবতা।
- রেকর্ডিং ফর্মটা: অডিওটি 16kHz এ রেকর্ড করা হয়েছিল, মনোতে 16-বিট PCM, একটি একক চ্যানেল ব্যবহার করে, এবং WAV ফাইল বিন্যাসে সংরক্ষিত হয়েছিল। অডিওটি অপ্রসেসড রয়ে গেছে, মানে কম্প্রেশন, রিভার্ব বা EQ এর কোন প্রয়োগ ছিল না।
- গুণ: প্রতিটি বক্তৃতা রেকর্ডিং কঠোর মান পরীক্ষা এবং বৈধতা অধীন ছিল. এই মূল্যায়ন পাস করা শুধুমাত্র রেকর্ডিং বিতরণ করা হয়েছে. যেকোন ফাইল যা সম্মতিকৃত মানের মানগুলির কম ছিল তা পুনরায় রেকর্ড করা হয়েছিল এবং কোনও অতিরিক্ত চার্জ ছাড়াই সরবরাহ করা হয়েছিল
ফলাফল
উচ্চ-মানের ব্র্যান্ড কী বাক্যাংশ অডিও ডেটা বা ভয়েস প্রম্পটগুলি স্বয়ংচালিত সংস্থাগুলি এবং তাদের গ্রাহকদের এর সাথে সক্ষম করবে:
- ব্র্যান্ডিং এবং পরিচয়: নির্দিষ্ট, ব্র্যান্ড শব্দগুচ্ছ সহ ভয়েস প্রম্পট কোম্পানিগুলিকে ব্যবহারকারী এবং ব্র্যান্ডের মধ্যে একটি প্রত্যক্ষ এবং স্মরণীয় সংযোগ তৈরি করতে সাহায্য করে যা ব্র্যান্ডের স্মরণ বাড়ায়।
- ব্যবহারে সহজ: ভয়েস কমান্ডগুলি চালকদের চাকা থেকে হাত না সরিয়ে বা রাস্তা থেকে চোখ না সরিয়ে গাড়ির সাথে যোগাযোগ করা সহজ করে তোলে যার ফলে রাস্তার নিরাপত্তা বৃদ্ধি পায়।
- কার্যকারিতার: ভয়েস কমান্ডগুলি গাড়ির বৈশিষ্ট্যগুলি অ্যাক্সেস এবং নিয়ন্ত্রণকে আরও স্বজ্ঞাত করে তোলে। এটি নেভিগেশন, মিডিয়া প্লেব্যাক, বা জলবায়ু নিয়ন্ত্রণ কিনা।
- অন্যান্য সিস্টেমের সাথে একীকরণ: অনেক ভয়েস-অ্যাক্টিভেটেড সিস্টেম স্মার্টফোন, স্মার্ট হোম ডিভাইস এবং অন্যান্য IoT ডিভাইসের সাথে একত্রিত হয়। উদাহরণস্বরূপ, একজন ব্যবহারকারী বাড়ির কাছে যাওয়ার সাথে সাথে তাদের গাড়িকে বাড়ির লাইট জ্বালাতে বলতে পারেন।
- প্রতিযোগিতামূলক সুবিধা: উন্নত ভয়েস-অ্যাক্টিভেটেড সিস্টেম অফার করা একটি বিক্রয় পয়েন্ট এবং একটি পার্থক্যকারী হতে পারে। একটি নতুন গাড়ি কেনার কথা বিবেচনা করার সময় ক্রেতারা সর্বশেষ প্রযুক্তির সন্ধান করে।
- ভবিষ্যতে প্রুফিং: প্রযুক্তির বিকাশের সাথে সাথে এবং IoT দৈনন্দিন জীবনে আরও একীভূত হয়ে ওঠে, একটি শক্তিশালী ভয়েস-অ্যাক্টিভেটেড সিস্টেম থাকা স্বয়ংচালিত কোম্পানিগুলিকে ভবিষ্যতের প্রযুক্তির সাথে আরও অভিযোজিত হতে দেয়।
- আয়ের সুযোগ: অতিরিক্ত নগদীকরণের সুযোগগুলি যেমন, ভয়েস সিস্টেমগুলি সুপারিশ বা সমন্বিত ই-কমার্স অভিজ্ঞতা প্রদান করে (যেমন খাবার অর্ডার করা বা কাছাকাছি পরিষেবাগুলি খোঁজা) যা অনুমোদিত রাজস্ব প্রদান করতে পারে।
আমরা যখন স্বয়ংচালিত সেক্টরের জন্য ভয়েস প্রম্পট সোর্সিং শুরু করি, তখন চ্যালেঞ্জগুলি অনেক ছিল। আমাদের ক্লায়েন্টের বিশ্বব্যাপী ক্লায়েন্টদের প্রতিনিধিত্ব করার জন্য বক্তৃতা, উচ্চারণ এবং সুরের বৈচিত্র্য ক্যাপচার করা গুরুত্বপূর্ণ ছিল। শাইপ কেবল একজন বিক্রেতা হিসাবে নয়, একজন সত্যিকারের অংশীদার হিসাবে দাঁড়িয়েছিল। বিভিন্ন অঞ্চল থেকে বিভিন্ন কণ্ঠস্বর সুরক্ষিত করার জন্য তাদের প্রতিশ্রুতি ছিল প্রশংসনীয়। তারা নিছক আওয়াজ সংগ্রহের বাইরে গিয়েছিলেন; তারা আমাদের প্রকল্পের প্রয়োজনীয়তার সূক্ষ্মতা উপলব্ধি করেছে, সেরা রেকর্ডিংয়ের গ্যারান্টি দেয়। অডিও সংগ্রহের মানগুলির প্রতি তাদের নিশ্ছিদ্র আনুগত্য তাদের পেশাদারিত্ব এবং প্রকল্পের প্রতি উত্সর্গ প্রদর্শন করে।