কেস স্টাডি: কন্টেন্ট মডারেশন
30K+ ডক্স ওয়েব স্ক্র্যাপ করা হয়েছে এবং বিষয়বস্তু সংযমের জন্য টীকা করা হয়েছে
আমরা যেখানে সংযোগ স্থাপন করি এবং যোগাযোগ করি সেই অনলাইন স্থানটিকে সুরক্ষিত করার জন্য কৃত্রিম বুদ্ধিমত্তা-চালিত কন্টেন্ট মডারেশনের চাহিদা ক্রমবর্ধমান।
সোশ্যাল মিডিয়ার ব্যবহার ক্রমবর্ধমান হারে বৃদ্ধি পাওয়ার সাথে সাথে, নিরাপদ অনলাইন স্থান নিশ্চিত করার জন্য প্রচেষ্টারত প্ল্যাটফর্মগুলির জন্য সাইবার বুলিং সমস্যা একটি গুরুত্বপূর্ণ বাধা হিসেবে দেখা দিয়েছে। বিস্ময়করভাবে ৩৮% ব্যক্তি প্রতিদিন এই ক্ষতিকারক আচরণের সম্মুখীন হন, যা উদ্ভাবনী কন্টেন্ট নিয়ন্ত্রণ পদ্ধতির জরুরি চাহিদার উপর জোর দেয়। আজকাল প্রতিষ্ঠানগুলি সাইবার বুলিং-এর স্থায়ী সমস্যাটি সক্রিয়ভাবে মোকাবেলা করার জন্য কৃত্রিম বুদ্ধিমত্তার ব্যবহারের উপর নির্ভর করে।
সাইবার নিরাপত্তা:
Facebook-এর Q4 কমিউনিটি স্ট্যান্ডার্ডস এনফোর্সমেন্ট রিপোর্ট প্রকাশ করেছে – 6.3 মিলিয়ন গুন্ডামি এবং হয়রানিমূলক সামগ্রীর উপর পদক্ষেপ, একটি সক্রিয় সনাক্তকরণের হার 49.9%
শিক্ষা:
A 2021 গবেষণা যে পাওয়া গেছে ৮০% মার্কিন যুক্তরাষ্ট্রে বছর বয়সী শিক্ষার্থীদের মধ্যে 12 & 17 স্কুলে পড়ার সময় এক বা অন্য সময়ে সাইবার বুলিং-এর অভিজ্ঞতা হয়েছে।
2020 সালের একটি প্রতিবেদন অনুসারে, 4.07 সালে বিশ্বব্যাপী বিষয়বস্তু সংযম সমাধানের বাজারের মূল্য ছিল USD 2019 বিলিয়ন এবং 11.94 সালের মধ্যে 2027% এর CAGR সহ 14.7 বিলিয়ন মার্কিন ডলারে পৌঁছবে বলে আশা করা হয়েছিল।
বাস্তব বিশ্ব সমাধান
ডেটা যা বিশ্বব্যাপী কথোপকথন নিয়ন্ত্রণ করে
ক্লায়েন্টটি তার ক্লাউড অফারিংয়ের জন্য একটি শক্তিশালী স্বয়ংক্রিয় কন্টেন্ট মডারেশন মেশিন লার্নিং মডেল তৈরি করছিল, যার জন্য তারা ডোমেন-নির্দিষ্ট বিক্রেতা খুঁজছিল যারা তাদের সঠিক প্রশিক্ষণ ডেটা দিয়ে সহায়তা করতে পারে।
ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং (NLP) এ আমাদের বিস্তৃত জ্ঞানকে কাজে লাগিয়ে, আমরা ক্লায়েন্টকে ইংরেজি এবং স্প্যানিশ উভয় ভাষায় 30,000 টির বেশি নথি সংগ্রহ, শ্রেণীকরণ এবং টক্সিক, পরিপক্ক, বা যৌনতাপূর্ণ বিষয়বস্তুতে বিভক্ত স্বয়ংক্রিয় বিষয়বস্তু সংযম মেশিন লার্নিং মডেল তৈরি করতে সহায়তা করেছি। বিভাগ
সমস্যা
- ওয়েব অগ্রাধিকারপ্রাপ্ত ডোমেন থেকে স্প্যানিশ এবং ইংরেজি উভয় ভাষায় 30,000 নথি স্ক্র্যাপ করছে
- সংগৃহীত বিষয়বস্তুকে সংক্ষিপ্ত, মাঝারি এবং দীর্ঘ বিভাগে শ্রেণীবদ্ধ করা
- কম্পাইল করা ডেটাকে বিষাক্ত, পরিপক্ক বা যৌনতাপূর্ণ বিষয়বস্তু হিসেবে লেবেল করা
- ন্যূনতম 90% নির্ভুলতার সাথে উচ্চ-মানের টীকা নিশ্চিত করা।
সমাধান
- ওয়েব BFSI, হেলথ কেয়ার, ম্যানুফ্যাকচারিং, খুচরা থেকে স্প্যানিশ এবং ইংরেজির জন্য প্রতিটি 30,000 নথি স্ক্র্যাপ করেছে। বিষয়বস্তু আরও সংক্ষিপ্ত, মাঝারি এবং দীর্ঘ নথিতে বিভক্ত ছিল
- শ্রেণীবদ্ধ বিষয়বস্তুকে বিষাক্ত, পরিপক্ক বা যৌনতাপূর্ণ বিষয়বস্তু হিসেবে সফলভাবে লেবেল করা
- 90% গুণমান অর্জনের জন্য, Shaip একটি দ্বি-স্তরের মান নিয়ন্ত্রণ প্রক্রিয়া বাস্তবায়ন করেছে:
» লেভেল 1: গুণমান নিশ্চিতকরণ পরীক্ষা: 100% ফাইল যাচাই করা হবে।
» লেভেল 2: ক্রিটিকাল কোয়ালিটি অ্যানালাইসিস চেক: Shaips এর CQA টিম 15%-20% রেট্রোস্পেক্টিভ নমুনার মূল্যায়ন করবে।
ফল
প্রশিক্ষণের তথ্য স্বয়ংক্রিয় বিষয়বস্তু সংযম ML মডেল তৈরি করতে সাহায্য করেছে যা একটি নিরাপদ অনলাইন পরিবেশ বজায় রাখার জন্য উপকারী বেশ কয়েকটি ফলাফল দিতে পারে। কিছু মূল ফলাফল অন্তর্ভুক্ত:
- বিপুল পরিমাণ ডেটা প্রক্রিয়া করার দক্ষতা
- সংযম নীতিগুলির অভিন্ন প্রয়োগ নিশ্চিত করার ক্ষেত্রে ধারাবাহিকতা
- ক্রমবর্ধমান ব্যবহারকারীর ভিত্তি এবং বিষয়বস্তুর ভলিউমের সাথে খাপ খাইয়ে নেওয়ার মাপযোগ্যতা
- রিয়েল-টাইম সংযম সনাক্ত করতে পারে এবং
সম্ভাব্য ক্ষতিকারক বিষয়বস্তু উত্পন্ন হওয়ার সাথে সাথে সরিয়ে দিন - মানুষের মডারেটরদের উপর নির্ভরতা হ্রাস করে খরচ-কার্যকারিতা