সংজ্ঞা
ডেটা ডি-আইডেন্টিফিকেশন হল ডেটাসেট থেকে ব্যক্তিগতভাবে শনাক্তযোগ্য তথ্য (PII) অপসারণ বা গোপন করার প্রক্রিয়া যাতে ব্যক্তিদের সহজে চেনা যায় না। কৌশলগুলির মধ্যে রয়েছে বেনামীকরণ এবং ছদ্মনামকরণ।
উদ্দেশ্য
এর উদ্দেশ্য হল গোপনীয়তা রক্ষা করা এবং বিশ্লেষণ, গবেষণা এবং এআই মডেল প্রশিক্ষণের জন্য ডেটা ব্যবহারের অনুমতি দেওয়া। এটি জিডিপিআর এবং এইচআইপিএএ-এর মতো আইনের সাথে সম্মতি নিশ্চিত করে।
গুরুত্ব
- গোপনীয়তা লঙ্ঘনের ঝুঁকি হ্রাস করে।
- নিয়ন্ত্রক সম্মতির জন্য প্রয়োজনীয়।
- গোপনীয়তার সাথে ডেটা ইউটিলিটির ভারসাম্য বজায় রাখে।
- অসম্পূর্ণ শনাক্তকরণ পুনঃশনাক্তকরণের ঝুঁকি তৈরি করতে পারে।
কিভাবে এটা কাজ করে
- ব্যক্তিগত শনাক্তকারী (নাম, ঠিকানা, বায়োমেট্রিক তথ্য) সনাক্ত করুন।
- মাস্কিং, সাধারণীকরণ, অথবা এনক্রিপশনের মতো কৌশল প্রয়োগ করুন।
- পুনঃশনাক্তকরণের ঝুঁকি কমিয়ে আনা হয়েছে তা যাচাই করুন।
- নিরীক্ষার প্রক্রিয়াটি নথিভুক্ত করুন।
- শনাক্ত না করা তথ্য নিরাপদে সংরক্ষণ এবং ভাগ করুন।
উদাহরণ (বাস্তব জগৎ)
- চিকিৎসা গবেষণার জন্য স্বাস্থ্যসেবা ডেটাসেটগুলি শনাক্ত করা হয়নি।
- অ্যাপলের iOS: ব্যবহারকারীর বিশ্লেষণের জন্য ডিফারেনশিয়াল গোপনীয়তা প্রয়োগ করে।
- মার্কিন আদমশুমারি ব্যুরো: জনসংখ্যার তথ্যের জন্য শনাক্তকরণের পদ্ধতি ব্যবহার করে।
তথ্যসূত্র / আরও পড়া
- NIST বিশেষ প্রকাশনা 800-188: তথ্য সনাক্তকরণ বিচ্ছিন্নকরণ।
- ISO/IEC 20889: গোপনীয়তা বৃদ্ধিকারী ডেটা সনাক্তকরণ বিচ্ছিন্নকরণ।
- বেনামীকরণের উপর GDPR নির্দেশিকা — ইউরোপীয় ডেটা সুরক্ষা বোর্ড।
- ডেটা ডি-আইডেন্টিফিকেশন এবং বেনামীকরণ সমাধান