সংজ্ঞা
নামযুক্ত সত্তা স্বীকৃতি (NER) হল একটি NLP কাজ যা পাঠ্যে থাকা সত্তাগুলিকে চিহ্নিত করে এবং শ্রেণীবদ্ধ করে, যেমন মানুষ, সংস্থা, অবস্থান, তারিখ বা পণ্য।
উদ্দেশ্য
এর উদ্দেশ্য হল মূল সত্ত্বা বের করে অসংগঠিত পাঠ্য গঠন করা। এটি অনুসন্ধান, তথ্য নিষ্কাশন এবং জ্ঞান গ্রাফ তৈরিতে সহায়তা করে।
গুরুত্ব
- তথ্য পুনরুদ্ধার এবং NLP পাইপলাইনের জন্য মৌলিক।
- ত্রুটিগুলি ডাউনস্ট্রিম অ্যাপ্লিকেশনগুলিতে ছড়িয়ে পড়ে।
- ডোমেন-নির্দিষ্ট NER (যেমন, চিকিৎসা, আইনি) এর জন্য কাস্টম ডেটাসেট প্রয়োজন।
- সত্তা লিঙ্কিং এবং সম্পর্ক নিষ্কাশনের মতো কাজের সাথে সম্পর্কিত।
কিভাবে এটা কাজ করে
- লেখা সংগ্রহ এবং প্রি-প্রসেস করা।
- সত্তা বিভাগ সহ ডেটাসেটগুলি টীকা করুন।
- লেবেলযুক্ত উদাহরণ (CRF, ট্রান্সফরমার) ব্যবহার করে মডেলগুলিকে প্রশিক্ষণ দিন।
- অদেখা টেক্সটে সত্তার পূর্বাভাস দিন।
- পরীক্ষার তথ্য দিয়ে সঠিকতা যাচাই করুন।
উদাহরণ (বাস্তব জগৎ)
- spaCy: বিল্ট-ইন NER সহ ওপেন-সোর্স NLP লাইব্রেরি।
- স্ট্যানফোর্ড কোরএনএলপি: নামযুক্ত সত্তা স্বীকৃতি সরঞ্জাম সরবরাহ করে।
- আর্থিক এনএলপি: প্রতিবেদন থেকে কোম্পানির নাম বের করে।
তথ্যসূত্র / আরও পড়া
- জুরাফস্কি এবং মার্টিন। বক্তৃতা এবং ভাষা প্রক্রিয়াকরণ। স্ট্যানফোর্ড।
- ল্যাম্পল এট আল। "নামযুক্ত সত্তা স্বীকৃতির জন্য স্নায়বিক স্থাপত্য।" ACL।
- আলিঙ্গনকারী মুখ ট্রান্সফরমার NER মডেল।
- নামযুক্ত সত্তা স্বীকৃতি (NER) কী?