সংজ্ঞা
টেক্সট রিকগনিশন বলতে ছবি বা স্ক্যান করা নথিতে টেক্সট অক্ষর সনাক্তকরণ বোঝায়। এর মধ্যে রয়েছে মুদ্রিত এবং হাতে লেখা স্বীকৃতি।
উদ্দেশ্য
উদ্দেশ্য হল ভিজ্যুয়াল ফর্ম্যাটে লেখাগুলিকে অ্যাক্সেসযোগ্য এবং অনুসন্ধানযোগ্য করে তোলা।
গুরুত্ব
- সংরক্ষণাগারের ডিজিটাইজেশন সক্ষম করে।
- অ্যাক্সেসিবিলিটি এবং অটোমেশনের জন্য গুরুত্বপূর্ণ।
- নির্ভুলতা ছবির মানের উপর নির্ভর করে।
- ওসিআর প্রযুক্তির সাথে সম্পর্কিত।
কিভাবে এটা কাজ করে
- স্ক্যান করা বা ছবি তোলা নথি ক্যাপচার করুন।
- স্পষ্টতা উন্নত করার জন্য ছবিগুলি প্রাক-প্রক্রিয়াজাত করুন।
- টেক্সট অঞ্চল সনাক্ত করুন।
- স্বীকৃতি মডেল প্রয়োগ করুন।
- মেশিন-পঠনযোগ্য টেক্সট আউটপুট করুন।
উদাহরণ (বাস্তব জগৎ)
- গুগল লেন্স: ছবির টেক্সট চিনতে পারে।
- ABBYY FineReader: স্ক্যান করা নথিগুলিকে ডিজিটাইজ করে।
- টেসের্যাক্ট ওসিআর: ওপেন-সোর্স টেক্সট রিকগনিশন ইঞ্জিন।
তথ্যসূত্র / আরও পড়া
- স্মিথ, আর. "টেসের্যাক্ট ওসিআর ইঞ্জিনের একটি সংক্ষিপ্তসার।" আইসিডিএআর।
- ISO/IEC 15938-4 স্ট্যান্ডার্ড।
- প্যাটার্ন বিশ্লেষণ এবং মেশিন ইন্টেলিজেন্সের উপর IEEE লেনদেন।