সংজ্ঞা
শব্দার্থিক বিভাজন হল কম্পিউটার ভিশনের কাজ যা একটি ছবির প্রতিটি পিক্সেলকে রাস্তা, ভবন বা পথচারীর মতো একটি বিভাগে শ্রেণীবদ্ধ করে।
উদ্দেশ্য
উদ্দেশ্য হল স্ব-ড্রাইভিং, মেডিকেল ইমেজিং এবং রোবোটিক্সে AI অ্যাপ্লিকেশনগুলির জন্য বিশদ দৃশ্য বোঝাপড়া প্রদান করা।
গুরুত্ব
- নিরাপত্তা-সমালোচনামূলক সিস্টেমে পিক্সেল-স্তরের উপলব্ধির জন্য অপরিহার্য।
- বাউন্ডিং বাক্সের তুলনায় সুনির্দিষ্ট বস্তুর সীমানা সক্ষম করে।
- বড় টীকাযুক্ত ডেটাসেট প্রয়োজন।
- উচ্চ রেজোলিউশনে গণনামূলকভাবে নিবিড়।
কিভাবে এটা কাজ করে
- পিক্সেল-স্তরের টীকাযুক্ত ছবি সংগ্রহ এবং লেবেল করুন।
- সম্পূর্ণ কনভলিউশনাল নেটওয়ার্কের মতো গভীর শিক্ষার মডেলগুলিকে প্রশিক্ষণ দিন।
- ইনপুট চিত্রটি পিক্সেল-স্তরের পূর্বাভাসে প্রক্রিয়াজাত করা হয়।
- আউটপুট মাস্ক প্রতিটি পিক্সেলকে একটি ক্লাসে বরাদ্দ করে।
- ইন্টারসেকশন ওভার ইউনিয়ন (IoU) এর মতো মেট্রিক্স দিয়ে মূল্যায়ন করুন।
উদাহরণ (বাস্তব জগৎ)
- সিটিস্কেপ ডেটাসেট: শহুরে দৃশ্যের জন্য শব্দার্থিক বিভাজন।
- টেসলা অটোপাইলট: রোড নেভিগেশনের জন্য পিক্সেল-স্তরের বিভাজন।
- মেডিকেল ইমেজিং: এমআরআই স্ক্যানে টিউমার সেগমেন্টেশন।
তথ্যসূত্র / আরও পড়া
- লং এবং অন্যান্যরা "সিমান্টিক সেগমেন্টেশনের জন্য সম্পূর্ণরূপে কনভোলিউশনাল নেটওয়ার্ক।" সিভিপিআর ২০১৫।
- সিটিস্কেপস ডেটাসেট।
- মেডিকেল ইমেজিং-এ IEEE লেনদেন।