একটি AI অ্যালগরিদম শুধুমাত্র ততটা ভাল যতটা ডেটা আপনি এটি খাওয়ান।
এটি একটি সাহসী বা একটি অপ্রচলিত বক্তব্য নয়। কয়েক দশক আগে AI অনেক দূরের বলে মনে হতে পারে, কিন্তু কৃত্রিম বুদ্ধিমত্তা এবং মেশিন লার্নিং তখন থেকে সত্যিই অনেক দূর এগিয়েছে।
কম্পিউটার ভিশন কম্পিউটারকে লেবেল এবং ছবি বুঝতে এবং ব্যাখ্যা করতে সাহায্য করে। যখন আপনি আপনার কম্পিউটারকে সঠিক ধরণের ইমেজ ডেটাসেট ব্যবহার করে প্রশিক্ষণ দেন, তখন এটি বিভিন্ন মুখের বৈশিষ্ট্য সনাক্ত করতে, বুঝতে এবং সনাক্ত করতে, রোগ সনাক্ত করতে, স্বায়ত্তশাসিত যানবাহন চালানোর এবং বহুমাত্রিক অঙ্গ স্ক্যানিং ব্যবহার করে জীবন বাঁচাতে সক্ষম হয়।
কম্পিউটার ভিশন বাজারে পৌঁছানোর পূর্বাভাস দেওয়া হয়েছে 144.46 দ্বারা 2028 বিলিয়ন একজন বিনয়ী থেকে 7.04 সালে $2020 বিলিয়ন, a এ ক্রমবর্ধমান 45.64 এবং 2021 এর মধ্যে 2028% এর CAGR।
আপনার মেশিন লার্নিং এবং কম্পিউটার ভিশন টাস্কের জন্য আপনি যে ইমেজ ডেটাসেটটি সরবরাহ করছেন এবং প্রশিক্ষণ দিচ্ছেন তা আপনার AI প্রকল্পের সাফল্যের জন্য অত্যন্ত গুরুত্বপূর্ণ। একটি মানসম্পন্ন ডেটাসেট পাওয়া বেশ কঠিন। শক্তিশালী মডেল প্রশিক্ষণ নিশ্চিত করতে এবং বাস্তব-জগতের জটিলতাকে আরও ভালভাবে প্রতিফলিত করার জন্য বিভিন্ন ধরণের ছবির সংগ্রহ ব্যবহার করা অপরিহার্য।
আপনার প্রকল্পের জটিলতার উপর নির্ভর করে, কম্পিউটার ভিশনের জন্য নির্ভরযোগ্য এবং প্রাসঙ্গিক ডেটাসেট পেতে কয়েক দিন থেকে কয়েক সপ্তাহ সময় লাগতে পারে। বিভিন্ন কম্পিউটার ভিশন কাজ এবং বাস্তব-বিশ্বের পরিস্থিতি কভার করার জন্য বিভিন্ন ধরণের ডেটাসেট প্রয়োজন। গবেষকরা প্রায়শই গবেষণার উদ্দেশ্যে একটি উল্লেখযোগ্য ডেটাসেট খোঁজেন যাতে ব্যাপক মডেল মূল্যায়ন নিশ্চিত করা যায় এবং বিস্তৃত অ্যাপ্লিকেশনগুলিকে সমর্থন করা যায়।
এখানে, আমরা আপনাকে ওপেন-সোর্স ইমেজ ডেটাসেটের একটি পরিসর (আপনার স্বাচ্ছন্দ্যের জন্য শ্রেণীবদ্ধ) প্রদান করি যা আপনি এখনই ব্যবহার করতে পারেন।
চিত্র ডেটাসেটের কাজ: শ্রেণীবিভাগ, বিভাজন, সনাক্তকরণ এবং আরও অনেক কিছু
ইমেজ ডেটাসেট আধুনিক কম্পিউটার দৃষ্টিভঙ্গির মেরুদণ্ড, যা বিভিন্ন ধরণের কাজের ক্ষমতা প্রদান করে যা মেশিনগুলিকে দৃশ্যমান তথ্য ব্যাখ্যা এবং বুঝতে সক্ষম করে। আপনি স্বায়ত্তশাসিত যানবাহনের জন্য একটি মডেল তৈরি করছেন, মুখের স্বীকৃতি প্রযুক্তি বিকাশ করছেন, অথবা চিকিৎসা চিত্র বিশ্লেষণে কাজ করছেন, সঠিক চিত্র ডেটাসেট সাফল্যের জন্য একটি অপরিহার্য হাতিয়ার।
ছবির শ্রেণীবিভাগ কম্পিউটারের দৃষ্টিভঙ্গির সবচেয়ে মৌলিক কাজগুলির মধ্যে একটি। এই প্রক্রিয়ায়, একজন মডেল তার বিষয়বস্তুর উপর ভিত্তি করে একটি সম্পূর্ণ চিত্রের জন্য একটি লেবেল নির্ধারণ করতে শেখে। উদাহরণস্বরূপ, একটি চিত্র শ্রেণিবিন্যাস ডেটাসেট একটি মডেলকে বিড়াল এবং কুকুরের চিত্রের মধ্যে পার্থক্য করতে, অথবা বিভিন্ন ধরণের উদ্ভিদ সনাক্ত করতে সাহায্য করতে পারে। স্বয়ংক্রিয় ফটো ট্যাগিং, চিকিৎসা চিত্র থেকে রোগ নির্ণয় এবং দৃশ্য শ্রেণীবদ্ধকরণ মানদণ্ডের মতো অ্যাপ্লিকেশনের জন্য এই কাজটি অত্যন্ত গুরুত্বপূর্ণ।
বস্তু সনাক্তকরণ শুধুমাত্র একটি ছবির মধ্যে বস্তুর উপস্থিতি সনাক্ত করেই নয় বরং বাউন্ডিং বাক্স ব্যবহার করে তাদের অবস্থান চিহ্নিত করেও জিনিসগুলিকে আরও এক ধাপ এগিয়ে নিয়ে যায়। বস্তু সনাক্তকরণের জন্য ডেটাসেট, যেমন বাউন্ডিং বাক্স সহ টীকাযুক্ত ছবি ধারণকারী ডেটাসেটগুলি, স্বায়ত্তশাসিত যানবাহনে পথচারী সনাক্তকরণ, নিরাপত্তা নজরদারি এবং খুচরা বিশ্লেষণের মতো অ্যাপ্লিকেশনগুলির জন্য গুরুত্বপূর্ণ। বাস্তব-বিশ্বের পরিস্থিতির জন্য শক্তিশালী কম্পিউটার ভিশন অ্যালগরিদম তৈরিতেও বস্তু সনাক্তকরণ একটি মূল উপাদান।
শব্দার্থ বিভাজন একটি ছবির প্রতিটি পিক্সেলকে একটি নির্দিষ্ট বিভাগে শ্রেণীবদ্ধ করা জড়িত, যা দৃশ্যের একটি বিশদ ধারণা প্রদান করে। এই পিক্সেল-স্তরের ট্রিম্যাপ বিভাজন বিশেষ করে মেডিকেল ইমেজিংয়ের মতো কাজে গুরুত্বপূর্ণ, যেখানে অঙ্গ বা টিউমারের সুনির্দিষ্ট সীমানা নির্ধারণ প্রয়োজন, এবং স্বায়ত্তশাসিত ড্রাইভিংয়ের জন্য শহুরে পরিবেশে, যেখানে রাস্তা, ফুটপাত এবং যানবাহনের মধ্যে পার্থক্য করা অত্যন্ত গুরুত্বপূর্ণ।
এই মূল কাজগুলির বাইরে, চিত্র ডেটাসেটগুলি ইনস্ট্যান্স সেগমেন্টেশন (একই শ্রেণীর পৃথক বস্তুর মধ্যে পার্থক্য করা), চিত্র ক্যাপশনিং (চিত্রের জন্য বর্ণনামূলক পাঠ্য তৈরি করা) এবং মুখের স্বীকৃতি (চিত্রগুলিতে মানুষের মুখ সনাক্তকরণ বা যাচাই করা) সমর্থন করে। এই প্রতিটি কম্পিউটার ভিশন কাজ মেশিন লার্নিং মডেলগুলিকে প্রশিক্ষণ এবং যাচাই করার জন্য উচ্চ-মানের, টীকাযুক্ত চিত্রের উপর নির্ভর করে।
বৈচিত্র্যময় এবং সু-টীকাযুক্ত চিত্র ডেটাসেটগুলি ব্যবহার করে, ডেটা বিজ্ঞানী এবং মেশিন লার্নিং অনুশীলনকারীরা চিত্র স্বীকৃতি এবং শ্রেণিবিন্যাসের কাজ থেকে শুরু করে জটিল বিভাজন এবং সনাক্তকরণ সমস্যা পর্যন্ত বিভিন্ন ধরণের কম্পিউটার দৃষ্টি চ্যালেঞ্জ মোকাবেলা করতে পারেন। সঠিক ডেটাসেট কেবল গবেষণা এবং উন্নয়নকে ত্বরান্বিত করে না বরং বাস্তব-বিশ্বের অ্যাপ্লিকেশনগুলিতে কম্পিউটার দৃষ্টি সিস্টেমগুলি সঠিকভাবে কাজ করে তাও নিশ্চিত করে।
আপনার কম্পিউটার ভিশন মডেলকে প্রশিক্ষণ দিতে ইমেজ ডেটাসেটের ব্যাপক তালিকা
সাধারণ:
-
IMAGEnet
ইমেজনেট একটি বহুল ব্যবহৃত ডেটাসেট, এবং এটি 1.2টি বিভাগে শ্রেণীবদ্ধ একটি বিস্ময়কর 1000 মিলিয়ন ছবি নিয়ে আসে। এই ডেটাসেটটি ওয়ার্ল্ডনেট অনুক্রম অনুসারে সংগঠিত এবং তিনটি ভাগে শ্রেণীবদ্ধ করা হয়েছে - প্রশিক্ষণ ডেটা, চিত্র লেবেল এবং বৈধতা ডেটা।
-
গতিবিদ্যা 700
কাইনেটিক্স 700 হল একটি বিশাল উচ্চ-মানের ডেটাসেট যার 650,000টি বিভিন্ন মানব অ্যাকশন ক্লাসের 700টিরও বেশি ক্লিপ রয়েছে। প্রতিটি ক্লাস অ্যাকশনে প্রায় 700টি ভিডিও ক্লিপ রয়েছে। ডেটাসেটের ক্লিপগুলিতে মানব-বস্তু এবং মানব-মানুষের মিথস্ক্রিয়া রয়েছে, যা ভিডিওতে মানুষের ক্রিয়াগুলি সনাক্ত করার সময় বেশ সহায়ক বলে প্রমাণিত হচ্ছে।
-
সিআইএফএআর -10
CIFAR 10 হল সবচেয়ে বড় কম্পিউটার-ভিশন ডেটাসেটগুলির মধ্যে একটি যা 60000 32 x 32 রঙের চিত্রগুলিকে দশটি ভিন্ন শ্রেণীর প্রতিনিধিত্ব করে। প্রতিটি ক্লাসে কম্পিউটার ভিশন অ্যালগরিদম এবং মেশিন লার্নিং প্রশিক্ষণের জন্য ব্যবহৃত প্রায় 6000টি চিত্র রয়েছে।
-
অক্সফোর্ড-IIIT পেট ইমেজ ডেটাসেট
পোষ্য ইমেজ ডেটাসেট প্রতি ক্লাসে 37টি ছবি সহ 200টি বিভাগ নিয়ে গঠিত। এই চিত্রগুলি স্কেল, ভঙ্গি এবং আলোতে পরিবর্তিত হয় এবং ব্রিড, হেড ROI এবং পিক্সেল-স্তরের ট্রিম্যাপ সেগমেন্টেশনের জন্য টীকা দিয়ে থাকে।
-
গুগলের ওপেন ইমেজ
একটি চিত্তাকর্ষক 9 মিলিয়ন ইউআরএল সহ, এটি তালিকার বৃহত্তম চিত্র ডেটাসেটগুলির মধ্যে একটি, যেখানে 6,000টি বিভাগে লেবেলযুক্ত লক্ষ লক্ষ ছবি রয়েছে৷
-
উদ্ভিদ ইমেজ
এই সংকলনে একাধিক ইমেজ ডেটাসেট রয়েছে যার মধ্যে একটি চিত্তাকর্ষক 1 মিলিয়ন উদ্ভিদের ছবি রয়েছে, যা প্রায় 11টি প্রজাতিকে কভার করে।
-
LSUN
LSUN হল একটি বৃহৎ-স্কেল ইমেজ ডেটাসেট যেখানে বিভিন্ন দৃশ্য এবং বস্তু বিভাগে লক্ষ লক্ষ লেবেলযুক্ত ছবি রয়েছে। ডেটাসেটে মডেল মূল্যায়নের জন্য একটি ডেডিকেটেড টেস্ট সেট অন্তর্ভুক্ত রয়েছে।
মুখের স্বীকৃতি:

-
লেবেলযুক্ত ফেস ইন দ্য ওয়াইল্ড
লেবেলযুক্ত ফেসড ইন দ্য ওয়াইল্ড হল একটি বিশাল ডেটাসেট যেখানে ইন্টারনেট থেকে সনাক্ত করা প্রায় 13,230 জনের 5,750টিরও বেশি ছবি রয়েছে৷ মুখের এই ডেটাসেটটি সীমাবদ্ধ মুখ সনাক্তকরণ অধ্যয়ন করা সহজ করার জন্য ডিজাইন করা হয়েছে৷
-
CASIA ওয়েবফেস
CASIA ওয়েব ফেস হল একটি সু-পরিকল্পিত ডেটাসেট যা মেশিন লার্নিং এবং সীমাহীন মুখের স্বীকৃতির উপর বৈজ্ঞানিক গবেষণায় সাহায্য করে। প্রায় 494,000টি আসল পরিচয়ের 10,000 টিরও বেশি চিত্র সহ, এটি মুখ শনাক্তকরণ এবং যাচাইকরণ কাজের জন্য আদর্শ।
-
UMD ফেস ডেটাসেট
UMD একটি ভাল-টীকাযুক্ত ডেটাসেটের মুখোমুখি হয় যাতে দুটি অংশ রয়েছে - স্থির চিত্র এবং ভিডিও ফ্রেম। ডেটাসেটে 367,800টিরও বেশি মুখের টীকা এবং 3.7 মিলিয়ন বিষয়ের টীকাযুক্ত ভিডিও ফ্রেম রয়েছে।
-
ফেস মাস্ক সনাক্তকরণ
এই ডেটাসেটে 853টি ছবি রয়েছে যা তিনটি শ্রেণিতে শ্রেণীবদ্ধ করা হয়েছে: PASCAL VOC ফরম্যাটে তাদের বাউন্ডিং বক্স সহ "মাস্ক সহ," "মাস্ক ছাড়া," এবং "ভুলভাবে পরিধান করা মাস্ক"।
-
FERET
FERET (ফেসিয়াল রিকগনিশন টেকনোলজি ডেটাবেস) হল একটি ব্যাপক ইমেজ ডেটাসেট যাতে মানুষের মুখের 14,000 টি টীকাযুক্ত ছবি রয়েছে।
হাতের লেখা চেনা:
-
MNIST ডাটাবেস
MNIST হল একটি ডাটাবেস যেখানে 0 থেকে 9 পর্যন্ত হাতে লেখা অঙ্কের নমুনা রয়েছে এবং এতে 60,000 এবং 10,000টি প্রশিক্ষণ এবং পরীক্ষার ছবি রয়েছে। 1999 সালে প্রকাশিত, MNIST ডিপ লার্নিং-এ ইমেজ প্রসেসিং সিস্টেম পরীক্ষা করা সহজ করে তোলে।
-
কৃত্রিম অক্ষর ডেটাসেট
কৃত্রিম অক্ষর ডেটাসেট হল, নাম অনুসারে, কৃত্রিমভাবে তৈরি করা ডেটা যা দশটি বড় অক্ষরে ইংরেজি ভাষার গঠন বর্ণনা করে। এটি 6000 টিরও বেশি চিত্রের সাথে আসে।
বস্তু সনাক্তকরণ:
এমএস কোকো
MS COCO বা Common Objects in Context হল একটি অবজেক্ট ডিটেকশন এবং ক্যাপশনিং ডেটাসেট।
এটিতে কীপয়েন্ট সনাক্তকরণ, মাল্টি-অবজেক্ট সনাক্তকরণ, ক্যাপশনিং এবং সেগমেন্টেশন মাস্ক টীকা সহ 328,000টিরও বেশি চিত্র রয়েছে। এটি 80টি অবজেক্ট ক্যাটাগরি এবং প্রতি ছবিতে পাঁচটি ক্যাপশন সহ আসে।
LSUN
LSUN, বড় আকারের দৃশ্য বোঝার জন্য সংক্ষিপ্ত, 20টি বস্তু এবং 10টি দৃশ্য বিভাগে এক মিলিয়নেরও বেশি লেবেলযুক্ত চিত্র রয়েছে৷ কিছু বিভাগে 300,000 এর কাছাকাছি চিত্র রয়েছে, 300টি ছবি বিশেষভাবে যাচাইকরণের জন্য এবং 1000টি পরীক্ষার ডেটার জন্য।
হোম অবজেক্ট
হোম অবজেক্ট ডেটাসেটে বাড়ির আশেপাশের এলোমেলো বস্তুর টীকাযুক্ত ছবি রয়েছে - রান্নাঘর, বসার ঘর এবং বাথরুম। এই ডেটাসেটে কয়েকটি টীকাযুক্ত ভিডিও এবং 398টি অব্যক্ত ফটো রয়েছে যা পরীক্ষার জন্য ডিজাইন করা হয়েছে৷
ভিজ্যুয়াল জিনোম
ভিজ্যুয়াল জিনোম হল একটি বিস্তৃত ভিজ্যুয়াল জ্ঞান ভাণ্ডার যার মধ্যে ১০৮,০০০ এরও বেশি ক্যাপশনযুক্ত ছবি রয়েছে। এটি বস্তু, বৈশিষ্ট্য এবং সম্পর্কের জন্য বিস্তৃত টীকা প্রদান করে, যা এটিকে বস্তু স্বীকৃতি, চিত্র ক্যাপশনিং এবং মাল্টিমোডাল শেখার কাজের জন্য মূল্যবান করে তোলে।
স্বয়ংচালিত:
সিটিস্কেপ ডেটাসেট
সিটিস্কেপ হল এমন ডেটাসেট যেখানে যেতে হয় যখন বিভিন্ন সাইটের রাস্তার দৃশ্য থেকে রেকর্ড করা বিভিন্ন ভিডিও সিকোয়েন্স খুঁজতে হয়। এই চিত্রগুলি দীর্ঘ সময় ধরে এবং বিভিন্ন আবহাওয়া এবং আলোর পরিস্থিতিতে ধারণ করা হয়েছিল। টীকাগুলি আটটি ভিন্ন বিভাগে বিভক্ত 30 শ্রেণীর চিত্রগুলির জন্য।
বার্কলে ডিপ ড্রাইভ
বার্কলে ডিপড্রাইভ বিশেষভাবে স্বায়ত্তশাসিত যানবাহন প্রশিক্ষণের জন্য ডিজাইন করা হয়েছে এবং এতে 100 হাজারের বেশি টীকাযুক্ত ভিডিও সিকোয়েন্স রয়েছে। পরিবর্তনশীল রাস্তা এবং ড্রাইভিং অবস্থার দ্বারা স্বায়ত্তশাসিত যানবাহনের জন্য এটি সবচেয়ে সহায়ক প্রশিক্ষণ ডেটাগুলির মধ্যে একটি।
ম্যাপিলারি
ম্যাপিলারিতে বিশ্বব্যাপী 750 মিলিয়নেরও বেশি রাস্তার দৃশ্য এবং ট্র্যাফিক লক্ষণ রয়েছে, যা মেশিন লার্নিং এবং এআই অ্যালগরিদমগুলিতে ভিজ্যুয়াল উপলব্ধি মডেল প্রশিক্ষণের জন্য অত্যন্ত কার্যকর। এটি আপনাকে স্বায়ত্তশাসিত যানবাহন বিকাশ করতে দেয় যা বিভিন্ন আলো এবং আবহাওয়ার পরিস্থিতি এবং দৃষ্টিভঙ্গি পূরণ করে।
মেডিকেল ইমেজিং:
Covid-19 ওপেন রিসার্চ ডেটাসেট
এই আসল ডেটাসেটে AP/PA বুকের এক্স-রে সম্পর্কে প্রায় 6500 পিক্সেল-পলিগোনাল ফুসফুসের বিভাজন রয়েছে। উপরন্তু, নাম, অবস্থান, ভর্তির বিশদ বিবরণ, ফলাফল এবং আরও অনেক কিছু সম্বলিত ট্যাগ সহ Covid-517 রোগীর এক্স-রেগুলির 19 টি ছবি পাওয়া যায়।
100,000 বুকের এক্স-রে এর NIH ডাটাবেস
NIH ডাটাবেস হল 100,000 বুকের এক্স-রে ছবি এবং বৈজ্ঞানিক ও গবেষণা সম্প্রদায়ের জন্য উপযোগী সম্পর্কিত ডেটা সহ সর্বজনীনভাবে উপলব্ধ সবচেয়ে ব্যাপক ডেটাসেটগুলির মধ্যে একটি। এমনকি এটিতে ফুসফুসের উন্নত অবস্থার রোগীদের চিত্রও রয়েছে।
ডিজিটাল প্যাথলজির অ্যাটলাস
ডিজিটাল প্যাথলজির অ্যাটলাস বিভিন্ন অঙ্গের প্রায় 17,000 টি টীকাযুক্ত স্লাইড থেকে বিভিন্ন হিস্টোপ্যাথলজিকাল প্যাচ চিত্র অফার করে, মোট 100টিরও বেশি। এই ডেটাসেটটি কম্পিউটার ভিশন এবং প্যাটার্ন রিকগনিশন সফ্টওয়্যার তৈরিতে কার্যকর।
দৃশ্য শনাক্তকরণ:

অন্দর দৃশ্য স্বীকৃতি
ইন্ডোর সিন রিকগনিশন হল একটি উচ্চ শ্রেণীবদ্ধ ডেটাসেট যার প্রায় 15620টি বস্তুর ছবি এবং ইনডোর সিনারি মেশিন লার্নিং এবং ডেটা প্রশিক্ষণে ব্যবহার করা হবে। এটি 65 টিরও বেশি বিভাগের সাথে আসে এবং প্রতিটি বিভাগে সর্বনিম্ন 100টি চিত্র রয়েছে।
xView
সেরা পরিচিত সর্বজনীনভাবে উপলব্ধ ডেটাসেটগুলির মধ্যে একটি হিসাবে, xView বিভিন্ন জটিল এবং বৃহৎ দৃশ্য থেকে টীকাযুক্ত ওভারহেড চিত্র ধারণ করে৷ প্রায় 60টি ক্লাস এবং এক মিলিয়নেরও বেশি বস্তুর দৃষ্টান্ত রয়েছে, এই ডেটাসেটের উদ্দেশ্য হল স্যাটেলাইট চিত্র ব্যবহার করে আরও ভাল দুর্যোগ ত্রাণ প্রদান করা।
জায়গা
স্থানগুলি, এমআইটি দ্বারা অবদানকৃত একটি ডেটাসেট, 1.8টি ভিন্ন দৃশ্যের বিভাগ থেকে 365 মিলিয়নেরও বেশি চিত্র রয়েছে। যাচাইকরণের জন্য এই বিভাগে প্রায় 50টি চিত্র এবং পরীক্ষার জন্য 900টি চিত্র রয়েছে। দৃশ্য শনাক্তকরণ বা ভিজ্যুয়াল রিকগনিশন কাজগুলি প্রতিষ্ঠা করতে গভীর দৃশ্যের বৈশিষ্ট্যগুলি শেখা সম্ভব।
SUN ডাটাবেস
SUN ডাটাবেস হল একটি বিস্তৃত দৃশ্য শ্রেণীবদ্ধকরণ মানদণ্ড যা কম্পিউটার ভিশনে ব্যাপকভাবে ব্যবহৃত হয়। এতে অভ্যন্তরীণ এবং বহিরঙ্গন পরিবেশের বিস্তৃত পরিসর জুড়ে হাজার হাজার ছবি রয়েছে, প্রতিটি দৃশ্যের জন্য বিশদ টীকা সহ। SUN ডাটাবেস বিভিন্ন দৃশ্যের কভারেজের জন্য স্বীকৃত এবং দৃশ্য বোঝার অ্যালগরিদম মূল্যায়নের জন্য একটি আদর্শ রেফারেন্স হিসেবে কাজ করে।
এনটারটেনমেন্ট:
আইএমডিবি উইকি ডেটাসেট
IMDB – উইকি হল বয়স, লিঙ্গ এবং নাম সহ পর্যাপ্তভাবে লেবেলযুক্ত মুখগুলির অন্যতম জনপ্রিয় পাবলিক ডাটাবেস। এটিতে সেলিব্রিটিদের প্রায় 20 হাজার মুখ এবং উইকিপিডিয়া থেকে 62 হাজার মুখ রয়েছে।
সেলিব্রিটি মুখ
Celeb Faces হল সেলিব্রিটিদের 200,000 টীকাযুক্ত ছবি সহ একটি বড় মাপের ডাটাবেস। ছবিগুলি ব্যাকগ্রাউন্ডের আওয়াজ এবং ভঙ্গি বৈচিত্র্যের সাথে আসে, যা কম্পিউটার ভিশন টাস্কে প্রশিক্ষণ পরীক্ষার সেটের জন্য মূল্যবান করে তোলে। মুখের স্বীকৃতি, সম্পাদনা, মুখের অংশ স্থানীয়করণ এবং আরও অনেক কিছুতে উচ্চতর নির্ভুলতা অর্জনের জন্য এটি অত্যন্ত উপকারী।
ইউটিউব-৮এম ডেটাসেট
YouTube-8M হল একটি বৃহৎ-স্কেল লেবেলযুক্ত ভিডিও ডেটাসেট যাতে লক্ষ লক্ষ YouTube ভিডিও আইডি রয়েছে যার মধ্যে ভিজ্যুয়াল সত্তার উচ্চ-মানের মেশিন-জেনারেটেড অ্যানোটেশন রয়েছে। এই ডেটাসেটটি বৃহৎ-স্কেল ভিডিও বোঝার এবং প্রশিক্ষণের ভিশন অ্যালগরিদমের জন্য ব্যাপকভাবে ব্যবহৃত হয়, কারণ এটি YouTube ভিডিও আইডির মাধ্যমে ভিডিও সামগ্রীকে মেটাডেটার সাথে লিঙ্ক করে, যা ভিডিও ডেটার স্কেলেবল সংগ্রহ এবং অ্যানোটেশন সক্ষম করে।
এখন যেহেতু আপনার কৃত্রিম বুদ্ধিমত্তার যন্ত্রপাতিকে শক্তিশালী করার জন্য ওপেন-সোর্স ইমেজ ডেটাসেটের বিশাল তালিকা আপনার হাতে রয়েছে। আপনার AI এবং মেশিন লার্নিং মডেলগুলির ফলাফল মূলত আপনি যে ডেটাসেটগুলি খাওয়ান এবং প্রশিক্ষণ দেন তার মানের উপর নির্ভর করে। আপনি যদি চান যে আপনার AI মডেলটি সঠিক ভবিষ্যদ্বাণী তৈরি করুক, তাহলে এর জন্য উন্নত মানের ডেটাসেট প্রয়োজন যা একত্রিত, ট্যাগ করা এবং নিখুঁতভাবে লেবেল করা। এই ডেটাসেটগুলির সাথে কাজ করা ব্যবহারিক, বাস্তব-বিশ্ব প্রকল্পের মাধ্যমে আপনার মেশিন লার্নিং দক্ষতা বিকাশ এবং উন্নত করার একটি দুর্দান্ত উপায়। আপনার কম্পিউটার ভিশন সিস্টেমের সাফল্যকে আরও উন্নত করতে, আপনাকে অবশ্যই আপনার প্রকল্পের ভিশনের সাথে প্রাসঙ্গিক মানসম্পন্ন ইমেজ ডেটাবেস ব্যবহার করতে হবে।


