ডেটাসেট খুলুন

ওপেন সোর্স ডেটাসেটগুলি আবিষ্কার করুন যা আপনাকে ML মডেলগুলিকে প্রশিক্ষণ দিতে যায়৷

ডেটাসেট খুলুন

AI/ML মডেলের সাথে শুরু করার জন্য ওপেন সোর্স ডেটাসেট

আপনার AI এবং ML মডেলগুলির আউটপুট শুধুমাত্র ততটাই ভাল যে ডেটা আপনি এটিকে প্রশিক্ষণের জন্য ব্যবহার করেন - তাই ডেটা একত্রিতকরণের ক্ষেত্রে আপনি যে নির্ভুলতা প্রয়োগ করেন এবং সেই ডেটার ট্যাগিং এবং সনাক্তকরণ গুরুত্বপূর্ণ!

সুতরাং আপনি যদি একটি নতুন এআই/এমএল উদ্যোগ শুরু করতে চান এবং এখন আপনি দ্রুত উপলব্ধি করছেন যে উচ্চ-মানের প্রশিক্ষণের ডেটা খুঁজে পাওয়া আপনার প্রকল্পের আরও চ্যালেঞ্জিং দিকগুলির মধ্যে একটি হবে কারণ উচ্চ-মানের ডেটাসেটগুলি হল জ্বালানী যা AI/কে ধরে রাখে। এমএল ইঞ্জিন চলছে। আমরা উন্মুক্ত ডেটাসেটের একটি তালিকা সংগ্রহ করেছি যা আপনার ভবিষ্যতের AI/ML মডেলগুলিকে ব্যবহার এবং প্রশিক্ষণের জন্য বিনামূল্যে।

বিশেষজ্ঞতাতথ্য টাইপডেটাসেটের নামশিল্প / বিভাগটীকা/ব্যবহারের ক্ষেত্রেবিবরণলিংক
NLPপাঠআমাজন পর্যালোচনাই-কমার্সঅনুভূতির বিশ্লেষণব্যবহারকারী এবং পণ্যের বিবরণ সহ সরল পাঠ্যে গত 35 বছরের 18 মিলিয়ন পর্যালোচনা এবং রেটিংগুলির একটি সেট৷লিংক
NLPপাঠউইকিপিডিয়া লিঙ্ক ডেটাসাধারণ৪ মিলিয়নের বেশি 4 Bn ধারণকারী নিবন্ধ. শব্দ যা শব্দ এবং বাক্যাংশের পাশাপাশি অনুচ্ছেদ নিয়ে গঠিত।লিংক
NLPপাঠস্ট্যান্ডফোর্ড সেন্টিমেন্ট ট্রিব্যাঙ্কবিনোদনঅনুভূতির বিশ্লেষণএইচটিএমএল ফাইল ফরম্যাটে Rotten Tomatoes থেকে 10,000 টুকরো পর্যালোচনার জন্য সেন্টিমেন্ট টীকা ডেটাসেটলিংক
NLPপাঠটুইটার ইউএস এয়ারলাইন সেন্টিমেন্টবিমানসংস্থাঅনুভূতির বিশ্লেষণ2015 ইউএস এয়ারলাইন্সের টুইটগুলি ইতিবাচক, নেতিবাচক এবং নিরপেক্ষ টোনে বিভক্তলিংক
CVভাবমূর্তি লেবেলযুক্ত ফেস ইন দ্য ওয়াইল্ডসাধারণমুখের স্বীকৃতিফেসিয়াল রিকগনিশন প্রশিক্ষণের জন্য দুটি ভিন্ন ছবি সহ 13,000 টিরও বেশি ক্রপ করা মুখের ডেটাসেট।লিংক
CVভিডিও, ছবিUMDFaces ডেটাসেটসাধারণমুখের স্বীকৃতিটীকাযুক্ত ডেটাসেট 367,000 টিরও বেশি বিষয় থেকে 8,000 টিরও বেশি মুখ সমন্বিত যা স্থির এবং ভিডিও চিত্রগুলি অন্তর্ভুক্ত করে৷লিংক
CVভাবমূর্তি ইমেজনেটসাধারণ14 মিলিয়নের বেশি ডেটাসেট। বিভিন্ন ফাইল ফরম্যাটে ছবি, WordNet অনুক্রম অনুসারে সংগঠিত।লিংক
CVভাবমূর্তি গুগলের ওপেন ইমেজসাধারণ9 Mn 6,000 টিরও বেশি বিভাগ থেকে সর্বজনীন ছবিকে শ্রেণীবদ্ধ করার জন্য URL।লিংক
NLPপাঠMIMIC ক্রিটিক্যাল কেয়ার ডাটাবেসস্বাস্থ্যসেবাকম্পিউটেশনাল ফিজিওলজি ডেটাসেটগুলি 40,000 ক্রিটিক্যাল কেয়ার রোগীদের থেকে ডি-আইডেন্টিফাই ডেটা সহ। ডেটাসেটে জনসংখ্যা, গুরুত্বপূর্ণ লক্ষণ, ওষুধ ইত্যাদির মতো তথ্য রয়েছে।লিংক
CVভাবমূর্তিমার্কিন জাতীয় ভ্রমণ ও পর্যটন অফিসভ্রমণব্যবস্থানির্ভরযোগ্য ডাটাবেস সহ পর্যটন শিল্প থেকে বিস্তৃত ফটোগ্রাফ সরবরাহ করে, অন্তর্মুখী এবং বহির্মুখী ভ্রমণ এবং আন্তর্জাতিক পর্যটন তথ্যের মতো বিষয়গুলি কভার করে।লিংক
NLPপাঠপরিবহন দপ্তরভ্রমণব্যবস্থাপর্যটন ডেটাসেট যা জাতীয় উদ্যান, ড্রাইভার রেজিস্টার, সেতু এবং রেল তথ্য ইত্যাদি অন্তর্ভুক্ত করে।লিংক
NLPAudioফ্লিকার অডিও ক্যাপশন কর্পাসসাধারণ40টি ফটোগ্রাফ থেকে 8,000 হাজারেরও বেশি কথ্য ক্যাপশন যা তত্ত্বাবধানহীন বক্তৃতা প্যাটার্নের জন্য ডিজাইন করা হয়েছেলিংক
NLPAudioস্পিচ কমান্ড ডেটাসেটসাধারণস্পিচ রিকগনিশন, অডিও টীকামৌলিক ভয়েস ইন্টারফেস তৈরি করতে হাজার হাজার ব্যক্তির কাছ থেকে 1 সেকেন্ড দীর্ঘ উচ্চারণ।লিংক
NLPAudioপরিবেশগত অডিও ডেটাসেটসাধারণএনভায়রনমেন্ট অডিও ডেটাসেট যাতে ইভেন্ট টেবিল এবং অ্যাকোস্টিক সিন টেবিলের শব্দ থাকে।লিংক
NLPপাঠCOVID-19 ওপেন রিসার্চ ডেটাসেট স্বাস্থ্যসেবামেডিকেল এআইকোভিড-১৯ এবং ভাইরাসের করোনাভাইরাস পরিবার সম্পর্কিত 45,000টি পণ্ডিত নিবন্ধ সমন্বিত একটি গবেষণা ডেটাসেট।লিংক
CVভাবমূর্তিWaymo ওপেন ডেটাসেট স্বয়ংচালিতWaymo দ্বারা প্রকাশিত সবচেয়ে বৈচিত্র্যময় স্বায়ত্তশাসিত ড্রাইভিং ডেটাসেটলিংক
CVভাবমূর্তিলেবেলমে পাবলিক সরকারলেবেলমে ম্যাটল্যাবের মাধ্যমে অ্যাক্সেসযোগ্য টীকাযুক্ত চিত্রগুলির একটি বড় সেটলিংক
CVভাবমূর্তিCOIL100সাধারণএকাধিক কোণ (অর্থাৎ 100 ডিগ্রি) থেকে 360 টিরও বেশি বৈচিত্র্যময় বস্তুর ছবি তোলা হয়েছেলিংক
CVভাবমূর্তিস্ট্যানফোর্ড ডগস ডেটাসেটসাধারণ20,500+ এর বেশি ছবি 120টি বিভিন্ন কুকুরের জাতের ইমেজ সেটে শ্রেণীবদ্ধ করা হয়েছেলিংক
CVভাবমূর্তিঅন্দর দৃশ্য স্বীকৃতিসাধারণদৃশ্য স্বীকৃতিদৃশ্য শনাক্তকরণ মডেল তৈরি করার জন্য 15620টি ইনডোর বিভাগ থেকে 67টি চিত্র সমন্বিত একটি নির্দিষ্ট ডেটাসেটলিংক
CVভাবমূর্তিভিজ্যুয়ালকিউএসাধারণএকটি ডেটাসেট যাতে 265,016টি ফটো সম্পর্কিত ওপেন-এন্ডেড প্রশ্ন থাকে যার প্রতিক্রিয়া জানাতে দৃষ্টি এবং ভাষা বোঝার প্রয়োজন।লিংক
NLPপাঠমাল্টিডোমেন সেন্টিমেন্ট বিশ্লেষণ ডেটাসেটই-কমার্সঅনুভূতির বিশ্লেষণঅ্যামাজন থেকে পণ্য পর্যালোচনা ধারণকারী ডেটাসেটলিংক
NLPপাঠIMDB পর্যালোচনাবিনোদনঅনুভূতির বিশ্লেষণঅনুভূতি বিশ্লেষণের জন্য 25000 মুভি পর্যালোচনা ধারণকারী ডেটাসেটলিংক
NLPপাঠঅনুভূতি140সাধারণঅনুভূতির বিশ্লেষণউচ্চ নির্ভুলতার জন্য প্রাক-মুছে ফেলা ইমোটিকন সহ 160,000 টি টুইট ধারণকারী ডেটাসেটলিংক
NLPপাঠব্লগার কর্পাসসাধারণকীপ্রেস বিশ্লেষণblogger.com থেকে 681,288টি ব্লগ পোস্ট সম্বলিত ডেটাসেট যাতে বহুল ব্যবহৃত ইংরেজি শব্দের ন্যূনতম 200টি ঘটনা রয়েছে।লিংক
NLPপাঠঝুঁকিসাধারণচ্যাটবট প্রশিক্ষণ200,000 টিরও বেশি প্রশ্ন সহ ডেটাসেট যা মেশিন লার্নিং মডেলগুলিকে বুদ্ধিমত্তার সাথে স্বয়ংক্রিয় প্রতিক্রিয়া জানাতে প্রশিক্ষণ দিতে ব্যবহার করা যেতে পারেলিংক
NLPপাঠইংরেজিতে এসএমএস স্প্যাম সংগ্রহটেলিকমস্প্যাম স্বীকৃতি5,574টি ইংরেজি এসএমএস সমন্বিত একটি স্প্যাম বার্তা ডেটাসেট৷লিংক
NLPপাঠYelp পর্যালোচনাসাধারণঅনুভূতির বিশ্লেষণYelp দ্বারা প্রকাশিত 5 মিলিয়নের বেশি পর্যালোচনা সহ একটি ডেটাসেট৷লিংক
NLPপাঠUCI এর Spambaseউদ্যোগস্প্যাম স্বীকৃতিস্প্যাম ইমেলগুলির একটি বড় ডেটাসেট, স্প্যাম ফিল্টারিংয়ের জন্য দরকারী৷লিংক
CVভিডিও, ছবিবার্কলে ডিপড্রাইভ BDD100kস্বয়ংচালিতস্বায়ত্বশাসিত যানবাহননিউইয়র্ক এবং সান ফ্রান্সিসকো এলাকা থেকে দিনের বিভিন্ন সময়ে 1,100টিরও বেশি ভিডিওতে 100,000-ঘন্টা ড্রাইভিং অভিজ্ঞতা সহ স্ব-ড্রাইভিং এআই-এর জন্য বৃহত্তম ডেটাসেটগুলির মধ্যে একটি৷লিংক
CVভিডিওকমা.আস্বয়ংচালিতস্বায়ত্বশাসিত যানবাহন একটি 7 ঘন্টা হাইওয়ে ড্রাইভিং ডেটাসেট যা গাড়ির গতি, ত্বরণ, স্টিয়ারিং কোণ এবং GPS স্থানাঙ্কের তথ্য সমন্বিত করেলিংক
CVভিডিও, ছবিসিটিস্কেপ ডেটাসেটস্বয়ংচালিতস্বায়ত্তশাসিত যানবাহনের জন্য শব্দার্থিক লেবেল5,000 পিক্সেল-স্তরের টীকাগুলির একটি ডেটাসেট এবং 20,000টি বিভিন্ন শহর থেকে রেকর্ড করা স্টেরিও ভিডিও সিকোয়েন্সে 50 দুর্বলভাবে টীকাযুক্ত ফ্রেমের একটি বড় সেটলিংক
CVভাবমূর্তিKUL বেলজিয়াম ট্রাফিক সাইন ডেটাসেটস্বয়ংচালিতস্বায়ত্বশাসিত যানবাহনবেলজিয়াম জুড়ে শারীরিকভাবে স্বতন্ত্র ট্রাফিক লক্ষণের উপর ভিত্তি করে ফ্ল্যান্ডার্স অঞ্চল থেকে 10000+ ট্রাফিক সাইন টীকা।লিংক
CVভাবমূর্তিLISA: বুদ্ধিমান এবং নিরাপদ অটোমোবাইলসের জন্য পরীক্ষাগার, UC সান দিয়েগো ডেটাসেটস্বয়ংচালিতস্বায়ত্বশাসিত যানবাহনট্র্যাফিক লক্ষণ, যানবাহন সনাক্তকরণ, ট্র্যাফিক লাইট এবং ট্র্যাজেক্টরি প্যাটার্ন ধারণকারী একটি সমৃদ্ধ ডেটাসেট।লিংক
CVভাবমূর্তিসিআইএফএআর -10সাধারণঅবজেক্ট রিকগনিশনবস্তু শনাক্তকরণের জন্য 50,000টি ছবি এবং 10,000টি পরীক্ষার ছবি (অর্থাৎ 60,000টি 32x32টি 10টি ক্লাসে কালার ইমেজ) সমন্বিত একটি ডেটাসেট।লিংক
CVভাবমূর্তিফ্যাশন MNISTফ্যাশনএকটি ইমেজ ডেটাসেট যা 60,000টি উদাহরণ এবং 10,000×28 গ্রেস্কেল ছবিতে 28টি উদাহরণের একটি পরীক্ষার সেট, 10টি ক্লাসের একটি লেবেলের সাথে যুক্ত।লিংক
CVভাবমূর্তিIMDB-উইকি ডেটাসেটবিনোদনমুখের স্বীকৃতিলিঙ্গ এবং বয়সের মতো লেবেল সহ মুখের চিত্রগুলির একটি বড় ডেটাসেট৷ মোট 523,051টি মুখের ছবির মধ্যে, 460,723টি ছবি 20,284 জন সেলিব্রিটির কাছ থেকে IMDB থেকে এবং 62,328টি উইকিপিডিয়া থেকে পাওয়া গেছে।লিংক
CVভিডিওগতিবিদ্যা-700সাধারণপ্রতিটি অ্যাকশন ক্লাসের জন্য, উচ্চ-মানের ডেটাসেটে 650,000 ভিডিও ক্লিপ থাকে এবং কমপক্ষে 700টি ভিডিও ক্লিপ সহ 600টি মানব অ্যাকশন ক্লাস অন্তর্ভুক্ত করে। এখানে, প্রতিটি ক্লিপ 10 সেকেন্ড বা তার বেশি স্থায়ী হয়।লিংক
CVভাবমূর্তিএমএস কোকোসাধারণঅবজেক্ট ডিটেকশন, সেগমেন্টেশনডেটাসেটে 328k ছবি রয়েছে এবং এতে মোট 2.5 মিলিয়ন দৃষ্টান্ত এবং 91টি অবজেক্ট ইমেজ রয়েছে যাতে বড় আকারের অবজেক্ট ডিটেকশন, সেগমেন্টেশন, এবং ডেটা ক্যাপশনিং সম্পর্কিত এমএল মডেল প্রশিক্ষণ দেওয়া যায়।লিংক
CVভাবমূর্তিMPII হিউম্যান পোজ ডেটাসেটসাধারণটীকাযুক্ত বডি জয়েন্ট সহ 25K এর বেশি ব্যক্তি সমন্বিত প্রায় 40K ফটোগ্রাফ ডেটাসেটে অন্তর্ভুক্ত করা হয়েছে, যা মানুষের ভঙ্গি অনুমান প্রকাশ করার জন্য ব্যবহৃত হয়। সামগ্রিকভাবে ডেটাসেটে 410টি মানুষের ক্রিয়াকলাপ রয়েছে এবং প্রতিটি চিত্র একটি কার্যকলাপ লেবেল সহ সরবরাহ করা হয়েছে।লিংক
CVভাবমূর্তিচিত্রগুলি খুলুনসাধারণঅবজেক্ট লোকেশন টীকাইমেজ-লেভেল লেবেল, অবজেক্ট বাউন্ডিং বক্স, অবজেক্ট সেগমেন্টেশন ইত্যাদি সহ প্রায় 9 মিলিয়ন ইমেজ সহ ইমেজ ডেটাসেট। ডেটাসেটটিতে 16 মিলিয়ন রয়েছে। 600 মিলিয়ন ছবিতে 1.9টি অবজেক্ট ক্লাসের জন্য বাউন্ডিং বক্স।লিংক
CVভিডিও, ছবিArgo, Argo, USA দ্বারাস্বয়ংচালিতবাউন্ডিং বক্স, অপটিক্যাল ফ্লো, আচরণগত লেবেল, শব্দার্থিক লেবেল, লেন চিহ্নিতকরণএকটি স্ব-ড্রাইভিং ডেটাসেট যা জ্যামিতিক এবং শব্দার্থিক মেটাডেটা সহ এইচডি মানচিত্র যেমন লেন কেন্দ্ররেখা, লেনের দিকনির্দেশ এবং ড্রাইভযোগ্য এলাকা। ডেটাসেটটি এমএল মডেলগুলিকে প্রশিক্ষণ দিতে, আরও সঠিক উপলব্ধি অ্যালগরিদম তৈরি করতে ব্যবহৃত হয়, যা স্ব-চালিত যানবাহনগুলিকে নিরাপদে নেভিগেট করতে সহায়তা করবে।লিংক
CVভিডিওBosch ছোট ট্রাফিক লাইট, Bosch উত্তর আমেরিকা গবেষণা দ্বারাস্বয়ংচালিতসীমান্ত বক্সদৃষ্টি-ভিত্তিক ট্র্যাফিক লাইট সনাক্তকরণ সিস্টেম তৈরি করতে 13427*1280 রেজোলিউশন সহ 720টি ক্যামেরা চিত্র সমন্বিত একটি ডেটাসেট। ডেটাসেটে 24000 টিরও বেশি টীকাযুক্ত ট্রাফিক লাইট রয়েছে৷লিংক
CVভিডিওBrain4Cars, কর্নেল ইউনিভার্সিটি দ্বারা, মার্কিন যুক্তরাষ্ট্রস্বয়ংচালিতআচরণগত লেবেলচালকের সতর্কতা সম্পর্কে দরকারী পরিসংখ্যান বের করার জন্য কেবিন সেন্সর (ক্যামেরা, স্পর্শকাতর সেন্সর, স্মার্ট ডিভাইস, ইত্যাদি) সমন্বিত একটি ডেটাসেট। আমাদের অ্যালগরিদমগুলি এমন ড্রাইভারদের সনাক্ত করতে পারে যারা তন্দ্রাচ্ছন্ন বা বিভ্রান্ত এবং সুরক্ষা উন্নত করার জন্য প্রয়োজনীয় অ্যালার্ম বাড়িয়ে দেয়।লিংক
CVভাবমূর্তিCULane, চীনা বিশ্ববিদ্যালয় দ্বারা। হংকং, বেইজিং, চীনস্বয়ংচালিতলেন চিহ্নিতকরণট্র্যাফিক লেন সনাক্তকরণের উপর একটি কম্পিউটার ভিশন ডেটাসেট, যার মধ্যে 55 ঘন্টা ভিডিও রয়েছে যার মধ্যে 133,235টি (88880টি প্রশিক্ষণ সেট, 9675টি বৈধতা সেট, এবং 34680টি পরীক্ষা সেট) ফ্রেমগুলি বের করা হয়েছে৷ এটি বেইজিংয়ের বিভিন্ন চালক দ্বারা চালিত ছয়টি ভিন্ন যানবাহনে লাগানো ক্যামেরা দ্বারা সংগ্রহ করা হয়।লিংক
CVভিডিওDAVIS, Univ দ্বারা। জুরিখ, ETH ¨ জুরিখ, জার্মানি, সুইজারল্যান্ডস্বয়ংচালিতএকটি এন্ড-টু-এন্ড যানবাহন ড্রাইভিং প্রশিক্ষণ ডেটাসেট যা একটি DAVIS ইভেন্ট+ফ্রেম ক্যামেরা ব্যবহার করে। গাড়ির ডেটা যেমন স্টিয়ারিং, থ্রটল, জিপিএস, ইত্যাদি স্বয়ংচালিত অ্যাপগুলির জন্য ফ্রেম এবং ইভেন্ট ডেটার ফিউশন মূল্যায়ন করতে ব্যবহৃত হয়।লিংক
CVভিডিওডিবিনেট, সাংহাই জিয়াও টং ইউনিভার্সিটি, জিয়ামেন ইউনিভার্সিটি, চীনস্বয়ংচালিতবিন্দু মেঘ, LiDARএকটি বাস্তব-বিশ্বের 1000 কিমি ড্রাইভিং ডেটা, যাতে সারিবদ্ধ ভিডিও, পয়েন্ট ক্লাউড, জিপিএস এবং ড্রাইভিং আচরণের উপর গভীর গবেষণার জন্য ড্রাইভারের আচরণ অন্তর্ভুক্ত।লিংক
CVভিডিওইউনিভার্সিটির দ্বারা ডা. মোডেনা এবং রেজিও এমিলিয়া, মোডেনা, ইতালিরস্বয়ংচালিতআচরণগত লেবেলপ্রতিটি 74 মিনিটের 5টি ভিডিও সিকোয়েন্স সহ ডেটাসেট, যা 500,000-এর বেশি ফ্রেমে টীকা করা হয়েছে৷ ডেটাসেটে জিও-রেফারেন্সযুক্ত অবস্থান, ড্রাইভিং স্পিড, কোর্স, এবং এছাড়াও ড্রাইভারদের দৃষ্টি নিবদ্ধকরণ এবং তাদের অস্থায়ী একীকরণের লেবেল রয়েছে যা টাস্ক-নির্দিষ্ট মানচিত্র প্রদান করে।লিংক
CVভিডিওETH পেডেস্ট্রিয়ান (2009), ETH জুরিখ, জুরিখ, সুইজারল্যান্ড দ্বারাসাধারণসীমান্ত বক্স74-এর বেশি ফ্রেমে টীকাযুক্ত প্রতিটি 5 মিনিটের 500,000টি ভিডিও সিকোয়েন্সের একটি ডেটাসেট৷ ডেটাসেটটি জিও-রেফারেন্সযুক্ত অবস্থান, ড্রাইভিং গতি, দিকনির্দেশ প্রদান করে এবং এছাড়াও চালকদের জন্য লেবেল স্থিরকরণ এবং তাদের সাময়িক একীকরণ, টাস্ক-নির্দিষ্ট মানচিত্র সহ।লিংক
CVভিডিওFord (2009), Univ দ্বারা। মিশিগান, মিশিগান, মার্কিনস্বয়ংচালিতবাউন্ডিং বক্স, , LiDARএকটি Velodyne 3D-লিডার স্ক্যানার, দুটি পুশ-ব্রুম ফরোয়ার্ড-লুকিং রিগ লিডার, একটি প্রযুক্তিগত এবং ভোক্তা জড়তা পরিমাপ ইউনিট (IMU), এবং একটি পয়েন্ট গ্রে লেডিবাগ 3 সর্বমুখী ক্যামেরা সিস্টেম দিয়ে সজ্জিত একটি স্বয়ংক্রিয় ল্যান্ড ভেহিকেল দ্বারা সংকলিত একটি ডেটাসেট।লিংক
CVভিডিওএইচসিআই চ্যালেঞ্জিং স্টেরিও, বোশ কর্পোরেশন রিসার্চ, হিলডেশেইম, জার্মানিসাধারণক্যাপচার করা ভিডিও দৃশ্য থেকে কয়েক মিলিয়ন ফ্রেমের একটি ডেটাসেট যাতে বিভিন্ন আবহাওয়ার পরিস্থিতি, গতির একাধিক স্তর এবং গভীরতা রয়েছে; শহর এবং গ্রামাঞ্চলের পরিস্থিতি ইত্যাদিলিংক
CVভিডিওJAAD, ইয়র্ক ইউনিভার্সিটি, ইউক্রেন, কানাডা দ্বারাস্বয়ংচালিতবাউন্ডিং বক্স, আচরণগত লেবেল"JAAD হল স্বায়ত্তশাসিত ড্রাইভিং এর প্রেক্ষাপটে যৌথ মনোযোগ অধ্যয়ন করার জন্য একটি ডেটাসেট। পথচারী এবং চালকের আচরণের উপর ফোকাস করা হয় ক্রসিং এর বিন্দুতে এবং তাদের প্রভাবিত করে এমন কারণগুলির উপর। এই লক্ষ্যে, JAAD ডেটাসেটটি 346টি ছোট ভিডিওর একটি সমৃদ্ধ টীকাযুক্ত সংগ্রহ প্রদান করে। ক্লিপগুলি (5-10 সেকেন্ড দীর্ঘ) উত্তর আমেরিকা এবং পূর্ব ইউরোপের বিভিন্ন স্থান থেকে 240 ঘন্টার বেশি ড্রাইভিং ফুটেজ থেকে বের করা হয়েছে৷ অক্লুশন ট্যাগ সহ বাউন্ডিং বাক্সগুলি সমস্ত পথচারীদের জন্য ব্যবহার করা হয় যা এই ডেটাসেটটিকে পথচারীদের সনাক্তকরণের জন্য উপযুক্ত করে তোলে৷ আচরণের টীকাগুলি পথচারীদের জন্য আচরণ নির্দিষ্ট করে৷ যা ড্রাইভারের সাথে ইন্টারঅ্যাক্ট করে বা তার মনোযোগের প্রয়োজন। প্রতিটি ভিডিওর জন্য বেশ কয়েকটি ট্যাগ (আবহাওয়া, অবস্থান, ইত্যাদি) এবং টাইমস্ট্যাম্পযুক্ত আচরণের লেবেল (যেমন থামানো, হাঁটা, দেখা ইত্যাদি) রয়েছে। উপরন্তু, জনসংখ্যাগত বৈশিষ্ট্যগুলির একটি তালিকা হল প্রতিটি পথচারীর জন্য (যেমন বয়স, লিঙ্গ, গতির দিক, ইত্যাদি) পাশাপাশি প্রতিটি ফ্রেমে দৃশ্যমান ট্র্যাফিক দৃশ্যের উপাদানগুলির একটি তালিকা (যেমন স্টপ সাইন, ট্র্যাফিক সিগন্যাল, ইত্যাদি) প্রদান করা হয়েছে।"লিংক
CVভাবমূর্তিLISA ট্রাফিক সাইন, Univ দ্বারা। ক্যালিফোর্নিয়া, সান দিয়েগো, মার্কিন যুক্তরাষ্ট্রস্বয়ংচালিতসীমান্ত বক্সভিডিও এবং টীকাযুক্ত ফ্রেম সমন্বিত ডেটাসেটের সেট যেখানে মার্কিন ট্রাফিক চিহ্ন রয়েছে৷ এটি দুটি পর্যায়ে প্রকাশ করা হয়, একটি শুধুমাত্র ছবি সহ এবং একটি ছবি এবং ভিডিও উভয়ের সাথে।লিংক
CVভাবমূর্তিMapillary Vistas, Mapillary AB, গ্লোবাল দ্বারাস্বয়ংচালিতশব্দার্থিক লেবেলপিক্সেল-সঠিক এবং দৃষ্টান্ত-নির্দিষ্ট মানব টীকা সহ সারা বিশ্বের রাস্তার দৃশ্য ব্যাখ্যা করার জন্য একটি রাস্তার-স্তরের ফটোগ্রাফি ডেটাসেট।লিংক
CVভিডিও, ছবিশব্দার্থিক KITTI, বন বিশ্ববিদ্যালয় দ্বারা, কার্লসরুহে, জার্মানিস্বয়ংচালিতবাউন্ডিং বক্স, শব্দার্থিক লেবেল, লেন চিহ্নিতকরণএকটি ডেটাসেট যা সমস্ত ওডোমেট্রি বেঞ্চমার্ক সিকোয়েন্সের জন্য একটি শব্দার্থিক টীকা অন্তর্ভুক্ত করে। ডেটাসেটটি বিভিন্ন ধরণের চলমান এবং অ-চলমান ট্রাফিকের টীকা দেয়: গাড়ি, বাইক, সাইকেল, পথচারী এবং সাইকেল আরোহীদের সহ, দৃশ্যের বস্তুগুলিকে অধ্যয়ন করার অনুমতি দেয়।লিংক
CVভিডিওস্ট্যানফোর্ড ট্র্যাক, স্ট্যানফোর্ড ইউনিভার্সিটি দ্বারা, মার্কিন যুক্তরাষ্ট্রস্বয়ংচালিতঅবজেক্ট ডিটেকশন / ক্লাসিফিকেশন LiDAR, GPS, কোডএকটি ডেটাসেট যাতে 14,000টি লেবেলযুক্ত অবজেক্ট ট্র্যাক রয়েছে যা একটি Velodyne HDL-64E S2 LIDAR দ্বারা প্রাকৃতিক রাস্তার দৃশ্যে পর্যবেক্ষণ করা হয়েছে, যা 3D অবজেক্ট রিকগনিশনের জন্য মেশিন লার্নিং মডেলকে প্রশিক্ষণ দিতে ব্যবহার করা যেতে পারে।লিংক
CVভিডিও, ছবিদ্য বক্সি ডেটাসেট, বোশ, মার্কিন যুক্তরাষ্ট্রস্বয়ংচালিতবাউন্ডিং বক্স / যানবাহন সনাক্তকরণমোটরওয়েতে স্ব-চালিত গাড়ির জন্য অবজেক্ট রিকগনিশন কৌশলের প্রশিক্ষণ এবং বিশ্লেষণের জন্য 2 মিলিয়ন টীকাযুক্ত যানবাহন সমন্বিত একটি যানবাহন সনাক্তকরণ ডেটা সেট।লিংক
CVভিডিওTME মোটরওয়ে, চেক টেকনিক্যাল ইউনিভার্সিটি দ্বারা, উত্তর ইতালিস্বয়ংচালিতসীমান্ত বক্সমোট 28 মিনিটের জন্য 27টি ক্লিপের একটি ডেটাসেট 30,000+ গাড়ির টীকা ফ্রেমে বিভক্ত। লেজার স্ক্যানার থেকে ডেটা ব্যবহার করে আধা-স্বয়ংক্রিয়ভাবে টীকা তৈরি করা হয়েছিল। এই তথ্য সংগ্রহে পরিবর্তনশীল ট্র্যাফিক পরিস্থিতি, লেনের সংখ্যা, রাস্তার বক্রতা এবং আলোকসজ্জা জড়িত, যা সম্পূর্ণ অধিগ্রহণের অনেক শর্তকে কভার করে।লিংক
CVভিডিওবোশ, মার্কিন যুক্তরাষ্ট্র দ্বারা তত্ত্বাবধান না করা লামাসস্বয়ংচালিতলেন চিহ্নিতকরণ, LiDARLidar-ভিত্তিক লেন মার্কার সহ হাই-ডেফিনিশন স্বয়ংক্রিয় ড্রাইভিং মানচিত্র তৈরি করে আন-সুপারভাইজড লামাস ডেটাসেটটি টীকা করা হয়েছিল। স্বায়ত্তশাসিত যানটিকে এই মানচিত্রের বিপরীতে সারিবদ্ধ করা যেতে পারে এবং লেনের চিহ্নগুলি ক্যামেরা ফ্রেমে প্রজেক্ট করা হয়। 3D প্রজেকশনটি ইতিমধ্যে পর্যবেক্ষিত এবং পূর্বাভাসিত চিত্র মার্কারগুলির মধ্যে পার্থক্য কমিয়ে অপ্টিমাইজ করা হয়েছে।লিংক
NLPAudioFacebook AI বহুভাষিক লাইব্রি স্পিচ (MLS)সাধারণঅডিও টীকা / বক্তৃতা স্বীকৃতিFacebook AI বহুভাষিক LibriSpeech (MLS), হল একটি বৃহৎ মাপের, ওপেন সোর্স ডেটা সেট যা স্বয়ংক্রিয় বক্তৃতা শনাক্তকরণে (ASR) অগ্রিম গবেষণায় সাহায্য করার জন্য ডিজাইন করা হয়েছে। MLS 50,000টি ভাষায় 8 ঘন্টার বেশি অডিও সরবরাহ করে: ইংরেজি, জার্মান, ডাচ, ফ্রেঞ্চ, স্প্যানিশ, ইতালীয়, পর্তুগিজ এবং পোলিশ। লিংক