ডেটাসেট খুলুন
ওপেন সোর্স ডেটাসেটগুলি আবিষ্কার করুন যা আপনাকে ML মডেলগুলিকে প্রশিক্ষণ দিতে যায়৷
AI/ML মডেলের সাথে শুরু করার জন্য ওপেন সোর্স ডেটাসেট
আপনার AI এবং ML মডেলগুলির আউটপুট শুধুমাত্র ততটাই ভাল যে ডেটা আপনি এটিকে প্রশিক্ষণের জন্য ব্যবহার করেন - তাই ডেটা একত্রিতকরণের ক্ষেত্রে আপনি যে নির্ভুলতা প্রয়োগ করেন এবং সেই ডেটার ট্যাগিং এবং সনাক্তকরণ গুরুত্বপূর্ণ!
সুতরাং আপনি যদি একটি নতুন এআই/এমএল উদ্যোগ শুরু করতে চান এবং এখন আপনি দ্রুত উপলব্ধি করছেন যে উচ্চ-মানের প্রশিক্ষণের ডেটা খুঁজে পাওয়া আপনার প্রকল্পের আরও চ্যালেঞ্জিং দিকগুলির মধ্যে একটি হবে কারণ উচ্চ-মানের ডেটাসেটগুলি হল জ্বালানী যা AI/কে ধরে রাখে। এমএল ইঞ্জিন চলছে। আমরা উন্মুক্ত ডেটাসেটের একটি তালিকা সংগ্রহ করেছি যা আপনার ভবিষ্যতের AI/ML মডেলগুলিকে ব্যবহার এবং প্রশিক্ষণের জন্য বিনামূল্যে।
বিশেষজ্ঞতা | তথ্য টাইপ | ডেটাসেটের নাম | শিল্প / বিভাগ | টীকা/ব্যবহারের ক্ষেত্রে | বিবরণ | লিংক |
---|---|---|---|---|---|---|
NLP | পাঠ | আমাজন পর্যালোচনা | ই-কমার্স | অনুভূতির বিশ্লেষণ | ব্যবহারকারী এবং পণ্যের বিবরণ সহ সরল পাঠ্যে গত 35 বছরের 18 মিলিয়ন পর্যালোচনা এবং রেটিংগুলির একটি সেট৷ | লিংক |
NLP | পাঠ | উইকিপিডিয়া লিঙ্ক ডেটা | সাধারণ | ৪ মিলিয়নের বেশি 4 Bn ধারণকারী নিবন্ধ. শব্দ যা শব্দ এবং বাক্যাংশের পাশাপাশি অনুচ্ছেদ নিয়ে গঠিত। | লিংক | |
NLP | পাঠ | স্ট্যান্ডফোর্ড সেন্টিমেন্ট ট্রিব্যাঙ্ক | বিনোদন | অনুভূতির বিশ্লেষণ | এইচটিএমএল ফাইল ফরম্যাটে Rotten Tomatoes থেকে 10,000 টুকরো পর্যালোচনার জন্য সেন্টিমেন্ট টীকা ডেটাসেট | লিংক |
NLP | পাঠ | টুইটার ইউএস এয়ারলাইন সেন্টিমেন্ট | বিমানসংস্থা | অনুভূতির বিশ্লেষণ | 2015 ইউএস এয়ারলাইন্সের টুইটগুলি ইতিবাচক, নেতিবাচক এবং নিরপেক্ষ টোনে বিভক্ত | লিংক |
CV | ভাবমূর্তি | লেবেলযুক্ত ফেস ইন দ্য ওয়াইল্ড | সাধারণ | মুখের স্বীকৃতি | ফেসিয়াল রিকগনিশন প্রশিক্ষণের জন্য দুটি ভিন্ন ছবি সহ 13,000 টিরও বেশি ক্রপ করা মুখের ডেটাসেট। | লিংক |
CV | ভিডিও, ছবি | UMDFaces ডেটাসেট | সাধারণ | মুখের স্বীকৃতি | টীকাযুক্ত ডেটাসেট 367,000 টিরও বেশি বিষয় থেকে 8,000 টিরও বেশি মুখ সমন্বিত যা স্থির এবং ভিডিও চিত্রগুলি অন্তর্ভুক্ত করে৷ | লিংক |
CV | ভাবমূর্তি | ইমেজনেট | সাধারণ | 14 মিলিয়নের বেশি ডেটাসেট। বিভিন্ন ফাইল ফরম্যাটে ছবি, WordNet অনুক্রম অনুসারে সংগঠিত। | লিংক | |
CV | ভাবমূর্তি | গুগলের ওপেন ইমেজ | সাধারণ | 9 Mn 6,000 টিরও বেশি বিভাগ থেকে সর্বজনীন ছবিকে শ্রেণীবদ্ধ করার জন্য URL। | লিংক | |
NLP | পাঠ | MIMIC ক্রিটিক্যাল কেয়ার ডাটাবেস | স্বাস্থ্যসেবা | কম্পিউটেশনাল ফিজিওলজি ডেটাসেটগুলি 40,000 ক্রিটিক্যাল কেয়ার রোগীদের থেকে ডি-আইডেন্টিফাই ডেটা সহ। ডেটাসেটে জনসংখ্যা, গুরুত্বপূর্ণ লক্ষণ, ওষুধ ইত্যাদির মতো তথ্য রয়েছে। | লিংক | |
CV | ভাবমূর্তি | মার্কিন জাতীয় ভ্রমণ ও পর্যটন অফিস | ভ্রমণব্যবস্থা | নির্ভরযোগ্য ডাটাবেস সহ পর্যটন শিল্প থেকে বিস্তৃত ফটোগ্রাফ সরবরাহ করে, অন্তর্মুখী এবং বহির্মুখী ভ্রমণ এবং আন্তর্জাতিক পর্যটন তথ্যের মতো বিষয়গুলি কভার করে। | লিংক | |
NLP | পাঠ | পরিবহন দপ্তর | ভ্রমণব্যবস্থা | পর্যটন ডেটাসেট যা জাতীয় উদ্যান, ড্রাইভার রেজিস্টার, সেতু এবং রেল তথ্য ইত্যাদি অন্তর্ভুক্ত করে। | লিংক | |
NLP | Audio | ফ্লিকার অডিও ক্যাপশন কর্পাস | সাধারণ | 40টি ফটোগ্রাফ থেকে 8,000 হাজারেরও বেশি কথ্য ক্যাপশন যা তত্ত্বাবধানহীন বক্তৃতা প্যাটার্নের জন্য ডিজাইন করা হয়েছে | লিংক | |
NLP | Audio | স্পিচ কমান্ড ডেটাসেট | সাধারণ | স্পিচ রিকগনিশন, অডিও টীকা | মৌলিক ভয়েস ইন্টারফেস তৈরি করতে হাজার হাজার ব্যক্তির কাছ থেকে 1 সেকেন্ড দীর্ঘ উচ্চারণ। | লিংক |
NLP | Audio | পরিবেশগত অডিও ডেটাসেট | সাধারণ | এনভায়রনমেন্ট অডিও ডেটাসেট যাতে ইভেন্ট টেবিল এবং অ্যাকোস্টিক সিন টেবিলের শব্দ থাকে। | লিংক | |
NLP | পাঠ | COVID-19 ওপেন রিসার্চ ডেটাসেট | স্বাস্থ্যসেবা | মেডিকেল এআই | কোভিড-১৯ এবং ভাইরাসের করোনাভাইরাস পরিবার সম্পর্কিত 45,000টি পণ্ডিত নিবন্ধ সমন্বিত একটি গবেষণা ডেটাসেট। | লিংক |
CV | ভাবমূর্তি | Waymo ওপেন ডেটাসেট | স্বয়ংচালিত | Waymo দ্বারা প্রকাশিত সবচেয়ে বৈচিত্র্যময় স্বায়ত্তশাসিত ড্রাইভিং ডেটাসেট | লিংক | |
CV | ভাবমূর্তি | লেবেলমে | পাবলিক সরকার | লেবেলমে ম্যাটল্যাবের মাধ্যমে অ্যাক্সেসযোগ্য টীকাযুক্ত চিত্রগুলির একটি বড় সেট | লিংক | |
CV | ভাবমূর্তি | COIL100 | সাধারণ | একাধিক কোণ (অর্থাৎ 100 ডিগ্রি) থেকে 360 টিরও বেশি বৈচিত্র্যময় বস্তুর ছবি তোলা হয়েছে | লিংক | |
CV | ভাবমূর্তি | স্ট্যানফোর্ড ডগস ডেটাসেট | সাধারণ | 20,500+ এর বেশি ছবি 120টি বিভিন্ন কুকুরের জাতের ইমেজ সেটে শ্রেণীবদ্ধ করা হয়েছে | লিংক | |
CV | ভাবমূর্তি | অন্দর দৃশ্য স্বীকৃতি | সাধারণ | দৃশ্য স্বীকৃতি | দৃশ্য শনাক্তকরণ মডেল তৈরি করার জন্য 15620টি ইনডোর বিভাগ থেকে 67টি চিত্র সমন্বিত একটি নির্দিষ্ট ডেটাসেট | লিংক |
CV | ভাবমূর্তি | ভিজ্যুয়ালকিউএ | সাধারণ | একটি ডেটাসেট যাতে 265,016টি ফটো সম্পর্কিত ওপেন-এন্ডেড প্রশ্ন থাকে যার প্রতিক্রিয়া জানাতে দৃষ্টি এবং ভাষা বোঝার প্রয়োজন। | লিংক | |
NLP | পাঠ | মাল্টিডোমেন সেন্টিমেন্ট বিশ্লেষণ ডেটাসেট | ই-কমার্স | অনুভূতির বিশ্লেষণ | অ্যামাজন থেকে পণ্য পর্যালোচনা ধারণকারী ডেটাসেট | লিংক |
NLP | পাঠ | IMDB পর্যালোচনা | বিনোদন | অনুভূতির বিশ্লেষণ | অনুভূতি বিশ্লেষণের জন্য 25000 মুভি পর্যালোচনা ধারণকারী ডেটাসেট | লিংক |
NLP | পাঠ | অনুভূতি140 | সাধারণ | অনুভূতির বিশ্লেষণ | উচ্চ নির্ভুলতার জন্য প্রাক-মুছে ফেলা ইমোটিকন সহ 160,000 টি টুইট ধারণকারী ডেটাসেট | লিংক |
NLP | পাঠ | ব্লগার কর্পাস | সাধারণ | কীপ্রেস বিশ্লেষণ | blogger.com থেকে 681,288টি ব্লগ পোস্ট সম্বলিত ডেটাসেট যাতে বহুল ব্যবহৃত ইংরেজি শব্দের ন্যূনতম 200টি ঘটনা রয়েছে। | লিংক |
NLP | পাঠ | ঝুঁকি | সাধারণ | চ্যাটবট প্রশিক্ষণ | 200,000 টিরও বেশি প্রশ্ন সহ ডেটাসেট যা মেশিন লার্নিং মডেলগুলিকে বুদ্ধিমত্তার সাথে স্বয়ংক্রিয় প্রতিক্রিয়া জানাতে প্রশিক্ষণ দিতে ব্যবহার করা যেতে পারে | লিংক |
NLP | পাঠ | ইংরেজিতে এসএমএস স্প্যাম সংগ্রহ | টেলিকম | স্প্যাম স্বীকৃতি | 5,574টি ইংরেজি এসএমএস সমন্বিত একটি স্প্যাম বার্তা ডেটাসেট৷ | লিংক |
NLP | পাঠ | Yelp পর্যালোচনা | সাধারণ | অনুভূতির বিশ্লেষণ | Yelp দ্বারা প্রকাশিত 5 মিলিয়নের বেশি পর্যালোচনা সহ একটি ডেটাসেট৷ | লিংক |
NLP | পাঠ | UCI এর Spambase | উদ্যোগ | স্প্যাম স্বীকৃতি | স্প্যাম ইমেলগুলির একটি বড় ডেটাসেট, স্প্যাম ফিল্টারিংয়ের জন্য দরকারী৷ | লিংক |
CV | ভিডিও, ছবি | বার্কলে ডিপড্রাইভ BDD100k | স্বয়ংচালিত | স্বায়ত্বশাসিত যানবাহন | নিউইয়র্ক এবং সান ফ্রান্সিসকো এলাকা থেকে দিনের বিভিন্ন সময়ে 1,100টিরও বেশি ভিডিওতে 100,000-ঘন্টা ড্রাইভিং অভিজ্ঞতা সহ স্ব-ড্রাইভিং এআই-এর জন্য বৃহত্তম ডেটাসেটগুলির মধ্যে একটি৷ | লিংক |
CV | ভিডিও | কমা.আ | স্বয়ংচালিত | স্বায়ত্বশাসিত যানবাহন | একটি 7 ঘন্টা হাইওয়ে ড্রাইভিং ডেটাসেট যা গাড়ির গতি, ত্বরণ, স্টিয়ারিং কোণ এবং GPS স্থানাঙ্কের তথ্য সমন্বিত করে | লিংক |
CV | ভিডিও, ছবি | সিটিস্কেপ ডেটাসেট | স্বয়ংচালিত | স্বায়ত্তশাসিত যানবাহনের জন্য শব্দার্থিক লেবেল | 5,000 পিক্সেল-স্তরের টীকাগুলির একটি ডেটাসেট এবং 20,000টি বিভিন্ন শহর থেকে রেকর্ড করা স্টেরিও ভিডিও সিকোয়েন্সে 50 দুর্বলভাবে টীকাযুক্ত ফ্রেমের একটি বড় সেট | লিংক |
CV | ভাবমূর্তি | KUL বেলজিয়াম ট্রাফিক সাইন ডেটাসেট | স্বয়ংচালিত | স্বায়ত্বশাসিত যানবাহন | বেলজিয়াম জুড়ে শারীরিকভাবে স্বতন্ত্র ট্রাফিক লক্ষণের উপর ভিত্তি করে ফ্ল্যান্ডার্স অঞ্চল থেকে 10000+ ট্রাফিক সাইন টীকা। | লিংক |
CV | ভাবমূর্তি | LISA: বুদ্ধিমান এবং নিরাপদ অটোমোবাইলসের জন্য পরীক্ষাগার, UC সান দিয়েগো ডেটাসেট | স্বয়ংচালিত | স্বায়ত্বশাসিত যানবাহন | ট্র্যাফিক লক্ষণ, যানবাহন সনাক্তকরণ, ট্র্যাফিক লাইট এবং ট্র্যাজেক্টরি প্যাটার্ন ধারণকারী একটি সমৃদ্ধ ডেটাসেট। | লিংক |
CV | ভাবমূর্তি | সিআইএফএআর -10 | সাধারণ | অবজেক্ট রিকগনিশন | বস্তু শনাক্তকরণের জন্য 50,000টি ছবি এবং 10,000টি পরীক্ষার ছবি (অর্থাৎ 60,000টি 32x32টি 10টি ক্লাসে কালার ইমেজ) সমন্বিত একটি ডেটাসেট। | লিংক |
CV | ভাবমূর্তি | ফ্যাশন MNIST | ফ্যাশন | একটি ইমেজ ডেটাসেট যা 60,000টি উদাহরণ এবং 10,000×28 গ্রেস্কেল ছবিতে 28টি উদাহরণের একটি পরীক্ষার সেট, 10টি ক্লাসের একটি লেবেলের সাথে যুক্ত। | লিংক | |
CV | ভাবমূর্তি | IMDB-উইকি ডেটাসেট | বিনোদন | মুখের স্বীকৃতি | লিঙ্গ এবং বয়সের মতো লেবেল সহ মুখের চিত্রগুলির একটি বড় ডেটাসেট৷ মোট 523,051টি মুখের ছবির মধ্যে, 460,723টি ছবি 20,284 জন সেলিব্রিটির কাছ থেকে IMDB থেকে এবং 62,328টি উইকিপিডিয়া থেকে পাওয়া গেছে। | লিংক |
CV | ভিডিও | গতিবিদ্যা-700 | সাধারণ | প্রতিটি অ্যাকশন ক্লাসের জন্য, উচ্চ-মানের ডেটাসেটে 650,000 ভিডিও ক্লিপ থাকে এবং কমপক্ষে 700টি ভিডিও ক্লিপ সহ 600টি মানব অ্যাকশন ক্লাস অন্তর্ভুক্ত করে। এখানে, প্রতিটি ক্লিপ 10 সেকেন্ড বা তার বেশি স্থায়ী হয়। | লিংক | |
CV | ভাবমূর্তি | এমএস কোকো | সাধারণ | অবজেক্ট ডিটেকশন, সেগমেন্টেশন | ডেটাসেটে 328k ছবি রয়েছে এবং এতে মোট 2.5 মিলিয়ন দৃষ্টান্ত এবং 91টি অবজেক্ট ইমেজ রয়েছে যাতে বড় আকারের অবজেক্ট ডিটেকশন, সেগমেন্টেশন, এবং ডেটা ক্যাপশনিং সম্পর্কিত এমএল মডেল প্রশিক্ষণ দেওয়া যায়। | লিংক |
CV | ভাবমূর্তি | MPII হিউম্যান পোজ ডেটাসেট | সাধারণ | টীকাযুক্ত বডি জয়েন্ট সহ 25K এর বেশি ব্যক্তি সমন্বিত প্রায় 40K ফটোগ্রাফ ডেটাসেটে অন্তর্ভুক্ত করা হয়েছে, যা মানুষের ভঙ্গি অনুমান প্রকাশ করার জন্য ব্যবহৃত হয়। সামগ্রিকভাবে ডেটাসেটে 410টি মানুষের ক্রিয়াকলাপ রয়েছে এবং প্রতিটি চিত্র একটি কার্যকলাপ লেবেল সহ সরবরাহ করা হয়েছে। | লিংক | |
CV | ভাবমূর্তি | চিত্রগুলি খুলুন | সাধারণ | অবজেক্ট লোকেশন টীকা | ইমেজ-লেভেল লেবেল, অবজেক্ট বাউন্ডিং বক্স, অবজেক্ট সেগমেন্টেশন ইত্যাদি সহ প্রায় 9 মিলিয়ন ইমেজ সহ ইমেজ ডেটাসেট। ডেটাসেটটিতে 16 মিলিয়ন রয়েছে। 600 মিলিয়ন ছবিতে 1.9টি অবজেক্ট ক্লাসের জন্য বাউন্ডিং বক্স। | লিংক |
CV | ভিডিও, ছবি | Argo, Argo, USA দ্বারা | স্বয়ংচালিত | বাউন্ডিং বক্স, অপটিক্যাল ফ্লো, আচরণগত লেবেল, শব্দার্থিক লেবেল, লেন চিহ্নিতকরণ | একটি স্ব-ড্রাইভিং ডেটাসেট যা জ্যামিতিক এবং শব্দার্থিক মেটাডেটা সহ এইচডি মানচিত্র যেমন লেন কেন্দ্ররেখা, লেনের দিকনির্দেশ এবং ড্রাইভযোগ্য এলাকা। ডেটাসেটটি এমএল মডেলগুলিকে প্রশিক্ষণ দিতে, আরও সঠিক উপলব্ধি অ্যালগরিদম তৈরি করতে ব্যবহৃত হয়, যা স্ব-চালিত যানবাহনগুলিকে নিরাপদে নেভিগেট করতে সহায়তা করবে। | লিংক |
CV | ভিডিও | Bosch ছোট ট্রাফিক লাইট, Bosch উত্তর আমেরিকা গবেষণা দ্বারা | স্বয়ংচালিত | সীমান্ত বক্স | দৃষ্টি-ভিত্তিক ট্র্যাফিক লাইট সনাক্তকরণ সিস্টেম তৈরি করতে 13427*1280 রেজোলিউশন সহ 720টি ক্যামেরা চিত্র সমন্বিত একটি ডেটাসেট। ডেটাসেটে 24000 টিরও বেশি টীকাযুক্ত ট্রাফিক লাইট রয়েছে৷ | লিংক |
CV | ভিডিও | Brain4Cars, কর্নেল ইউনিভার্সিটি দ্বারা, মার্কিন যুক্তরাষ্ট্র | স্বয়ংচালিত | আচরণগত লেবেল | চালকের সতর্কতা সম্পর্কে দরকারী পরিসংখ্যান বের করার জন্য কেবিন সেন্সর (ক্যামেরা, স্পর্শকাতর সেন্সর, স্মার্ট ডিভাইস, ইত্যাদি) সমন্বিত একটি ডেটাসেট। আমাদের অ্যালগরিদমগুলি এমন ড্রাইভারদের সনাক্ত করতে পারে যারা তন্দ্রাচ্ছন্ন বা বিভ্রান্ত এবং সুরক্ষা উন্নত করার জন্য প্রয়োজনীয় অ্যালার্ম বাড়িয়ে দেয়। | লিংক |
CV | ভাবমূর্তি | CULane, চীনা বিশ্ববিদ্যালয় দ্বারা। হংকং, বেইজিং, চীন | স্বয়ংচালিত | লেন চিহ্নিতকরণ | ট্র্যাফিক লেন সনাক্তকরণের উপর একটি কম্পিউটার ভিশন ডেটাসেট, যার মধ্যে 55 ঘন্টা ভিডিও রয়েছে যার মধ্যে 133,235টি (88880টি প্রশিক্ষণ সেট, 9675টি বৈধতা সেট, এবং 34680টি পরীক্ষা সেট) ফ্রেমগুলি বের করা হয়েছে৷ এটি বেইজিংয়ের বিভিন্ন চালক দ্বারা চালিত ছয়টি ভিন্ন যানবাহনে লাগানো ক্যামেরা দ্বারা সংগ্রহ করা হয়। | লিংক |
CV | ভিডিও | DAVIS, Univ দ্বারা। জুরিখ, ETH ¨ জুরিখ, জার্মানি, সুইজারল্যান্ড | স্বয়ংচালিত | একটি এন্ড-টু-এন্ড যানবাহন ড্রাইভিং প্রশিক্ষণ ডেটাসেট যা একটি DAVIS ইভেন্ট+ফ্রেম ক্যামেরা ব্যবহার করে। গাড়ির ডেটা যেমন স্টিয়ারিং, থ্রটল, জিপিএস, ইত্যাদি স্বয়ংচালিত অ্যাপগুলির জন্য ফ্রেম এবং ইভেন্ট ডেটার ফিউশন মূল্যায়ন করতে ব্যবহৃত হয়। | লিংক | |
CV | ভিডিও | ডিবিনেট, সাংহাই জিয়াও টং ইউনিভার্সিটি, জিয়ামেন ইউনিভার্সিটি, চীন | স্বয়ংচালিত | বিন্দু মেঘ, LiDAR | একটি বাস্তব-বিশ্বের 1000 কিমি ড্রাইভিং ডেটা, যাতে সারিবদ্ধ ভিডিও, পয়েন্ট ক্লাউড, জিপিএস এবং ড্রাইভিং আচরণের উপর গভীর গবেষণার জন্য ড্রাইভারের আচরণ অন্তর্ভুক্ত। | লিংক |
CV | ভিডিও | ইউনিভার্সিটির দ্বারা ডা. মোডেনা এবং রেজিও এমিলিয়া, মোডেনা, ইতালির | স্বয়ংচালিত | আচরণগত লেবেল | প্রতিটি 74 মিনিটের 5টি ভিডিও সিকোয়েন্স সহ ডেটাসেট, যা 500,000-এর বেশি ফ্রেমে টীকা করা হয়েছে৷ ডেটাসেটে জিও-রেফারেন্সযুক্ত অবস্থান, ড্রাইভিং স্পিড, কোর্স, এবং এছাড়াও ড্রাইভারদের দৃষ্টি নিবদ্ধকরণ এবং তাদের অস্থায়ী একীকরণের লেবেল রয়েছে যা টাস্ক-নির্দিষ্ট মানচিত্র প্রদান করে। | লিংক |
CV | ভিডিও | ETH পেডেস্ট্রিয়ান (2009), ETH জুরিখ, জুরিখ, সুইজারল্যান্ড দ্বারা | সাধারণ | সীমান্ত বক্স | 74-এর বেশি ফ্রেমে টীকাযুক্ত প্রতিটি 5 মিনিটের 500,000টি ভিডিও সিকোয়েন্সের একটি ডেটাসেট৷ ডেটাসেটটি জিও-রেফারেন্সযুক্ত অবস্থান, ড্রাইভিং গতি, দিকনির্দেশ প্রদান করে এবং এছাড়াও চালকদের জন্য লেবেল স্থিরকরণ এবং তাদের সাময়িক একীকরণ, টাস্ক-নির্দিষ্ট মানচিত্র সহ। | লিংক |
CV | ভিডিও | Ford (2009), Univ দ্বারা। মিশিগান, মিশিগান, মার্কিন | স্বয়ংচালিত | বাউন্ডিং বক্স, , LiDAR | একটি Velodyne 3D-লিডার স্ক্যানার, দুটি পুশ-ব্রুম ফরোয়ার্ড-লুকিং রিগ লিডার, একটি প্রযুক্তিগত এবং ভোক্তা জড়তা পরিমাপ ইউনিট (IMU), এবং একটি পয়েন্ট গ্রে লেডিবাগ 3 সর্বমুখী ক্যামেরা সিস্টেম দিয়ে সজ্জিত একটি স্বয়ংক্রিয় ল্যান্ড ভেহিকেল দ্বারা সংকলিত একটি ডেটাসেট। | লিংক |
CV | ভিডিও | এইচসিআই চ্যালেঞ্জিং স্টেরিও, বোশ কর্পোরেশন রিসার্চ, হিলডেশেইম, জার্মানি | সাধারণ | ক্যাপচার করা ভিডিও দৃশ্য থেকে কয়েক মিলিয়ন ফ্রেমের একটি ডেটাসেট যাতে বিভিন্ন আবহাওয়ার পরিস্থিতি, গতির একাধিক স্তর এবং গভীরতা রয়েছে; শহর এবং গ্রামাঞ্চলের পরিস্থিতি ইত্যাদি | লিংক | |
CV | ভিডিও | JAAD, ইয়র্ক ইউনিভার্সিটি, ইউক্রেন, কানাডা দ্বারা | স্বয়ংচালিত | বাউন্ডিং বক্স, আচরণগত লেবেল | "JAAD হল স্বায়ত্তশাসিত ড্রাইভিং এর প্রেক্ষাপটে যৌথ মনোযোগ অধ্যয়ন করার জন্য একটি ডেটাসেট। পথচারী এবং চালকের আচরণের উপর ফোকাস করা হয় ক্রসিং এর বিন্দুতে এবং তাদের প্রভাবিত করে এমন কারণগুলির উপর। এই লক্ষ্যে, JAAD ডেটাসেটটি 346টি ছোট ভিডিওর একটি সমৃদ্ধ টীকাযুক্ত সংগ্রহ প্রদান করে। ক্লিপগুলি (5-10 সেকেন্ড দীর্ঘ) উত্তর আমেরিকা এবং পূর্ব ইউরোপের বিভিন্ন স্থান থেকে 240 ঘন্টার বেশি ড্রাইভিং ফুটেজ থেকে বের করা হয়েছে৷ অক্লুশন ট্যাগ সহ বাউন্ডিং বাক্সগুলি সমস্ত পথচারীদের জন্য ব্যবহার করা হয় যা এই ডেটাসেটটিকে পথচারীদের সনাক্তকরণের জন্য উপযুক্ত করে তোলে৷ আচরণের টীকাগুলি পথচারীদের জন্য আচরণ নির্দিষ্ট করে৷ যা ড্রাইভারের সাথে ইন্টারঅ্যাক্ট করে বা তার মনোযোগের প্রয়োজন। প্রতিটি ভিডিওর জন্য বেশ কয়েকটি ট্যাগ (আবহাওয়া, অবস্থান, ইত্যাদি) এবং টাইমস্ট্যাম্পযুক্ত আচরণের লেবেল (যেমন থামানো, হাঁটা, দেখা ইত্যাদি) রয়েছে। উপরন্তু, জনসংখ্যাগত বৈশিষ্ট্যগুলির একটি তালিকা হল প্রতিটি পথচারীর জন্য (যেমন বয়স, লিঙ্গ, গতির দিক, ইত্যাদি) পাশাপাশি প্রতিটি ফ্রেমে দৃশ্যমান ট্র্যাফিক দৃশ্যের উপাদানগুলির একটি তালিকা (যেমন স্টপ সাইন, ট্র্যাফিক সিগন্যাল, ইত্যাদি) প্রদান করা হয়েছে।" | লিংক |
CV | ভাবমূর্তি | LISA ট্রাফিক সাইন, Univ দ্বারা। ক্যালিফোর্নিয়া, সান দিয়েগো, মার্কিন যুক্তরাষ্ট্র | স্বয়ংচালিত | সীমান্ত বক্স | ভিডিও এবং টীকাযুক্ত ফ্রেম সমন্বিত ডেটাসেটের সেট যেখানে মার্কিন ট্রাফিক চিহ্ন রয়েছে৷ এটি দুটি পর্যায়ে প্রকাশ করা হয়, একটি শুধুমাত্র ছবি সহ এবং একটি ছবি এবং ভিডিও উভয়ের সাথে। | লিংক |
CV | ভাবমূর্তি | Mapillary Vistas, Mapillary AB, গ্লোবাল দ্বারা | স্বয়ংচালিত | শব্দার্থিক লেবেল | পিক্সেল-সঠিক এবং দৃষ্টান্ত-নির্দিষ্ট মানব টীকা সহ সারা বিশ্বের রাস্তার দৃশ্য ব্যাখ্যা করার জন্য একটি রাস্তার-স্তরের ফটোগ্রাফি ডেটাসেট। | লিংক |
CV | ভিডিও, ছবি | শব্দার্থিক KITTI, বন বিশ্ববিদ্যালয় দ্বারা, কার্লসরুহে, জার্মানি | স্বয়ংচালিত | বাউন্ডিং বক্স, শব্দার্থিক লেবেল, লেন চিহ্নিতকরণ | একটি ডেটাসেট যা সমস্ত ওডোমেট্রি বেঞ্চমার্ক সিকোয়েন্সের জন্য একটি শব্দার্থিক টীকা অন্তর্ভুক্ত করে। ডেটাসেটটি বিভিন্ন ধরণের চলমান এবং অ-চলমান ট্রাফিকের টীকা দেয়: গাড়ি, বাইক, সাইকেল, পথচারী এবং সাইকেল আরোহীদের সহ, দৃশ্যের বস্তুগুলিকে অধ্যয়ন করার অনুমতি দেয়। | লিংক |
CV | ভিডিও | স্ট্যানফোর্ড ট্র্যাক, স্ট্যানফোর্ড ইউনিভার্সিটি দ্বারা, মার্কিন যুক্তরাষ্ট্র | স্বয়ংচালিত | অবজেক্ট ডিটেকশন / ক্লাসিফিকেশন LiDAR, GPS, কোড | একটি ডেটাসেট যাতে 14,000টি লেবেলযুক্ত অবজেক্ট ট্র্যাক রয়েছে যা একটি Velodyne HDL-64E S2 LIDAR দ্বারা প্রাকৃতিক রাস্তার দৃশ্যে পর্যবেক্ষণ করা হয়েছে, যা 3D অবজেক্ট রিকগনিশনের জন্য মেশিন লার্নিং মডেলকে প্রশিক্ষণ দিতে ব্যবহার করা যেতে পারে। | লিংক |
CV | ভিডিও, ছবি | দ্য বক্সি ডেটাসেট, বোশ, মার্কিন যুক্তরাষ্ট্র | স্বয়ংচালিত | বাউন্ডিং বক্স / যানবাহন সনাক্তকরণ | মোটরওয়েতে স্ব-চালিত গাড়ির জন্য অবজেক্ট রিকগনিশন কৌশলের প্রশিক্ষণ এবং বিশ্লেষণের জন্য 2 মিলিয়ন টীকাযুক্ত যানবাহন সমন্বিত একটি যানবাহন সনাক্তকরণ ডেটা সেট। | লিংক |
CV | ভিডিও | TME মোটরওয়ে, চেক টেকনিক্যাল ইউনিভার্সিটি দ্বারা, উত্তর ইতালি | স্বয়ংচালিত | সীমান্ত বক্স | মোট 28 মিনিটের জন্য 27টি ক্লিপের একটি ডেটাসেট 30,000+ গাড়ির টীকা ফ্রেমে বিভক্ত। লেজার স্ক্যানার থেকে ডেটা ব্যবহার করে আধা-স্বয়ংক্রিয়ভাবে টীকা তৈরি করা হয়েছিল। এই তথ্য সংগ্রহে পরিবর্তনশীল ট্র্যাফিক পরিস্থিতি, লেনের সংখ্যা, রাস্তার বক্রতা এবং আলোকসজ্জা জড়িত, যা সম্পূর্ণ অধিগ্রহণের অনেক শর্তকে কভার করে। | লিংক |
CV | ভিডিও | বোশ, মার্কিন যুক্তরাষ্ট্র দ্বারা তত্ত্বাবধান না করা লামাস | স্বয়ংচালিত | লেন চিহ্নিতকরণ, LiDAR | Lidar-ভিত্তিক লেন মার্কার সহ হাই-ডেফিনিশন স্বয়ংক্রিয় ড্রাইভিং মানচিত্র তৈরি করে আন-সুপারভাইজড লামাস ডেটাসেটটি টীকা করা হয়েছিল। স্বায়ত্তশাসিত যানটিকে এই মানচিত্রের বিপরীতে সারিবদ্ধ করা যেতে পারে এবং লেনের চিহ্নগুলি ক্যামেরা ফ্রেমে প্রজেক্ট করা হয়। 3D প্রজেকশনটি ইতিমধ্যে পর্যবেক্ষিত এবং পূর্বাভাসিত চিত্র মার্কারগুলির মধ্যে পার্থক্য কমিয়ে অপ্টিমাইজ করা হয়েছে। | লিংক |
NLP | Audio | Facebook AI বহুভাষিক লাইব্রি স্পিচ (MLS) | সাধারণ | অডিও টীকা / বক্তৃতা স্বীকৃতি | Facebook AI বহুভাষিক LibriSpeech (MLS), হল একটি বৃহৎ মাপের, ওপেন সোর্স ডেটা সেট যা স্বয়ংক্রিয় বক্তৃতা শনাক্তকরণে (ASR) অগ্রিম গবেষণায় সাহায্য করার জন্য ডিজাইন করা হয়েছে। MLS 50,000টি ভাষায় 8 ঘন্টার বেশি অডিও সরবরাহ করে: ইংরেজি, জার্মান, ডাচ, ফ্রেঞ্চ, স্প্যানিশ, ইতালীয়, পর্তুগিজ এবং পোলিশ। | লিংক |