ডেটাসেট খুলুন

ওপেন সোর্স ডেটাসেটগুলি আবিষ্কার করুন যা আপনাকে ML মডেলগুলিকে প্রশিক্ষণ দিতে যায়৷

AI/ML মডেলের সাথে শুরু করার জন্য ওপেন সোর্স ডেটাসেট

আপনার AI এবং ML মডেলগুলির আউটপুট শুধুমাত্র ততটাই ভাল যে ডেটা আপনি এটিকে প্রশিক্ষণের জন্য ব্যবহার করেন - তাই ডেটা একত্রিতকরণের ক্ষেত্রে আপনি যে নির্ভুলতা প্রয়োগ করেন এবং সেই ডেটার ট্যাগিং এবং সনাক্তকরণ গুরুত্বপূর্ণ!

সুতরাং আপনি যদি একটি নতুন এআই/এমএল উদ্যোগ শুরু করতে চান এবং এখন আপনি দ্রুত উপলব্ধি করছেন যে উচ্চ-মানের প্রশিক্ষণের ডেটা খুঁজে পাওয়া আপনার প্রকল্পের আরও চ্যালেঞ্জিং দিকগুলির মধ্যে একটি হবে কারণ উচ্চ-মানের ডেটাসেটগুলি হল জ্বালানী যা AI/কে ধরে রাখে। এমএল ইঞ্জিন চলছে। আমরা উন্মুক্ত ডেটাসেটের একটি তালিকা সংগ্রহ করেছি যা আপনার ভবিষ্যতের AI/ML মডেলগুলিকে ব্যবহার এবং প্রশিক্ষণের জন্য বিনামূল্যে।

বিশেষজ্ঞতা	তথ্য টাইপ	ডেটাসেটের নাম	শিল্প / বিভাগ	টীকা/ব্যবহারের ক্ষেত্রে	বিবরণ	লিংক
NLP	পাঠ	আমাজন পর্যালোচনা	ই-কমার্স	অনুভূতির বিশ্লেষণ	ব্যবহারকারী এবং পণ্যের বিবরণ সহ সরল পাঠ্যে গত 35 বছরের 18 মিলিয়ন পর্যালোচনা এবং রেটিংগুলির একটি সেট৷	লিংক
NLP	পাঠ	উইকিপিডিয়া লিঙ্ক ডেটা	সাধারণ		৪ মিলিয়নের বেশি 4 Bn ধারণকারী নিবন্ধ. শব্দ যা শব্দ এবং বাক্যাংশের পাশাপাশি অনুচ্ছেদ নিয়ে গঠিত।	লিংক
NLP	পাঠ	স্ট্যান্ডফোর্ড সেন্টিমেন্ট ট্রিব্যাঙ্ক	বিনোদন	অনুভূতির বিশ্লেষণ	এইচটিএমএল ফাইল ফরম্যাটে Rotten Tomatoes থেকে 10,000 টুকরো পর্যালোচনার জন্য সেন্টিমেন্ট টীকা ডেটাসেট	লিংক
NLP	পাঠ	টুইটার ইউএস এয়ারলাইন সেন্টিমেন্ট	বিমানসংস্থা	অনুভূতির বিশ্লেষণ	2015 ইউএস এয়ারলাইন্সের টুইটগুলি ইতিবাচক, নেতিবাচক এবং নিরপেক্ষ টোনে বিভক্ত	লিংক
CV	ভাবমূর্তি	লেবেলযুক্ত ফেস ইন দ্য ওয়াইল্ড	সাধারণ	মুখের স্বীকৃতি	ফেসিয়াল রিকগনিশন প্রশিক্ষণের জন্য দুটি ভিন্ন ছবি সহ 13,000 টিরও বেশি ক্রপ করা মুখের ডেটাসেট।	লিংক
CV	ভিডিও, ছবি	UMDFaces ডেটাসেট	সাধারণ	মুখের স্বীকৃতি	টীকাযুক্ত ডেটাসেট 367,000 টিরও বেশি বিষয় থেকে 8,000 টিরও বেশি মুখ সমন্বিত যা স্থির এবং ভিডিও চিত্রগুলি অন্তর্ভুক্ত করে৷	লিংক
CV	ভাবমূর্তি	ইমেজনেট	সাধারণ		14 মিলিয়নের বেশি ডেটাসেট। বিভিন্ন ফাইল ফরম্যাটে ছবি, WordNet অনুক্রম অনুসারে সংগঠিত।	লিংক
CV	ভাবমূর্তি	গুগলের ওপেন ইমেজ	সাধারণ		9 Mn 6,000 টিরও বেশি বিভাগ থেকে সর্বজনীন ছবিকে শ্রেণীবদ্ধ করার জন্য URL।	লিংক
NLP	পাঠ	MIMIC ক্রিটিক্যাল কেয়ার ডাটাবেস	স্বাস্থ্যসেবা		কম্পিউটেশনাল ফিজিওলজি ডেটাসেটগুলি 40,000 ক্রিটিক্যাল কেয়ার রোগীদের থেকে ডি-আইডেন্টিফাই ডেটা সহ। ডেটাসেটে জনসংখ্যা, গুরুত্বপূর্ণ লক্ষণ, ওষুধ ইত্যাদির মতো তথ্য রয়েছে।	লিংক
CV	ভাবমূর্তি	মার্কিন জাতীয় ভ্রমণ ও পর্যটন অফিস	ভ্রমণব্যবস্থা		নির্ভরযোগ্য ডাটাবেস সহ পর্যটন শিল্প থেকে বিস্তৃত ফটোগ্রাফ সরবরাহ করে, অন্তর্মুখী এবং বহির্মুখী ভ্রমণ এবং আন্তর্জাতিক পর্যটন তথ্যের মতো বিষয়গুলি কভার করে।	লিংক
NLP	পাঠ	পরিবহন দপ্তর	ভ্রমণব্যবস্থা		পর্যটন ডেটাসেট যা জাতীয় উদ্যান, ড্রাইভার রেজিস্টার, সেতু এবং রেল তথ্য ইত্যাদি অন্তর্ভুক্ত করে।	লিংক
NLP	Audio	ফ্লিকার অডিও ক্যাপশন কর্পাস	সাধারণ		40টি ফটোগ্রাফ থেকে 8,000 হাজারেরও বেশি কথ্য ক্যাপশন যা তত্ত্বাবধানহীন বক্তৃতা প্যাটার্নের জন্য ডিজাইন করা হয়েছে	লিংক
NLP	Audio	স্পিচ কমান্ড ডেটাসেট	সাধারণ	স্পিচ রিকগনিশন, অডিও টীকা	মৌলিক ভয়েস ইন্টারফেস তৈরি করতে হাজার হাজার ব্যক্তির কাছ থেকে 1 সেকেন্ড দীর্ঘ উচ্চারণ।	লিংক
NLP	Audio	পরিবেশগত অডিও ডেটাসেট	সাধারণ		এনভায়রনমেন্ট অডিও ডেটাসেট যাতে ইভেন্ট টেবিল এবং অ্যাকোস্টিক সিন টেবিলের শব্দ থাকে।	লিংক
NLP	পাঠ	COVID-19 ওপেন রিসার্চ ডেটাসেট	স্বাস্থ্যসেবা	মেডিকেল এআই	কোভিড-১৯ এবং ভাইরাসের করোনাভাইরাস পরিবার সম্পর্কিত 45,000টি পণ্ডিত নিবন্ধ সমন্বিত একটি গবেষণা ডেটাসেট।	লিংক
CV	ভাবমূর্তি	Waymo ওপেন ডেটাসেট	স্বয়ংচালিত		Waymo দ্বারা প্রকাশিত সবচেয়ে বৈচিত্র্যময় স্বায়ত্তশাসিত ড্রাইভিং ডেটাসেট	লিংক
CV	ভাবমূর্তি	ভিজ্যুয়াল জিনোম	সাধারণ	ছবির ক্যাপশনিং	100K এর বেশি চিত্রের বিস্তারিত ক্যাপশন সহ একটি ভিজ্যুয়াল জ্ঞানের ভিত্তি	লিংক
CV	ভাবমূর্তি	লেবেলমে	পাবলিক সরকার		লেবেলমে ম্যাটল্যাবের মাধ্যমে অ্যাক্সেসযোগ্য টীকাযুক্ত চিত্রগুলির একটি বড় সেট	লিংক
CV	ভাবমূর্তি	COIL100	সাধারণ		একাধিক কোণ (অর্থাৎ 100 ডিগ্রি) থেকে 360 টিরও বেশি বৈচিত্র্যময় বস্তুর ছবি তোলা হয়েছে	লিংক
CV	ভাবমূর্তি	স্ট্যানফোর্ড ডগস ডেটাসেট	সাধারণ		20,500+ এর বেশি ছবি 120টি বিভিন্ন কুকুরের জাতের ইমেজ সেটে শ্রেণীবদ্ধ করা হয়েছে	লিংক
CV	ভাবমূর্তি	অন্দর দৃশ্য স্বীকৃতি	সাধারণ	দৃশ্য স্বীকৃতি	দৃশ্য শনাক্তকরণ মডেল তৈরি করার জন্য 15620টি ইনডোর বিভাগ থেকে 67টি চিত্র সমন্বিত একটি নির্দিষ্ট ডেটাসেট	লিংক
CV	ভাবমূর্তি	ভিজ্যুয়ালকিউএ	সাধারণ		একটি ডেটাসেট যাতে 265,016টি ফটো সম্পর্কিত ওপেন-এন্ডেড প্রশ্ন থাকে যার প্রতিক্রিয়া জানাতে দৃষ্টি এবং ভাষা বোঝার প্রয়োজন।	লিংক
NLP	পাঠ	মাল্টিডোমেন সেন্টিমেন্ট বিশ্লেষণ ডেটাসেট	ই-কমার্স	অনুভূতির বিশ্লেষণ	অ্যামাজন থেকে পণ্য পর্যালোচনা ধারণকারী ডেটাসেট	লিংক
NLP	পাঠ	IMDB পর্যালোচনা	বিনোদন	অনুভূতির বিশ্লেষণ	অনুভূতি বিশ্লেষণের জন্য 25000 মুভি পর্যালোচনা ধারণকারী ডেটাসেট	লিংক
NLP	পাঠ	অনুভূতি140	সাধারণ	অনুভূতির বিশ্লেষণ	উচ্চ নির্ভুলতার জন্য প্রাক-মুছে ফেলা ইমোটিকন সহ 160,000 টি টুইট ধারণকারী ডেটাসেট	লিংক
NLP	পাঠ	ব্লগার কর্পাস	সাধারণ	কীপ্রেস বিশ্লেষণ	blogger.com থেকে 681,288টি ব্লগ পোস্ট সম্বলিত ডেটাসেট যাতে বহুল ব্যবহৃত ইংরেজি শব্দের ন্যূনতম 200টি ঘটনা রয়েছে।	লিংক
NLP	পাঠ	ঝুঁকি	সাধারণ	চ্যাটবট প্রশিক্ষণ	200,000 টিরও বেশি প্রশ্ন সহ ডেটাসেট যা মেশিন লার্নিং মডেলগুলিকে বুদ্ধিমত্তার সাথে স্বয়ংক্রিয় প্রতিক্রিয়া জানাতে প্রশিক্ষণ দিতে ব্যবহার করা যেতে পারে	লিংক
NLP	পাঠ	ইংরেজিতে এসএমএস স্প্যাম সংগ্রহ	টেলিকম	স্প্যাম স্বীকৃতি	5,574টি ইংরেজি এসএমএস সমন্বিত একটি স্প্যাম বার্তা ডেটাসেট৷	লিংক
NLP	পাঠ	Yelp পর্যালোচনা	সাধারণ	অনুভূতির বিশ্লেষণ	Yelp দ্বারা প্রকাশিত 5 মিলিয়নের বেশি পর্যালোচনা সহ একটি ডেটাসেট৷	লিংক
NLP	পাঠ	UCI এর Spambase	উদ্যোগ	স্প্যাম স্বীকৃতি	স্প্যাম ইমেলগুলির একটি বড় ডেটাসেট, স্প্যাম ফিল্টারিংয়ের জন্য দরকারী৷	লিংক
CV	ভিডিও, ছবি	বার্কলে ডিপড্রাইভ BDD100k	স্বয়ংচালিত	স্বায়ত্বশাসিত যানবাহন	নিউইয়র্ক এবং সান ফ্রান্সিসকো এলাকা থেকে দিনের বিভিন্ন সময়ে 1,100টিরও বেশি ভিডিওতে 100,000-ঘন্টা ড্রাইভিং অভিজ্ঞতা সহ স্ব-ড্রাইভিং এআই-এর জন্য বৃহত্তম ডেটাসেটগুলির মধ্যে একটি৷	লিংক
CV	ভিডিও	কমা.আ	স্বয়ংচালিত	স্বায়ত্বশাসিত যানবাহন	একটি 7 ঘন্টা হাইওয়ে ড্রাইভিং ডেটাসেট যা গাড়ির গতি, ত্বরণ, স্টিয়ারিং কোণ এবং GPS স্থানাঙ্কের তথ্য সমন্বিত করে	লিংক
CV	ভিডিও, ছবি	সিটিস্কেপ ডেটাসেট	স্বয়ংচালিত	স্বায়ত্তশাসিত যানবাহনের জন্য শব্দার্থিক লেবেল	5,000 পিক্সেল-স্তরের টীকাগুলির একটি ডেটাসেট এবং 20,000টি বিভিন্ন শহর থেকে রেকর্ড করা স্টেরিও ভিডিও সিকোয়েন্সে 50 দুর্বলভাবে টীকাযুক্ত ফ্রেমের একটি বড় সেট	লিংক
CV	ভাবমূর্তি	KUL বেলজিয়াম ট্রাফিক সাইন ডেটাসেট	স্বয়ংচালিত	স্বায়ত্বশাসিত যানবাহন	বেলজিয়াম জুড়ে শারীরিকভাবে স্বতন্ত্র ট্রাফিক লক্ষণের উপর ভিত্তি করে ফ্ল্যান্ডার্স অঞ্চল থেকে 10000+ ট্রাফিক সাইন টীকা।	লিংক
CV	ভাবমূর্তি	LISA: বুদ্ধিমান এবং নিরাপদ অটোমোবাইলসের জন্য পরীক্ষাগার, UC সান দিয়েগো ডেটাসেট	স্বয়ংচালিত	স্বায়ত্বশাসিত যানবাহন	ট্র্যাফিক লক্ষণ, যানবাহন সনাক্তকরণ, ট্র্যাফিক লাইট এবং ট্র্যাজেক্টরি প্যাটার্ন ধারণকারী একটি সমৃদ্ধ ডেটাসেট।	লিংক
CV	ভাবমূর্তি	সিআইএফএআর -10	সাধারণ	অবজেক্ট রিকগনিশন	বস্তু শনাক্তকরণের জন্য 50,000টি ছবি এবং 10,000টি পরীক্ষার ছবি (অর্থাৎ 60,000টি 32x32টি 10টি ক্লাসে কালার ইমেজ) সমন্বিত একটি ডেটাসেট।	লিংক
CV	ভাবমূর্তি	ফ্যাশন MNIST	ফ্যাশন		একটি ইমেজ ডেটাসেট যা 60,000টি উদাহরণ এবং 10,000×28 গ্রেস্কেল ছবিতে 28টি উদাহরণের একটি পরীক্ষার সেট, 10টি ক্লাসের একটি লেবেলের সাথে যুক্ত।	লিংক
CV	ভাবমূর্তি	IMDB-উইকি ডেটাসেট	বিনোদন	মুখের স্বীকৃতি	লিঙ্গ এবং বয়সের মতো লেবেল সহ মুখের চিত্রগুলির একটি বড় ডেটাসেট৷ মোট 523,051টি মুখের ছবির মধ্যে, 460,723টি ছবি 20,284 জন সেলিব্রিটির কাছ থেকে IMDB থেকে এবং 62,328টি উইকিপিডিয়া থেকে পাওয়া গেছে।	লিংক
CV	ভিডিও	গতিবিদ্যা-700	সাধারণ		প্রতিটি অ্যাকশন ক্লাসের জন্য, উচ্চ-মানের ডেটাসেটে 650,000 ভিডিও ক্লিপ থাকে এবং কমপক্ষে 700টি ভিডিও ক্লিপ সহ 600টি মানব অ্যাকশন ক্লাস অন্তর্ভুক্ত করে। এখানে, প্রতিটি ক্লিপ 10 সেকেন্ড বা তার বেশি স্থায়ী হয়।	লিংক
CV	ভাবমূর্তি	এমএস কোকো	সাধারণ	অবজেক্ট ডিটেকশন, সেগমেন্টেশন	ডেটাসেটে 328k ছবি রয়েছে এবং এতে মোট 2.5 মিলিয়ন দৃষ্টান্ত এবং 91টি অবজেক্ট ইমেজ রয়েছে যাতে বড় আকারের অবজেক্ট ডিটেকশন, সেগমেন্টেশন, এবং ডেটা ক্যাপশনিং সম্পর্কিত এমএল মডেল প্রশিক্ষণ দেওয়া যায়।	লিংক
CV	ভাবমূর্তি	MPII হিউম্যান পোজ ডেটাসেট	সাধারণ		টীকাযুক্ত বডি জয়েন্ট সহ 25K এর বেশি ব্যক্তি সমন্বিত প্রায় 40K ফটোগ্রাফ ডেটাসেটে অন্তর্ভুক্ত করা হয়েছে, যা মানুষের ভঙ্গি অনুমান প্রকাশ করার জন্য ব্যবহৃত হয়। সামগ্রিকভাবে ডেটাসেটে 410টি মানুষের ক্রিয়াকলাপ রয়েছে এবং প্রতিটি চিত্র একটি কার্যকলাপ লেবেল সহ সরবরাহ করা হয়েছে।	লিংক
CV	ভাবমূর্তি	চিত্রগুলি খুলুন	সাধারণ	অবজেক্ট লোকেশন টীকা	ইমেজ-লেভেল লেবেল, অবজেক্ট বাউন্ডিং বক্স, অবজেক্ট সেগমেন্টেশন ইত্যাদি সহ প্রায় 9 মিলিয়ন ইমেজ সহ ইমেজ ডেটাসেট। ডেটাসেটটিতে 16 মিলিয়ন রয়েছে। 600 মিলিয়ন ছবিতে 1.9টি অবজেক্ট ক্লাসের জন্য বাউন্ডিং বক্স।	লিংক
CV	ভিডিও	Apollo Open Platform, Baidu Inc, চীন দ্বারা	স্বয়ংচালিত	বাউন্ডিং বক্স, লিডার	একটি সমৃদ্ধ স্বায়ত্তশাসিত ড্রাইভিং ডেটাসেট, যা বিকাশকারীদের উদ্ভাবনী পুনরাবৃত্তির দক্ষতাকে ত্বরান্বিত করতে স্বায়ত্তশাসিত ড্রাইভিং-এ প্রয়োজনীয় ডেটা সরবরাহ করে।	লিংক
CV	ভিডিও, ছবি	Argo, Argo, USA দ্বারা	স্বয়ংচালিত	বাউন্ডিং বক্স, অপটিক্যাল ফ্লো, আচরণগত লেবেল, শব্দার্থিক লেবেল, লেন চিহ্নিতকরণ	একটি স্ব-ড্রাইভিং ডেটাসেট যা জ্যামিতিক এবং শব্দার্থিক মেটাডেটা সহ এইচডি মানচিত্র যেমন লেন কেন্দ্ররেখা, লেনের দিকনির্দেশ এবং ড্রাইভযোগ্য এলাকা। ডেটাসেটটি এমএল মডেলগুলিকে প্রশিক্ষণ দিতে, আরও সঠিক উপলব্ধি অ্যালগরিদম তৈরি করতে ব্যবহৃত হয়, যা স্ব-চালিত যানবাহনগুলিকে নিরাপদে নেভিগেট করতে সহায়তা করবে।	লিংক
CV	ভিডিও	Bosch ছোট ট্রাফিক লাইট, Bosch উত্তর আমেরিকা গবেষণা দ্বারা	স্বয়ংচালিত	সীমান্ত বক্স	দৃষ্টি-ভিত্তিক ট্র্যাফিক লাইট সনাক্তকরণ সিস্টেম তৈরি করতে 13427*1280 রেজোলিউশন সহ 720টি ক্যামেরা চিত্র সমন্বিত একটি ডেটাসেট। ডেটাসেটে 24000 টিরও বেশি টীকাযুক্ত ট্রাফিক লাইট রয়েছে৷	লিংক
CV	ভিডিও	Brain4Cars, কর্নেল ইউনিভার্সিটি দ্বারা, মার্কিন যুক্তরাষ্ট্র	স্বয়ংচালিত	আচরণগত লেবেল	চালকের সতর্কতা সম্পর্কে দরকারী পরিসংখ্যান বের করার জন্য কেবিন সেন্সর (ক্যামেরা, স্পর্শকাতর সেন্সর, স্মার্ট ডিভাইস, ইত্যাদি) সমন্বিত একটি ডেটাসেট। আমাদের অ্যালগরিদমগুলি এমন ড্রাইভারদের সনাক্ত করতে পারে যারা তন্দ্রাচ্ছন্ন বা বিভ্রান্ত এবং সুরক্ষা উন্নত করার জন্য প্রয়োজনীয় অ্যালার্ম বাড়িয়ে দেয়।	লিংক
CV	ভাবমূর্তি	CULane, চীনা বিশ্ববিদ্যালয় দ্বারা। হংকং, বেইজিং, চীন	স্বয়ংচালিত	লেন চিহ্নিতকরণ	ট্র্যাফিক লেন সনাক্তকরণের উপর একটি কম্পিউটার ভিশন ডেটাসেট, যার মধ্যে 55 ঘন্টা ভিডিও রয়েছে যার মধ্যে 133,235টি (88880টি প্রশিক্ষণ সেট, 9675টি বৈধতা সেট, এবং 34680টি পরীক্ষা সেট) ফ্রেমগুলি বের করা হয়েছে৷ এটি বেইজিংয়ের বিভিন্ন চালক দ্বারা চালিত ছয়টি ভিন্ন যানবাহনে লাগানো ক্যামেরা দ্বারা সংগ্রহ করা হয়।	লিংক
CV	ভিডিও	DAVIS, Univ দ্বারা। জুরিখ, ETH ¨ জুরিখ, জার্মানি, সুইজারল্যান্ড	স্বয়ংচালিত		একটি এন্ড-টু-এন্ড যানবাহন ড্রাইভিং প্রশিক্ষণ ডেটাসেট যা একটি DAVIS ইভেন্ট+ফ্রেম ক্যামেরা ব্যবহার করে। গাড়ির ডেটা যেমন স্টিয়ারিং, থ্রটল, জিপিএস, ইত্যাদি স্বয়ংচালিত অ্যাপগুলির জন্য ফ্রেম এবং ইভেন্ট ডেটার ফিউশন মূল্যায়ন করতে ব্যবহৃত হয়।	লিংক
CV	ভিডিও	ডিবিনেট, সাংহাই জিয়াও টং ইউনিভার্সিটি, জিয়ামেন ইউনিভার্সিটি, চীন	স্বয়ংচালিত	বিন্দু মেঘ, LiDAR	একটি বাস্তব-বিশ্বের 1000 কিমি ড্রাইভিং ডেটা, যাতে সারিবদ্ধ ভিডিও, পয়েন্ট ক্লাউড, জিপিএস এবং ড্রাইভিং আচরণের উপর গভীর গবেষণার জন্য ড্রাইভারের আচরণ অন্তর্ভুক্ত।	লিংক
CV	ভিডিও	ইউনিভার্সিটির দ্বারা ডা. মোডেনা এবং রেজিও এমিলিয়া, মোডেনা, ইতালির	স্বয়ংচালিত	আচরণগত লেবেল	প্রতিটি 74 মিনিটের 5টি ভিডিও সিকোয়েন্স সহ ডেটাসেট, যা 500,000-এর বেশি ফ্রেমে টীকা করা হয়েছে৷ ডেটাসেটে জিও-রেফারেন্সযুক্ত অবস্থান, ড্রাইভিং স্পিড, কোর্স, এবং এছাড়াও ড্রাইভারদের দৃষ্টি নিবদ্ধকরণ এবং তাদের অস্থায়ী একীকরণের লেবেল রয়েছে যা টাস্ক-নির্দিষ্ট মানচিত্র প্রদান করে।	লিংক
CV	ভিডিও	ETH পেডেস্ট্রিয়ান (2009), ETH জুরিখ, জুরিখ, সুইজারল্যান্ড দ্বারা	সাধারণ	সীমান্ত বক্স	74-এর বেশি ফ্রেমে টীকাযুক্ত প্রতিটি 5 মিনিটের 500,000টি ভিডিও সিকোয়েন্সের একটি ডেটাসেট৷ ডেটাসেটটি জিও-রেফারেন্সযুক্ত অবস্থান, ড্রাইভিং গতি, দিকনির্দেশ প্রদান করে এবং এছাড়াও চালকদের জন্য লেবেল স্থিরকরণ এবং তাদের সাময়িক একীকরণ, টাস্ক-নির্দিষ্ট মানচিত্র সহ।	লিংক
CV	ভিডিও	Ford (2009), Univ দ্বারা। মিশিগান, মিশিগান, মার্কিন	স্বয়ংচালিত	বাউন্ডিং বক্স, , LiDAR	একটি Velodyne 3D-লিডার স্ক্যানার, দুটি পুশ-ব্রুম ফরোয়ার্ড-লুকিং রিগ লিডার, একটি প্রযুক্তিগত এবং ভোক্তা জড়তা পরিমাপ ইউনিট (IMU), এবং একটি পয়েন্ট গ্রে লেডিবাগ 3 সর্বমুখী ক্যামেরা সিস্টেম দিয়ে সজ্জিত একটি স্বয়ংক্রিয় ল্যান্ড ভেহিকেল দ্বারা সংকলিত একটি ডেটাসেট।	লিংক
CV	ভিডিও	এইচসিআই চ্যালেঞ্জিং স্টেরিও, বোশ কর্পোরেশন রিসার্চ, হিলডেশেইম, জার্মানি	সাধারণ		ক্যাপচার করা ভিডিও দৃশ্য থেকে কয়েক মিলিয়ন ফ্রেমের একটি ডেটাসেট যাতে বিভিন্ন আবহাওয়ার পরিস্থিতি, গতির একাধিক স্তর এবং গভীরতা রয়েছে; শহর এবং গ্রামাঞ্চলের পরিস্থিতি ইত্যাদি	লিংক
CV	ভিডিও	JAAD, ইয়র্ক ইউনিভার্সিটি, ইউক্রেন, কানাডা দ্বারা	স্বয়ংচালিত	বাউন্ডিং বক্স, আচরণগত লেবেল	"JAAD হল স্বায়ত্তশাসিত ড্রাইভিং এর প্রেক্ষাপটে যৌথ মনোযোগ অধ্যয়ন করার জন্য একটি ডেটাসেট। পথচারী এবং চালকের আচরণের উপর ফোকাস করা হয় ক্রসিং এর বিন্দুতে এবং তাদের প্রভাবিত করে এমন কারণগুলির উপর। এই লক্ষ্যে, JAAD ডেটাসেটটি 346টি ছোট ভিডিওর একটি সমৃদ্ধ টীকাযুক্ত সংগ্রহ প্রদান করে। ক্লিপগুলি (5-10 সেকেন্ড দীর্ঘ) উত্তর আমেরিকা এবং পূর্ব ইউরোপের বিভিন্ন স্থান থেকে 240 ঘন্টার বেশি ড্রাইভিং ফুটেজ থেকে বের করা হয়েছে৷ অক্লুশন ট্যাগ সহ বাউন্ডিং বাক্সগুলি সমস্ত পথচারীদের জন্য ব্যবহার করা হয় যা এই ডেটাসেটটিকে পথচারীদের সনাক্তকরণের জন্য উপযুক্ত করে তোলে৷ আচরণের টীকাগুলি পথচারীদের জন্য আচরণ নির্দিষ্ট করে৷ যা ড্রাইভারের সাথে ইন্টারঅ্যাক্ট করে বা তার মনোযোগের প্রয়োজন। প্রতিটি ভিডিওর জন্য বেশ কয়েকটি ট্যাগ (আবহাওয়া, অবস্থান, ইত্যাদি) এবং টাইমস্ট্যাম্পযুক্ত আচরণের লেবেল (যেমন থামানো, হাঁটা, দেখা ইত্যাদি) রয়েছে। উপরন্তু, জনসংখ্যাগত বৈশিষ্ট্যগুলির একটি তালিকা হল প্রতিটি পথচারীর জন্য (যেমন বয়স, লিঙ্গ, গতির দিক, ইত্যাদি) পাশাপাশি প্রতিটি ফ্রেমে দৃশ্যমান ট্র্যাফিক দৃশ্যের উপাদানগুলির একটি তালিকা (যেমন স্টপ সাইন, ট্র্যাফিক সিগন্যাল, ইত্যাদি) প্রদান করা হয়েছে।"	লিংক
CV	ভিডিও	KAIST আরবান, KAIST, দক্ষিণ কোরিয়া দ্বারা	সাধারণ	LiDAR	ডেটা সংগ্রহে LiDAR ডেটা এবং স্টেরিও চিত্রগুলির জন্য অনেকগুলি অবস্থান সেন্সর রয়েছে যা খুব জটিল শহুরে এলাকাকে লক্ষ্য করে (যেমন মহানগর এলাকা, জটিল ভবন এবং আবাসিক এলাকা)।	লিংক
CV	ভাবমূর্তি	LISA ট্রাফিক সাইন, Univ দ্বারা। ক্যালিফোর্নিয়া, সান দিয়েগো, মার্কিন যুক্তরাষ্ট্র	স্বয়ংচালিত	সীমান্ত বক্স	ভিডিও এবং টীকাযুক্ত ফ্রেম সমন্বিত ডেটাসেটের সেট যেখানে মার্কিন ট্রাফিক চিহ্ন রয়েছে৷ এটি দুটি পর্যায়ে প্রকাশ করা হয়, একটি শুধুমাত্র ছবি সহ এবং একটি ছবি এবং ভিডিও উভয়ের সাথে।	লিংক
CV	ভাবমূর্তি	Mapillary Vistas, Mapillary AB, গ্লোবাল দ্বারা	স্বয়ংচালিত	শব্দার্থিক লেবেল	পিক্সেল-সঠিক এবং দৃষ্টান্ত-নির্দিষ্ট মানব টীকা সহ সারা বিশ্বের রাস্তার দৃশ্য ব্যাখ্যা করার জন্য একটি রাস্তার-স্তরের ফটোগ্রাফি ডেটাসেট।	লিংক
CV	ভিডিও, ছবি	শব্দার্থিক KITTI, বন বিশ্ববিদ্যালয় দ্বারা, কার্লসরুহে, জার্মানি	স্বয়ংচালিত	বাউন্ডিং বক্স, শব্দার্থিক লেবেল, লেন চিহ্নিতকরণ	একটি ডেটাসেট যা সমস্ত ওডোমেট্রি বেঞ্চমার্ক সিকোয়েন্সের জন্য একটি শব্দার্থিক টীকা অন্তর্ভুক্ত করে। ডেটাসেটটি বিভিন্ন ধরণের চলমান এবং অ-চলমান ট্রাফিকের টীকা দেয়: গাড়ি, বাইক, সাইকেল, পথচারী এবং সাইকেল আরোহীদের সহ, দৃশ্যের বস্তুগুলিকে অধ্যয়ন করার অনুমতি দেয়।	লিংক
CV	ভিডিও	স্ট্যানফোর্ড ট্র্যাক, স্ট্যানফোর্ড ইউনিভার্সিটি দ্বারা, মার্কিন যুক্তরাষ্ট্র	স্বয়ংচালিত	অবজেক্ট ডিটেকশন / ক্লাসিফিকেশন LiDAR, GPS, কোড	একটি ডেটাসেট যাতে 14,000টি লেবেলযুক্ত অবজেক্ট ট্র্যাক রয়েছে যা একটি Velodyne HDL-64E S2 LIDAR দ্বারা প্রাকৃতিক রাস্তার দৃশ্যে পর্যবেক্ষণ করা হয়েছে, যা 3D অবজেক্ট রিকগনিশনের জন্য মেশিন লার্নিং মডেলকে প্রশিক্ষণ দিতে ব্যবহার করা যেতে পারে।	লিংক
CV	ভিডিও, ছবি	দ্য বক্সি ডেটাসেট, বোশ, মার্কিন যুক্তরাষ্ট্র	স্বয়ংচালিত	বাউন্ডিং বক্স / যানবাহন সনাক্তকরণ	মোটরওয়েতে স্ব-চালিত গাড়ির জন্য অবজেক্ট রিকগনিশন কৌশলের প্রশিক্ষণ এবং বিশ্লেষণের জন্য 2 মিলিয়ন টীকাযুক্ত যানবাহন সমন্বিত একটি যানবাহন সনাক্তকরণ ডেটা সেট।	লিংক
CV	ভিডিও	TME মোটরওয়ে, চেক টেকনিক্যাল ইউনিভার্সিটি দ্বারা, উত্তর ইতালি	স্বয়ংচালিত	সীমান্ত বক্স	মোট 28 মিনিটের জন্য 27টি ক্লিপের একটি ডেটাসেট 30,000+ গাড়ির টীকা ফ্রেমে বিভক্ত। লেজার স্ক্যানার থেকে ডেটা ব্যবহার করে আধা-স্বয়ংক্রিয়ভাবে টীকা তৈরি করা হয়েছিল। এই তথ্য সংগ্রহে পরিবর্তনশীল ট্র্যাফিক পরিস্থিতি, লেনের সংখ্যা, রাস্তার বক্রতা এবং আলোকসজ্জা জড়িত, যা সম্পূর্ণ অধিগ্রহণের অনেক শর্তকে কভার করে।	লিংক
CV	ভিডিও	বোশ, মার্কিন যুক্তরাষ্ট্র দ্বারা তত্ত্বাবধান না করা লামাস	স্বয়ংচালিত	লেন চিহ্নিতকরণ, LiDAR	Lidar-ভিত্তিক লেন মার্কার সহ হাই-ডেফিনিশন স্বয়ংক্রিয় ড্রাইভিং মানচিত্র তৈরি করে আন-সুপারভাইজড লামাস ডেটাসেটটি টীকা করা হয়েছিল। স্বায়ত্তশাসিত যানটিকে এই মানচিত্রের বিপরীতে সারিবদ্ধ করা যেতে পারে এবং লেনের চিহ্নগুলি ক্যামেরা ফ্রেমে প্রজেক্ট করা হয়। 3D প্রজেকশনটি ইতিমধ্যে পর্যবেক্ষিত এবং পূর্বাভাসিত চিত্র মার্কারগুলির মধ্যে পার্থক্য কমিয়ে অপ্টিমাইজ করা হয়েছে।	লিংক
NLP	Audio	Facebook AI বহুভাষিক লাইব্রি স্পিচ (MLS)	সাধারণ	অডিও টীকা / বক্তৃতা স্বীকৃতি	Facebook AI বহুভাষিক LibriSpeech (MLS), হল একটি বৃহৎ মাপের, ওপেন সোর্স ডেটা সেট যা স্বয়ংক্রিয় বক্তৃতা শনাক্তকরণে (ASR) অগ্রিম গবেষণায় সাহায্য করার জন্য ডিজাইন করা হয়েছে। MLS 50,000টি ভাষায় 8 ঘন্টার বেশি অডিও সরবরাহ করে: ইংরেজি, জার্মান, ডাচ, ফ্রেঞ্চ, স্প্যানিশ, ইতালীয়, পর্তুগিজ এবং পোলিশ।	লিংক

ডেটাসেট খুলুন

AI/ML মডেলের সাথে শুরু করার জন্য ওপেন সোর্স ডেটাসেট

এআই ডেটা সার্ভিস

বিশিষ্টতা

শিল্প

পণ্য

কোম্পানির

Resources

যোগাযোগ করুন