স্বাস্থ্যসেবা এআই-এর জন্য চিকিৎসা ডেটা ক্যাটালগ
আপনার হেলথকেয়ার এআই প্রোজেক্ট জাম্পস্টার্ট করতে অফ-দ্য-শেল্ফ হেল্থকেয়ার/মেডিকেল ডেটাসেট
মেশিন লার্নিং এর জন্য মেডিকেল এবং হেলথ কেয়ার ডেটাসেট
শাইপ মেডিকেল ডেটা ক্যাটালগে কী কী অন্তর্ভুক্ত রয়েছে?
শাইপ মেডিকেল ডেটা ক্যাটালগ হলো HIPAA-সম্মত এবং সহজলভ্য একটি লাইব্রেরি, যেখানে ৩১টি চিকিৎসা বিশেষত্ব জুড়ে পরিচয় গোপন করা স্বাস্থ্যসেবা প্রশিক্ষণ ডেটা রয়েছে। এর মধ্যে অন্তর্ভুক্ত আছে ২৫৭,৯৭৭ ঘণ্টার চিকিৎসকের ডিকটেশন অডিও, অনুলিখিত মেডিকেল রেকর্ড, ইলেকট্রনিক স্বাস্থ্য রেকর্ড এবং মাল্টিমোডাল ডেটাসেট। প্রতিটি ডেটাসেট বাণিজ্যিক এআই প্রশিক্ষণের জন্য লাইসেন্সপ্রাপ্ত এবং এতে সেফ হারবার বা এক্সপার্ট ডিটারমিনেশন ডি-আইডেন্টিফিকেশন ব্যবস্থা রয়েছে।
চিকিত্সক নির্দেশনা অডিও ডেটা
স্বাস্থ্যসেবার জন্য আমাদের অ-শনাক্তকৃত ডেটাসেটে 31টি বিশেষায়িত বিভাগের অডিও ফাইল রয়েছে যা চিকিৎসকদের দ্বারা নির্ধারিত, যা রোগীদের ক্লিনিকাল অবস্থা এবং ক্লিনিকাল সেটিংয়ে চিকিৎসক-রোগীর মুখোমুখি হওয়ার উপর ভিত্তি করে যত্নের পরিকল্পনা বর্ণনা করে।
অফ-দ্য-শেল্ফ চিকিত্সক নির্দেশনা অডিও ফাইল:
- স্বাস্থ্যসেবা বক্তৃতা মডেলদের প্রশিক্ষণের জন্য ৩১টি বিশেষায়িত প্রতিষ্ঠান থেকে ২৫৭,৯৭৭ ঘন্টার রিয়েল-ওয়ার্ল্ড ফিজিশিয়ান ডিক্টেশন বক্তৃতা ডেটাসেট
- টেলিফোন ডিকটেশন (54.3%), ডিজিটাল রেকর্ডার (24.9%), স্পিচ মাইক (5.4%), স্মার্ট ফোন (2.7%) এবং অজানা (12.7%) এর মতো বিভিন্ন ডিভাইস থেকে ডিকটেশন অডিও ক্যাপচার করা হয়েছে।
- PII সংশোধিত অডিও এবং প্রতিলিপি HIPAA-এর সাথে সঙ্গতিপূর্ণ নিরাপদ হারবার নির্দেশিকা মেনে চলে
প্রতিলিপি মেডিকেল রেকর্ড
ট্রান্সক্রাইবড মেডিকেল রেকর্ড বলতে চিকিৎসক এবং রোগীর কথোপকথনের ট্রান্সক্রিপশন, মেডিকেল রিপোর্টের ট্রান্সক্রিপশন এবং মেডিকেল মূল্যায়ন বোঝায়। এটি ভবিষ্যতের পরিদর্শনের জন্য রোগীর চিকিৎসা ইতিহাস ম্যাপ করতে সাহায্য করে এবং ডাক্তারদের জন্য একটি রেফারেন্স পয়েন্ট হিসেবেও কাজ করে। এটি রোগীর বর্তমান অবস্থা মূল্যায়ন করতে এবং উপযুক্ত চিকিৎসার পরামর্শ দিতে সাহায্য করে।
অফ-দ্য-শেল্ফ প্রতিলিপিকৃত মেডিকেল রেকর্ডস:
- হেলথকেয়ার স্পিচ মডেলকে প্রশিক্ষণের জন্য 257,977টি বিশেষত্ব থেকে 31 ঘণ্টার রিয়েল-ওয়ার্ল্ড ফিজিশিয়ান ডিকটেশনের ট্রান্সক্রিপশন
- অপারেটিভ রিপোর্ট, ডিসচার্জ সারাংশ, কনসালটেশন নোট, অ্যাডমিট নোট, ইডি নোট, ক্লিনিক নোট, রেডিওলজি রিপোর্ট ইত্যাদির মতো বিভিন্ন কাজের ধরনের থেকে প্রতিলিপি করা মেডিকেল রেকর্ড।
- PII সংশোধিত অডিও এবং প্রতিলিপি HIPAA-এর সাথে সঙ্গতিপূর্ণ নিরাপদ হারবার নির্দেশিকা মেনে চলে
ইলেকট্রনিক হেলথ রেকর্ডস (EHR)
ইলেকট্রনিক হেলথ রেকর্ডস বা EHR হল মেডিকেল রেকর্ড যাতে রোগীর চিকিৎসার ইতিহাস, রোগ নির্ণয়, প্রেসক্রিপশন, চিকিৎসার পরিকল্পনা, টিকা বা ইমিউনাইজেশনের তারিখ, অ্যালার্জি, রেডিওলজি ছবি (সিটি স্ক্যান, এমআরআই, এক্স-রে), এবং ল্যাবরেটরি পরীক্ষা এবং আরও অনেক কিছু থাকে।
অফ-দ্য-শেল্ফ ইলেক্ট্রনিক হেলথ রেকর্ডস (EHR):
- 5.1টি বিশেষত্বে 31M+ রেকর্ড এবং চিকিৎসকের অডিও ফাইল
- ক্লিনিক্যাল এনএলপি এবং অন্যান্য ডকুমেন্ট এআই মডেলের প্রশিক্ষণের জন্য বাস্তব-বিশ্বের স্বর্ণ-মানের মেডিকেল রেকর্ড
- মেটাডেটা তথ্য যেমন MRN (বেনামী), ভর্তির তারিখ, ডিসচার্জের তারিখ, থাকার দিনগুলির দৈর্ঘ্য, লিঙ্গ, রোগীর শ্রেণী, প্রদানকারী, আর্থিক শ্রেণী, রাজ্য, ডিসচার্জ ডিসপোজিশন, বয়স, DRG, DRG বিবরণ, $ প্রতিদান, AMLOS, GMLOS, ঝুঁকি মৃত্যুহার, অসুস্থতার তীব্রতা, গ্রুপার, হাসপাতালের জিপ কোড, ইত্যাদি।
- মার্কিন যুক্তরাষ্ট্রের বিভিন্ন রাজ্য এবং অঞ্চল থেকে মেডিকেল রেকর্ড- উত্তর পূর্ব (46%), দক্ষিণ (9%), মধ্যপশ্চিম (3%), পশ্চিম (28%), অন্যান্য (14%)
- সমস্ত রোগীর শ্রেণীভুক্ত মেডিকেল রেকর্ড- ইনপেশেন্ট, বহিরাগত রোগী (ক্লিনিক্যাল, রিহ্যাব, রিকারিং, সার্জিক্যাল ডে কেয়ার), ইমার্জেন্সি।
- সমস্ত রোগীর বয়স গ্রুপের মেডিকেল রেকর্ড <10 বছর (7.9%), 11-20 বছর (5.7%), 21-30 বছর (10.9%), 31-40 বছর (11.7%), 41-50 বছর (10.4%) ), 51-60 বছর (13.8%), 61-70 বছর (16.1%), 71-80 বছর (13.3%), 81-90 বছর (7.8%), 90+ বছর (2.4%)
- রোগীর লিঙ্গ অনুপাত 46% (পুরুষ) এবং 54% (মহিলা)
- PII সংশোধিত নথিগুলি HIPAA এর সাথে সামঞ্জস্য রেখে নিরাপদ হারবার নির্দেশিকা মেনে চলে
ক্রেতাদের পাঁচটি কারণ লাইসেন্স শাইপ একসাথে সেলাই করার পরিবর্তে।
শাইপ মেডিকেল ডেটা ক্যাটালগটির অস্তিত্ব রয়েছে কারণ বেশিরভাগ স্বাস্থ্যসেবা এআই দল নয় থেকে বারো মাস সময় হারায়। একটিও মডেলকে প্রশিক্ষণ দেওয়ার আগে সঙ্গতিপূর্ণ প্রশিক্ষণ ডেটা সংগ্রহ করা। সেই মাসগুলো ফেরত এলে কী পরিবর্তন হয়, তা এখানে দেওয়া হলো।
ক্যাটালগের এমন মাপকাঠি যা বেশিরভাগ দলই মেলাতে পারে না।
শাইপ ক্যাটালগ বিস্তৃত 257,977 ঘণ্টা চিকিৎসকের শ্রুতলিপি থেকে প্রতিলিপি ৪০টি চিকিৎসা বিশেষত্বএবং প্রতিটি রোগীর বয়সসীমা অন্তর্ভুক্ত ইএইচআর রেকর্ড — এই বিপুল পরিমাণ তথ্য ক্রেতাদেরকে এক ডজন উন্মুক্ত ডেটাসেট একত্রিত না করেই মডেলগুলিকে প্রশিক্ষণ এবং মূল্যায়ন করুন.
সম্মতি একটি প্রাথমিক শর্ত, কোনো বৈশিষ্ট্য নয়।
প্রতিটি শাইপ মেডিকেল ডেটাসেটের সাথে অন্তর্ভুক্ত থাকে ডিফল্টরূপে HIPAA সেফ হারবার ডি-আইডেন্টিফিকেশনঅনুরোধের ভিত্তিতে বিশেষজ্ঞের সিদ্ধান্ত, GDPR-সম্মত পরিচালনা, এবং আওতাভুক্ত সংস্থাগুলির জন্য BAA-প্রস্তুতি। ক্রেতাদের পরবর্তীতে কমপ্লায়েন্স নতুন করে সংযোজন করার প্রয়োজন নেই।
স্বাস্থ্যসেবায় প্রশিক্ষিত বিশেষজ্ঞ, সাধারণ জনতা কর্মী নয়।
শাইপ মেডিকেল ক্যাটালগের টীকা, প্রতিলিপি এবং গুণমান নিশ্চিতকরণ (QA) সম্পাদন করেন: স্বাস্থ্যসেবা-প্রশিক্ষিত বিশেষজ্ঞশাইপ ওয়ার্কফ্লোতে ক্লিনিক্যাল নির্ভুলতার মানদণ্ড অনুযায়ী ক্রমাঙ্কিত বহুস্তরীয় গুণমান নিশ্চিতকরণ (QA) এবং মানব-সক্রিয় যাচাইকরণ অন্তর্ভুক্ত রয়েছে।
আজই তৈরি, চাহিদা অনুযায়ী কাস্টমাইজ করা যাবে।
ক্রেতারা বিদ্যমান Shaip ডেটাসেটগুলো অবিলম্বে লাইসেন্স করতে পারেন অথবা নির্দিষ্ট জনসংখ্যা, ভৌগোলিক অঞ্চল, ভাষা এবং পদ্ধতি অনুসারে কাস্টম সংগ্রহের জন্য অর্ডার দিতে পারেন — বিক্রেতা পরিবর্তন না করে বা সম্মতি পর্যালোচনা পুনরায় না চালিয়ে.
যেখানে ডেটা টিমগুলো আগে থেকেই কাজ করে, সেখানেই উপলব্ধ।
শাইপের পরিচয় গোপন করা ইএইচআর এবং চিকিৎসকের ডিকটেশন ডেটাসেটগুলো এখানে পাওয়া যাচ্ছে। ডেটাব্রিক্স মার্কেটপ্লেসডেটা এবং এমএল টিমগুলো ইতোমধ্যে যে ফরম্যাটগুলো ব্যবহার করে — যেমন JSON, CSV, WAV — সেই ফরম্যাটেই ডেলিভারি করা হয়। কোনো প্রতিশ্রুতি দেওয়ার আগেই নমুনা ডেটাসেট পাওয়া যায়।
সুরক্ষা ও সম্মতি
আপনি যা খুঁজছেন তা খুঁজে পাচ্ছেন না?
নতুন অফ-দ্য-শেল্ফ মেডিকেল ডেটাসেটগুলি সমস্ত ডেটা প্রকার জুড়ে সংগ্রহ করা হচ্ছে
আপনার স্বাস্থ্যসেবা প্রশিক্ষণের ডেটা সংগ্রহের উদ্বেগ দূর করতে এখনই আমাদের সাথে যোগাযোগ করুন
প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী (FAQ)
১. মেডিকেল ডেটাসেট কি?
মেডিকেল ডেটাসেট হলো স্বাস্থ্যসেবা সংক্রান্ত ডেটা যা এআই/এমএল মডেলকে প্রশিক্ষণ, মূল্যায়ন এবং উন্নত করতে ব্যবহৃত হয়। এর মধ্যে অন্তর্ভুক্ত থাকতে পারে চিকিৎসকের নির্দেশিত অডিও, অনুলিখিত মেডিকেল রেকর্ড, ইলেকট্রনিক স্বাস্থ্য রেকর্ড, চিকিৎসক-রোগীর কৃত্রিম কথোপকথন এবং মাল্টিমোডাল স্বাস্থ্যসেবা ডেটাসেট যা প্রাসঙ্গিক টেক্সট, স্পিচ এবং কাঠামোগত ক্লিনিক্যাল ডেটাকে একত্রিত করে।
২. শাইপ মেডিকেল ডেটা ক্যাটালগে কী কী অন্তর্ভুক্ত রয়েছে?
শাইপ মেডিকেল ডেটা ক্যাটালগে চিকিৎসকের বলা অডিও, অনুলিখিত মেডিকেল রেকর্ড, ইলেকট্রনিক স্বাস্থ্য রেকর্ড, চিকিৎসক-রোগীর কৃত্রিম কথোপকথন এবং মাল্টিমোডাল ডেটাসেট অন্তর্ভুক্ত রয়েছে, যা রোগী বা সাক্ষাৎ পর্যায়ে টেক্সট, স্পিচ এবং কাঠামোগত ক্লিনিক্যাল ডেটাকে সংযুক্ত করে। এতে ৩১টি মেডিকেল স্পেশালিটি জুড়ে ২৫৭,৯৭৭ ঘণ্টার চিকিৎসকের বলা অডিও রয়েছে এবং এটি বাণিজ্যিক এআই প্রশিক্ষণের জন্য উপলব্ধ।
৩. শাইপের মেডিকেল ডেটাসেটগুলো কি HIPAA-সম্মত?
হ্যাঁ। শাইপ-এর মেডিকেল ডেটাসেটগুলো ডিফল্টরূপে HIPAA সেফ হারবার-এর অধীনে পরিচয়বিহীন করা থাকে, যা HIPAA প্রাইভেসি রুলে উল্লেখিত ১৮ ধরনের শনাক্তকারীকে মুছে ফেলে। যখন পরিসংখ্যানগত সার্টিফিকেশনের প্রয়োজন হয়, তখন এক্সপার্ট ডিটারমিনেশন ডি-আইডেন্টিফিকেশনও উপলব্ধ থাকে, এবং শাইপ কভার্ড এনটিটিগুলোর জন্য BAA-রেডি।
৪. শাইপের মেডিকেল ডেটাসেটগুলো কি জিডিপিআর এবং স্বাস্থ্যসেবা সংক্রান্ত অন্যান্য ডেটার প্রয়োজনীয়তা পূরণ করতে পারে?
হ্যাঁ। প্রকল্পের পরিধি, ভৌগোলিক অবস্থান, ডেটার ধরন এবং চুক্তিগত শর্তাবলীর উপর নির্ভর করে, শাইপ-এর মেডিকেল ডেটাসেটগুলো HIPAA, GDPR এবং স্বাস্থ্যসেবা সংক্রান্ত অন্যান্য প্রযোজ্য ডেটার প্রয়োজনীয়তা পূরণের জন্য প্রস্তুত করা যেতে পারে।
৫. আমি কি স্বাস্থ্যসেবা সংক্রান্ত ডেটাসেট তৈরি অবস্থায় কিনতে পারি, নাকি সেগুলো সংগ্রহ করতে হবে?
উভয় বিকল্পই উপলব্ধ। বাণিজ্যিক এআই প্রশিক্ষণের জন্য শাইপ তার শাইপ মেডিকেল ডেটা ক্যাটালগের মাধ্যমে তৈরি স্বাস্থ্যসেবা ডেটাসেট সরবরাহ করে। যদি কোনো প্রকল্পের জন্য নির্দিষ্ট ভাষা, জনসংখ্যাতাত্ত্বিক তথ্য, বিশেষত্ব, চিকিৎসা পদ্ধতি বা ক্লিনিকাল পরিবেশের প্রয়োজন হয়, তবে শাইপ একই সম্মতি মানদণ্ড মেনে কাস্টম মেডিকেল ডেটা সংগ্রহও করতে পারে।
৬. শাইপ মেডিকেল ডেটাসেটগুলো কি কাস্টমাইজ করা যায়?
হ্যাঁ। শাইপ বিশেষত্ব, রোগীর বয়সসীমা, লিঙ্গ, ভৌগোলিক অবস্থান, ভাষা, চিকিৎসা পদ্ধতি, ক্লিনিকাল সেটিং, ফরম্যাট, পরিমাণ এবং প্রকল্পের প্রয়োজনীয়তা অনুসারে মেডিকেল ডেটাসেট কাস্টমাইজ করতে পারে। কাস্টম ডেটাসেটগুলো একটি স্টেটমেন্ট অফ ওয়ার্কের মাধ্যমে নির্ধারণ করা হয় এবং প্রযোজ্য ডি-আইডেন্টিফিকেশন ও কমপ্লায়েন্স স্ট্যান্ডার্ড অনুসরণ করে।
৭. লাইসেন্স নেওয়ার আগে আমি কি একটি নমুনা ডেটাসেট দেখতে পারি?
হ্যাঁ। শাইপ এনডিএ-এর অধীনে প্রতিনিধিত্বমূলক নমুনা ডেটাসেট সরবরাহ করে, যাতে এআই টিমগুলো লাইসেন্স করার আগে ফরম্যাট, গুণমান, জনসংখ্যাতাত্ত্বিক পরিধি এবং মডেল ফিট মূল্যায়ন করতে পারে। স্ট্যান্ডার্ড লাইসেন্স বা কাস্টম কালেকশন চুক্তির আগে সাধারণত নমুনা অ্যাক্সেসই প্রথম ধাপ।
৮. শাইপ কোন কোন ফরম্যাটে মেডিকেল ডেটাসেট সরবরাহ করে?
শাইপ এআই-উপযোগী ফরম্যাটে মেডিকেল ডেটাসেট সরবরাহ করে, যার মধ্যে রয়েছে স্ট্রাকচার্ড রেকর্ডের জন্য JSON, CSV, ও FHIR; অডিওর জন্য জোড়া ট্রান্সক্রিপ্টসহ WAV ফাইল; এবং স্পিচ ও ল্যাঙ্গুয়েজ ডেটাসেটের জন্য ট্রান্সক্রিপ্ট ফাইল। মাল্টিমোডাল ডেটাসেটে ম্যানিফেস্ট ফাইল অন্তর্ভুক্ত থাকতে পারে, যা টেক্সট, অডিও এবং স্ট্রাকচার্ড ক্লিনিক্যাল রেকর্ডকে সংযুক্ত করে।
৯. শাইপ কীভাবে চিকিৎসা সংক্রান্ত ডেটাসেটের গুণমান নিশ্চিত করে?
শাইপ বিশেষজ্ঞ পর্যালোচনা, ডোমেইন-বিশেষজ্ঞের টীকা সংযোজন, যাচাইকরণ কর্মপ্রবাহ এবং কাঠামোগত QA চেকের মাধ্যমে মেডিকেল ডেটাসেটের গুণমান নিশ্চিত করে। এই প্রক্রিয়াগুলো স্বাস্থ্যসেবা AI উন্নয়নের জন্য নির্ভুলতা, নির্ভরযোগ্যতা এবং মডেলের প্রস্তুতি নিশ্চিত করতে সাহায্য করে।
১০. শাইপের মেডিকেল ডেটাসেটগুলো কি বৃহৎ এআই/এমএল প্রকল্পের জন্য সম্প্রসারণযোগ্য?
হ্যাঁ। শাইপের মেডিকেল ডেটাসেটগুলো ছোট পাইলট প্রকল্প এবং এন্টারপ্রাইজ এআই/এমএল প্রকল্প, উভয়ের জন্যই সম্প্রসারণযোগ্য। এগুলো এমন সব প্রকল্পকে সমর্থন করতে পারে, যেগুলোর জন্য বিপুল পরিমাণ মেডিকেল রেকর্ড, কাঠামোগত ক্লিনিক্যাল ডেটা, ট্রান্সক্রিপ্ট, অথবা কয়েক লক্ষ ঘণ্টার চিকিৎসকের ডিকটেশন অডিও প্রয়োজন হয়।
১১. শাইপ মেডিকেল ডেটাসেটগুলো কি বিদ্যমান এআই মডেল এবং ওয়ার্কফ্লোতে একীভূত করা যায়?
হ্যাঁ। শাইপ মেডিকেল ডেটাসেটগুলো JSON, CSV, FHIR, WAV এবং ট্রান্সক্রিপ্ট ফাইলের মতো ব্যবহারের জন্য প্রস্তুত ফরম্যাটে সরবরাহ করে। এই ফরম্যাটগুলো বিদ্যমান AI, ML, NLP, স্পিচ, হেলথকেয়ার LLM এবং মাল্টিমোডাল মডেল ডেভেলপমেন্ট ওয়ার্কফ্লোতে ইন্টিগ্রেশন সমর্থন করে।
১২. একটি শাইপ মেডিকেল ডেটাসেট পেতে কত সময় লাগে?
নমুনা পর্যালোচনা, চুক্তি স্বাক্ষর এবং লাইসেন্স চূড়ান্তকরণের পর সাধারণত কয়েক দিনের মধ্যেই রেডিমেড মেডিকেল ডেটাসেট সরবরাহ করা যায়। কাস্টম ডেটা সংগ্রহের সময়সীমা প্রকল্পের পরিধি, ডেটাসেটের আকার, পদ্ধতি, নিয়মকানুন ও জটিলতার উপর নির্ভর করে এবং তা কাজের বিবরণে (statement of work) উল্লেখ করা থাকে।
১৩. চিকিৎসা সংক্রান্ত ডেটাসেটের দাম কত?
মেডিকেল ডেটাসেটের খরচ ডেটাসেটের ধরন, পদ্ধতি, পরিমাণ, কাস্টমাইজেশনের প্রয়োজনীয়তা, লাইসেন্সিং শর্তাবলী, ডেলিভারির সময়সীমা এবং কমপ্লায়েন্সের চাহিদার উপর নির্ভর করে। টিমগুলো একটি কাস্টম কোটেশন পাওয়ার জন্য আমাদের সাথে যোগাযোগ ফর্মের মাধ্যমে তাদের প্রয়োজনীয়তাগুলো জানাতে পারে।
১৪. স্বাস্থ্যসেবায় এআই/এমএল-এর জন্য মেডিকেল ডেটাসেট কেন গুরুত্বপূর্ণ?
নির্ভুল, নির্ভরযোগ্য এবং চিকিৎসাগতভাবে কার্যকর স্বাস্থ্যসেবা এআই মডেল প্রশিক্ষণের জন্য উচ্চ-মানের মেডিকেল ডেটাসেট অপরিহার্য। এগুলি মেডিকেল ডকুমেন্টেশন, ক্লিনিক্যাল এনএলপি, স্পিচ রিকগনিশন, সামারাইজেশন, ডিসিশন সাপোর্ট, অটোমেশন, পেশেন্ট কেয়ার ওয়ার্কফ্লো এবং হেলথকেয়ার ডেটা ইন্টেলিজেন্স উন্নত করতে সাহায্য করে।