ডেটা টীকা - NER

ক্লিনিকাল NLP-এর জন্য নামকৃত সত্তা স্বীকৃতি (NER) টীকা৷

নের টীকা

হেলথকেয়ার API-এর পরবর্তী সংস্করণ তৈরি করতে ক্লিনিকাল এনএলপি প্রশিক্ষিত/উন্নত করার জন্য ভাল-টীকাযুক্ত এবং গোল্ড স্ট্যান্ডার্ড ক্লিনিকাল পাঠ্য ডেটা

ক্লিনিকাল ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং (NLP) এর গুরুত্ব বিগত বছরগুলিতে ক্রমবর্ধমানভাবে স্বীকৃত হয়েছে এবং এটি রূপান্তরমূলক অগ্রগতির দিকে পরিচালিত করেছে। ক্লিনিক্যাল এনএলপি কম্পিউটারগুলিকে রোগীর ডাক্তারের লিখিত বিশ্লেষণের পিছনে থাকা সমৃদ্ধ অর্থ বুঝতে দেয়। ক্লিনিকাল NLP-তে জনসংখ্যার স্বাস্থ্য বিশ্লেষণ থেকে শুরু করে ক্লিনিকাল ডকুমেন্টেশনের উন্নতি থেকে বক্তৃতা স্বীকৃতি থেকে ক্লিনিকাল ট্রায়াল ম্যাচিং ইত্যাদির মধ্যে একাধিক ব্যবহারের ক্ষেত্রে থাকতে পারে।

যেকোন ক্লিনিকাল NLP মডেলের বিকাশ এবং প্রশিক্ষণের জন্য, আপনার প্রচুর পরিমাণে সঠিক, নিরপেক্ষ এবং ভাল-টীকাযুক্ত ডেটাসেট প্রয়োজন। গোল্ড স্ট্যান্ডার্ড এবং বিভিন্ন ডেটা NLP ইঞ্জিনগুলির নির্ভুলতা এবং প্রত্যাহার বাড়াতে সাহায্য করে।

আয়তন

টীকাকৃত নথির সংখ্যা
10
টীকা করা পৃষ্ঠার সংখ্যা
10 +
প্রকল্পের সময়কাল
< 1 মাসের

চ্যালেঞ্জ

ক্লায়েন্ট তাদের ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং (NLP) প্ল্যাটফর্মকে নতুন সত্তার ধরন সহ প্রশিক্ষণ ও বিকাশের জন্য এবং বিভিন্ন প্রকারের মধ্যে সম্পর্ক সনাক্ত করার অপেক্ষায় ছিল। অধিকন্তু, তারা বিক্রেতাদের মূল্যায়ন করছিল যারা উচ্চ নির্ভুলতা প্রদান করেছে, স্থানীয় আইন মেনেছে এবং ডেটার একটি বড় সেট টীকা করার জন্য প্রয়োজনীয় চিকিৎসা জ্ঞান ছিল।

কাজটি ছিল 20,000টি লেবেলযুক্ত রেকর্ডগুলিকে লেবেল করা এবং টীকা করা যার মধ্যে 15,000টি পর্যন্ত ইনপেশেন্ট এবং আউটপেশেন্ট ইলেকট্রনিক হেলথ রেকর্ড (EHR) ডেটা থেকে এবং 5,000টি লেবেলযুক্ত রেকর্ডগুলি ট্রান্সক্রিপ্ট করা মেডিকেল ডিকটেশনগুলি থেকে, সমানভাবে বিতরণ করা (1) জিওগ্রাফ এবং জিওগ্রাফ জুড়ে প্রমাণিত। 2) উপলব্ধ চিকিৎসা বিশেষত্ব.

সুতরাং, চ্যালেঞ্জগুলি সংক্ষিপ্ত করতে:

  • এনএলপি প্ল্যাটফর্ম প্রশিক্ষণের জন্য ভিন্নধর্মী ক্লিনিকাল ডেটা সংগঠিত করুন
  • গুরুত্বপূর্ণ তথ্য আহরণের জন্য বিভিন্ন সত্তার মধ্যে সম্পর্ক চিহ্নিত করুন
  • জটিল ক্লিনিকাল নথিগুলির একটি বিস্তৃত সেট লেবেল / টীকা করার ক্ষমতা এবং দক্ষতা
  • নির্ধারিত সময়সীমার মধ্যে ক্লিনিকাল এনএলপি প্রশিক্ষণের জন্য প্রচুর পরিমাণে ডেটা লেবেল / টীকা করতে খরচ নিয়ন্ত্রণে রাখা
  • 75% EHR এবং 25% ডিকটেশন রেকর্ড নিয়ে গঠিত ক্লিনিকাল ডেটাসেটে সত্তাগুলিকে টীকা করুন৷
  • ডেলিভারির সময় ডেটা ডি-আইডেন্টিফিকেশন

প্রাকৃতিক ভাষা বোঝার অন্যান্য চ্যালেঞ্জ

অস্পষ্টতা

শব্দগুলি অনন্য কিন্তু প্রেক্ষাপটের উপর নির্ভর করে এর ভিন্ন অর্থ থাকতে পারে যার ফলে আভিধানিক, সিনট্যাকটিক এবং শব্দার্থিক স্তরে অস্পষ্টতা দেখা দেয়।

সিএননিমি

আমরা একই ধারণাকে বিভিন্ন পদ দিয়ে প্রকাশ করতে পারি যা প্রতিশব্দও: বড় এবং বৃহৎ একটি বস্তুকে বর্ণনা করার সময় একই অর্থ।

কোরফারেন্স

একটি পাঠ্যের একই সত্তাকে নির্দেশ করে এমন সমস্ত অভিব্যক্তি খুঁজে পাওয়ার প্রক্রিয়াটিকে কোরফারেন্স রেজোলিউশন বলা হয়।

ব্যক্তিত্ব, উদ্দেশ্য, আবেগ

বক্তার ব্যক্তিত্বের উপর নির্ভর করে, তাদের উদ্দেশ্য এবং আবেগ একই ধারণার জন্য ভিন্নভাবে প্রকাশ করা যেতে পারে।

সমাধান

মেডিকেল ডকুমেন্টের আকারে প্রচুর পরিমাণে চিকিৎসা তথ্য এবং জ্ঞান পাওয়া যায়, তবে এটি মূলত একটি অসংগঠিত বিন্যাসে। মেডিক্যাল এন্টিটি অ্যানোটেশন/নামড এন্টিটি রিকগনিশন (এনইআর) টীকা সহ, শাইপ বিভিন্ন ধরনের ক্লিনিকাল রেকর্ড থেকে দরকারী তথ্য টীকা করে কাঠামোবিহীন ডেটাকে একটি কাঠামোগত বিন্যাসে রূপান্তর করতে সক্ষম হয়েছিল। একবার সত্তাগুলি চিহ্নিত হয়ে গেলে, তাদের মধ্যে সম্পর্কটিও গুরুত্বপূর্ণ তথ্য সনাক্ত করার জন্য ম্যাপ করা হয়েছিল।

কাজের পরিধি: স্বাস্থ্যসেবা সত্তা উল্লেখ টীকা

9টি সত্তার ধরন

  • চিকিৎসাধীন অবস্থা
  • চিকিৎসা পদ্ধতি
  • শারীরবৃত্তীয় কাঠামো
  • ঔষধ
  • মেডিকেল ডিভাইস
  • শারীরিক পরিমাপ
  • পদার্থ অপব্যবহার
  • ল্যাবরেটরি ডেটা
  • শরীরের ফাংশন

17 মডিফায়ার

  • ওষুধ সংশোধনকারী: শক্তি, একক, ডোজ, থেকে, ফ্রিকোয়েন্সি, রুট, সময়কাল, স্থিতি
  • শারীরিক পরিমাপ সংশোধক: মান, একক, ফলাফল
  • পদ্ধতি পরিবর্তনকারী: পদ্ধতি
    • ল্যাবরেটরি ডেটা মডিফায়ার: ল্যাব ভ্যালু, ল্যাব ইউনিট, ল্যাব রেজাল্ট
  • নির্দয়তা
  • পদ্ধতির ফলাফল

27 সম্পর্ক এবং রোগীর অবস্থা

ফলাফল

টীকাকৃত ডেটা ক্লায়েন্টের ক্লিনিকাল NLP প্ল্যাটফর্মের বিকাশ ও প্রশিক্ষণের জন্য ব্যবহার করা হবে, যা তাদের স্বাস্থ্যসেবা API-এর পরবর্তী সংস্করণে অন্তর্ভুক্ত করা হবে। ক্লায়েন্ট প্রাপ্ত সুবিধাগুলি হল:

  • লেবেল করা/টীকা করা ডেটা ক্লায়েন্টের স্ট্যান্ডার্ড ডেটা টীকা নির্দেশিকা পূরণ করেছে।
  • বৃহত্তর নির্ভুলতার জন্য এনএলপি প্ল্যাটফর্ম প্রশিক্ষণের জন্য ভিন্ন ভিন্ন ডেটাসেটগুলি ব্যবহার করা হয়েছিল।
  • বিভিন্ন সত্ত্বার মধ্যে সম্পর্ক, যেমন শারীরবৃত্তীয় শরীরের গঠন <> চিকিৎসা যন্ত্র, চিকিৎসা অবস্থা <> চিকিৎসা ডিভাইস, চিকিৎসা অবস্থা <> ওষুধ, চিকিৎসা অবস্থা <> পদ্ধতিকে জটিল চিকিৎসা তথ্য সংগ্রহের জন্য চিহ্নিত করা হয়েছে।
  • ডেলিভারির সময় লেবেল/টীকাযুক্ত ডেটার বিস্তৃত সেটগুলিও ডি-শনাক্ত করা হয়েছিল।

Shaip এর সাথে আমাদের সহযোগিতা স্বাস্থ্যসেবার মধ্যে পরিবেষ্টিত প্রযুক্তি এবং কথোপকথনমূলক AI-তে আমাদের প্রকল্পকে উল্লেখযোগ্যভাবে উন্নত করেছে। সিন্থেটিক স্বাস্থ্যসেবা সংলাপগুলি তৈরি এবং প্রতিলিপি করার ক্ষেত্রে তাদের দক্ষতা একটি দৃঢ় ভিত্তি প্রদান করে, যা নিয়ন্ত্রক চ্যালেঞ্জগুলি কাটিয়ে উঠতে সিন্থেটিক ডেটার সম্ভাব্যতা প্রদর্শন করে। Shaip এর সাথে, আমরা এই বাধাগুলি নেভিগেট করেছি এবং এখন স্বজ্ঞাত স্বাস্থ্যসেবা সমাধানের আমাদের দৃষ্টিভঙ্গি উপলব্ধি করার এক ধাপ কাছাকাছি।

গোল্ডেন-৫-স্টার

আপনার কথোপকথনমূলক এআই ত্বরান্বিত করুন
100% দ্বারা অ্যাপ্লিকেশন উন্নয়ন