covid19sum

  • বর্ণনা :

CORD-19 হল 45,000 টিরও বেশি পণ্ডিত নিবন্ধের একটি সংস্থান, যার মধ্যে 33,000 টিরও বেশি সম্পূর্ণ পাঠ্য সহ, COVID-19, SARS-CoV-2 এবং সংশ্লিষ্ট করোনভাইরাস সম্পর্কিত।

বিমূর্ত সারাংশের মাধ্যমে COVID-19 এর বৈজ্ঞানিক সাহিত্যে তথ্য সংগঠিত করতে সহায়তা করা। এই ডেটাসেট সেই নিবন্ধগুলিকে দস্তাবেজের জোড়া এবং সম্পূর্ণ_পাঠ-বিমূর্ত বা ভূমিকা-বিমূর্তের সারাংশে পার্স করে।

বৈশিষ্ট্যগুলির মধ্যে রয়েছে এর স্ট্রিংগুলি: বিমূর্ত, ফুল_টেক্সট, শা (পিডিএফের হ্যাশ), সোর্স_এক্স (প্রকাশনার উত্স), শিরোনাম, ডোআই (ডিজিটাল অবজেক্ট শনাক্তকারী), লাইসেন্স, লেখক, প্রকাশ_সময়, জার্নাল, ইউআরএল।

  • অতিরিক্ত ডকুমেন্টেশন : কোড সহ কাগজপত্রে অন্বেষণ করুন

  • হোমপেজ : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

  • সোর্স কোড : tfds.summarization.Covid19sum

  • সংস্করণ :

    • 1.0.0 (ডিফল্ট): কোনো রিলিজ নোট নেই।
  • ডাউনলোড আকার : Unknown size

  • ডেটাসেটের আকার : Unknown size

  • ম্যানুয়াল ডাউনলোডের নির্দেশাবলী : এই ডেটাসেটের জন্য আপনাকে ডাউনলোড_config.manual_dir-এ ম্যানুয়ালি উৎস ডেটা download_config.manual_dir করতে হবে ( ~/tensorflow_datasets/downloads/manual/ ডিফল্ট):
    এই ডেটাসেটটি কাগল এপিআই-এর মাধ্যমে ম্যানুয়ালি ডাউনলোড করতে হবে: kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge ডাউনলোড করা জিপ ফাইলটি ম্যানুয়াল ফোল্ডারে রাখুন।

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): অজানা

  • বিভাজন :

বিভক্ত উদাহরণ
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'abstract': string,
    'authors': string,
    'body_text': Sequence({
        'section': string,
        'text': string,
    }),
    'doi': string,
    'journal': string,
    'license': string,
    'publish_time': string,
    'sha': string,
    'source_x': string,
    'title': string,
    'url': string,
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
বিমূর্ত টেনসর স্ট্রিং
লেখক টেনসর স্ট্রিং
মূল লেখা ক্রম
body_text/বিভাগ টেনসর স্ট্রিং
বডি_টেক্সট/টেক্সট টেনসর স্ট্রিং
doi টেনসর স্ট্রিং
জার্নাল টেনসর স্ট্রিং
লাইসেন্স টেনসর স্ট্রিং
প্রকাশ_সময় টেনসর স্ট্রিং
sha টেনসর স্ট্রিং
উৎস_এক্স টেনসর স্ট্রিং
শিরোনাম টেনসর স্ট্রিং
url টেনসর স্ট্রিং
@ONLINE {CORD-19-research-challenge,
    author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
    title  = "COVID-19 Open Research Dataset Challenge (CORD-19)",
    month  = "april",
    year   = "2020",
    url    = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}