- বর্ণনা :
CORD-19 হল 45,000 টিরও বেশি পণ্ডিত নিবন্ধের একটি সংস্থান, যার মধ্যে 33,000 টিরও বেশি সম্পূর্ণ পাঠ্য সহ, COVID-19, SARS-CoV-2 এবং সংশ্লিষ্ট করোনভাইরাস সম্পর্কিত।
বিমূর্ত সারাংশের মাধ্যমে COVID-19 এর বৈজ্ঞানিক সাহিত্যে তথ্য সংগঠিত করতে সহায়তা করা। এই ডেটাসেট সেই নিবন্ধগুলিকে দস্তাবেজের জোড়া এবং সম্পূর্ণ_পাঠ-বিমূর্ত বা ভূমিকা-বিমূর্তের সারাংশে পার্স করে।
বৈশিষ্ট্যগুলির মধ্যে রয়েছে এর স্ট্রিংগুলি: বিমূর্ত, ফুল_টেক্সট, শা (পিডিএফের হ্যাশ), সোর্স_এক্স (প্রকাশনার উত্স), শিরোনাম, ডোআই (ডিজিটাল অবজেক্ট শনাক্তকারী), লাইসেন্স, লেখক, প্রকাশ_সময়, জার্নাল, ইউআরএল।
হোমপেজ : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge
সোর্স কোড :
tfds.summarization.Covid19sum
সংস্করণ :
-
1.0.0
(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড আকার :
Unknown size
ডেটাসেটের আকার :
Unknown size
ম্যানুয়াল ডাউনলোডের নির্দেশাবলী : এই ডেটাসেটের জন্য আপনাকে ডাউনলোড_config.manual_dir-এ ম্যানুয়ালি উৎস ডেটা
download_config.manual_dir
করতে হবে (~/tensorflow_datasets/downloads/manual/
ডিফল্ট):
এই ডেটাসেটটি কাগল এপিআই-এর মাধ্যমে ম্যানুয়ালি ডাউনলোড করতে হবে:kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge
ডাউনলোড করা জিপ ফাইলটি ম্যানুয়াল ফোল্ডারে রাখুন।স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): অজানা
বিভাজন :
বিভক্ত | উদাহরণ |
---|
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'abstract': string,
'authors': string,
'body_text': Sequence({
'section': string,
'text': string,
}),
'doi': string,
'journal': string,
'license': string,
'publish_time': string,
'sha': string,
'source_x': string,
'title': string,
'url': string,
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
বিমূর্ত | টেনসর | স্ট্রিং | ||
লেখক | টেনসর | স্ট্রিং | ||
মূল লেখা | ক্রম | |||
body_text/বিভাগ | টেনসর | স্ট্রিং | ||
বডি_টেক্সট/টেক্সট | টেনসর | স্ট্রিং | ||
doi | টেনসর | স্ট্রিং | ||
জার্নাল | টেনসর | স্ট্রিং | ||
লাইসেন্স | টেনসর | স্ট্রিং | ||
প্রকাশ_সময় | টেনসর | স্ট্রিং | ||
sha | টেনসর | স্ট্রিং | ||
উৎস_এক্স | টেনসর | স্ট্রিং | ||
শিরোনাম | টেনসর | স্ট্রিং | ||
url | টেনসর | স্ট্রিং |
তত্ত্বাবধানে থাকা কী (
as_supervised
ডক হিসেবে ):('body_text', 'abstract')
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ): অনুপস্থিত।
উদ্ধৃতি :
@ONLINE {CORD-19-research-challenge,
author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
title = "COVID-19 Open Research Dataset Challenge (CORD-19)",
month = "april",
year = "2020",
url = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}