- विवरण :
CORD-19 45,000 से अधिक विद्वानों के लेखों का एक संसाधन है, जिसमें पूर्ण पाठ के साथ 33,000 से अधिक, COVID-19, SARS-CoV-2 और संबंधित कोरोनविर्यूज़ के बारे में है।
सार संक्षेपण के माध्यम से COVID-19 के वैज्ञानिक साहित्य में सूचना को व्यवस्थित करने में मदद करना। यह डेटासेट उन लेखों को दस्तावेज़ के जोड़े और पूर्ण_पाठ-सार या परिचय-सार के सारांश के लिए पार्स करता है।
विशेषताओं में शामिल हैं: सार, पूर्ण_पाठ, शा (पीडीएफ का हैश), स्रोत_एक्स (प्रकाशन का स्रोत), शीर्षक, डीओआई (डिजिटल वस्तु पहचानकर्ता), लाइसेंस, लेखक, प्रकाशन_समय, पत्रिका, यूआरएल।
अतिरिक्त दस्तावेज़ीकरण : कोड वाले पेपर्स पर एक्सप्लोर करें
होमपेज : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge
स्रोत कोड :
tfds.summarization.Covid19sumसंस्करण :
-
1.0.0(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
डाउनलोड आकार :
Unknown sizeडेटासेट का आकार :
Unknown sizeमैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से
download_config.manual_dir(डिफ़ॉल्ट रूप से~/tensorflow_datasets/downloads/manual/) में डाउनलोड करना होगा:
इस डेटासेट को kaggle api के माध्यम से मैन्युअल रूप से डाउनलोड करने की आवश्यकता है:kaggle datasets download allen-institute-for-ai/CORD-19-research-challengeडाउनलोड की गई ज़िप फ़ाइल को मैन्युअल फ़ोल्डर में रखें।ऑटो-कैश्ड ( दस्तावेज़ीकरण ): अज्ञात
विभाजन :
| विभाजित करना | उदाहरण |
|---|
- फ़ीचर संरचना :
FeaturesDict({
'abstract': string,
'authors': string,
'body_text': Sequence({
'section': string,
'text': string,
}),
'doi': string,
'journal': string,
'license': string,
'publish_time': string,
'sha': string,
'source_x': string,
'title': string,
'url': string,
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| विशेषताएं डिक्ट | ||||
| सार | टेन्सर | डोरी | ||
| लेखकों | टेन्सर | डोरी | ||
| मुख्य भाग | क्रम | |||
| बॉडी_टेक्स्ट/सेक्शन | टेन्सर | डोरी | ||
| बॉडी_टेक्स्ट/टेक्स्ट | टेन्सर | डोरी | ||
| दोई | टेन्सर | डोरी | ||
| पत्रिका | टेन्सर | डोरी | ||
| लाइसेंस | टेन्सर | डोरी | ||
| publish_time | टेन्सर | डोरी | ||
| शा | टेन्सर | डोरी | ||
| स्रोत_x | टेन्सर | डोरी | ||
| शीर्षक | टेन्सर | डोरी | ||
| यूआरएल | टेन्सर | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervisedदस्तावेज़ देखें):('body_text', 'abstract')चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ): गुम।
उद्धरण :
@ONLINE {CORD-19-research-challenge,
author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
title = "COVID-19 Open Research Dataset Challenge (CORD-19)",
month = "april",
year = "2020",
url = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}