- توضیحات :
CORD-19 منبعی از بیش از 45000 مقاله علمی است، از جمله بیش از 33000 مقاله با متن کامل، در مورد COVID-19، SARS-CoV-2، و کروناویروس های مرتبط.
برای کمک به سازماندهی اطلاعات در متون علمی COVID-19 از طریق جمع بندی انتزاعی. این مجموعه داده آن مقالات را به جفت سند و خلاصه متن کامل-چکیده یا مقدمه-چکیده تجزیه می کند.
ویژگیها شامل رشتههایی از: چکیده، متن کامل، sha (هش pdf)، source_x (منبع انتشار)، عنوان، doi (شناسه شی دیجیتال)، مجوز، نویسندگان، زمان انتشار، مجله، آدرس اینترنتی است.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge
کد منبع :
tfds.summarization.Covid19sumنسخه ها :
-
1.0.0(پیش فرض): بدون یادداشت انتشار.
-
اندازه دانلود :
Unknown sizeاندازه مجموعه داده :
Unknown sizeدستورالعملهای دانلود دستی : این مجموعه داده از شما میخواهد که دادههای منبع را به صورت دستی در
download_config.manual_dir(پیشفرض~/tensorflow_datasets/downloads/manual/):
این مجموعه داده باید به صورت دستی از طریق kaggle api دانلود شود:kaggle datasets download allen-institute-for-ai/CORD-19-research-challengeفایل فشرده دانلود شده را در پوشه دستی قرار دهید.ذخیره خودکار ( اسناد ): ناشناخته
تقسیم ها :
| شکاف | مثال ها |
|---|
- ساختار ویژگی :
FeaturesDict({
'abstract': string,
'authors': string,
'body_text': Sequence({
'section': string,
'text': string,
}),
'doi': string,
'journal': string,
'license': string,
'publish_time': string,
'sha': string,
'source_x': string,
'title': string,
'url': string,
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| FeaturesDict | ||||
| چکیده | تانسور | رشته | ||
| نویسندگان | تانسور | رشته | ||
| متن بدنه | توالی | |||
| متن_بدن/بخش | تانسور | رشته | ||
| بدن_متن/متن | تانسور | رشته | ||
| doi | تانسور | رشته | ||
| مجله | تانسور | رشته | ||
| مجوز | تانسور | رشته | ||
| انتشار_زمان | تانسور | رشته | ||
| شا | تانسور | رشته | ||
| منبع_x | تانسور | رشته | ||
| عنوان | تانسور | رشته | ||
| آدرس اینترنتی | تانسور | رشته |
کلیدهای نظارت شده (به
as_supervisedنظارت شده مراجعه کنید):('body_text', 'abstract')شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ): وجود ندارد.
نقل قول :
@ONLINE {CORD-19-research-challenge,
author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
title = "COVID-19 Open Research Dataset Challenge (CORD-19)",
month = "april",
year = "2020",
url = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}