covid19sum

  • توضیحات :

CORD-19 منبعی از بیش از 45000 مقاله علمی است، از جمله بیش از 33000 مقاله با متن کامل، در مورد COVID-19، SARS-CoV-2، و کروناویروس های مرتبط.

برای کمک به سازماندهی اطلاعات در متون علمی COVID-19 از طریق جمع بندی انتزاعی. این مجموعه داده آن مقالات را به جفت سند و خلاصه متن کامل-چکیده یا مقدمه-چکیده تجزیه می کند.

ویژگی‌ها شامل رشته‌هایی از: چکیده، متن کامل، sha (هش pdf)، source_x (منبع انتشار)، عنوان، doi (شناسه شی دیجیتال)، مجوز، نویسندگان، زمان انتشار، مجله، آدرس اینترنتی است.

  • اسناد اضافی : کاوش در کاغذها با کد

  • صفحه اصلی : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

  • کد منبع : tfds.summarization.Covid19sum

  • نسخه ها :

    • 1.0.0 (پیش فرض): بدون یادداشت انتشار.
  • اندازه دانلود : Unknown size

  • اندازه مجموعه داده : Unknown size

  • دستورالعمل‌های دانلود دستی : این مجموعه داده از شما می‌خواهد که داده‌های منبع را به صورت دستی در download_config.manual_dir (پیش‌فرض ~/tensorflow_datasets/downloads/manual/ ):
    این مجموعه داده باید به صورت دستی از طریق kaggle api دانلود شود: kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge فایل فشرده دانلود شده را در پوشه دستی قرار دهید.

  • ذخیره خودکار ( اسناد ): ناشناخته

  • تقسیم ها :

شکاف مثال ها
  • ساختار ویژگی :
FeaturesDict({
    'abstract': string,
    'authors': string,
    'body_text': Sequence({
        'section': string,
        'text': string,
    }),
    'doi': string,
    'journal': string,
    'license': string,
    'publish_time': string,
    'sha': string,
    'source_x': string,
    'title': string,
    'url': string,
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
چکیده تانسور رشته
نویسندگان تانسور رشته
متن بدنه توالی
متن_بدن/بخش تانسور رشته
بدن_متن/متن تانسور رشته
doi تانسور رشته
مجله تانسور رشته
مجوز تانسور رشته
انتشار_زمان تانسور رشته
شا تانسور رشته
منبع_x تانسور رشته
عنوان تانسور رشته
آدرس اینترنتی تانسور رشته
  • کلیدهای نظارت شده (به as_supervised نظارت شده مراجعه کنید): ('body_text', 'abstract')

  • شکل ( tfds.show_examples ): پشتیبانی نمی شود.

  • مثال‌ها ( tfds.as_dataframe ): وجود ندارد.

  • نقل قول :

@ONLINE {CORD-19-research-challenge,
    author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
    title  = "COVID-19 Open Research Dataset Challenge (CORD-19)",
    month  = "april",
    year   = "2020",
    url    = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}