covid19sum

  • Mô tả:

CORD-19 là một nguồn tài nguyên của hơn 45.000 bài báo học thuật, trong đó có hơn 33.000 với toàn văn về COVID-19, SARS-CoV-2 và các coronavirus liên quan.

Để giúp tổ chức thông tin trong tài liệu khoa học của COVID-19 thông qua tóm tắt trừu tượng. Tập dữ liệu này phân tích cú pháp các bài báo đó thành các cặp tài liệu và tóm tắt của full_text-abstract hoặc giới thiệu-trừu tượng.

Các tính năng bao gồm các chuỗi: abstract, full_text, sha (băm của pdf), source_x (nguồn xuất bản), title, doi (mã định danh đối tượng kỹ thuật số), giấy phép, tác giả, Publishing_time, tạp chí, url.

  • Trang chủ: https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

  • Source code: tfds.summarization.Covid19sum

  • phiên bản:

    • 1.0.0 (mặc định): Không có ghi chú phát hành.
  • Dung lượng tải về: Unknown size

  • Kích thước tập dữ liệu: Unknown size

  • Hướng dẫn tải về Hướng dẫn sử dụng: Bộ dữ liệu này đòi hỏi bạn phải tải về dữ liệu nguồn bằng tay vào download_config.manual_dir (mặc định là ~/tensorflow_datasets/downloads/manual/ ):
    Cần tập dữ liệu này được tải về bằng tay thông qua kaggle api: kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge Đặt download zip file trong thư mục bằng tay.

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
  • Các tính năng:
FeaturesDict({
    'abstract': tf.string,
    'authors': tf.string,
    'body_text': Sequence({
        'section': tf.string,
        'text': tf.string,
    }),
    'doi': tf.string,
    'journal': tf.string,
    'license': tf.string,
    'publish_time': tf.string,
    'sha': tf.string,
    'source_x': tf.string,
    'title': tf.string,
    'url': tf.string,
})
@ONLINE {CORD-19-research-challenge,
    author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
    title  = "COVID-19 Open Research Dataset Challenge (CORD-19)",
    month  = "april",
    year   = "2020",
    url    = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}