covid19sum

 • Mô tả:

CORD-19 là một nguồn tài nguyên của hơn 45.000 bài báo học thuật, trong đó có hơn 33.000 với toàn văn về COVID-19, SARS-CoV-2 và các coronavirus liên quan.

Để giúp tổ chức thông tin trong tài liệu khoa học của COVID-19 thông qua tóm tắt trừu tượng. Tập dữ liệu này phân tích cú pháp các bài báo đó thành các cặp tài liệu và tóm tắt của full_text-abstract hoặc giới thiệu-trừu tượng.

Các tính năng bao gồm các chuỗi: abstract, full_text, sha (băm của pdf), source_x (nguồn xuất bản), title, doi (mã định danh đối tượng kỹ thuật số), giấy phép, tác giả, Publishing_time, tạp chí, url.

 • Trang chủ: https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

 • Source code: tfds.summarization.Covid19sum

 • phiên bản:

  • 1.0.0 (mặc định): Không có ghi chú phát hành.
 • Dung lượng tải về: Unknown size

 • Kích thước tập dữ liệu: Unknown size

 • Hướng dẫn tải về Hướng dẫn sử dụng: Bộ dữ liệu này đòi hỏi bạn phải tải về dữ liệu nguồn bằng tay vào download_config.manual_dir (mặc định là ~/tensorflow_datasets/downloads/manual/ ):
  Cần tập dữ liệu này được tải về bằng tay thông qua kaggle api: kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge Đặt download zip file trong thư mục bằng tay.

 • Tự động lưu trữ ( tài liệu ): Unknown

 • tách:

Tách ra Các ví dụ
 • Các tính năng:
FeaturesDict({
  'abstract': tf.string,
  'authors': tf.string,
  'body_text': Sequence({
    'section': tf.string,
    'text': tf.string,
  }),
  'doi': tf.string,
  'journal': tf.string,
  'license': tf.string,
  'publish_time': tf.string,
  'sha': tf.string,
  'source_x': tf.string,
  'title': tf.string,
  'url': tf.string,
})
@ONLINE {CORD-19-research-challenge,
  author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
  title = "COVID-19 Open Research Dataset Challenge (CORD-19)",
  month = "april",
  year  = "2020",
  url  = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}