- Açıklama :
CORD-19, COVID-19, SARS-CoV-2 ve ilgili koronavirüsler hakkında 33.000'den fazla tam metin dahil olmak üzere 45.000'den fazla bilimsel makale içeren bir kaynaktır.
Soyutlayıcı özetleme yoluyla COVID-19'un bilimsel literatürlerindeki bilgilerin düzenlenmesine yardımcı olmak. Bu veri kümesi, bu makaleleri belge çiftlerine ve full_text-abstract veya tanıtım-abstract özetlerine ayrıştırır.
Özellikler şu dizeleri içerir: özet, tam metin, sha (pdf karması), kaynak_x (yayın kaynağı), başlık, doi (dijital nesne tanımlayıcı), lisans, yazarlar, yayın_zamanı, dergi, url.
Ek Belgeler : Belgeleri Keşfedin
Ana Sayfa : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge
Kaynak kodu :
tfds.summarization.Covid19sumsürümler :
-
1.0.0(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
Unknown sizeVeri kümesi boyutu :
Unknown sizeManuel indirme talimatları : Bu veri kümesi, kaynak verileri manuel olarak download_config.manual_dir içine
download_config.manual_dirgerektirir (varsayılan olarak~/tensorflow_datasets/downloads/manual/):
Bu veri setinin kaggle api aracılığıyla manuel olarak indirilmesi gerekiyor:kaggle datasets download allen-institute-for-ai/CORD-19-research-challengeİndirilen zip dosyasını manual klasörüne yerleştirin.Otomatik önbelleğe alınmış ( belgeler ): Bilinmiyor
bölmeler :
| Bölmek | örnekler |
|---|
- Özellik yapısı :
FeaturesDict({
'abstract': string,
'authors': string,
'body_text': Sequence({
'section': string,
'text': string,
}),
'doi': string,
'journal': string,
'license': string,
'publish_time': string,
'sha': string,
'source_x': string,
'title': string,
'url': string,
})
- Özellik belgeleri :
| Özellik | Sınıf | Şekil | Dtipi | Tanım |
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| Öz | tensör | sicim | ||
| yazarlar | tensör | sicim | ||
| gövde metni | Sekans | |||
| gövde_metni/bölüm | tensör | sicim | ||
| gövde_metni/metin | tensör | sicim | ||
| doi | tensör | sicim | ||
| dergi | tensör | sicim | ||
| lisans | tensör | sicim | ||
| yayın_zamanı | tensör | sicim | ||
| sha | tensör | sicim | ||
| kaynak_x | tensör | sicim | ||
| Başlık | tensör | sicim | ||
| url | tensör | sicim |
Denetimli anahtarlar (Bkz
as_superviseddoc ):('body_text', 'abstract')Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ): Eksik.
Alıntı :
@ONLINE {CORD-19-research-challenge,
author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
title = "COVID-19 Open Research Dataset Challenge (CORD-19)",
month = "april",
year = "2020",
url = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}