- Açıklama :
Bu, akademik makalelerdeki alıntı amaçlarını sınıflandırmak için bir veri setidir. Her Json nesnesi için ana alıntı amacı etiketi, etiket anahtarıyla belirtilirken, alıntı bağlamı bir bağlam anahtarıyla belirtilir. Örnek: { 'string': 'Chacma babunlarında erkek-bebek ilişkileri hem arkadaşlıkların oluşumuyla hem de babalık başarısıyla ilişkilendirilebilir [30,31].' 'sectionName': 'Introduction', 'label': 'background', 'citingPaperId': '7a6b2d4b405439', 'citedPaperId': '9d1abadc55b5e0', ... } Sağlanan kağıt kimliklerini kullanarak makale ile ilgili tüm bilgileri alabilirsiniz. Semantic Scholar API ile ( https://api.semanticscholar.org/ ). Etiketler şunlardır: Yöntem, Arka Plan, Sonuç
Ana sayfa : https://github.com/allenai/scicite
Kaynak kodu :
tfds.text.Scicite
Sürümler :
-
1.0.0
(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
22.12 MiB
Veri kümesi boyutu :
Unknown size
Otomatik önbelleğe alındı ( belgeler ): Bilinmiyor
Bölmeler :
Bölmek | Örnekler |
---|---|
'test' | 1.859 |
'train' | 8.194 |
'validation' | 916 |
- Özellik yapısı :
FeaturesDict({
'citeEnd': tf.int64,
'citeStart': tf.int64,
'citedPaperId': Text(shape=(), dtype=tf.string),
'citingPaperId': Text(shape=(), dtype=tf.string),
'excerpt_index': tf.int32,
'id': Text(shape=(), dtype=tf.string),
'isKeyCitation': tf.bool,
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
'label2_confidence': tf.float32,
'label_confidence': tf.float32,
'sectionName': Text(shape=(), dtype=tf.string),
'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
'string': Text(shape=(), dtype=tf.string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtype | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
alıntıBitiş | tensör | tf.int64 | ||
alıntıBaşla | tensör | tf.int64 | ||
alıntılananKağıtKimliği | Metin | tf.string | ||
alıntıKağıtKimliği | Metin | tf.string | ||
alıntı_index | tensör | tf.int32 | ||
İD | Metin | tf.string | ||
isKeyCitation | tensör | tf.bool | ||
etiket | sınıf etiketi | tf.int64 | ||
etiket2 | sınıf etiketi | tf.int64 | ||
etiket2_güven | tensör | tf.float32 | ||
etiket_güven | tensör | tf.float32 | ||
Bölüm adı | Metin | tf.string | ||
kaynak | sınıf etiketi | tf.int64 | ||
sicim | Metin | tf.string |
Denetlenen anahtarlar (bkz
as_supervised
doc ):('string', 'label')
Şekil ( tfds.show_examples ): Desteklenmez.
Örnekler ( tfds.as_dataframe ):
- alıntı :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}