- Açıklama :
Bu, akademik makalelerdeki alıntı amaçlarını sınıflandırmak için bir veri kümesidir. Her Json nesnesi için ana alıntı amacı etiketi, etiket anahtarıyla belirtilirken, alıntı bağlamı bir bağlam anahtarıyla belirtilir. Örnek vermek:
{
'string': 'In chacma baboons, male-infant relationships can be linked to both
formation of friendships and paternity success [30,31].'
'sectionName': 'Introduction',
'label': 'background',
'citingPaperId': '7a6b2d4b405439',
'citedPaperId': '9d1abadc55b5e0',
...
}
Semantic Scholar API ( https://api.semanticscholar.org/ ) ile sağlanan makale kimliklerini kullanarak makale hakkındaki tüm bilgileri edinebilirsiniz.
Etiketler şunlardır: Yöntem, Arka Plan, Sonuç
Ek Belgeler : Belgeleri Keşfedin
Anasayfa : https://github.com/allenai/scicite
Kaynak kodu :
tfds.datasets.scicite.Buildersürümler :
-
1.0.0(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
22.12 MiBVeri kümesi boyutu :
7.26 MiBOtomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
| Bölmek | örnekler |
|---|---|
'test' | 1.859 |
'train' | 8.194 |
'validation' | 916 |
- Özellik yapısı :
FeaturesDict({
'citeEnd': int64,
'citeStart': int64,
'citedPaperId': Text(shape=(), dtype=string),
'citingPaperId': Text(shape=(), dtype=string),
'excerpt_index': int32,
'id': Text(shape=(), dtype=string),
'isKeyCitation': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label2_confidence': float32,
'label_confidence': float32,
'sectionName': Text(shape=(), dtype=string),
'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
'string': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
| Özellik | Sınıf | Şekil | Dtipi | Açıklama |
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| alıntıSonu | tensör | int64 | ||
| alıntı Başlat | tensör | int64 | ||
| alıntılananKağıtKimliği | Metin | sicim | ||
| alıntıKağıtKimliği | Metin | sicim | ||
| alıntı_index | tensör | int32 | ||
| İD | Metin | sicim | ||
| isKeyCitation | tensör | bool | ||
| etiket | SınıfEtiketi | int64 | ||
| etiket2 | SınıfEtiketi | int64 | ||
| etiket2_güven | tensör | şamandıra32 | ||
| etiket_güveni | tensör | şamandıra32 | ||
| Bölüm adı | Metin | sicim | ||
| kaynak | SınıfEtiketi | int64 | ||
| sicim | Metin | sicim |
Denetlenen anahtarlar (Bkz
as_superviseddoc ):('string', 'label')Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}