- Deskripsi :
Ini adalah kumpulan data untuk mengklasifikasikan maksud kutipan dalam makalah akademis. Label maksud kutipan utama untuk setiap objek Json ditentukan dengan kunci label sedangkan konteks kutipan ditentukan dengan kunci konteks. Contoh:
{
'string': 'In chacma baboons, male-infant relationships can be linked to both
formation of friendships and paternity success [30,31].'
'sectionName': 'Introduction',
'label': 'background',
'citingPaperId': '7a6b2d4b405439',
'citedPaperId': '9d1abadc55b5e0',
...
}
Anda dapat memperoleh informasi lengkap tentang makalah menggunakan id kertas yang disediakan dengan Semantic Scholar API ( https://api.semanticscholar.org/ ).
Labelnya adalah: Metode, Latar Belakang, Hasil
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://github.com/allenai/scicite
Kode sumber :
tfds.datasets.scicite.Builder
Versi :
-
1.0.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
22.12 MiB
Ukuran dataset :
7.26 MiB
Di-cache otomatis ( dokumentasi ): Ya
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 1.859 |
'train' | 8.194 |
'validation' | 916 |
- Struktur fitur :
FeaturesDict({
'citeEnd': int64,
'citeStart': int64,
'citedPaperId': Text(shape=(), dtype=string),
'citingPaperId': Text(shape=(), dtype=string),
'excerpt_index': int32,
'id': Text(shape=(), dtype=string),
'isKeyCitation': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label2_confidence': float32,
'label_confidence': float32,
'sectionName': Text(shape=(), dtype=string),
'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
'string': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
mengutipEnd | Tensor | int64 | ||
mengutipMulai | Tensor | int64 | ||
dikutipPaperId | Teks | rangkaian | ||
mengutipPaperId | Teks | rangkaian | ||
kutipan_indeks | Tensor | int32 | ||
Indo | Teks | rangkaian | ||
isKeyCitation | Tensor | bool | ||
label | LabelKelas | int64 | ||
label2 | LabelKelas | int64 | ||
label2_kepercayaan | Tensor | float32 | ||
label_kepercayaan | Tensor | float32 | ||
nama bagian | Teks | rangkaian | ||
sumber | LabelKelas | int64 | ||
rangkaian | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('string', 'label')
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}