- Descrizione :
Questo è un set di dati per classificare gli intenti di citazione nei documenti accademici. L'etichetta dell'intento della citazione principale per ogni oggetto Json è specificata con la chiave dell'etichetta mentre il contesto della citazione è specificato con una chiave di contesto. Esempio: { 'string': 'Nei babbuini chacma, le relazioni maschio-bambino possono essere collegate sia alla formazione di amicizie che al successo della paternità [30,31]'. 'sectionName': 'Introduction', 'label': 'background', 'citingPaperId': '7a6b2d4b405439', 'citedPaperId': '9d1abadc55b5e0', ... } È possibile ottenere le informazioni complete sulla carta utilizzando gli ID carta forniti con l'API Semantic Scholar ( https://api.semanticscholar.org/ ). Le etichette sono: Metodo, Sfondo, Risultato
Homepage : https://github.com/alenai/scicite
Codice sorgente :
tfds.text.Scicite
Versioni :
-
1.0.0
(predefinito): nessuna nota di rilascio.
-
Dimensione download :
22.12 MiB
Dimensione del set di dati :
Unknown size
Memorizzazione automatica nella cache ( documentazione ): sconosciuto
Spaccature :
Diviso | Esempi |
---|---|
'test' | 1.859 |
'train' | 8.194 |
'validation' | 916 |
- Struttura delle caratteristiche :
FeaturesDict({
'citeEnd': tf.int64,
'citeStart': tf.int64,
'citedPaperId': Text(shape=(), dtype=tf.string),
'citingPaperId': Text(shape=(), dtype=tf.string),
'excerpt_index': tf.int32,
'id': Text(shape=(), dtype=tf.string),
'isKeyCitation': tf.bool,
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
'label2_confidence': tf.float32,
'label_confidence': tf.float32,
'sectionName': Text(shape=(), dtype=tf.string),
'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
'string': Text(shape=(), dtype=tf.string),
})
- Documentazione sulle caratteristiche :
Caratteristica | Classe | Forma | tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
citeFine | Tensore | tf.int64 | ||
citeStart | Tensore | tf.int64 | ||
cited PaperId | Testo | tf.string | ||
citando PaperId | Testo | tf.string | ||
estratto_indice | Tensore | tf.int32 | ||
ID | Testo | tf.string | ||
isKeyCitation | Tensore | tf.bool | ||
etichetta | ClassLabel | tf.int64 | ||
etichetta2 | ClassLabel | tf.int64 | ||
label2_confidence | Tensore | tf.float32 | ||
label_confidence | Tensore | tf.float32 | ||
nomesezione | Testo | tf.string | ||
fonte | ClassLabel | tf.int64 | ||
corda | Testo | tf.string |
Chiavi supervisionate (Vedi
as_supervised
doc ):('string', 'label')
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}