scicite

  • Descrizione :

Questo è un set di dati per classificare gli intenti di citazione nei documenti accademici. L'etichetta dell'intento della citazione principale per ogni oggetto Json è specificata con la chiave dell'etichetta mentre il contesto della citazione è specificato con una chiave di contesto. Esempio: { 'string': 'Nei babbuini chacma, le relazioni maschio-bambino possono essere collegate sia alla formazione di amicizie che al successo della paternità [30,31]'. 'sectionName': 'Introduction', 'label': 'background', 'citingPaperId': '7a6b2d4b405439', 'citedPaperId': '9d1abadc55b5e0', ... } È possibile ottenere le informazioni complete sulla carta utilizzando gli ID carta forniti con l'API Semantic Scholar ( https://api.semanticscholar.org/ ). Le etichette sono: Metodo, Sfondo, Risultato

Diviso Esempi
'test' 1.859
'train' 8.194
'validation' 916
  • Struttura delle caratteristiche :
FeaturesDict({
    'citeEnd': tf.int64,
    'citeStart': tf.int64,
    'citedPaperId': Text(shape=(), dtype=tf.string),
    'citingPaperId': Text(shape=(), dtype=tf.string),
    'excerpt_index': tf.int32,
    'id': Text(shape=(), dtype=tf.string),
    'isKeyCitation': tf.bool,
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'label2_confidence': tf.float32,
    'label_confidence': tf.float32,
    'sectionName': Text(shape=(), dtype=tf.string),
    'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
    'string': Text(shape=(), dtype=tf.string),
})
  • Documentazione sulle caratteristiche :
Caratteristica Classe Forma tipo D Descrizione
CaratteristicheDict
citeFine Tensore tf.int64
citeStart Tensore tf.int64
cited PaperId Testo tf.string
citando PaperId Testo tf.string
estratto_indice Tensore tf.int32
ID Testo tf.string
isKeyCitation Tensore tf.bool
etichetta ClassLabel tf.int64
etichetta2 ClassLabel tf.int64
label2_confidence Tensore tf.float32
label_confidence Tensore tf.float32
nomesezione Testo tf.string
fonte ClassLabel tf.int64
corda Testo tf.string
  • Citazione :
@InProceedings{Cohan2019Structural,
  author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
  title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
  booktitle="NAACL",
  year="2019"
}