scicite

  • Descriptif :

Il s'agit d'un ensemble de données permettant de classer les intentions de citation dans les articles universitaires. L'étiquette d'intention de citation principale pour chaque objet Json est spécifiée avec la clé d'étiquette tandis que le contexte de citation est spécifié avec une clé de contexte. Exemple : { 'string' : 'Chez les babouins chacma, les relations mâle-nourrisson peuvent être liées à la fois à la formation d'amitiés et au succès de la paternité [30,31].' 'sectionName' : 'Introduction', 'label' : 'background', 'citingPaperId' : '7a6b2d4b405439', 'citedPaperId' : '9d1abadc55b5e0', ... } Vous pouvez obtenir toutes les informations sur l'article en utilisant les identifiants d'article fournis avec l'API Semantic Scholar ( https://api.semanticscholar.org/ ). Les étiquettes sont : Méthode, Contexte, Résultat

Diviser Exemples
'test' 1 859
'train' 8 194
'validation' 916
  • Structure des fonctionnalités :
FeaturesDict({
    'citeEnd': tf.int64,
    'citeStart': tf.int64,
    'citedPaperId': Text(shape=(), dtype=tf.string),
    'citingPaperId': Text(shape=(), dtype=tf.string),
    'excerpt_index': tf.int32,
    'id': Text(shape=(), dtype=tf.string),
    'isKeyCitation': tf.bool,
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'label2_confidence': tf.float32,
    'label_confidence': tf.float32,
    'sectionName': Text(shape=(), dtype=tf.string),
    'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
    'string': Text(shape=(), dtype=tf.string),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Façonner Dtype La description
FonctionnalitésDict
citerFin Tenseur tf.int64
citerStart Tenseur tf.int64
quotePaperId Texte tf.string
citingPaperId Texte tf.string
extrait_index Tenseur tf.int32
identifiant Texte tf.string
isKeyCitation Tenseur tf.bool
étiqueter Étiquette de classe tf.int64
étiquette2 Étiquette de classe tf.int64
label2_confiance Tenseur tf.float32
label_confidence Tenseur tf.float32
Nom de la section Texte tf.string
la source Étiquette de classe tf.int64
chaîne de caractères Texte tf.string
  • Citation :
@InProceedings{Cohan2019Structural,
  author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
  title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
  booktitle="NAACL",
  year="2019"
}