- Descriptif :
Il s'agit d'un ensemble de données permettant de classer les intentions de citation dans les articles universitaires. L'étiquette d'intention de citation principale pour chaque objet Json est spécifiée avec la clé d'étiquette tandis que le contexte de citation est spécifié avec une clé de contexte. Exemple : { 'string' : 'Chez les babouins chacma, les relations mâle-nourrisson peuvent être liées à la fois à la formation d'amitiés et au succès de la paternité [30,31].' 'sectionName' : 'Introduction', 'label' : 'background', 'citingPaperId' : '7a6b2d4b405439', 'citedPaperId' : '9d1abadc55b5e0', ... } Vous pouvez obtenir toutes les informations sur l'article en utilisant les identifiants d'article fournis avec l'API Semantic Scholar ( https://api.semanticscholar.org/ ). Les étiquettes sont : Méthode, Contexte, Résultat
Page d' accueil : https://github.com/allenai/scicite
Code source :
tfds.text.Scicite
Versions :
-
1.0.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
22.12 MiB
Taille du jeu de données :
Unknown size
Mise en cache automatique ( documentation ): Inconnu
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 1 859 |
'train' | 8 194 |
'validation' | 916 |
- Structure des fonctionnalités :
FeaturesDict({
'citeEnd': tf.int64,
'citeStart': tf.int64,
'citedPaperId': Text(shape=(), dtype=tf.string),
'citingPaperId': Text(shape=(), dtype=tf.string),
'excerpt_index': tf.int32,
'id': Text(shape=(), dtype=tf.string),
'isKeyCitation': tf.bool,
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
'label2_confidence': tf.float32,
'label_confidence': tf.float32,
'sectionName': Text(shape=(), dtype=tf.string),
'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
'string': Text(shape=(), dtype=tf.string),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Façonner | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
citerFin | Tenseur | tf.int64 | ||
citerStart | Tenseur | tf.int64 | ||
quotePaperId | Texte | tf.string | ||
citingPaperId | Texte | tf.string | ||
extrait_index | Tenseur | tf.int32 | ||
identifiant | Texte | tf.string | ||
isKeyCitation | Tenseur | tf.bool | ||
étiqueter | Étiquette de classe | tf.int64 | ||
étiquette2 | Étiquette de classe | tf.int64 | ||
label2_confiance | Tenseur | tf.float32 | ||
label_confidence | Tenseur | tf.float32 | ||
Nom de la section | Texte | tf.string | ||
la source | Étiquette de classe | tf.int64 | ||
chaîne de caractères | Texte | tf.string |
Clés supervisées (Voir
as_supervised
doc ):('string', 'label')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}