מדע

  • תיאור :

זהו מערך נתונים לסיווג כוונות ציטוט במאמרים אקדמיים. תווית כוונת הציטוט הראשית עבור כל אובייקט Json מצוינת עם מפתח התווית בעוד שהקשר הציטוט מצוין במפתח הקשר. דוגמא:

{
 
'string': 'In chacma baboons, male-infant relationships can be linked to both
    formation of friendships and paternity success
[30,31].'
 
'sectionName': 'Introduction',
 
'label': 'background',
 
'citingPaperId': '7a6b2d4b405439',
 
'citedPaperId': '9d1abadc55b5e0',
 
...
 
}

אתה יכול לקבל את המידע המלא על המאמר באמצעות מזהי הנייר שסופקו עם ה-Semantic Scholar API ( https://api.semanticscholar.org/ ).

התוויות הן: שיטה, רקע, תוצאה

לְפַצֵל דוגמאות
'test' 1,859
'train' 8,194
'validation' 916
  • מבנה תכונה :
FeaturesDict({
   
'citeEnd': int64,
   
'citeStart': int64,
   
'citedPaperId': Text(shape=(), dtype=string),
   
'citingPaperId': Text(shape=(), dtype=string),
   
'excerpt_index': int32,
   
'id': Text(shape=(), dtype=string),
   
'isKeyCitation': bool,
   
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
   
'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
   
'label2_confidence': float32,
   
'label_confidence': float32,
   
'sectionName': Text(shape=(), dtype=string),
   
'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
   
'string': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
citeEnd מוֹתֵחַ int64
citeStart מוֹתֵחַ int64
citedPaperId טֶקסט חוּט
citingPaperId טֶקסט חוּט
exerpt_index מוֹתֵחַ int32
תְעוּדַת זֶהוּת טֶקסט חוּט
isKeyCitation מוֹתֵחַ bool
תווית ClassLabel int64
תווית2 ClassLabel int64
label2_confidence מוֹתֵחַ לצוף32
label_confidence מוֹתֵחַ לצוף32
שם סעיף טֶקסט חוּט
מָקוֹר ClassLabel int64
חוּט טֶקסט חוּט
  • ציטוט :
@InProceedings{Cohan2019Structural,
  author
={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
  title
={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
  booktitle
="NAACL",
  year
="2019"
}