- תיאור :
זהו מערך נתונים לסיווג כוונות ציטוט במאמרים אקדמיים. תווית כוונת הציטוט הראשית עבור כל אובייקט Json מצוינת עם מפתח התווית בעוד שהקשר הציטוט מצוין במפתח הקשר. דוגמה: { 'string': 'בבבונים של צ'קמה, יחסים בין זכר לתינוק יכולים להיות קשורים הן ליצירת חברויות והן להצלחת אבהות [30,31].' 'sectionName': 'מבוא', 'label': 'background', 'citingPaperId': '7a6b2d4b405439', 'citedPaperId': '9d1abadc55b5e0', ... } תוכל לקבל את המידע המלא על הנייר באמצעות מזהי הנייר שסופקו עם ה-Semantic Scholar API ( https://api.semanticscholar.org/ ). התוויות הן: שיטה, רקע, תוצאה
דף הבית : https://github.com/allenai/scicite
קוד מקור :
tfds.text.Scicite
גרסאות :
-
1.0.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
22.12 MiB
גודל ערכת נתונים :
Unknown size
שמור אוטומטי במטמון ( תיעוד ): לא ידוע
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 1,859 |
'train' | 8,194 |
'validation' | 916 |
- מבנה תכונה :
FeaturesDict({
'citeEnd': tf.int64,
'citeStart': tf.int64,
'citedPaperId': Text(shape=(), dtype=tf.string),
'citingPaperId': Text(shape=(), dtype=tf.string),
'excerpt_index': tf.int32,
'id': Text(shape=(), dtype=tf.string),
'isKeyCitation': tf.bool,
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
'label2_confidence': tf.float32,
'label_confidence': tf.float32,
'sectionName': Text(shape=(), dtype=tf.string),
'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
'string': Text(shape=(), dtype=tf.string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
citeEnd | מוֹתֵחַ | tf.int64 | ||
citeStart | מוֹתֵחַ | tf.int64 | ||
citedPaperId | טֶקסט | tf.string | ||
citingPaperId | טֶקסט | tf.string | ||
exerpt_index | מוֹתֵחַ | tf.int32 | ||
תְעוּדַת זֶהוּת | טֶקסט | tf.string | ||
isKeyCitation | מוֹתֵחַ | tf.bool | ||
תווית | ClassLabel | tf.int64 | ||
תווית2 | ClassLabel | tf.int64 | ||
label2_confidence | מוֹתֵחַ | tf.float32 | ||
label_confidence | מוֹתֵחַ | tf.float32 | ||
שם סעיף | טֶקסט | tf.string | ||
מָקוֹר | ClassLabel | tf.int64 | ||
חוּט | טֶקסט | tf.string |
מפתחות בפיקוח (ראה
as_supervised
doc ):('string', 'label')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}