- الوصف :
هذه مجموعة بيانات لتصنيف نوايا الاقتباس في الأوراق الأكاديمية. يتم تحديد التسمية الرئيسية لهدف الاقتباس لكل كائن Json بمفتاح التسمية بينما يتم تحديد سياق الاقتباس بمفتاح سياق. مثال: {'string': 'في chacma baboons ، يمكن ربط العلاقات بين الذكور والرضع بكل من تكوين الصداقات ونجاح الأبوة [30 ، 31]. 'sectionName': 'مقدمة'، 'label': 'خلفية'، 'citingPaperId': '7a6b2d4b405439'، 'citedPaperId': '9d1abadc55b5e0'، ...} يمكنك الحصول على المعلومات الكاملة حول الورق باستخدام معرفات الورق المتوفرة باستخدام واجهة برمجة تطبيقات الباحث الدلالي ( https://api.semanticscholar.org/ ). الملصقات هي: الطريقة ، الخلفية ، النتيجة
الصفحة الرئيسية : https://github.com/allenai/scicite
كود المصدر :
tfds.text.Scicite
الإصدارات :
-
1.0.0
(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
22.12 MiB
حجم مجموعة البيانات :
Unknown size
التخزين المؤقت التلقائي ( الوثائق ): غير معروف
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 1،859 |
'train' | 8194 |
'validation' | 916 |
- هيكل الميزة :
FeaturesDict({
'citeEnd': tf.int64,
'citeStart': tf.int64,
'citedPaperId': Text(shape=(), dtype=tf.string),
'citingPaperId': Text(shape=(), dtype=tf.string),
'excerpt_index': tf.int32,
'id': Text(shape=(), dtype=tf.string),
'isKeyCitation': tf.bool,
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
'label2_confidence': tf.float32,
'label_confidence': tf.float32,
'sectionName': Text(shape=(), dtype=tf.string),
'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
'string': Text(shape=(), dtype=tf.string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
استشهد | موتر | tf.int64 | ||
استشهد | موتر | tf.int64 | ||
تم الاستشهاد به | نص | tf.string | ||
نقلاً عن PaperId | نص | tf.string | ||
مقتطفات_الفهرس | موتر | tf.int32 | ||
هوية شخصية | نص | tf.string | ||
هو المفتاح | موتر | tf.bool | ||
ضع الكلمة المناسبة | ClassLabel | tf.int64 | ||
التسمية 2 | ClassLabel | tf.int64 | ||
Label2_confidence | موتر | tf.float32 | ||
الثقة التسمية | موتر | tf.float32 | ||
اسم القسم | نص | tf.string | ||
مصدر | ClassLabel | tf.int64 | ||
سلسلة | نص | tf.string |
المفاتيح الخاضعة للإشراف (راجع المستند
as_supervised
):('string', 'label')
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}