- توضیحات :
این مجموعه داده ای برای طبقه بندی اهداف استنادی در مقالات دانشگاهی است. برچسب اصلی استناد برای هر شی Json با کلید برچسب مشخص می شود در حالی که زمینه استناد با یک کلید زمینه مشخص می شود. مثال: { 'string': 'در بابونهای چاکما، روابط پسر و نوزاد میتواند هم به شکلگیری دوستیها و هم با موفقیت پدری مرتبط باشد [30،31]. 'sectionName': 'Introduction', 'label': 'background', 'citingPaperId': '7a6b2d4b405439', 'citedPaperId': '9d1abadc55b5e0', ... } می توانید اطلاعات کامل مقاله را با استفاده از شناسه های کاغذ ارائه شده به دست آورید با Semantic Scholar API ( https://api.semanticscholar.org/ ). برچسب ها عبارتند از: روش، پس زمینه، نتیجه
صفحه اصلی : https://github.com/allenai/scicite
کد منبع :
tfds.text.Scicite
نسخه ها :
-
1.0.0
(پیشفرض): بدون یادداشت انتشار.
-
حجم دانلود :
22.12 MiB
اندازه مجموعه داده :
Unknown size
ذخیره خودکار ( اسناد ): ناشناخته
تقسیمات :
شکاف | مثال ها |
---|---|
'test' | 1,859 |
'train' | 8,194 |
'validation' | 916 |
- ساختار ویژگی :
FeaturesDict({
'citeEnd': tf.int64,
'citeStart': tf.int64,
'citedPaperId': Text(shape=(), dtype=tf.string),
'citingPaperId': Text(shape=(), dtype=tf.string),
'excerpt_index': tf.int32,
'id': Text(shape=(), dtype=tf.string),
'isKeyCitation': tf.bool,
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
'label2_confidence': tf.float32,
'label_confidence': tf.float32,
'sectionName': Text(shape=(), dtype=tf.string),
'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
'string': Text(shape=(), dtype=tf.string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
citeEnd | تانسور | tf.int64 | ||
citeStart | تانسور | tf.int64 | ||
به نقل از PaperId | متن | tf.string | ||
با استناد به PaperId | متن | tf.string | ||
excerpt_index | تانسور | tf.int32 | ||
شناسه | متن | tf.string | ||
isKeyCitation | تانسور | tf.bool | ||
برچسب | ClassLabel | tf.int64 | ||
label2 | ClassLabel | tf.int64 | ||
label2_اعتماد | تانسور | tf.float32 | ||
برچسب_اعتماد | تانسور | tf.float32 | ||
نام بخش | متن | tf.string | ||
منبع | ClassLabel | tf.int64 | ||
رشته | متن | tf.string |
کلیدهای نظارت شده (مشاهده
as_supervised
doc ):('string', 'label')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}