scicite

  • توضیحات :

این مجموعه داده ای برای طبقه بندی اهداف استنادی در مقالات دانشگاهی است. برچسب اصلی استناد برای هر شی Json با کلید برچسب مشخص می شود در حالی که زمینه استناد با یک کلید زمینه مشخص می شود. مثال: { 'string': 'در بابون‌های چاکما، روابط پسر و نوزاد می‌تواند هم به شکل‌گیری دوستی‌ها و هم با موفقیت پدری مرتبط باشد [30،31]. 'sectionName': 'Introduction', 'label': 'background', 'citingPaperId': '7a6b2d4b405439', 'citedPaperId': '9d1abadc55b5e0', ... } می توانید اطلاعات کامل مقاله را با استفاده از شناسه های کاغذ ارائه شده به دست آورید با Semantic Scholar API ( https://api.semanticscholar.org/ ). برچسب ها عبارتند از: روش، پس زمینه، نتیجه

  • صفحه اصلی : https://github.com/allenai/scicite

  • کد منبع : tfds.text.Scicite

  • نسخه ها :

    • 1.0.0 (پیش‌فرض): بدون یادداشت انتشار.
  • حجم دانلود : 22.12 MiB

  • اندازه مجموعه داده : Unknown size

  • ذخیره خودکار ( اسناد ): ناشناخته

  • تقسیمات :

شکاف مثال ها
'test' 1,859
'train' 8,194
'validation' 916
  • ساختار ویژگی :
FeaturesDict({
    'citeEnd': tf.int64,
    'citeStart': tf.int64,
    'citedPaperId': Text(shape=(), dtype=tf.string),
    'citingPaperId': Text(shape=(), dtype=tf.string),
    'excerpt_index': tf.int32,
    'id': Text(shape=(), dtype=tf.string),
    'isKeyCitation': tf.bool,
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'label2_confidence': tf.float32,
    'label_confidence': tf.float32,
    'sectionName': Text(shape=(), dtype=tf.string),
    'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
    'string': Text(shape=(), dtype=tf.string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
citeEnd تانسور tf.int64
citeStart تانسور tf.int64
به نقل از PaperId متن tf.string
با استناد به PaperId متن tf.string
excerpt_index تانسور tf.int32
شناسه متن tf.string
isKeyCitation تانسور tf.bool
برچسب ClassLabel tf.int64
label2 ClassLabel tf.int64
label2_اعتماد تانسور tf.float32
برچسب_اعتماد تانسور tf.float32
نام بخش متن tf.string
منبع ClassLabel tf.int64
رشته متن tf.string
  • نقل قول :
@InProceedings{Cohan2019Structural,
  author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
  title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
  booktitle="NAACL",
  year="2019"
}