scicite

  • Mô tả :

Đây là tập dữ liệu để phân loại ý định trích dẫn trong các bài báo học thuật. Nhãn mục đích trích dẫn chính cho mỗi đối tượng Json được chỉ định bằng khóa nhãn trong khi ngữ cảnh trích dẫn được chỉ định bằng khóa ngữ cảnh. Ví dụ: {'string': 'Ở khỉ đầu chó chacma, mối quan hệ giữa nam và trẻ sơ sinh có thể được liên kết với cả việc hình thành tình bạn và sự thành công trong quan hệ cha con [30,31].' 'sectionName': 'Introduction', 'label': 'background', 'citingPaperId': '7a6b2d4b405439', 'securePaperId': '9d1abadc55b5e0', ...} Bạn có thể nhận được thông tin đầy đủ về bài báo bằng cách sử dụng id giấy được cung cấp với API Semantic Scholar ( https://api.semanticscholar.org/ ). Các nhãn là: Phương pháp, Nền tảng, Kết quả

  • Trang chủ : https://github.com/allenai/scicite

  • Mã nguồn : tfds.text.Scicite

  • Các phiên bản :

    • 1.0.0 (mặc định): Không có ghi chú phát hành.
  • Kích thước tải xuống : 22.12 MiB

  • Kích thước tập dữ liệu : Unknown size

  • Tự động lưu trong bộ nhớ đệm ( tài liệu ): Không xác định

  • Tách :

Tách ra Các ví dụ
'test' 1.859
'train' 8.194
'validation' 916
  • Cấu trúc tính năng :
FeaturesDict({
    'citeEnd': tf.int64,
    'citeStart': tf.int64,
    'citedPaperId': Text(shape=(), dtype=tf.string),
    'citingPaperId': Text(shape=(), dtype=tf.string),
    'excerpt_index': tf.int32,
    'id': Text(shape=(), dtype=tf.string),
    'isKeyCitation': tf.bool,
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'label2_confidence': tf.float32,
    'label_confidence': tf.float32,
    'sectionName': Text(shape=(), dtype=tf.string),
    'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
    'string': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
citeEnd Tensor tf.int64
citeStart Tensor tf.int64
Trích dẫnPaperId Bản văn tf.string
citingPaperId Bản văn tf.string
Trích_lục_sử_lý Tensor tf.int32
Tôi Bản văn tf.string
isKeyCitation Tensor tf.bool
nhãn mác ClassLabel tf.int64
label2 ClassLabel tf.int64
label2_confidence Tensor tf.float32
label_confidence Tensor tf.float32
sectionName Bản văn tf.string
nguồn ClassLabel tf.int64
sợi dây Bản văn tf.string
  • Trích dẫn :
@InProceedings{Cohan2019Structural,
  author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
  title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
  booktitle="NAACL",
  year="2019"
}