scicite

  • คำอธิบาย :

นี่คือชุดข้อมูลสำหรับจำแนกความตั้งใจในการอ้างอิงในเอกสารทางวิชาการ ป้ายกำกับจุดประสงค์ในการอ้างอิงหลักสำหรับออบเจ็กต์ Json แต่ละรายการมีการระบุด้วยคีย์ป้ายกำกับ ขณะที่ระบุบริบทการอ้างอิงด้วยคีย์บริบท ตัวอย่าง: { 'สตริง': 'ในลิงบาบูน chacma ความสัมพันธ์ระหว่างผู้ชายกับทารกสามารถเชื่อมโยงกับทั้งการสร้างมิตรภาพและความสำเร็จในการเป็นพ่อ [30,31]' 'sectionName': 'Introduction', 'label': 'background', 'citingPaperId': '7a6b2d4b405439', 'citedPaperId': '9d1abadc55b5e0', ... } คุณอาจได้รับข้อมูลทั้งหมดเกี่ยวกับกระดาษโดยใช้รหัสกระดาษที่ให้มา ด้วย Semantic Scholar API ( https://api.semanticsscholar.org/ ) ป้ายกำกับคือ: วิธีการ, พื้นหลัง, ผลลัพธ์

  • หน้าแรก : https://github.com/allenai/scicite

  • ซอร์สโค้ด : tfds.text.Scicite

  • รุ่น :

    • 1.0.0 (ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
  • ขนาดดาวน์โหลด : 22.12 MiB

  • ขนาดชุดข้อมูล : Unknown size

  • แคชอัตโนมัติ ( เอกสาร ): Unknown

  • แยก :

แยก ตัวอย่าง
'test' 1,859
'train' 8,194
'validation' 916
  • โครงสร้างคุณสมบัติ :
FeaturesDict({
    'citeEnd': tf.int64,
    'citeStart': tf.int64,
    'citedPaperId': Text(shape=(), dtype=tf.string),
    'citingPaperId': Text(shape=(), dtype=tf.string),
    'excerpt_index': tf.int32,
    'id': Text(shape=(), dtype=tf.string),
    'isKeyCitation': tf.bool,
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'label2_confidence': tf.float32,
    'label_confidence': tf.float32,
    'sectionName': Text(shape=(), dtype=tf.string),
    'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
    'string': Text(shape=(), dtype=tf.string),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง Dtype คำอธิบาย
คุณสมบัติDict
อ้างจบ เทนเซอร์ tf.int64
อ้างเริ่ม เทนเซอร์ tf.int64
อ้างPaperId ข้อความ tf.string
อ้างถึงPaperId ข้อความ tf.string
excerpt_index เทนเซอร์ tf.int32
id ข้อความ tf.string
isKeyCitation เทนเซอร์ tf.bool
ฉลาก ClassLabel tf.int64
label2 ClassLabel tf.int64
label2_confidence เทนเซอร์ tf.float32
label_confidence เทนเซอร์ tf.float32
ส่วนชื่อ ข้อความ tf.string
แหล่งที่มา ClassLabel tf.int64
สตริง ข้อความ tf.string
  • อ้างอิง :
@InProceedings{Cohan2019Structural,
  author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
  title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
  booktitle="NAACL",
  year="2019"
}