- คำอธิบาย :
นี่คือชุดข้อมูลสำหรับจำแนกความตั้งใจในการอ้างอิงในเอกสารทางวิชาการ ป้ายกำกับจุดประสงค์ในการอ้างอิงหลักสำหรับออบเจ็กต์ Json แต่ละรายการมีการระบุด้วยคีย์ป้ายกำกับ ขณะที่ระบุบริบทการอ้างอิงด้วยคีย์บริบท ตัวอย่าง: { 'สตริง': 'ในลิงบาบูน chacma ความสัมพันธ์ระหว่างผู้ชายกับทารกสามารถเชื่อมโยงกับทั้งการสร้างมิตรภาพและความสำเร็จในการเป็นพ่อ [30,31]' 'sectionName': 'Introduction', 'label': 'background', 'citingPaperId': '7a6b2d4b405439', 'citedPaperId': '9d1abadc55b5e0', ... } คุณอาจได้รับข้อมูลทั้งหมดเกี่ยวกับกระดาษโดยใช้รหัสกระดาษที่ให้มา ด้วย Semantic Scholar API ( https://api.semanticsscholar.org/ ) ป้ายกำกับคือ: วิธีการ, พื้นหลัง, ผลลัพธ์
หน้าแรก : https://github.com/allenai/scicite
ซอร์สโค้ด :
tfds.text.Scicite
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
ขนาดดาวน์โหลด :
22.12 MiB
ขนาดชุดข้อมูล :
Unknown size
แคชอัตโนมัติ ( เอกสาร ): Unknown
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 1,859 |
'train' | 8,194 |
'validation' | 916 |
- โครงสร้างคุณสมบัติ :
FeaturesDict({
'citeEnd': tf.int64,
'citeStart': tf.int64,
'citedPaperId': Text(shape=(), dtype=tf.string),
'citingPaperId': Text(shape=(), dtype=tf.string),
'excerpt_index': tf.int32,
'id': Text(shape=(), dtype=tf.string),
'isKeyCitation': tf.bool,
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
'label2_confidence': tf.float32,
'label_confidence': tf.float32,
'sectionName': Text(shape=(), dtype=tf.string),
'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
'string': Text(shape=(), dtype=tf.string),
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | Dtype | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
อ้างจบ | เทนเซอร์ | tf.int64 | ||
อ้างเริ่ม | เทนเซอร์ | tf.int64 | ||
อ้างPaperId | ข้อความ | tf.string | ||
อ้างถึงPaperId | ข้อความ | tf.string | ||
excerpt_index | เทนเซอร์ | tf.int32 | ||
id | ข้อความ | tf.string | ||
isKeyCitation | เทนเซอร์ | tf.bool | ||
ฉลาก | ClassLabel | tf.int64 | ||
label2 | ClassLabel | tf.int64 | ||
label2_confidence | เทนเซอร์ | tf.float32 | ||
label_confidence | เทนเซอร์ | tf.float32 | ||
ส่วนชื่อ | ข้อความ | tf.string | ||
แหล่งที่มา | ClassLabel | tf.int64 | ||
สตริง | ข้อความ | tf.string |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('string', 'label')
รูป ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- อ้างอิง :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}