- คำอธิบาย :
BillSum การสรุปร่างกฎหมายของรัฐสภาสหรัฐฯ และรัฐแคลิฟอร์เนีย
มีคุณสมบัติหลายประการ: - ข้อความ: ข้อความบิล - สรุป: สรุปตั๋วเงิน - หัวเรื่อง: หัวเรื่องของตั๋วเงิน คุณสมบัติสำหรับเราค่า ใบเรียกเก็บเงิน ca ไม่มี - text_len: จำนวนตัวอักษรในข้อความ - sum_len: จำนวนตัวอักษรโดยสรุป
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
หน้าแรก : https://github.com/FiscalNote/BillSum
รหัสที่มา :
tfds.datasets.billsum.Builder
รุ่น :
-
3.0.0
(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
ขนาดการดาวน์โหลด :
64.14 MiB
ขนาดชุดข้อมูล :
260.84 MiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'ca_test' | 1,237 |
'test' | 3,269 |
'train' | 18,949 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'summary': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
สรุป | ข้อความ | สตริง | ||
ข้อความ | ข้อความ | สตริง | ||
ชื่อ | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('text', 'summary')
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@misc{kornilova2019billsum,
title={BillSum: A Corpus for Automatic Summarization of US Legislation},
author={Anastassia Kornilova and Vlad Eidelman},
year={2019},
eprint={1910.00523},
archivePrefix={arXiv},
primaryClass={cs.CL}
}