bot_adversarial_dialogue

Mô tả :

Bộ dữ liệu đối thoại đối nghịch của Bot.

Các tập dữ liệu đối thoại được gắn nhãn mang tính xúc phạm từ nhiệm vụ Đối thoại đối nghịch với Bot. Các cuộc đối thoại được thu thập bằng cách yêu cầu con người nói chuyện với bot.

Thêm chi tiết trong bài báo .

Trang chủ : https://github.com/facebookresearch/ParlAI/tree/main/parlai/tasks/bot_adversarial_dialogue
Mã nguồn : tfds.datasets.bot_adversarial_dialogue.Builder
Phiên bản :
- 1.0.0 (mặc định): Bản phát hành đầu tiên.
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có
Khóa được giám sát (Xem as_supervised doc ): None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Trích dẫn :

@misc{xu2021recipes,
      title={Recipes for Safety in Open-domain Chatbots},
      author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
      year={2021},
      eprint={2010.07079},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

bot_adversarial_dialogue/dialogue_datasets (cấu hình mặc định)

Mô tả cấu hình : Các bộ dữ liệu hội thoại, được chia thành các phần đào tạo, xác thực và kiểm tra.
Kích thước tải xuống : 3.06 MiB
Kích thước tập dữ liệu : 23.38 MiB
Chia tách :

Tách ra	Ví dụ
`'test'`	2,598
`'train'`	69.274
`'valid'`	7.002

Cấu trúc tính năng :

FeaturesDict({
    'bot_persona': Sequence(Text(shape=(), dtype=string)),
    'dialogue_id': float32,
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'round_id': float32,
    'speaker_to_eval': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})

Tài liệu tính năng :

Tính năng	Lớp học	Hình dạng	loại D	Sự miêu tả
	Tính năngDict
bot_persona	Trình tự(Văn bản)	(Không có,)	sợi dây	Nhân vật được mạo danh bởi bot.
hội thoại_id	Tenxơ		phao32
tập_done	Tenxơ		bool
nhận dạng	Chữ		sợi dây	Id của mẫu.
nhãn	Nhãn lớp		int64
vòng_id	Tenxơ		phao32
loa_to_eval	Chữ		sợi dây	Người nói những lời phát biểu được dán nhãn.
chữ	Chữ		sợi dây	Cách nói để phân loại.

Ví dụ ( tfds.as_dataframe ):

bot_adversarial_dialogue/human_nonadv_safety_eval

Mô tả cấu hình : Một bộ đánh giá an toàn con người được các nhân viên sử dụng nguồn lực từ cộng đồng đánh giá về mức độ xúc phạm.
Kích thước tải xuống : 10.57 KiB
Kích thước tập dữ liệu : 34.55 KiB
Chia tách :

Tách ra	Ví dụ
`'test'`	180

Cấu trúc tính năng :

FeaturesDict({
    'episode_done': bool,
    'id': Text(shape=(), dtype=string),
    'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'text': Text(shape=(), dtype=string),
})

Tài liệu tính năng :

Tính năng	Lớp học	loại D	Sự miêu tả
	Tính năngDict
tập_done	Tenxơ	bool
nhận dạng	Chữ	sợi dây	Id của mẫu.
nhãn	Nhãn lớp	int64
chữ	Chữ	sợi dây	Cách nói để phân loại.

Ví dụ ( tfds.as_dataframe ):

bot_adversarial_dialogue Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.

Bộ dữ liệu đối thoại đối nghịch của Bot.

bot_adversarial_dialogue/dialogue_datasets (cấu hình mặc định)

bot_adversarial_dialogue/human_nonadv_safety_eval

bot_adversarial_dialogue