- Sự miêu tả :
CLEVR là bộ dữ liệu chẩn đoán kiểm tra nhiều khả năng suy luận trực quan. Nó chứa những thành kiến tối thiểu và có chú thích chi tiết mô tả loại lý luận mà mỗi câu hỏi yêu cầu.
Tài liệu bổ sung : Khám phá trên giấy tờ có mã
Trang chủ : https://cs.stanford.edu/people/jcjohns/clevr/
Mã nguồn :
tfds.datasets.clevr.Builder
Phiên bản :
-
3.0.0
: Không có ghi chú phát hành. -
3.1.0
(mặc định): Thêm văn bản câu hỏi/câu trả lời.
-
Kích thước tải xuống :
17.72 GiB
Kích thước tập dữ liệu :
17.75 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 15.000 |
'train' | 70.000 |
'validation' | 15.000 |
- Cấu trúc tính năng :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'objects': Sequence({
'3d_coords': Tensor(shape=(3,), dtype=float32),
'color': ClassLabel(shape=(), dtype=int64, num_classes=8),
'material': ClassLabel(shape=(), dtype=int64, num_classes=2),
'pixel_coords': Tensor(shape=(3,), dtype=float32),
'rotation': float32,
'shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
'size': ClassLabel(shape=(), dtype=int64, num_classes=2),
}),
'question_answer': Sequence({
'answer': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | loại D | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
tên_tệp | Chữ | sợi dây | ||
hình ảnh | Hình ảnh | (Không, Không, 3) | uint8 | |
các đối tượng | Sự liên tiếp | |||
đối tượng/3d_coords | Tenxơ | (3,) | phao32 | |
đồ vật/màu sắc | Nhãn lớp | int64 | ||
đồ vật/vật chất | Nhãn lớp | int64 | ||
đối tượng/pixel_coords | Tenxơ | (3,) | phao32 | |
đối tượng/xoay | Tenxơ | phao32 | ||
đồ vật/hình dạng | Nhãn lớp | int64 | ||
đồ vật/kích thước | Nhãn lớp | int64 | ||
trả lời câu hỏi | Sự liên tiếp | |||
câu hỏi_câu trả lời/câu trả lời | Chữ | sợi dây | ||
câu hỏi_câu trả lời/câu hỏi | Chữ | sợi dây |
Khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
- Trích dẫn :
@inproceedings{johnson2017clevr,
title={ {CLEVR}: A diagnostic dataset for compositional language and elementary visual reasoning},
author={Johnson, Justin and Hariharan, Bharath and van der Maaten, Laurens and Fei-Fei, Li and Lawrence Zitnick, C and Girshick, Ross},
booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
year={2017}
}