Hình ảnh: Khám phá trong Know dữ liệu của bạn
Mô tả:
CLEVR là một tập dữ liệu chẩn đoán kiểm tra một loạt các khả năng suy luận trực quan. Nó chứa những thành kiến tối thiểu và có chú thích chi tiết mô tả kiểu lập luận mà mỗi câu hỏi yêu cầu.
Source code:
tfds.image.CLEVR
phiên bản:
-
3.0.0
: Không có ghi chú phát hành. -
3.1.0
(mặc định): Thêm câu hỏi / câu trả lời văn bản.
-
Dung lượng tải về:
17.72 GiB
Kích thước tập dữ liệu:
17.75 GiB
Tự động lưu trữ ( tài liệu ): Không
tách:
Tách ra | Các ví dụ |
---|---|
'test' | 15.000 |
'train' | 70.000 |
'validation' | 15.000 |
- Các tính năng:
FeaturesDict({
'file_name': Text(shape=(), dtype=tf.string),
'image': Image(shape=(None, None, 3), dtype=tf.uint8),
'objects': Sequence({
'3d_coords': Tensor(shape=(3,), dtype=tf.float32),
'color': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
'material': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'pixel_coords': Tensor(shape=(3,), dtype=tf.float32),
'rotation': tf.float32,
'shape': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'size': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
}),
'question_answer': Sequence({
'answer': Text(shape=(), dtype=tf.string),
'question': Text(shape=(), dtype=tf.string),
}),
})
Phím giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
- Trích dẫn:
@inproceedings{johnson2017clevr,
title={ {CLEVR}: A diagnostic dataset for compositional language and elementary visual reasoning},
author={Johnson, Justin and Hariharan, Bharath and van der Maaten, Laurens and Fei-Fei, Li and Lawrence Zitnick, C and Girshick, Ross},
booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
year={2017}
}