akıllı

  • Tanım :

CLEVR, çeşitli görsel muhakeme yeteneklerini test eden bir tanısal veri kümesidir. Minimum düzeyde önyargı içerir ve her sorunun gerektirdiği akıl yürütme türünü açıklayan ayrıntılı açıklamalara sahiptir.

Bölmek Örnekler
'test' 15.000
'train' 70.000
'validation' 15.000
  • Özellik yapısı :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        '3d_coords': Tensor(shape=(3,), dtype=float32),
        'color': ClassLabel(shape=(), dtype=int64, num_classes=8),
        'material': ClassLabel(shape=(), dtype=int64, num_classes=2),
        'pixel_coords': Tensor(shape=(3,), dtype=float32),
        'rotation': float32,
        'shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
        'size': ClassLabel(shape=(), dtype=int64, num_classes=2),
    }),
    'question_answer': Sequence({
        'answer': Text(shape=(), dtype=string),
        'question': Text(shape=(), dtype=string),
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
dosya adı Metin sicim
resim Resim (Yok, Yok, 3) uint8
nesneler Sekans
nesneler/3d_koordlar Tensör (3,) kayan nokta32
nesneler/renk SınıfEtiketi int64
nesneler/malzeme SınıfEtiketi int64
nesneler/pixel_coords Tensör (3,) kayan nokta32
nesneler/döndürme Tensör kayan nokta32
nesneler/şekil SınıfEtiketi int64
nesneler/boyut SınıfEtiketi int64
soru cevap Sekans
soru_cevap/cevap Metin sicim
soru_cevap/soru Metin sicim

Görselleştirme

  • Alıntı :
@inproceedings{johnson2017clevr,
  title={ {CLEVR}: A diagnostic dataset for compositional language and elementary visual reasoning},
  author={Johnson, Justin and Hariharan, Bharath and van der Maaten, Laurens and Fei-Fei, Li and Lawrence Zitnick, C and Girshick, Ross},
  booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
  year={2017}
}