- Deskripsi :
Data Matriks yang Dihasilkan Secara Prosedural (PGM) dari makalah Mengukur Penalaran Abstrak di Neural Networks, Barrett, Hill, Santoro et al. 2018. Tujuannya adalah menyimpulkan jawaban yang benar dari panel konteks berdasarkan penalaran abstrak.
Untuk menggunakan kumpulan data ini, unduh semua file *.tar.gz dari halaman kumpulan data dan tempatkan di ~/tensorflow_datasets/abstract_reasoning/.
\(R\) menunjukkan kumpulan tipe relasi (progresi, XOR, ATAU, DAN, penyatuan yang konsisten), \(O\) menunjukkan tipe objek (bentuk, garis), dan \(A\) menunjukkan tipe atribut (ukuran, warna, posisi, nomor). Struktur matriks,\(S\), adalah himpunan tiga kali lipat \(S={[r, o, a]}\) yang menentukan tantangan yang ditimbulkan oleh matriks tertentu.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://github.com/deepmind/abstract-reasoning-matrices
Kode sumber :
tfds.datasets.abstract_reasoning.Builder
Versi :
-
1.0.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
Unknown size
Instruksi pengunduhan manual : Kumpulan data ini mengharuskan Anda mengunduh data sumber secara manual ke
download_config.manual_dir
(default ke~/tensorflow_datasets/downloads/manual/
):
Data dapat diunduh dari https://console.cloud.google.com/storage/browser/ravens-matrices Silakan masukkan semua file tar.gz di manual_dir.Di-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 200.000 |
'train' | 1.200.000 |
'validation' | 20.000 |
- Struktur fitur :
FeaturesDict({
'answers': Video(Image(shape=(160, 160, 1), dtype=uint8)),
'context': Video(Image(shape=(160, 160, 1), dtype=uint8)),
'filename': Text(shape=(), dtype=string),
'meta_target': Tensor(shape=(12,), dtype=int64),
'relation_structure_encoded': Tensor(shape=(4, 12), dtype=int64),
'target': ClassLabel(shape=(), dtype=int64, num_classes=8),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
jawaban | Video(Gambar) | (8, 160, 160, 1) | uint8 | |
konteks | Video(Gambar) | (8, 160, 160, 1) | uint8 | |
nama file | Teks | rangkaian | ||
meta_target | Tensor | (12,) | int64 | |
relasi_struktur_dikodekan | Tensor | (4, 12) | int64 | |
target | LabelKelas | int64 |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Kutipan :
@InProceedings{pmlr-v80-barrett18a,
title = {Measuring abstract reasoning in neural networks},
author = {Barrett, David and Hill, Felix and Santoro, Adam and Morcos, Ari and Lillicrap, Timothy},
booktitle = {Proceedings of the 35th International Conference on Machine Learning},
pages = {511--520},
year = {2018},
editor = {Dy, Jennifer and Krause, Andreas},
volume = {80},
series = {Proceedings of Machine Learning Research},
address = {Stockholmsmassan, Stockholm Sweden},
month = {10--15 Jul},
publisher = {PMLR},
pdf = {http://proceedings.mlr.press/v80/barrett18a/barrett18a.pdf},
url = {http://proceedings.mlr.press/v80/barrett18a.html},
abstract = {Whether neural networks can learn abstract reasoning or whetherthey merely rely on superficial statistics is a topic of recent debate. Here, we propose a dataset and challenge designed to probe abstract reasoning, inspired by a well-known human IQ test. To succeed at this challenge, models must cope with various generalisation 'regimes' in which the training data and test questions differ in clearly-defined ways. We show that popular models such as ResNets perform poorly, even when the training and test sets differ only minimally, and we present a novel architecture, with structure designed to encourage reasoning, that does significantly better. When we vary the way in which the test questions and training data differ, we find that our model is notably proficient at certain forms of generalisation, but notably weak at others. We further show that the model's ability to generalise improves markedly if it is trained to predict symbolic explanations for its answers. Altogether, we introduce and explore ways to both measure and induce stronger abstract reasoning in neural networks. Our freely-available dataset should motivate further progress in this direction.}
}
abstract_reasoning/netral (konfigurasi default)
Deskripsi konfigurasi : Struktur yang menyandikan matriks di kedua
set pelatihan dan pengujian berisi tiga kali lipat \([r, o, a]\) untuk \(r \\in R\),
\(o \\in O\), dan \(a \\in A\). Set pelatihan dan pengujian dipisahkan, dengan
pemisahan yang terjadi pada tingkat variabel input (yaitu piksel
manifestasi).Ukuran dataset :
42.02 GiB
Contoh ( tfds.as_dataframe ):
abstract_reasoning/interpolasi
Deskripsi konfigurasi : Seperti pada split netral, \(S\) terdiri dari apa saja
tiga kali lipat \([r, o, a]\). Untuk interpolasi, di set pelatihan, saat
atribut adalah "warna" atau "ukuran" (yaitu atribut yang dipesan), nilai dari
atribut dibatasi untuk anggota yang diindeks genap dari kumpulan diskrit,
sedangkan dalam set pengujian hanya nilai indeks ganjil yang diizinkan. Perhatikan bahwa semua
\(S\) berisi beberapa triple \([r, o, a]\) dengan atribut color or size .
Dengan demikian, generalisasi diperlukan untuk setiap pertanyaan dalam rangkaian tes.Ukuran dataset :
37.09 GiB
Contoh ( tfds.as_dataframe ):
abstrak_penalaran/ekstrapolasi
Deskripsi konfigurasi : Sama seperti interpolasi, tetapi nilai dari
atribut dibatasi pada bagian bawah set diskrit selama
pelatihan, sedangkan di set tes mereka mengambil nilai di bagian atas.Ukuran dataset :
35.91 GiB
Contoh ( tfds.as_dataframe ):
abstract_reasoning/attr.rel.pairs
Deskripsi konfigurasi : Semua \(S\) berisi setidaknya dua tripel,
\(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\), 400 di antaranya layak. Kita
dialokasikan secara acak 360 ke set pelatihan dan 40 ke set tes. Anggota
\((t_1, t_2)\) dari 40 pasangan yang bertahan tidak muncul bersamaan dalam struktur\(S\)
di set pelatihan, dan semua struktur \(S\) memiliki setidaknya satu pasangan seperti itu
\((t_1, t_2)\) sebagai subset.Ukuran dataset :
41.07 GiB
Contoh ( tfds.as_dataframe ):
abstract_reasoning/attr.rels
Deskripsi konfigurasi : Dalam dataset kami, ada 29 kemungkinan unik
tiga kali lipat \([r,o,a]\). Kami mengalokasikan tujuh di antaranya untuk set pengujian, secara acak,
tetapi sedemikian rupa sehingga masing-masing atribut diwakili tepat satu kali dalam himpunan ini.
Tiga kali lipat yang ditahan ini tidak pernah muncul dalam pertanyaan di set pelatihan, dan
setiap \(S\) dalam set pengujian berisi setidaknya satu dari mereka.Ukuran dataset :
41.45 GiB
Contoh ( tfds.as_dataframe ):
abstract_reasoning/attrs.pairs
Deskripsi konfigurasi : \(S\) berisi setidaknya dua tripel. Ada 20
(unordered) pasang layak atribut \((a_1, a_2)\) sehingga untuk beberapa
\(r_i, o_i, ([r_1,o_1,a_1],[r_2,o_2,a_2])\) adalah triple pair yang layak
\(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\). Kami mengalokasikan 16 pasangan ini
untuk pelatihan dan empat untuk pengujian. Untuk sepasang \((a_1, a_2)\) di set pengujian,
\(S\) dalam set pelatihan berisi tiga kali lipat dengan \(a_1\) atau \(a_2\). Dalam ujian
set, semua \(S\) berisi tiga kali lipat dengan \(a_1\) dan \(a_2\).Ukuran dataset :
40.98 GiB
Contoh ( tfds.as_dataframe ):
abstract_reasoning/attrs.shape.color
Deskripsi konfigurasi : Warna-bentuk atribut yang dipertahankan. \(S\) in
set pelatihan tidak berisi tiga kali lipat dengan \(o\)= bentuk dan \(a\)= warna.
Semua struktur yang mengatur teka-teki dalam set tes berisi setidaknya satu rangkap tiga
dengan \(o\)= bentuk dan \(a\)= warna.Ukuran dataset :
41.21 GiB
Contoh ( tfds.as_dataframe ):
abstract_reasoning/attrs.line.type
Deskripsi konfigurasi : Tipe baris atribut yang ditahan. \(S\) in
set pelatihan tidak berisi tiga kali lipat dengan \(o\)=line dan \(a\)=type.
Semua struktur yang mengatur teka-teki dalam set tes berisi setidaknya satu rangkap tiga
dengan \(o\)= garis dan \(a\)= tipe.Ukuran dataset :
41.40 GiB
Contoh ( tfds.as_dataframe ):