abstract_reasoning

l10n-placeholder1 menunjukkan kumpulan tipe relasi (progresi, XOR, ATAU, DAN, penyatuan yang konsisten), \\(O\\) menunjukkan tipe objek (bentuk, garis), dan \\(A\\) menunjukkan tipe atribut (ukuran, warna, posisi, jumlah). Struktur matriks, \\(S\\), adalah himpunan tripel \\(S={[r, o, a]}\\) yang menentukan tantangan yang ditimbulkan oleh matriks tertentu. Untuk menggunakan kumpulan data ini: ```python import tensorflow_datasets as tfds ds = tfds.load('abstract_reasoning', split='train') for ex in ds.take(4): print(ex) ``` Lihat [panduan ](https://www.tensorflow.org/datasets/overview) untuk informasi selengkapnya tentang [tensorflow_datasets](https://www.tensorflow.org/datasets). " />
  • Deskripsi :

Data Matriks yang Dihasilkan Secara Prosedural (PGM) dari makalah Mengukur Penalaran Abstrak di Neural Networks, Barrett, Hill, Santoro et al. 2018. Tujuannya adalah menyimpulkan jawaban yang benar dari panel konteks berdasarkan penalaran abstrak.

Untuk menggunakan kumpulan data ini, unduh semua file *.tar.gz dari halaman kumpulan data dan tempatkan di ~/tensorflow_datasets/abstract_reasoning/.

\(R\) menunjukkan kumpulan tipe relasi (progresi, XOR, ATAU, DAN, penyatuan yang konsisten), \(O\) menunjukkan tipe objek (bentuk, garis), dan \(A\) menunjukkan tipe atribut (ukuran, warna, posisi, nomor). Struktur matriks,\(S\), adalah himpunan tiga kali lipat \(S={[r, o, a]}\) yang menentukan tantangan yang ditimbulkan oleh matriks tertentu.

Membelah Contoh
'test' 200.000
'train' 1.200.000
'validation' 20.000
  • Struktur fitur :
FeaturesDict({
    'answers': Video(Image(shape=(160, 160, 1), dtype=uint8)),
    'context': Video(Image(shape=(160, 160, 1), dtype=uint8)),
    'filename': Text(shape=(), dtype=string),
    'meta_target': Tensor(shape=(12,), dtype=int64),
    'relation_structure_encoded': Tensor(shape=(4, 12), dtype=int64),
    'target': ClassLabel(shape=(), dtype=int64, num_classes=8),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
jawaban Video(Gambar) (8, 160, 160, 1) uint8
konteks Video(Gambar) (8, 160, 160, 1) uint8
nama file Teks rangkaian
meta_target Tensor (12,) int64
relasi_struktur_dikodekan Tensor (4, 12) int64
target LabelKelas int64
@InProceedings{pmlr-v80-barrett18a,
  title =    {Measuring abstract reasoning in neural networks},
  author =   {Barrett, David and Hill, Felix and Santoro, Adam and Morcos, Ari and Lillicrap, Timothy},
  booktitle =    {Proceedings of the 35th International Conference on Machine Learning},
  pages =    {511--520},
  year =     {2018},
  editor =   {Dy, Jennifer and Krause, Andreas},
  volume =   {80},
  series =   {Proceedings of Machine Learning Research},
  address =      {Stockholmsmassan, Stockholm Sweden},
  month =    {10--15 Jul},
  publisher =    {PMLR},
  pdf =      {http://proceedings.mlr.press/v80/barrett18a/barrett18a.pdf},
  url =      {http://proceedings.mlr.press/v80/barrett18a.html},
  abstract =     {Whether neural networks can learn abstract reasoning or whetherthey merely rely on superficial statistics is a topic of recent debate. Here, we propose a dataset and challenge designed to probe abstract reasoning, inspired by a well-known human IQ test. To succeed at this challenge, models must cope with various generalisation 'regimes' in which the training data and test questions differ in clearly-defined ways. We show that popular models such as ResNets perform poorly, even when the training and test sets differ only minimally, and we present a novel architecture, with structure designed to encourage reasoning, that does significantly better. When we vary the way in which the test questions and training data differ, we find that our model is notably proficient at certain forms of generalisation, but notably weak at others. We further show that the model's ability to generalise improves markedly if it is trained to predict symbolic explanations for its answers. Altogether, we introduce and explore ways to both measure and induce stronger abstract reasoning in neural networks. Our freely-available dataset should motivate further progress in this direction.}
}

abstract_reasoning/netral (konfigurasi default)

  • Deskripsi konfigurasi : Struktur yang menyandikan matriks di kedua
    set pelatihan dan pengujian berisi tiga kali lipat \([r, o, a]\) untuk \(r \\in R\),
    \(o \\in O\), dan \(a \\in A\). Set pelatihan dan pengujian dipisahkan, dengan
    pemisahan yang terjadi pada tingkat variabel input (yaitu piksel
    manifestasi).

  • Ukuran dataset : 42.02 GiB

  • Contoh ( tfds.as_dataframe ):

abstract_reasoning/interpolasi

  • Deskripsi konfigurasi : Seperti pada split netral, \(S\) terdiri dari apa saja
    tiga kali lipat \([r, o, a]\). Untuk interpolasi, di set pelatihan, saat
    atribut adalah "warna" atau "ukuran" (yaitu atribut yang dipesan), nilai dari
    atribut dibatasi untuk anggota yang diindeks genap dari kumpulan diskrit,
    sedangkan dalam set pengujian hanya nilai indeks ganjil yang diizinkan. Perhatikan bahwa semua
    \(S\) berisi beberapa triple \([r, o, a]\) dengan atribut color or size .
    Dengan demikian, generalisasi diperlukan untuk setiap pertanyaan dalam rangkaian tes.

  • Ukuran dataset : 37.09 GiB

  • Contoh ( tfds.as_dataframe ):

abstrak_penalaran/ekstrapolasi

  • Deskripsi konfigurasi : Sama seperti interpolasi, tetapi nilai dari
    atribut dibatasi pada bagian bawah set diskrit selama
    pelatihan, sedangkan di set tes mereka mengambil nilai di bagian atas.

  • Ukuran dataset : 35.91 GiB

  • Contoh ( tfds.as_dataframe ):

abstract_reasoning/attr.rel.pairs

  • Deskripsi konfigurasi : Semua \(S\) berisi setidaknya dua tripel,
    \(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\), 400 di antaranya layak. Kita
    dialokasikan secara acak 360 ke set pelatihan dan 40 ke set tes. Anggota
    \((t_1, t_2)\) dari 40 pasangan yang bertahan tidak muncul bersamaan dalam struktur\(S\)
    di set pelatihan, dan semua struktur \(S\) memiliki setidaknya satu pasangan seperti itu
    \((t_1, t_2)\) sebagai subset.

  • Ukuran dataset : 41.07 GiB

  • Contoh ( tfds.as_dataframe ):

abstract_reasoning/attr.rels

  • Deskripsi konfigurasi : Dalam dataset kami, ada 29 kemungkinan unik
    tiga kali lipat \([r,o,a]\). Kami mengalokasikan tujuh di antaranya untuk set pengujian, secara acak,
    tetapi sedemikian rupa sehingga masing-masing atribut diwakili tepat satu kali dalam himpunan ini.
    Tiga kali lipat yang ditahan ini tidak pernah muncul dalam pertanyaan di set pelatihan, dan
    setiap \(S\) dalam set pengujian berisi setidaknya satu dari mereka.

  • Ukuran dataset : 41.45 GiB

  • Contoh ( tfds.as_dataframe ):

abstract_reasoning/attrs.pairs

  • Deskripsi konfigurasi : \(S\) berisi setidaknya dua tripel. Ada 20
    (unordered) pasang layak atribut \((a_1, a_2)\) sehingga untuk beberapa
    \(r_i, o_i, ([r_1,o_1,a_1],[r_2,o_2,a_2])\) adalah triple pair yang layak
    \(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\). Kami mengalokasikan 16 pasangan ini
    untuk pelatihan dan empat untuk pengujian. Untuk sepasang \((a_1, a_2)\) di set pengujian,
    \(S\) dalam set pelatihan berisi tiga kali lipat dengan \(a_1\) atau \(a_2\). Dalam ujian
    set, semua \(S\) berisi tiga kali lipat dengan \(a_1\) dan \(a_2\).

  • Ukuran dataset : 40.98 GiB

  • Contoh ( tfds.as_dataframe ):

abstract_reasoning/attrs.shape.color

  • Deskripsi konfigurasi : Warna-bentuk atribut yang dipertahankan. \(S\) in
    set pelatihan tidak berisi tiga kali lipat dengan \(o\)= bentuk dan \(a\)= warna.
    Semua struktur yang mengatur teka-teki dalam set tes berisi setidaknya satu rangkap tiga
    dengan \(o\)= bentuk dan \(a\)= warna.

  • Ukuran dataset : 41.21 GiB

  • Contoh ( tfds.as_dataframe ):

abstract_reasoning/attrs.line.type

  • Deskripsi konfigurasi : Tipe baris atribut yang ditahan. \(S\) in
    set pelatihan tidak berisi tiga kali lipat dengan \(o\)=line dan \(a\)=type.
    Semua struktur yang mengatur teka-teki dalam set tes berisi setidaknya satu rangkap tiga
    dengan \(o\)= garis dan \(a\)= tipe.

  • Ukuran dataset : 41.40 GiB

  • Contoh ( tfds.as_dataframe ):