lí giải trừu tượng

l10n-placeholder1 biểu thị tập hợp các loại quan hệ (lũy tiến, XOR, OR, AND, liên hợp nhất quán), \\(O\\) biểu thị các loại đối tượng (hình dạng, đường kẻ) và \\(A\\) biểu thị các loại thuộc tính (kích thước, màu sắc, số vị trí). Cấu trúc của ma trận, \\(S\\), là tập hợp các bộ ba \\(S={[r, o, a]}\\) xác định thử thách do một ma trận cụ thể đặt ra. Để sử dụng tập dữ liệu này: `` python import tensorflow_datasets as tfds ds = tfds.load ('abstract_reasoning', split = 'train') for ex in ds.take (4): print (ex) '' 'Xem [hướng dẫn ] (https://www.tensorflow.org/datasets/overview) để biết thêm thông tin về [tensorflow_datasets] (https://www.tensorflow.org/datasets). "/>
  • Mô tả :

Dữ liệu về ma trận được tạo theo thủ tục (PGM) từ bài báo Đo lường lý luận trừu tượng trong mạng thần kinh, Barrett, Hill, Santoro et al. 2018. Mục đích là để suy ra câu trả lời chính xác từ các bảng ngữ cảnh dựa trên suy luận trừu tượng.

Để sử dụng tập dữ liệu này, vui lòng tải xuống tất cả các tệp * .tar.gz từ trang tập dữ liệu và đặt chúng vào ~ / tensorflow_datasets / abstract_reasoning /.

\(R\) biểu thị tập hợp các kiểu quan hệ (lũy tiến, XOR, OR, AND, liên hợp nhất quán), \(O\) biểu thị các loại đối tượng (hình dạng, đường kẻ) và \(A\) biểu thị các loại thuộc tính (kích thước, màu sắc, vị trí, con số). Cấu trúc của ma trận,\(S\), là tập hợp các bộ ba \(S={[r, o, a]}\) xác định thử thách đặt ra bởi một ma trận cụ thể.

Tách ra Các ví dụ
'test' 200.000
'train' 1.200.000
'validation' 20.000
  • Cấu trúc tính năng :
FeaturesDict({
    'answers': Video(Image(shape=(160, 160, 1), dtype=tf.uint8)),
    'context': Video(Image(shape=(160, 160, 1), dtype=tf.uint8)),
    'filename': Text(shape=(), dtype=tf.string),
    'meta_target': Tensor(shape=(12,), dtype=tf.int64),
    'relation_structure_encoded': Tensor(shape=(4, 12), dtype=tf.int64),
    'target': ClassLabel(shape=(), dtype=tf.int64, num_classes=8),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Các tính năng
câu trả lời Video (Hình ảnh) (8, 160, 160, 1) tf.uint8
định nghĩa bài văn Video (Hình ảnh) (8, 160, 160, 1) tf.uint8
tên tập tin Chữ tf.string
meta_target Tensor (12,) tf.int64
quan hệ_cấu trúc_đã mã hóa Tensor (4, 12) tf.int64
Mục tiêu ClassLabel tf.int64
@InProceedings{pmlr-v80-barrett18a,
  title =    {Measuring abstract reasoning in neural networks},
  author =   {Barrett, David and Hill, Felix and Santoro, Adam and Morcos, Ari and Lillicrap, Timothy},
  booktitle =    {Proceedings of the 35th International Conference on Machine Learning},
  pages =    {511--520},
  year =     {2018},
  editor =   {Dy, Jennifer and Krause, Andreas},
  volume =   {80},
  series =   {Proceedings of Machine Learning Research},
  address =      {Stockholmsmassan, Stockholm Sweden},
  month =    {10--15 Jul},
  publisher =    {PMLR},
  pdf =      {http://proceedings.mlr.press/v80/barrett18a/barrett18a.pdf},
  url =      {http://proceedings.mlr.press/v80/barrett18a.html},
  abstract =     {Whether neural networks can learn abstract reasoning or whetherthey merely rely on superficial statistics is a topic of recent debate. Here, we propose a dataset and challenge designed to probe abstract reasoning, inspired by a well-known human IQ test. To succeed at this challenge, models must cope with various generalisation 'regimes' in which the training data and test questions differ in clearly-defined ways. We show that popular models such as ResNets perform poorly, even when the training and test sets differ only minimally, and we present a novel architecture, with structure designed to encourage reasoning, that does significantly better. When we vary the way in which the test questions and training data differ, we find that our model is notably proficient at certain forms of generalisation, but notably weak at others. We further show that the model's ability to generalise improves markedly if it is trained to predict symbolic explanations for its answers. Altogether, we introduce and explore ways to both measure and induce stronger abstract reasoning in neural networks. Our freely-available dataset should motivate further progress in this direction.}
}

trừu tượng_reasoning / trung lập (cấu hình mặc định)

  • Mô tả cấu hình : Các cấu trúc mã hóa ma trận trong cả
    bộ đào tạo và kiểm tra chứa bất kỳ bộ ba nào \([r, o, a]\) cho \(r \\in R\),
    \(o \\in O\)và \(a \\in A\). Tập hợp đào tạo và kiểm tra là rời rạc, với
    sự phân tách xảy ra ở cấp độ của các biến đầu vào (tức là pixel
    biểu hiện).

abstract_reasoning / interpolation

  • Mô tả cấu hình : Như trong phần tách trung lập, \(S\) bao gồm bất kỳ
    bộ ba \([r, o, a]\). Đối với nội suy, trong tập huấn luyện, khi
    thuộc tính là "color" hoặc "size" (tức là các thuộc tính có thứ tự), các giá trị của
    các thuộc tính bị hạn chế đối với các thành viên được lập chỉ mục chẵn của một tập hợp rời rạc,
    trong khi trong bộ thử nghiệm chỉ cho phép các giá trị được lập chỉ mục lẻ. Lưu ý rằng tất cả
    \(S\) chứa một số bộ ba \([r, o, a]\) với thuộc tính màu sắc hoặc kích thước.
    Vì vậy, cần có sự khái quát hóa cho mọi câu hỏi trong bộ đề kiểm tra.

trừu tượng_reasoning / ngoại suy

  • Mô tả cấu hình : Giống như trong nội suy, nhưng các giá trị của
    các thuộc tính bị hạn chế ở nửa dưới của tập hợp rời rạc trong
    đào tạo, trong khi trong tập thử nghiệm, họ lấy các giá trị ở nửa trên.

trừu tượng_reasoning / attr.rel.pairs

  • Mô tả cấu hình : Tất cả \(S\) chứa ít nhất hai bộ ba,
    \(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\), trong đó 400 là khả thi. chúng tôi
    phân bổ ngẫu nhiên 360 cho tập huấn luyện và 40 cho tập kiểm tra. Các thành viên
    \((t_1, t_2)\) trong số 40 cặp tổ chức không xảy ra cùng nhau trong cấu trúc\(S\)
    trong tập huấn luyện và tất cả các cấu trúc \(S\) có ít nhất một cặp như vậy
    \((t_1, t_2)\) như một tập hợp con.

abstract_reasoning / attr.rels

  • Mô tả cấu hình : Trong tập dữ liệu của chúng tôi, có 29
    gấp ba lần \([r,o,a]\). Chúng tôi đã phân bổ bảy trong số này cho tập thử nghiệm, một cách ngẫu nhiên,
    nhưng sao cho mỗi thuộc tính được biểu diễn chính xác một lần trong tập hợp này.
    Những bộ ba cố định này không bao giờ xảy ra trong các câu hỏi trong tập huấn luyện và
    mọi \(S\) trong tập thử nghiệm chứa ít nhất một trong số chúng.

abstract_reasoning / attrs.pairs

  • Mô tả cấu hình : \(S\) chứa ít nhất hai bộ ba. Có 20
    (không có thứ tự) các cặp thuộc tính khả thi \((a_1, a_2)\) như vậy đối với một số
    \(r_i, o_i, ([r_1,o_1,a_1],[r_2,o_2,a_2])\) là một cặp bộ ba khả thi
    \(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\). Chúng tôi đã phân bổ 16 cặp trong số này
    để đào tạo và bốn để thử nghiệm. Đối với một cặp \((a_1, a_2)\) trong bộ thử nghiệm,
    \(S\) trong tập huấn luyện chứa bộ ba với \(a_1\) hoặc \(a_2\). Trong bài kiểm tra
    , tất cả \(S\) đều chứa bộ ba với \(a_1\) và \(a_2\).

trừu tượng_reasoning / attrs.shape.color

  • Mô tả cấu hình : Màu sắc hình dạng thuộc tính được tổ chức. \(S\) trong
    tập huấn luyện không chứa bộ ba nào với \(o\)= shape và \(a\)= color.
    Tất cả các cấu trúc điều chỉnh các câu đố trong bộ thử nghiệm chứa ít nhất một bộ ba
    với \(o\)= shape và \(a\)= color.

abstract_reasoning / attrs.line.type

  • Mô tả cấu hình : Loại dòng thuộc tính cố định. \(S\) trong
    tập huấn luyện không chứa bộ ba nào với dòng \(o\)= và \(a\)= type.
    Tất cả các cấu trúc điều chỉnh các câu đố trong bộ thử nghiệm chứa ít nhất một bộ ba
    với \(o\)= dòng và \(a\)= type.