abstract_reasoning

l10n-placeholder1 مجموعه ای از انواع روابط را نشان می دهد (پیشرفت، XOR، OR، AND، اتحادیه سازگار)، \\(O\\) نشان دهنده انواع شی (شکل، خط)، و \\(A\\) نشان دهنده انواع ویژگی ها (اندازه، رنگ، موقعیت، تعداد). ساختار یک ماتریس، \\(S\\)، مجموعه ای از سه گانه \\(S={[r, o, a]}\\) است که چالش ایجاد شده توسط یک ماتریس خاص را تعیین می کند. برای استفاده از این مجموعه داده: «Python tensorflow_datasets را به‌عنوان tfds ds = tfds.load('abstract_reasoning', split='train') برای ex در ds.take(4) وارد می‌کند: print(ex) ``` [راهنما را ببینید ](https://www.tensorflow.org/datasets/overview) برای اطلاعات بیشتر در مورد [tensorflow_datasets] (https://www.tensorflow.org/datasets). "/>
  • توضیحات :

داده های ماتریس های تولید شده رویه ای (PGM) از مقاله اندازه گیری استدلال انتزاعی در شبکه های عصبی، بارت، هیل، سانتورو و همکاران. 2018. هدف استنتاج پاسخ صحیح از پانل های زمینه بر اساس استدلال انتزاعی است.

برای استفاده از این مجموعه داده، لطفاً همه فایل های *.tar.gz را از صفحه مجموعه داده دانلود کرده و در ~/tensorflow_datasets/abstract_reasoning/ قرار دهید.

\(R\) مجموعه ای از انواع رابطه (پیشرفت، XOR، OR، AND، اتحادیه ثابت)، \(O\) نشان دهنده انواع شی (شکل، خط)، و \(A\) نشان دهنده انواع ویژگی ها (اندازه، رنگ، موقعیت، عدد). ساختار یک ماتریس،\(S\)، مجموعه ای از سه گانه \(S={[r, o, a]}\) است که چالش ایجاد شده توسط یک ماتریس خاص را تعیین می کند.

شکاف مثال ها
'test' 200000
'train' 1,200,000
'validation' 20000
  • ساختار ویژگی :
FeaturesDict({
    'answers': Video(Image(shape=(160, 160, 1), dtype=uint8)),
    'context': Video(Image(shape=(160, 160, 1), dtype=uint8)),
    'filename': Text(shape=(), dtype=string),
    'meta_target': Tensor(shape=(12,), dtype=int64),
    'relation_structure_encoded': Tensor(shape=(4, 12), dtype=int64),
    'target': ClassLabel(shape=(), dtype=int64, num_classes=8),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
پاسخ می دهد ویدئو (تصویر) (8، 160، 160، 1) uint8
متن نوشته ویدئو (تصویر) (8، 160، 160، 1) uint8
نام فایل متن رشته
متا_هدف تانسور (12،) int64
relation_structure_encoded تانسور (4، 12) int64
هدف ClassLabel int64
@InProceedings{pmlr-v80-barrett18a,
  title =    {Measuring abstract reasoning in neural networks},
  author =   {Barrett, David and Hill, Felix and Santoro, Adam and Morcos, Ari and Lillicrap, Timothy},
  booktitle =    {Proceedings of the 35th International Conference on Machine Learning},
  pages =    {511--520},
  year =     {2018},
  editor =   {Dy, Jennifer and Krause, Andreas},
  volume =   {80},
  series =   {Proceedings of Machine Learning Research},
  address =      {Stockholmsmassan, Stockholm Sweden},
  month =    {10--15 Jul},
  publisher =    {PMLR},
  pdf =      {http://proceedings.mlr.press/v80/barrett18a/barrett18a.pdf},
  url =      {http://proceedings.mlr.press/v80/barrett18a.html},
  abstract =     {Whether neural networks can learn abstract reasoning or whetherthey merely rely on superficial statistics is a topic of recent debate. Here, we propose a dataset and challenge designed to probe abstract reasoning, inspired by a well-known human IQ test. To succeed at this challenge, models must cope with various generalisation 'regimes' in which the training data and test questions differ in clearly-defined ways. We show that popular models such as ResNets perform poorly, even when the training and test sets differ only minimally, and we present a novel architecture, with structure designed to encourage reasoning, that does significantly better. When we vary the way in which the test questions and training data differ, we find that our model is notably proficient at certain forms of generalisation, but notably weak at others. We further show that the model's ability to generalise improves markedly if it is trained to predict symbolic explanations for its answers. Altogether, we introduce and explore ways to both measure and induce stronger abstract reasoning in neural networks. Our freely-available dataset should motivate further progress in this direction.}
}

abstract_reasoning/neutral (پیکربندی پیش‌فرض)

  • توضیحات پیکربندی : ساختارهایی که ماتریس ها را در هر دو کدگذاری می کنند
    مجموعه های آموزشی و آزمایشی حاوی هر سه گانه \([r, o, a]\) برای \(r \\in R\)هستند،
    \(o \\in O\)و \(a \\in A\). مجموعه های آموزشی و آزمایشی از هم جدا هستند، با
    جداسازی در سطح متغیرهای ورودی (یعنی پیکسل
    تظاهرات).

  • حجم مجموعه داده : 42.02 GiB

  • مثال‌ها ( tfds.as_dataframe ):

abstract_reasoning/interpolation

  • شرح پیکربندی : مانند تقسیم خنثی، \(S\) شامل هر کدام بود
    \([r, o, a]\)را سه برابر می کند. برای درون یابی، در مجموعه آموزشی، زمانی که
    ویژگی "رنگ" یا "اندازه" (یعنی صفات مرتب شده)، مقادیر بود
    ویژگی‌ها به اعضای زوج نمایه‌شده یک مجموعه گسسته محدود شدند،
    در حالی که در مجموعه آزمایشی فقط مقادیر شاخص فرد مجاز بود. توجه داشته باشید که همه
    \(S\) حاوی چند \([r, o, a]\) سه گانه با ویژگی رنگ یا اندازه است.
    بنابراین، تعمیم برای هر سؤال در مجموعه آزمون مورد نیاز است.

  • حجم مجموعه داده : 37.09 GiB

  • مثال‌ها ( tfds.as_dataframe ):

abstract_reasoning/extrapolation

  • توضیحات پیکربندی : مانند درون یابی است، اما مقادیر
    صفات به نیمه پایینی مجموعه گسسته در طول محدود شد
    آموزش، در حالی که در مجموعه تست آنها مقادیر را در نیمه بالایی دریافت کردند.

  • حجم مجموعه داده : 35.91 GiB

  • مثال‌ها ( tfds.as_dataframe ):

abstract_reasoning/attr.rel.pairs

  • توضیحات پیکربندی : همه \(S\) حداقل شامل دو سه گانه بودند،
    \(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\)، که 400 مورد آن قابل اجرا هستند. ما
    به طور تصادفی 360 به مجموعه آموزشی و 40 به مجموعه تست اختصاص داده شد. اعضا
    \((t_1, t_2)\) از 40 جفت نگهداشته شده با هم در ساختارها رخ ندادند\(S\)
    در مجموعه آموزشی، و تمام ساختارهای \(S\) حداقل یک جفت از این قبیل داشتند
    \((t_1, t_2)\) به عنوان یک زیر مجموعه.

  • حجم مجموعه داده : 41.07 GiB

  • مثال‌ها ( tfds.as_dataframe ):

abstract_reasoning/attr.rels

  • توضیحات پیکربندی : در مجموعه داده ما، 29 مورد منحصر به فرد وجود دارد
    \([r,o,a]\)سه برابر می کند. ما هفت مورد از اینها را به صورت تصادفی برای مجموعه آزمایشی اختصاص دادیم.
    اما به گونه ای که هر یک از ویژگی ها دقیقاً یک بار در این مجموعه نشان داده شده است.
    این سه‌گانه‌های نگه‌داشته‌شده هرگز در سؤالات مجموعه آموزشی رخ ندادند، و
    هر \(S\) در مجموعه آزمایشی حداقل یکی از آنها را داشت.

  • حجم مجموعه داده : 41.45 GiB

  • مثال‌ها ( tfds.as_dataframe ):

abstract_reasoning/attrs.pairs

  • شرح پیکربندی : \(S\) حاوی حداقل دو سه گانه است. 20 تا هستند
    (نامرتب) جفت ویژگی های قابل دوام \((a_1, a_2)\) به طوری که برای برخی
    \(r_i, o_i, ([r_1,o_1,a_1],[r_2,o_2,a_2])\) یک جفت سه گانه قابل دوام است
    \(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\). ما 16 عدد از این جفت ها را اختصاص دادیم
    برای آموزش و چهار برای تست. برای یک جفت \((a_1, a_2)\) در مجموعه آزمایشی،
    \(S\) در مجموعه آموزشی شامل سه گانه با \(a_1\) یا \(a_2\)بود. در آزمون
    مجموعه، همه \(S\) شامل سه گانه با \(a_1\) و \(a_2\)بودند.

  • حجم مجموعه داده : 40.98 GiB

  • مثال‌ها ( tfds.as_dataframe ):

abstract_reasoning/attrs.shape.color

  • توضیحات پیکربندی : ویژگی شکل-رنگ مشخص شده است. \(S\) اینچ
    مجموعه آموزشی شامل هیچ سه گانه با \(o\)= شکل و \(a\)= رنگ.
    تمام ساختارهای حاکم بر پازل ها در مجموعه آزمایشی شامل حداقل یک سه گانه بودند
    با \(o\)=شکل و \(a\)=رنگ.

  • حجم مجموعه داده : 41.21 GiB

  • مثال‌ها ( tfds.as_dataframe ):

abstract_reasoning/attrs.line.type

  • شرح پیکربندی : نوع خط مشخصه نگه داشته شده. \(S\) اینچ
    مجموعه آموزشی شامل هیچ سه گانه با \(o\)=خط و \(a\)=نوع نبود.
    تمام ساختارهای حاکم بر پازل ها در مجموعه آزمایشی شامل حداقل یک سه گانه بودند
    با \(o\)=خط و \(a\)=نوع.

  • حجم مجموعه داده : 41.40 GiB

  • مثال‌ها ( tfds.as_dataframe ):