भाववाचक तर्क

l10n-प्लेसहोल्डर1 संबंध प्रकार (प्रगति, XOR, OR, और, संगत संघ) के सेट को दर्शाता है, \\(O\\) ऑब्जेक्ट प्रकार (आकार, रेखा) को दर्शाता है, और \\(A\\) विशेषता प्रकार (आकार, रंग, स्थिति, संख्या)। एक मैट्रिक्स की संरचना, \\(S\\)4, ट्रिपल \\(S={[r, o, a]}\\) 5 का सेट है जो एक विशेष मैट्रिक्स द्वारा उत्पन्न चुनौती को निर्धारित करता है। इस डेटासेट का उपयोग करने के लिए: ```python आयात Tensorflow_datasets as tfds ds = tfds.load('abstract_reasoning', split='train') for ex in ds.take(4): Print(ex) ``` देखें [गाइड ](https://www.tensorflow.org/datasets/overview) [tensorflow_datasets](https://www.tensorflow.org/datasets) पर अधिक जानकारी के लिए। " />
  • विवरण :

न्यूरल नेटवर्क्स, बैरेट, हिल, सैंटोरो एट अल में मापन सार तर्क पत्र से प्रक्रियात्मक रूप से उत्पन्न मैट्रिसेस (पीजीएम) डेटा। 2018. सार तर्क के आधार पर संदर्भ पैनल से सही उत्तर का अनुमान लगाना लक्ष्य है।

इस डेटा सेट का उपयोग करने के लिए, कृपया डेटा सेट पेज से सभी *.tar.gz फ़ाइलें डाउनलोड करें और उन्हें ~/tensorflow_datasets/abstract_reasoning/ में रखें।

\(R\) संबंध प्रकार (प्रगति, XOR, OR, AND, संगत संघ) के सेट को दर्शाता है, \(O\) ऑब्जेक्ट प्रकार (आकार, रेखा) को दर्शाता है, और \(A\) विशेषता प्रकार (आकार, रंग, स्थिति) को दर्शाता है। संख्या)। एक मैट्रिक्स की संरचना,\(S\), ट्रिपल \(S={[r, o, a]}\) का सेट है जो एक विशेष मैट्रिक्स द्वारा उत्पन्न चुनौती को निर्धारित करता है।

विभाजित करना उदाहरण
'test' 200,000
'train' 1,200,000
'validation' 20,000
  • फ़ीचर संरचना :
FeaturesDict({
    'answers': Video(Image(shape=(160, 160, 1), dtype=uint8)),
    'context': Video(Image(shape=(160, 160, 1), dtype=uint8)),
    'filename': Text(shape=(), dtype=string),
    'meta_target': Tensor(shape=(12,), dtype=int64),
    'relation_structure_encoded': Tensor(shape=(4, 12), dtype=int64),
    'target': ClassLabel(shape=(), dtype=int64, num_classes=8),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
जवाब वीडियो (छवि) (8, 160, 160, 1) uint8
संदर्भ वीडियो (छवि) (8, 160, 160, 1) uint8
फ़ाइल का नाम मूलपाठ डोरी
मेटा_टारगेट टेन्सर (12,) int64
संबंध_संरचना_एन्कोडेड टेन्सर (4, 12) int64
लक्ष्य क्लासलेबल int64
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

  • उद्धरण :

@InProceedings{pmlr-v80-barrett18a,
  title =    {Measuring abstract reasoning in neural networks},
  author =   {Barrett, David and Hill, Felix and Santoro, Adam and Morcos, Ari and Lillicrap, Timothy},
  booktitle =    {Proceedings of the 35th International Conference on Machine Learning},
  pages =    {511--520},
  year =     {2018},
  editor =   {Dy, Jennifer and Krause, Andreas},
  volume =   {80},
  series =   {Proceedings of Machine Learning Research},
  address =      {Stockholmsmassan, Stockholm Sweden},
  month =    {10--15 Jul},
  publisher =    {PMLR},
  pdf =      {http://proceedings.mlr.press/v80/barrett18a/barrett18a.pdf},
  url =      {http://proceedings.mlr.press/v80/barrett18a.html},
  abstract =     {Whether neural networks can learn abstract reasoning or whetherthey merely rely on superficial statistics is a topic of recent debate. Here, we propose a dataset and challenge designed to probe abstract reasoning, inspired by a well-known human IQ test. To succeed at this challenge, models must cope with various generalisation 'regimes' in which the training data and test questions differ in clearly-defined ways. We show that popular models such as ResNets perform poorly, even when the training and test sets differ only minimally, and we present a novel architecture, with structure designed to encourage reasoning, that does significantly better. When we vary the way in which the test questions and training data differ, we find that our model is notably proficient at certain forms of generalisation, but notably weak at others. We further show that the model's ability to generalise improves markedly if it is trained to predict symbolic explanations for its answers. Altogether, we introduce and explore ways to both measure and induce stronger abstract reasoning in neural networks. Our freely-available dataset should motivate further progress in this direction.}
}

सार_तर्क/तटस्थ (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • कॉन्फिग विवरण : दोनों में मैट्रिसेस को कूटने वाली संरचनाएं
    प्रशिक्षण और परीक्षण सेट में l10n-placeholder12 के लिए कोई ट्रिपल \([r, o, a]\) \(r \\in R\)शामिल है,
    \(o \\in O\)13 , और \(a \\in A\)। प्रशिक्षण और परीक्षण सेट असंबद्ध हैं, साथ
    इनपुट चर के स्तर पर होने वाली जुदाई (यानी pixel
    अभिव्यक्तियाँ)।

  • डेटासेट का आकार : 42.02 GiB

  • उदाहरण ( tfds.as_dataframe ):

सार तर्क / प्रक्षेप

  • विन्यास विवरण : तटस्थ विभाजन के रूप में, \(S\) में कोई भी शामिल है
    ट्रिपल्स \([r, o, a]\). प्रक्षेप के लिए, प्रशिक्षण सेट में, जब
    विशेषता "रंग" या "आकार" (यानी, आदेशित विशेषताएँ) थी, के मान
    विशेषताएँ असतत सेट के सम-अनुक्रमित सदस्यों तक ही सीमित थीं,
    जबकि परीक्षण सेट में केवल विषम-अनुक्रमित मानों की अनुमति थी। ध्यान दें कि सभी
    \(S\) 17 में रंग या आकार विशेषता के साथ कुछ ट्रिपल \([r, o, a]\) प्लेसहोल्डर18 समाहित है।
    इस प्रकार, परीक्षण सेट में प्रत्येक प्रश्न के लिए सामान्यीकरण आवश्यक है।

  • डेटासेट का आकार : 37.09 GiB

  • उदाहरण ( tfds.as_dataframe ):

सार_तर्क / बहिर्वेशन

  • विन्यास विवरण : प्रक्षेप के समान, लेकिन के मान
    विशेषताएँ असतत सेट के निचले आधे हिस्से तक ही सीमित थीं
    प्रशिक्षण, जबकि परीक्षण सेट में उन्होंने ऊपरी आधे हिस्से में मान लिया।

  • डेटासेट का आकार : 35.91 GiB

  • उदाहरण ( tfds.as_dataframe ):

सार_तर्क/attr.rel.pairs

  • कॉन्फ़िगरेशन विवरण : सभी \(S\) में कम से कम दो ट्रिपल शामिल हैं,
    \(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\), जिनमें से 400 व्यवहार्य हैं। हम
    बेतरतीब ढंग से प्रशिक्षण सेट के लिए 360 और परीक्षण सेट के लिए 40 आवंटित। सदस्यों
    40 आयोजित-आउट जोड़े में से\(S\)\((t_1, t_2)\)
    प्रशिक्षण सेट में, और सभी संरचनाओं \(S\) में कम से कम एक ऐसी जोड़ी थी
    \((t_1, t_2)\) एक सबसेट के रूप में।

  • डेटासेट का आकार : 41.07 GiB

  • उदाहरण ( tfds.as_dataframe ):

सार तर्क / attr.rels

  • कॉन्फ़िगरेशन विवरण : हमारे डेटासेट में, 29 संभावित अद्वितीय हैं
    ट्रिपल्स \([r,o,a]\). हमने इनमें से सात को परीक्षण सेट के लिए यादृच्छिक रूप से आवंटित किया,
    लेकिन ऐसा है कि इस सेट में प्रत्येक विशेषता को एक बार प्रदर्शित किया गया था।
    प्रशिक्षण सेट में प्रश्नों में ये होल्ड-आउट ट्रिपल कभी नहीं हुए, और
    परीक्षण सेट में प्रत्येक \(S\) में उनमें से कम से कम एक शामिल था।

  • डेटासेट का आकार : 41.45 GiB

  • उदाहरण ( tfds.as_dataframe ):

सार_तर्क/attrs.pairs

  • विन्यास विवरण : \(S\) में कम से कम दो ट्रिपल शामिल हैं। 20 हैं
    (अक्रमित) गुणों के व्यवहार्य जोड़े \((a_1, a_2)\) जैसे कि कुछ के लिए
    \(r_i, o_i, ([r_1,o_1,a_1],[r_2,o_2,a_2])\) एक व्यवहार्य ट्रिपल जोड़ी है
    \(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\). हमने इनमें से 16 जोड़े आवंटित किए
    प्रशिक्षण के लिए और चार परीक्षण के लिए। परीक्षण सेट में एक जोड़ी \((a_1, a_2)\) के लिए,
    प्रशिक्षण सेट में\(S\) 32 में l10n-प्लेसहोल्डर33 या \(a_2\) \(a_1\) 34 के साथ ट्रिपल शामिल हैं। परीक्षण में
    सेट, सभी \(S\) 35 में l10n-प्लेसहोल्डर36 और \(a_2\) \(a_1\) साथ ट्रिपल शामिल हैं।

  • डेटासेट का आकार : 40.98 GiB

  • उदाहरण ( tfds.as_dataframe ):

सार_तर्क/attrs.shape.color

  • कॉन्फ़िग विवरण : हेल्ड-आउट विशेषता आकार-रंग। \(S\) इंच
    प्रशिक्षण सेट में \(o\)= आकार और \(a\)= रंग के साथ कोई ट्रिपल नहीं था।
    परीक्षण सेट में पहेलियों को नियंत्रित करने वाली सभी संरचनाएं कम से कम एक ट्रिपल होती हैं
    \(o\)= आकार और \(a\)= रंग के साथ।

  • डेटासेट का आकार : 41.21 GiB

  • उदाहरण ( tfds.as_dataframe ):

सार_तर्क/attrs.line.type

  • कॉन्फ़िगरेशन विवरण : हेल्ड-आउट विशेषता लाइन-प्रकार। \(S\) इंच
    प्रशिक्षण सेट में \(o\)=line और \(a\)=type के साथ कोई ट्रिपल नहीं था।
    परीक्षण सेट में पहेलियों को नियंत्रित करने वाली सभी संरचनाएं कम से कम एक ट्रिपल होती हैं
    \(o\)=लाइन और \(a\)=टाइप के साथ।

  • डेटासेट का आकार : 41.40 GiB

  • उदाहरण ( tfds.as_dataframe ):