مسح

  • الوصف :

مهام SCAN مع تقسيمات مختلفة.

SCAN عبارة عن مجموعة من مهام التنقل البسيطة التي تعتمد على اللغة لدراسة التعلم التركيبي والتعميم بدون طلقة.

يتم وصف معظم الانقسامات على https://github.com/brendenlake/SCAN للحصول على تقسيمات MCD ، يرجى الاطلاع على https://arxiv.org/abs/1912.09713.pdf

الاستخدام الأساسي:

data = tfds.load('scan/length')

مثال أكثر تقدمًا:

import tensorflow_datasets as tfds
from tensorflow_datasets.datasets.scan import scan_dataset_builder

data = tfds.load(
    'scan',
    builder_kwargs=dict(
        config=scan_dataset_builder.ScanConfig(
            name='simple_p8', directory='simple_split/size_variations')))
FeaturesDict({
    'actions': Text(shape=(), dtype=string),
    'commands': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
أجراءات نص سلسلة
أوامر نص سلسلة
@inproceedings{Lake2018GeneralizationWS,
  title={Generalization without Systematicity: On the Compositional Skills of
         Sequence-to-Sequence Recurrent Networks},
  author={Brenden M. Lake and Marco Baroni},
  booktitle={ICML},
  year={2018},
  url={https://arxiv.org/pdf/1711.00350.pdf},
}
@inproceedings{Keysers2020,
  title={Measuring Compositional Generalization: A Comprehensive Method on
         Realistic Data},
  author={Daniel Keysers and Nathanael Sch\"{a}rli and Nathan Scales and
          Hylke Buisman and Daniel Furrer and Sergii Kashubin and
          Nikola Momchev and Danila Sinopalnikov and Lukasz Stafiniak and
          Tibor Tihon and Dmitry Tsarkov and Xiao Wang and Marc van Zee and
          Olivier Bousquet},
  note={Additional citation for MCD splits},
  booktitle={ICLR},
  year={2020},
  url={https://arxiv.org/abs/1912.09713.pdf},
}

مسح / بسيط (التكوين الافتراضي)

  • حجم التحميل : 17.82 MiB

  • حجم مجموعة البيانات : 4.47 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 4182
'train' 16،728

مسح / addprim_jump

  • حجم التحميل : 17.82 MiB

  • حجم مجموعة البيانات : 4.53 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 7706
'train' 14،670

مسح / addprim_turn_left

  • حجم التحميل : 17.82 MiB

  • حجم مجموعة البيانات : 4.58 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 1،208
'train' 21890

مسح / filler_num0

  • حجم التحميل : 17.82 MiB

  • حجم مجموعة البيانات : 3.20 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 1173
'train' 15،225

scan / filler_num1

  • حجم التحميل : 17.82 MiB

  • حجم مجموعة البيانات : 3.51 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 1173
'train' 16،290

scan / filler_num2

  • حجم التحميل : 17.82 MiB

  • حجم مجموعة البيانات : 3.84 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 1173
'train' 17391

Scan / filler_num3

  • حجم التحميل : 17.82 MiB

  • حجم مجموعة البيانات : 4.17 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 1173
'train' 18.528

مسح / طول

  • حجم التحميل : 17.82 MiB

  • حجم مجموعة البيانات : 4.47 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 3920
'train' 16990

امسح / template_around_right

  • حجم التحميل : 17.82 MiB

  • حجم مجموعة البيانات : 4.17 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 4،476
'train' 15،225

Scan / template_jump_around_right

  • حجم التحميل : 17.82 MiB

  • حجم مجموعة البيانات : 4.17 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 1173
'train' 18.528

مسح / قالب_مقابل_حق

  • حجم التحميل : 17.82 MiB

  • حجم مجموعة البيانات : 4.22 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 4،476
'train' 15،225

مسح / قالب_حق

  • حجم التحميل : 17.82 MiB

  • حجم مجموعة البيانات : 4.26 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 4،476
'train' 15،225

مسح / mcd1

  • حجم التحميل : 17.89 MiB

  • حجم مجموعة البيانات : 1.89 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 1045
'train' 8365

مسح / mcd2

  • حجم التحميل : 17.89 MiB

  • حجم مجموعة البيانات : 1.84 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 1045
'train' 8365

مسح / mcd3

  • حجم التحميل : 17.89 MiB

  • حجم مجموعة البيانات : 1.87 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 1045
'train' 8365