
  • תיאור :

Grounded SCAN (gSCAN) הוא מערך נתונים סינתטי להערכת הכללה קומפוזיציית בהבנת שפה ממוקמת. gSCAN משלב הוראות שפה טבעית עם רצפי פעולה, ודורש מהסוכן לפרש הוראות בהקשר של סביבת ניווט ויזואלית מבוססת רשת.

מידע נוסף ניתן למצוא ב:

'command': Sequence(Text(shape=(), dtype=string)),
'manner': Text(shape=(), dtype=string),
'meaning': Sequence(Text(shape=(), dtype=string)),
'referred_target': Text(shape=(), dtype=string),
'situation': FeaturesDict({
'agent_direction': int32,
'agent_position': FeaturesDict({
'column': int32,
'row': int32,
'direction_to_target': Text(shape=(), dtype=string),
'distance_to_target': int32,
'grid_size': int32,
'placed_objects': Sequence({
'object': FeaturesDict({
'color': Text(shape=(), dtype=string),
'shape': Text(shape=(), dtype=string),
'size': int32,
'position': FeaturesDict({
'column': int32,
'row': int32,
'vector': Text(shape=(), dtype=string),
'target_object': FeaturesDict({
'object': FeaturesDict({
'color': Text(shape=(), dtype=string),
'shape': Text(shape=(), dtype=string),
'size': int32,
'position': FeaturesDict({
'column': int32,
'row': int32,
'vector': Text(shape=(), dtype=string),
'target_commands': Sequence(Text(shape=(), dtype=string)),
'verb_in_command': Text(shape=(), dtype=string),
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
פקודה רצף (טקסט) (אף אחד,) חוּט
דֶרֶך טֶקסט חוּט
מַשְׁמָעוּת רצף (טקסט) (אף אחד,) חוּט
refer_target טֶקסט חוּט
מַצָב FeaturesDict
מצב/כיוון_סוכן מוֹתֵחַ int32
מצב/עמדה_סוכן FeaturesDict
מצב/עמדה_סוכן/עמודה מוֹתֵחַ int32
מצב/עמדה_סוכן/שורה מוֹתֵחַ int32
מצב/כיוון_למטרה טֶקסט חוּט
מצב/מרחק_למטרה מוֹתֵחַ int32
מצב/גודל_רשת מוֹתֵחַ int32
מצב/חפצים_מוצבים סדר פעולות
מצב/חפצים_ממוקמים/אובייקט FeaturesDict
מצב/חפצים_ממוקמים/אובייקט/צבע טֶקסט חוּט
מצב/אובייקטים_מוצבים/אובייקט/צורה טֶקסט חוּט
situation/placed_objects/object/size מוֹתֵחַ int32
מצב/הציבו_אובייקטים/עמדה FeaturesDict
מצב/חפצים_ממוקמים/מיקום/עמודה מוֹתֵחַ int32
מצב/אובייקטים_ממוקמים/מיקום/שורה מוֹתֵחַ int32
מצב/אובייקטים_ממוקמים/וקטור טֶקסט חוּט
מצב/אובייקט_יעד FeaturesDict
situation/target_object/object FeaturesDict
situation/target_object/object/color טֶקסט חוּט
מצב/אובייקט_מטרה/אובייקט/צורה טֶקסט חוּט
situation/target_object/object/size מוֹתֵחַ int32
מצב/אובייקט_יעד/מיקום FeaturesDict
situation/target_object/position/column מוֹתֵחַ int32
situation/target_object/position/row מוֹתֵחַ int32
מצב/אובייקט_יעד/וקטור טֶקסט חוּט
target_commands רצף (טקסט) (אף אחד,) חוּט
פועל_בפקודה טֶקסט חוּט
= {Ruis, Laura and Andreas, Jacob and Baroni, Marco and Bouchacourt, Diane and Lake, Brenden M},
= {Advances in Neural Information Processing Systems},
= {H. Larochelle and M. Ranzato and R. Hadsell and M. F. Balcan and H. Lin},
= {19861--19872},
= {Curran Associates, Inc.},
= {A Benchmark for Systematic Generalization in Grounded Language Understanding},
= {https://proceedings.neurips.cc/paper/2020/file/e5a90182cc81e12ab5e72d66e0b46fe3-Paper.pdf},
= {33},
= {2020}

= "Systematic Generalization on g{SCAN}: {W}hat is Nearly Solved and What is Next?",
= "Qiu, Linlu  and
      Hu, Hexiang  and
      Zhang, Bowen  and
      Shaw, Peter  and
      Sha, Fei"
= "Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing",
= nov,
= "2021",
= "Online and Punta Cana, Dominican Republic",
= "Association for Computational Linguistics",
= "https://aclanthology.org/2021.emnlp-main.166",
= "10.18653/v1/2021.emnlp-main.166",
= "2180--2188",

grounded_scan/compositional_splits (תצורת ברירת מחדל)

  • תיאור תצורה : דוגמאות להכללה קומפוזיציונית.

  • גודל הורדה : 82.10 MiB

  • גודל מערך נתונים : 998.11 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'adverb_1' 112,880
'adverb_2' 38,582
'contextual' 11,460
'dev' 3,716
'situational_1' 88,642
'situational_2' 16,808
'test' 19,282
'train' 367,933
'visual' 37,436
'visual_easier' 18,718


  • תיאור תצורה : דוגמאות להכללה לאורכי יעד גדולים יותר.

  • גודל הורדה : 53.41 MiB

  • גודל ערכת נתונים: 546.73 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'dev' 1,821
'target_lengths' 198,588
'test' 37,784
'train' 180,301


  • תיאור תצורה : דוגמאות להנמקת יחסים מרחבית.

  • גודל הורדה : 89.59 MiB

  • גודל ערכת נתונים: 675.09 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'dev' 2,617
'referent' 30,492
'relation' 6,285
'relative_position_1' 41,576
'relative_position_2' 41,529
'test' 28,526
'train' 259,088
'visual' 62,250