grounded_scan

  • Deskripsi :

Grounded SCAN (gSCAN) adalah kumpulan data sintetik untuk mengevaluasi generalisasi komposisi dalam pemahaman bahasa situasional. gSCAN memasangkan instruksi bahasa alami dengan urutan tindakan, dan mengharuskan agen untuk menginterpretasikan instruksi dalam konteks lingkungan navigasi visual berbasis grid.

Informasi lebih lanjut dapat ditemukan di:

FeaturesDict({
    'command': Sequence(Text(shape=(), dtype=string)),
    'manner': Text(shape=(), dtype=string),
    'meaning': Sequence(Text(shape=(), dtype=string)),
    'referred_target': Text(shape=(), dtype=string),
    'situation': FeaturesDict({
        'agent_direction': int32,
        'agent_position': FeaturesDict({
            'column': int32,
            'row': int32,
        }),
        'direction_to_target': Text(shape=(), dtype=string),
        'distance_to_target': int32,
        'grid_size': int32,
        'placed_objects': Sequence({
            'object': FeaturesDict({
                'color': Text(shape=(), dtype=string),
                'shape': Text(shape=(), dtype=string),
                'size': int32,
            }),
            'position': FeaturesDict({
                'column': int32,
                'row': int32,
            }),
            'vector': Text(shape=(), dtype=string),
        }),
        'target_object': FeaturesDict({
            'object': FeaturesDict({
                'color': Text(shape=(), dtype=string),
                'shape': Text(shape=(), dtype=string),
                'size': int32,
            }),
            'position': FeaturesDict({
                'column': int32,
                'row': int32,
            }),
            'vector': Text(shape=(), dtype=string),
        }),
    }),
    'target_commands': Sequence(Text(shape=(), dtype=string)),
    'verb_in_command': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
memerintah Urutan (Teks) (Tidak ada,) rangkaian
tata krama Teks rangkaian
arti Urutan (Teks) (Tidak ada,) rangkaian
refered_target Teks rangkaian
situasi fiturDict
situasi/agen_direction Tensor int32
situasi/posisi_agen fiturDict
situasi/agen_posisi/kolom Tensor int32
situasi/agen_posisi/baris Tensor int32
situasi/arah_ke_target Teks rangkaian
situasi/jarak_ke_target Tensor int32
situasi/grid_size Tensor int32
situasi/objek_ditempatkan Urutan
situasi/objek_ditempatkan/objek fiturDict
situasi/objek_ditempatkan/objek/warna Teks rangkaian
situasi/objek_ditempatkan/objek/bentuk Teks rangkaian
situasi/objek_ditempatkan/objek/ukuran Tensor int32
situasi/objek_ditempatkan/posisi fiturDict
situasi/objek_ditempatkan/posisi/kolom Tensor int32
situasi/objek_ditempatkan/posisi/baris Tensor int32
situasi/objek_ditempatkan/vektor Teks rangkaian
situasi/target_objek fiturDict
situasi/target_objek/objek fiturDict
situasi/target_objek/objek/warna Teks rangkaian
situasi/target_objek/objek/bentuk Teks rangkaian
situasi/target_objek/objek/ukuran Tensor int32
situasi/target_objek/posisi fiturDict
situasi/objek_target/posisi/kolom Tensor int32
situasi/target_objek/posisi/baris Tensor int32
situasi/target_objek/vektor Teks rangkaian
target_commands Urutan (Teks) (Tidak ada,) rangkaian
verb_in_command Teks rangkaian
@inproceedings{NEURIPS2020_e5a90182,
 author = {Ruis, Laura and Andreas, Jacob and Baroni, Marco and Bouchacourt, Diane and Lake, Brenden M},
 booktitle = {Advances in Neural Information Processing Systems},
 editor = {H. Larochelle and M. Ranzato and R. Hadsell and M. F. Balcan and H. Lin},
 pages = {19861--19872},
 publisher = {Curran Associates, Inc.},
 title = {A Benchmark for Systematic Generalization in Grounded Language Understanding},
 url = {https://proceedings.neurips.cc/paper/2020/file/e5a90182cc81e12ab5e72d66e0b46fe3-Paper.pdf},
 volume = {33},
 year = {2020}
}

@inproceedings{qiu-etal-2021-systematic,
    title = "Systematic Generalization on g{SCAN}: {W}hat is Nearly Solved and What is Next?",
    author = "Qiu, Linlu  and
      Hu, Hexiang  and
      Zhang, Bowen  and
      Shaw, Peter  and
      Sha, Fei",
    booktitle = "Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing",
    month = nov,
    year = "2021",
    address = "Online and Punta Cana, Dominican Republic",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2021.emnlp-main.166",
    doi = "10.18653/v1/2021.emnlp-main.166",
    pages = "2180--2188",
}

grounded_scan/compositional_splits (konfigurasi default)

  • Deskripsi konfigurasi : Contoh untuk generalisasi komposisi.

  • Ukuran unduhan : 82.10 MiB

  • Ukuran dataset : 998.11 MiB

  • Perpecahan :

Membelah Contoh
'adverb_1' 112.880
'adverb_2' 38.582
'contextual' 11.460
'dev' 3.716
'situational_1' 88.642
'situational_2' 16.808
'test' 19.282
'train' 367.933
'visual' 37.436
'visual_easier' 18.718

grounded_scan/target_length_split

  • Deskripsi konfigurasi : Contoh untuk menggeneralisasi ke panjang target yang lebih besar.

  • Ukuran unduhan : 53.41 MiB

  • Ukuran dataset : 546.73 MiB

  • Perpecahan :

Membelah Contoh
'dev' 1.821
'target_lengths' 198.588
'test' 37.784
'train' 180.301

grounded_scan/spatial_relation_splits

  • Deskripsi konfigurasi : Contoh untuk penalaran hubungan spasial.

  • Ukuran unduhan : 89.59 MiB

  • Ukuran dataset : 675.09 MiB

  • Perpecahan :

Membelah Contoh
'dev' 2.617
'referent' 30.492
'relation' 6.285
'relative_position_1' 41.576
'relative_position_2' 41.529
'test' 28.526
'train' 259.088
'visual' 62.250