- Deskripsi :
Grounded SCAN (gSCAN) adalah kumpulan data sintetik untuk mengevaluasi generalisasi komposisi dalam pemahaman bahasa situasional. gSCAN memasangkan instruksi bahasa alami dengan urutan tindakan, dan mengharuskan agen untuk menginterpretasikan instruksi dalam konteks lingkungan navigasi visual berbasis grid.
Informasi lebih lanjut dapat ditemukan di:
Untuk
compositional_splits
dantarget_length_split
: https://github.com/LauraRuis/groundedSCANUntuk
spatial_relation_splits
: https://github.com/google-research/language/tree/master/language/gscan/dataKode sumber :
tfds.vision_language.grounded_scan.GroundedScan
Versi :
-
1.0.0
: Rilis awal. -
1.1.0
: Mengubah fiturvector
menjadi Teks(). -
2.0.0
(default): Menambahkan konfigurasi spatial_relation_splits baru.
-
Di-cache otomatis ( dokumentasi ): Tidak
Struktur fitur :
FeaturesDict({
'command': Sequence(Text(shape=(), dtype=string)),
'manner': Text(shape=(), dtype=string),
'meaning': Sequence(Text(shape=(), dtype=string)),
'referred_target': Text(shape=(), dtype=string),
'situation': FeaturesDict({
'agent_direction': int32,
'agent_position': FeaturesDict({
'column': int32,
'row': int32,
}),
'direction_to_target': Text(shape=(), dtype=string),
'distance_to_target': int32,
'grid_size': int32,
'placed_objects': Sequence({
'object': FeaturesDict({
'color': Text(shape=(), dtype=string),
'shape': Text(shape=(), dtype=string),
'size': int32,
}),
'position': FeaturesDict({
'column': int32,
'row': int32,
}),
'vector': Text(shape=(), dtype=string),
}),
'target_object': FeaturesDict({
'object': FeaturesDict({
'color': Text(shape=(), dtype=string),
'shape': Text(shape=(), dtype=string),
'size': int32,
}),
'position': FeaturesDict({
'column': int32,
'row': int32,
}),
'vector': Text(shape=(), dtype=string),
}),
}),
'target_commands': Sequence(Text(shape=(), dtype=string)),
'verb_in_command': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
memerintah | Urutan (Teks) | (Tidak ada,) | rangkaian | |
tata krama | Teks | rangkaian | ||
arti | Urutan (Teks) | (Tidak ada,) | rangkaian | |
refered_target | Teks | rangkaian | ||
situasi | fiturDict | |||
situasi/agen_direction | Tensor | int32 | ||
situasi/posisi_agen | fiturDict | |||
situasi/agen_posisi/kolom | Tensor | int32 | ||
situasi/agen_posisi/baris | Tensor | int32 | ||
situasi/arah_ke_target | Teks | rangkaian | ||
situasi/jarak_ke_target | Tensor | int32 | ||
situasi/grid_size | Tensor | int32 | ||
situasi/objek_ditempatkan | Urutan | |||
situasi/objek_ditempatkan/objek | fiturDict | |||
situasi/objek_ditempatkan/objek/warna | Teks | rangkaian | ||
situasi/objek_ditempatkan/objek/bentuk | Teks | rangkaian | ||
situasi/objek_ditempatkan/objek/ukuran | Tensor | int32 | ||
situasi/objek_ditempatkan/posisi | fiturDict | |||
situasi/objek_ditempatkan/posisi/kolom | Tensor | int32 | ||
situasi/objek_ditempatkan/posisi/baris | Tensor | int32 | ||
situasi/objek_ditempatkan/vektor | Teks | rangkaian | ||
situasi/target_objek | fiturDict | |||
situasi/target_objek/objek | fiturDict | |||
situasi/target_objek/objek/warna | Teks | rangkaian | ||
situasi/target_objek/objek/bentuk | Teks | rangkaian | ||
situasi/target_objek/objek/ukuran | Tensor | int32 | ||
situasi/target_objek/posisi | fiturDict | |||
situasi/objek_target/posisi/kolom | Tensor | int32 | ||
situasi/target_objek/posisi/baris | Tensor | int32 | ||
situasi/target_objek/vektor | Teks | rangkaian | ||
target_commands | Urutan (Teks) | (Tidak ada,) | rangkaian | |
verb_in_command | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Kutipan :
@inproceedings{NEURIPS2020_e5a90182,
author = {Ruis, Laura and Andreas, Jacob and Baroni, Marco and Bouchacourt, Diane and Lake, Brenden M},
booktitle = {Advances in Neural Information Processing Systems},
editor = {H. Larochelle and M. Ranzato and R. Hadsell and M. F. Balcan and H. Lin},
pages = {19861--19872},
publisher = {Curran Associates, Inc.},
title = {A Benchmark for Systematic Generalization in Grounded Language Understanding},
url = {https://proceedings.neurips.cc/paper/2020/file/e5a90182cc81e12ab5e72d66e0b46fe3-Paper.pdf},
volume = {33},
year = {2020}
}
@inproceedings{qiu-etal-2021-systematic,
title = "Systematic Generalization on g{SCAN}: {W}hat is Nearly Solved and What is Next?",
author = "Qiu, Linlu and
Hu, Hexiang and
Zhang, Bowen and
Shaw, Peter and
Sha, Fei",
booktitle = "Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing",
month = nov,
year = "2021",
address = "Online and Punta Cana, Dominican Republic",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2021.emnlp-main.166",
doi = "10.18653/v1/2021.emnlp-main.166",
pages = "2180--2188",
}
grounded_scan/compositional_splits (konfigurasi default)
Deskripsi konfigurasi : Contoh untuk generalisasi komposisi.
Ukuran unduhan :
82.10 MiB
Ukuran dataset :
998.11 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'adverb_1' | 112.880 |
'adverb_2' | 38.582 |
'contextual' | 11.460 |
'dev' | 3.716 |
'situational_1' | 88.642 |
'situational_2' | 16.808 |
'test' | 19.282 |
'train' | 367.933 |
'visual' | 37.436 |
'visual_easier' | 18.718 |
- Contoh ( tfds.as_dataframe ):
grounded_scan/target_length_split
Deskripsi konfigurasi : Contoh untuk menggeneralisasi ke panjang target yang lebih besar.
Ukuran unduhan :
53.41 MiB
Ukuran dataset :
546.73 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'dev' | 1.821 |
'target_lengths' | 198.588 |
'test' | 37.784 |
'train' | 180.301 |
- Contoh ( tfds.as_dataframe ):
grounded_scan/spatial_relation_splits
Deskripsi konfigurasi : Contoh untuk penalaran hubungan spasial.
Ukuran unduhan :
89.59 MiB
Ukuran dataset :
675.09 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'dev' | 2.617 |
'referent' | 30.492 |
'relation' | 6.285 |
'relative_position_1' | 41.576 |
'relative_position_2' | 41.529 |
'test' | 28.526 |
'train' | 259.088 |
'visual' | 62.250 |
- Contoh ( tfds.as_dataframe ):