- Keterangan :
PASS adalah kumpulan data gambar berskala besar yang tidak menyertakan manusia, bagian tubuh manusia, atau informasi identitas pribadi lainnya. Ini dapat digunakan untuk pra-pelatihan dengan pengawasan mandiri berkualitas tinggi sekaligus mengurangi masalah privasi secara signifikan.
PASS berisi 1.439.589 gambar tanpa label apa pun yang bersumber dari YFCC-100M.
Semua gambar dalam kumpulan data ini dilisensikan di bawah lisensi CC-BY, begitu pula kumpulan data itu sendiri. Untuk YFCC-100M lihat http://www.multimediacommons.org/
Dokumentasi Tambahan : Jelajahi Makalah Dengan Kode
Kode sumber :
tfds.datasets.pass.Builder
Versi :
-
1.0.0
: Rilis awal. -
2.0.0
: v2: Menghapus 472 gambar dari v1 karena berisi manusia. Juga menambahkan metadata: data yang diambil dan GPS. -
3.0.0
(default): v3: Menghapus 131 gambar dari v2 karena berisi manusia/tato.
-
Ukuran unduhan :
167.30 GiB
Ukuran kumpulan data :
166.43 GiB
Cache otomatis ( dokumentasi ): Tidak
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 1.439.588 |
- Struktur fitur :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Tipe D | Keterangan |
---|---|---|---|---|
FiturDict | ||||
gambar | Gambar | (Tidak ada, Tidak ada, 3) | uint8 | |
gambar/nama_pencipta | Teks | rangkaian | ||
gambar/tanggal_diambil | Teks | rangkaian | ||
gambar/gps_lat | Tensor | float32 | ||
gambar/gps_lon | Tensor | float32 | ||
gambar/hash | Teks | rangkaian |
Kunci yang diawasi (Lihat dokumen
as_supervised
):None
Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):
- Kutipan :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}