- Deskripsi :
Dataset ini berisi 14.344.391 kata sandi yang bocor atau dicuri dari berbagai situs. Penulis kumpulan data ini menyatakan bahwa "Saya menghostingnya karena sepertinya tidak ada orang lain yang melakukannya (mudah-mudahan bukan karena menghostingnya ilegal :)). Tentu saja, bukan saya yang mencuri ini; saya hanya menemukan mereka secara online, hapus semua nama/alamat email/dll.".
Kumpulan data ini digunakan untuk melatih model Machine Learning untuk menebak dan memecahkan kata sandi.
Beranda : https://wiki.skullsecurity.org/Passwords
Kode sumber :
tfds.datasets.rock_you.BuilderVersi :
-
1.0.0(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
133.44 MiBUkuran dataset :
393.36 MiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 14.344.391 |
- Struktur fitur :
FeaturesDict({
'password': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| kata sandi | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):NoneGambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :