हिला देेंगे

  • विवरण :

इस डेटासेट में 14,344,391 पासवर्ड हैं जो विभिन्न साइटों से लीक या चोरी हुए थे। इस डेटासेट के लेखक का कहना है कि "मैं उन्हें होस्ट कर रहा हूं क्योंकि ऐसा लगता है कि कोई और नहीं करता है (उम्मीद है कि ऐसा इसलिए नहीं है क्योंकि उन्हें होस्ट करना अवैध है :))। स्वाभाविक रूप से, मैं वह नहीं हूं जिसने इन्हें चुराया है; मैंने बस पाया उन्हें ऑनलाइन किया, किसी भी नाम/ईमेल पते/आदि को हटा दिया।"

इस डेटासेट का उपयोग पासवर्ड अनुमान लगाने और क्रैक करने के लिए मशीन लर्निंग मॉडल को प्रशिक्षित करने के लिए किया जाता है।

विभाजित करना उदाहरण
'train' 14,344,391
  • विशेषताएं :
FeaturesDict({
    'password': Text(shape=(), dtype=tf.string),
})
  • उद्धरण :