kddcup99

  • תיאור :

זהו מערך הנתונים המשמש לתחרות ה-Third International Knowledge Discovery and Mining Tools, שהתקיימה בשיתוף עם KDD-99 הכנס הבינלאומי החמישי בנושא גילוי ידע וכריית נתונים. משימת התחרות הייתה לבנות גלאי חדירת רשת, מודל חיזוי המסוגל להבחין בין חיבורים 'רעים', הנקראים פריצות או התקפות, לבין חיבורים רגילים 'טובים'. מסד נתונים זה מכיל סט נתונים סטנדרטי לביקורת, הכולל מגוון רחב של פריצות המדומות בסביבת רשת צבאית.

לְפַצֵל דוגמאות
'test' 311,029
'train' 4,898,431
  • מבנה תכונה :
FeaturesDict({
    'count': int32,
    'diff_srv_rate': float32,
    'dst_bytes': int32,
    'dst_host_count': int32,
    'dst_host_diff_srv_rate': float32,
    'dst_host_rerror_rate': float32,
    'dst_host_same_src_port_rate': float32,
    'dst_host_same_srv_rate': float32,
    'dst_host_serror_rate': float32,
    'dst_host_srv_count': int32,
    'dst_host_srv_diff_host_rate': float32,
    'dst_host_srv_rerror_rate': float32,
    'dst_host_srv_serror_rate': float32,
    'duration': int32,
    'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
    'hot': int32,
    'is_guest_login': bool,
    'is_hot_login': bool,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'land': bool,
    'logged_in': bool,
    'num_access_files': int32,
    'num_compromised': int32,
    'num_failed_logins': int32,
    'num_file_creations': int32,
    'num_outbound_cmds': int32,
    'num_root': int32,
    'num_shells': int32,
    'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'rerror_rate': float32,
    'root_shell': bool,
    'same_srv_rate': float32,
    'serror_rate': float32,
    'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
    'src_bytes': int32,
    'srv_count': int32,
    'srv_diff_host_rate': float32,
    'srv_rerror_rate': float32,
    'srv_serror_rate': float32,
    'su_attempted': int32,
    'urgent': int32,
    'wrong_fragment': int32,
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
לספור מוֹתֵחַ int32
diff_srv_rate מוֹתֵחַ לצוף32
dst_bytes מוֹתֵחַ int32
dst_host_count מוֹתֵחַ int32
dst_host_diff_srv_rate מוֹתֵחַ לצוף32
dst_host_rerror_rate מוֹתֵחַ לצוף32
dst_host_same_src_port_rate מוֹתֵחַ לצוף32
dst_host_same_srv_rate מוֹתֵחַ לצוף32
dst_host_serror_rate מוֹתֵחַ לצוף32
dst_host_srv_count מוֹתֵחַ int32
dst_host_srv_diff_host_rate מוֹתֵחַ לצוף32
dst_host_srv_rerror_rate מוֹתֵחַ לצוף32
dst_host_srv_serror_rate מוֹתֵחַ לצוף32
מֶשֶׁך מוֹתֵחַ int32
דֶגֶל ClassLabel int64
חַם מוֹתֵחַ int32
הוא_אורח_כניסה מוֹתֵחַ bool
is_hot_login מוֹתֵחַ bool
תווית ClassLabel int64
ארץ מוֹתֵחַ bool
מחובר מוֹתֵחַ bool
num_access_files מוֹתֵחַ int32
num_comompromised מוֹתֵחַ int32
num_failed_logins מוֹתֵחַ int32
num_file_creations מוֹתֵחַ int32
num_outbound_cmds מוֹתֵחַ int32
num_root מוֹתֵחַ int32
num_shells מוֹתֵחַ int32
protocol_type ClassLabel int64
rror_rate מוֹתֵחַ לצוף32
root_shell מוֹתֵחַ bool
same_srv_rate מוֹתֵחַ לצוף32
serror_rate מוֹתֵחַ לצוף32
שֵׁרוּת ClassLabel int64
src_bytes מוֹתֵחַ int32
srv_count מוֹתֵחַ int32
srv_diff_host_rate מוֹתֵחַ לצוף32
srv_rerror_rate מוֹתֵחַ לצוף32
srv_serror_rate מוֹתֵחַ לצוף32
סו_ניסיון מוֹתֵחַ int32
דחוף מוֹתֵחַ int32
קטע_שגוי מוֹתֵחַ int32
  • ציטוט :
@misc{Dua:2019 ,
  author = "Dua, Dheeru and Graff, Casey",
  year = 2017,
  title = "{UCI} Machine Learning Repository",
  url = "http://archive.ics.uci.edu/ml",
  institution = "University of California, Irvine, School of Information and
Computer Sciences"
}