kddcup99

  • توضیحات :

این مجموعه داده‌ای است که برای سومین مسابقه بین‌المللی ابزارهای کشف دانش و داده‌کاوی استفاده می‌شود، که همراه با KDD-99 پنجمین کنفرانس بین‌المللی کشف دانش و داده‌کاوی برگزار شد. وظیفه مسابقه ساخت یک آشکارساز نفوذ شبکه بود، یک مدل پیش بینی که قادر به تمایز بین اتصالات «بد»، به نام نفوذ یا حملات، و اتصالات عادی «خوب» است. این پایگاه داده حاوی مجموعه استانداردی از داده های مورد بازرسی است که شامل طیف گسترده ای از نفوذهای شبیه سازی شده در یک محیط شبکه نظامی است.

شکاف مثال ها
'test' 311,029
'train' 4,898,431
  • ساختار ویژگی :
FeaturesDict({
    'count': int32,
    'diff_srv_rate': float32,
    'dst_bytes': int32,
    'dst_host_count': int32,
    'dst_host_diff_srv_rate': float32,
    'dst_host_rerror_rate': float32,
    'dst_host_same_src_port_rate': float32,
    'dst_host_same_srv_rate': float32,
    'dst_host_serror_rate': float32,
    'dst_host_srv_count': int32,
    'dst_host_srv_diff_host_rate': float32,
    'dst_host_srv_rerror_rate': float32,
    'dst_host_srv_serror_rate': float32,
    'duration': int32,
    'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
    'hot': int32,
    'is_guest_login': bool,
    'is_hot_login': bool,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'land': bool,
    'logged_in': bool,
    'num_access_files': int32,
    'num_compromised': int32,
    'num_failed_logins': int32,
    'num_file_creations': int32,
    'num_outbound_cmds': int32,
    'num_root': int32,
    'num_shells': int32,
    'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'rerror_rate': float32,
    'root_shell': bool,
    'same_srv_rate': float32,
    'serror_rate': float32,
    'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
    'src_bytes': int32,
    'srv_count': int32,
    'srv_diff_host_rate': float32,
    'srv_rerror_rate': float32,
    'srv_serror_rate': float32,
    'su_attempted': int32,
    'urgent': int32,
    'wrong_fragment': int32,
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
شمردن تانسور int32
diff_srv_rate تانسور float32
dst_bytes تانسور int32
dst_host_count تانسور int32
dst_host_diff_srv_rate تانسور float32
dst_host_rerror_rate تانسور float32
dst_host_same_src_port_rate تانسور float32
dst_host_same_srv_rate تانسور float32
dst_host_serror_rate تانسور float32
dst_host_srv_count تانسور int32
dst_host_srv_diff_host_rate تانسور float32
dst_host_srv_rerror_rate تانسور float32
dst_host_srv_serror_rate تانسور float32
مدت زمان تانسور int32
پرچم ClassLabel int64
داغ تانسور int32
is_guest_login تانسور بوول
is_hot_login تانسور بوول
برچسب ClassLabel int64
زمین تانسور بوول
وارد شده تانسور بوول
num_access_files تانسور int32
num_compromised تانسور int32
num_failed_logins تانسور int32
num_file_creations تانسور int32
num_outbound_cmds تانسور int32
num_root تانسور int32
num_shells تانسور int32
پروتکل_نوع ClassLabel int64
خطا_نرخ تانسور float32
root_shell تانسور بوول
same_srv_rate تانسور float32
serror_rate تانسور float32
سرویس ClassLabel int64
src_bytes تانسور int32
srv_count تانسور int32
srv_diff_host_rate تانسور float32
srv_rerror_rate تانسور float32
srv_serror_rate تانسور float32
سو_تلاش کرد تانسور int32
فوری تانسور int32
اشتباه_قطعه تانسور int32
  • نقل قول :
@misc{Dua:2019 ,
  author = "Dua, Dheeru and Graff, Casey",
  year = 2017,
  title = "{UCI} Machine Learning Repository",
  url = "http://archive.ics.uci.edu/ml",
  institution = "University of California, Irvine, School of Information and
Computer Sciences"
}