kddcup99

  • Mô tả :

Đây là tập dữ liệu được sử dụng cho Cuộc thi Công cụ Khai thác và Khám phá Tri thức Quốc tế lần thứ ba, được tổ chức cùng với Hội nghị Quốc tế lần thứ Năm về Khám phá Tri thức và Khai thác Dữ liệu của KDD-99. Nhiệm vụ cạnh tranh là xây dựng một bộ phát hiện xâm nhập mạng, một mô hình dự đoán có khả năng phân biệt giữa các kết nối 'xấu', được gọi là xâm nhập hoặc tấn công và các kết nối bình thường 'tốt'. Cơ sở dữ liệu này chứa một bộ dữ liệu chuẩn cần được kiểm toán, bao gồm nhiều loại hình xâm nhập được mô phỏng trong môi trường mạng quân sự.

Tách ra Các ví dụ
'test' 311.029
'train' 4.898.431
  • Các tính năng :
FeaturesDict({
    'count': tf.int32,
    'diff_srv_rate': tf.float32,
    'dst_bytes': tf.int32,
    'dst_host_count': tf.int32,
    'dst_host_diff_srv_rate': tf.float32,
    'dst_host_rerror_rate': tf.float32,
    'dst_host_same_src_port_rate': tf.float32,
    'dst_host_same_srv_rate': tf.float32,
    'dst_host_serror_rate': tf.float32,
    'dst_host_srv_count': tf.int32,
    'dst_host_srv_diff_host_rate': tf.float32,
    'dst_host_srv_rerror_rate': tf.float32,
    'dst_host_srv_serror_rate': tf.float32,
    'duration': tf.int32,
    'flag': ClassLabel(shape=(), dtype=tf.int64, num_classes=11),
    'hot': tf.int32,
    'is_guest_login': tf.bool,
    'is_hot_login': tf.bool,
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
    'land': tf.bool,
    'logged_in': tf.bool,
    'num_access_files': tf.int32,
    'num_compromised': tf.int32,
    'num_failed_logins': tf.int32,
    'num_file_creations': tf.int32,
    'num_outbound_cmds': tf.int32,
    'num_root': tf.int32,
    'num_shells': tf.int32,
    'protocol_type': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'rerror_rate': tf.float32,
    'root_shell': tf.bool,
    'same_srv_rate': tf.float32,
    'serror_rate': tf.float32,
    'service': ClassLabel(shape=(), dtype=tf.int64, num_classes=71),
    'src_bytes': tf.int32,
    'srv_count': tf.int32,
    'srv_diff_host_rate': tf.float32,
    'srv_rerror_rate': tf.float32,
    'srv_serror_rate': tf.float32,
    'su_attempted': tf.int32,
    'urgent': tf.int32,
    'wrong_fragment': tf.int32,
})
  • Trích dẫn :
@misc{Dua:2019 ,
  author = "Dua, Dheeru and Graff, Casey",
  year = 2017,
  title = "{UCI} Machine Learning Repository",
  url = "http://archive.ics.uci.edu/ml",
  institution = "University of California, Irvine, School of Information and
Computer Sciences"
}