kddcup99

  • Mô tả :

Đây là bộ dữ liệu được sử dụng cho Cuộc thi Công cụ Khai thác Dữ liệu và Khám phá Tri thức Quốc tế lần thứ ba, được tổ chức cùng với KDD-99 Hội nghị Quốc tế lần thứ năm về Khám phá Tri thức và Khai thác Dữ liệu. Nhiệm vụ của cuộc thi là xây dựng một bộ phát hiện xâm nhập mạng, một mô hình dự đoán có khả năng phân biệt giữa các kết nối 'xấu', được gọi là xâm nhập hoặc tấn công và các kết nối thông thường 'tốt'. Cơ sở dữ liệu này chứa một bộ dữ liệu tiêu chuẩn sẽ được kiểm tra, bao gồm nhiều loại xâm nhập được mô phỏng trong môi trường mạng quân sự.

Tách ra ví dụ
'test' 311,029
'train' 4.898.431
  • Cấu trúc tính năng :
FeaturesDict({
    'count': int32,
    'diff_srv_rate': float32,
    'dst_bytes': int32,
    'dst_host_count': int32,
    'dst_host_diff_srv_rate': float32,
    'dst_host_rerror_rate': float32,
    'dst_host_same_src_port_rate': float32,
    'dst_host_same_srv_rate': float32,
    'dst_host_serror_rate': float32,
    'dst_host_srv_count': int32,
    'dst_host_srv_diff_host_rate': float32,
    'dst_host_srv_rerror_rate': float32,
    'dst_host_srv_serror_rate': float32,
    'duration': int32,
    'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
    'hot': int32,
    'is_guest_login': bool,
    'is_hot_login': bool,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'land': bool,
    'logged_in': bool,
    'num_access_files': int32,
    'num_compromised': int32,
    'num_failed_logins': int32,
    'num_file_creations': int32,
    'num_outbound_cmds': int32,
    'num_root': int32,
    'num_shells': int32,
    'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'rerror_rate': float32,
    'root_shell': bool,
    'same_srv_rate': float32,
    'serror_rate': float32,
    'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
    'src_bytes': int32,
    'srv_count': int32,
    'srv_diff_host_rate': float32,
    'srv_rerror_rate': float32,
    'srv_serror_rate': float32,
    'su_attempted': int32,
    'urgent': int32,
    'wrong_fragment': int32,
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự miêu tả
Tính năngDict
đếm tenxơ int32
diff_srv_rate tenxơ phao32
dst_byte tenxơ int32
dst_host_count tenxơ int32
dst_host_diff_srv_rate tenxơ phao32
dst_host_rerror_rate tenxơ phao32
dst_host_same_src_port_rate tenxơ phao32
dst_host_same_srv_rate tenxơ phao32
dst_host_serror_rate tenxơ phao32
dst_host_srv_count tenxơ int32
dst_host_srv_diff_host_rate tenxơ phao32
dst_host_srv_rerror_rate tenxơ phao32
dst_host_srv_serror_rate tenxơ phao32
khoảng thời gian tenxơ int32
lá cờ LớpNhãn int64
nóng bức tenxơ int32
is_guest_login tenxơ bool
is_hot_login tenxơ bool
nhãn mác LớpNhãn int64
đất tenxơ bool
đăng nhập tenxơ bool
num_access_files tenxơ int32
num_compromised tenxơ int32
num_failed_logins tenxơ int32
num_file_creations tenxơ int32
num_outbound_cmds tenxơ int32
số_root tenxơ int32
num_shells tenxơ int32
giao thức_type LớpNhãn int64
rerror_rate tenxơ phao32
Vỏ rễ tenxơ bool
same_srv_rate tenxơ phao32
serror_rate tenxơ phao32
dịch vụ LớpNhãn int64
src_byte tenxơ int32
srv_count tenxơ int32
srv_diff_host_rate tenxơ phao32
srv_rerror_rate tenxơ phao32
srv_serror_rate tenxơ phao32
su_attempted tenxơ int32
cấp bách tenxơ int32
sai_đoạn tenxơ int32
  • trích dẫn :
@misc{Dua:2019 ,
  author = "Dua, Dheeru and Graff, Casey",
  year = 2017,
  title = "{UCI} Machine Learning Repository",
  url = "http://archive.ics.uci.edu/ml",
  institution = "University of California, Irvine, School of Information and
Computer Sciences"
}