- Mô tả :
Đây là tập dữ liệu được sử dụng cho Cuộc thi Công cụ Khai thác và Khám phá Tri thức Quốc tế lần thứ ba, được tổ chức cùng với Hội nghị Quốc tế lần thứ Năm về Khám phá Tri thức và Khai thác Dữ liệu của KDD-99. Nhiệm vụ cạnh tranh là xây dựng một bộ phát hiện xâm nhập mạng, một mô hình dự đoán có khả năng phân biệt giữa các kết nối 'xấu', được gọi là xâm nhập hoặc tấn công và các kết nối bình thường 'tốt'. Cơ sở dữ liệu này chứa một bộ dữ liệu chuẩn cần được kiểm toán, bao gồm nhiều loại hình xâm nhập được mô phỏng trong môi trường mạng quân sự.
Trang chủ : https://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
Mã nguồn :
tfds.structured.kddcup99.Kddcup99
Các phiên bản :
-
1.0.0
(mặc định): Bản phát hành ban đầu.
-
Kích thước tải xuống :
18.62 MiB
Kích thước tập dữ liệu :
5.25 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Tách :
Tách ra | Các ví dụ |
---|---|
'test' | 311.029 |
'train' | 4.898.431 |
- Các tính năng :
FeaturesDict({
'count': tf.int32,
'diff_srv_rate': tf.float32,
'dst_bytes': tf.int32,
'dst_host_count': tf.int32,
'dst_host_diff_srv_rate': tf.float32,
'dst_host_rerror_rate': tf.float32,
'dst_host_same_src_port_rate': tf.float32,
'dst_host_same_srv_rate': tf.float32,
'dst_host_serror_rate': tf.float32,
'dst_host_srv_count': tf.int32,
'dst_host_srv_diff_host_rate': tf.float32,
'dst_host_srv_rerror_rate': tf.float32,
'dst_host_srv_serror_rate': tf.float32,
'duration': tf.int32,
'flag': ClassLabel(shape=(), dtype=tf.int64, num_classes=11),
'hot': tf.int32,
'is_guest_login': tf.bool,
'is_hot_login': tf.bool,
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=40),
'land': tf.bool,
'logged_in': tf.bool,
'num_access_files': tf.int32,
'num_compromised': tf.int32,
'num_failed_logins': tf.int32,
'num_file_creations': tf.int32,
'num_outbound_cmds': tf.int32,
'num_root': tf.int32,
'num_shells': tf.int32,
'protocol_type': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'rerror_rate': tf.float32,
'root_shell': tf.bool,
'same_srv_rate': tf.float32,
'serror_rate': tf.float32,
'service': ClassLabel(shape=(), dtype=tf.int64, num_classes=71),
'src_bytes': tf.int32,
'srv_count': tf.int32,
'srv_diff_host_rate': tf.float32,
'srv_rerror_rate': tf.float32,
'srv_serror_rate': tf.float32,
'su_attempted': tf.int32,
'urgent': tf.int32,
'wrong_fragment': tf.int32,
})
Khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- Trích dẫn :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = 2017,
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and
Computer Sciences"
}