kddcup99

  • Deskripsi :

Ini adalah kumpulan data yang digunakan untuk The Third International Knowledge Discovery and Data Mining Tools Competition, yang diselenggarakan bersamaan dengan KDD-99 The Fifth International Conference on Knowledge Discovery and Data Mining. Tugas kompetisi adalah membangun detektor intrusi jaringan, model prediktif yang mampu membedakan antara koneksi 'buruk', yang disebut intrusi atau serangan, dan koneksi normal yang 'baik'. Basis data ini berisi kumpulan data standar yang akan diaudit, yang mencakup berbagai macam intrusi yang disimulasikan dalam lingkungan jaringan militer.

Membelah Contoh
'test' 311.029
'train' 4.898.431
  • Struktur fitur :
FeaturesDict({
    'count': int32,
    'diff_srv_rate': float32,
    'dst_bytes': int32,
    'dst_host_count': int32,
    'dst_host_diff_srv_rate': float32,
    'dst_host_rerror_rate': float32,
    'dst_host_same_src_port_rate': float32,
    'dst_host_same_srv_rate': float32,
    'dst_host_serror_rate': float32,
    'dst_host_srv_count': int32,
    'dst_host_srv_diff_host_rate': float32,
    'dst_host_srv_rerror_rate': float32,
    'dst_host_srv_serror_rate': float32,
    'duration': int32,
    'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
    'hot': int32,
    'is_guest_login': bool,
    'is_hot_login': bool,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'land': bool,
    'logged_in': bool,
    'num_access_files': int32,
    'num_compromised': int32,
    'num_failed_logins': int32,
    'num_file_creations': int32,
    'num_outbound_cmds': int32,
    'num_root': int32,
    'num_shells': int32,
    'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'rerror_rate': float32,
    'root_shell': bool,
    'same_srv_rate': float32,
    'serror_rate': float32,
    'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
    'src_bytes': int32,
    'srv_count': int32,
    'srv_diff_host_rate': float32,
    'srv_rerror_rate': float32,
    'srv_serror_rate': float32,
    'su_attempted': int32,
    'urgent': int32,
    'wrong_fragment': int32,
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
menghitung Tensor int32
diff_srv_rate Tensor float32
dst_bytes Tensor int32
dst_host_count Tensor int32
dst_host_diff_srv_rate Tensor float32
dst_host_rerror_rate Tensor float32
dst_Host_same_src_port_rate Tensor float32
dst_Host_same_srv_rate Tensor float32
dst_host_serror_rate Tensor float32
dst_host_srv_count Tensor int32
dst_host_srv_diff_host_rate Tensor float32
dst_host_srv_rerror_rate Tensor float32
dst_host_srv_serror_rate Tensor float32
durasi Tensor int32
bendera LabelKelas int64
panas Tensor int32
is_guest_login Tensor bool
is_hot_login Tensor bool
label LabelKelas int64
tanah Tensor bool
login_in Tensor bool
num_access_files Tensor int32
num_compromised Tensor int32
num_failed_login Tensor int32
num_file_kreasi Tensor int32
num_outbound_cmds Tensor int32
num_root Tensor int32
num_shells Tensor int32
protocol_type LabelKelas int64
tingkat_kesalahan Tensor float32
root_shell Tensor bool
sama_srv_rate Tensor float32
tingkat kesalahan Tensor float32
melayani LabelKelas int64
src_bytes Tensor int32
srv_count Tensor int32
srv_diff_host_rate Tensor float32
srv_rerror_rate Tensor float32
srv_serror_rate Tensor float32
su_attempted Tensor int32
mendesak Tensor int32
salah_fragmen Tensor int32
  • Kutipan :
@misc{Dua:2019 ,
  author = "Dua, Dheeru and Graff, Casey",
  year = 2017,
  title = "{UCI} Machine Learning Repository",
  url = "http://archive.ics.uci.edu/ml",
  institution = "University of California, Irvine, School of Information and
Computer Sciences"
}