kddcup99

  • คำอธิบาย :

นี่คือชุดข้อมูลที่ใช้สำหรับการแข่งขันการค้นพบความรู้ระดับนานาชาติและเครื่องมือขุดข้อมูลครั้งที่สาม ซึ่งจัดขึ้นร่วมกับ KDD-99 การประชุมนานาชาติครั้งที่ห้าว่าด้วยการค้นพบความรู้และการทำเหมืองข้อมูล ภารกิจการแข่งขันคือการสร้างเครื่องตรวจจับการบุกรุกเครือข่าย ซึ่งเป็นโมเดลคาดการณ์ที่สามารถแยกความแตกต่างระหว่างการเชื่อมต่อที่ 'ไม่ดี' ซึ่งเรียกว่าการบุกรุกหรือการโจมตี และการเชื่อมต่อปกติที่ 'ดี' ฐานข้อมูลนี้มีชุดข้อมูลมาตรฐานที่ต้องตรวจสอบ ซึ่งรวมถึงการบุกรุกที่หลากหลายซึ่งจำลองขึ้นในสภาพแวดล้อมเครือข่ายทางทหาร

แยก ตัวอย่าง
'test' 311,029
'train' 4,898,431
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
   
'count': int32,
   
'diff_srv_rate': float32,
   
'dst_bytes': int32,
   
'dst_host_count': int32,
   
'dst_host_diff_srv_rate': float32,
   
'dst_host_rerror_rate': float32,
   
'dst_host_same_src_port_rate': float32,
   
'dst_host_same_srv_rate': float32,
   
'dst_host_serror_rate': float32,
   
'dst_host_srv_count': int32,
   
'dst_host_srv_diff_host_rate': float32,
   
'dst_host_srv_rerror_rate': float32,
   
'dst_host_srv_serror_rate': float32,
   
'duration': int32,
   
'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
   
'hot': int32,
   
'is_guest_login': bool,
   
'is_hot_login': bool,
   
'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
   
'land': bool,
   
'logged_in': bool,
   
'num_access_files': int32,
   
'num_compromised': int32,
   
'num_failed_logins': int32,
   
'num_file_creations': int32,
   
'num_outbound_cmds': int32,
   
'num_root': int32,
   
'num_shells': int32,
   
'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
   
'rerror_rate': float32,
   
'root_shell': bool,
   
'same_srv_rate': float32,
   
'serror_rate': float32,
   
'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
   
'src_bytes': int32,
   
'srv_count': int32,
   
'srv_diff_host_rate': float32,
   
'srv_rerror_rate': float32,
   
'srv_serror_rate': float32,
   
'su_attempted': int32,
   
'urgent': int32,
   
'wrong_fragment': int32,
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
นับ เทนเซอร์ int32
diff_srv_rate เทนเซอร์ ลอย32
dst_bytes เทนเซอร์ int32
dst_host_count เทนเซอร์ int32
dst_host_diff_srv_rate เทนเซอร์ ลอย32
dst_host_rerror_rate เทนเซอร์ ลอย32
dst_host_same_src_port_rate เทนเซอร์ ลอย32
dst_host_same_srv_rate เทนเซอร์ ลอย32
dst_host_serror_rate เทนเซอร์ ลอย32
dst_host_srv_count เทนเซอร์ int32
dst_host_srv_diff_host_rate เทนเซอร์ ลอย32
dst_host_srv_rerror_rate เทนเซอร์ ลอย32
dst_host_srv_serror_rate เทนเซอร์ ลอย32
ระยะเวลา เทนเซอร์ int32
ธง ป้ายกำกับคลาส int64
ร้อน เทนเซอร์ int32
is_guest_login เทนเซอร์ บูล
is_hot_login เทนเซอร์ บูล
ฉลาก ป้ายกำกับคลาส int64
ที่ดิน เทนเซอร์ บูล
เข้าสู่ระบบ เทนเซอร์ บูล
num_access_files เทนเซอร์ int32
num_compromised เทนเซอร์ int32
num_failed_logins เทนเซอร์ int32
num_file_creations เทนเซอร์ int32
num_outbound_cmds เทนเซอร์ int32
num_root เทนเซอร์ int32
num_shells เทนเซอร์ int32
protocol_type ป้ายกำกับคลาส int64
rerror_rate เทนเซอร์ ลอย32
root_shell เทนเซอร์ บูล
same_srv_rate เทนเซอร์ ลอย32
serror_rate เทนเซอร์ ลอย32
บริการ ป้ายกำกับคลาส int64
src_bytes เทนเซอร์ int32
srv_count เทนเซอร์ int32
srv_diff_host_rate เทนเซอร์ ลอย32
srv_rerror_rate เทนเซอร์ ลอย32
srv_serror_rate เทนเซอร์ ลอย32
su_attempted เทนเซอร์ int32
ด่วน เทนเซอร์ int32
ผิด_ส่วน เทนเซอร์ int32
  • การอ้างอิง :
@misc{Dua:2019 ,
  author
= "Dua, Dheeru and Graff, Casey",
  year
= 2017,
  title
= "{UCI} Machine Learning Repository",
  url
= "http://archive.ics.uci.edu/ml",
  institution
= "University of California, Irvine, School of Information and
Computer Sciences"

}