- คำอธิบาย :
นี่คือชุดข้อมูลที่ใช้สำหรับการแข่งขันการค้นพบความรู้ระดับนานาชาติและเครื่องมือขุดข้อมูลครั้งที่สาม ซึ่งจัดขึ้นร่วมกับ KDD-99 การประชุมนานาชาติครั้งที่ห้าว่าด้วยการค้นพบความรู้และการทำเหมืองข้อมูล ภารกิจการแข่งขันคือการสร้างเครื่องตรวจจับการบุกรุกเครือข่าย ซึ่งเป็นโมเดลคาดการณ์ที่สามารถแยกความแตกต่างระหว่างการเชื่อมต่อที่ 'ไม่ดี' ซึ่งเรียกว่าการบุกรุกหรือการโจมตี และการเชื่อมต่อปกติที่ 'ดี' ฐานข้อมูลนี้มีชุดข้อมูลมาตรฐานที่ต้องตรวจสอบ ซึ่งรวมถึงการบุกรุกที่หลากหลายซึ่งจำลองขึ้นในสภาพแวดล้อมเครือข่ายทางทหาร
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
หน้าแรก : https://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
รหัสที่มา :
tfds.datasets.kddcup99.Builder
รุ่น :
-
1.0.0
: การเปิดตัวครั้งแรก -
1.0.1
(ค่าเริ่มต้น): แก้ไขการแยกวิเคราะห์ฟิลด์บูลีนland
,logged_in
,root_shell
,is_hot_login
และis_guest_login
-
ขนาดการดาวน์โหลด :
18.62 MiB
ขนาดชุดข้อมูล :
5.25 GiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 311,029 |
'train' | 4,898,431 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'count': int32,
'diff_srv_rate': float32,
'dst_bytes': int32,
'dst_host_count': int32,
'dst_host_diff_srv_rate': float32,
'dst_host_rerror_rate': float32,
'dst_host_same_src_port_rate': float32,
'dst_host_same_srv_rate': float32,
'dst_host_serror_rate': float32,
'dst_host_srv_count': int32,
'dst_host_srv_diff_host_rate': float32,
'dst_host_srv_rerror_rate': float32,
'dst_host_srv_serror_rate': float32,
'duration': int32,
'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
'hot': int32,
'is_guest_login': bool,
'is_hot_login': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
'land': bool,
'logged_in': bool,
'num_access_files': int32,
'num_compromised': int32,
'num_failed_logins': int32,
'num_file_creations': int32,
'num_outbound_cmds': int32,
'num_root': int32,
'num_shells': int32,
'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
'rerror_rate': float32,
'root_shell': bool,
'same_srv_rate': float32,
'serror_rate': float32,
'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
'src_bytes': int32,
'srv_count': int32,
'srv_diff_host_rate': float32,
'srv_rerror_rate': float32,
'srv_serror_rate': float32,
'su_attempted': int32,
'urgent': int32,
'wrong_fragment': int32,
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
นับ | เทนเซอร์ | int32 | ||
diff_srv_rate | เทนเซอร์ | ลอย32 | ||
dst_bytes | เทนเซอร์ | int32 | ||
dst_host_count | เทนเซอร์ | int32 | ||
dst_host_diff_srv_rate | เทนเซอร์ | ลอย32 | ||
dst_host_rerror_rate | เทนเซอร์ | ลอย32 | ||
dst_host_same_src_port_rate | เทนเซอร์ | ลอย32 | ||
dst_host_same_srv_rate | เทนเซอร์ | ลอย32 | ||
dst_host_serror_rate | เทนเซอร์ | ลอย32 | ||
dst_host_srv_count | เทนเซอร์ | int32 | ||
dst_host_srv_diff_host_rate | เทนเซอร์ | ลอย32 | ||
dst_host_srv_rerror_rate | เทนเซอร์ | ลอย32 | ||
dst_host_srv_serror_rate | เทนเซอร์ | ลอย32 | ||
ระยะเวลา | เทนเซอร์ | int32 | ||
ธง | ป้ายกำกับคลาส | int64 | ||
ร้อน | เทนเซอร์ | int32 | ||
is_guest_login | เทนเซอร์ | บูล | ||
is_hot_login | เทนเซอร์ | บูล | ||
ฉลาก | ป้ายกำกับคลาส | int64 | ||
ที่ดิน | เทนเซอร์ | บูล | ||
เข้าสู่ระบบ | เทนเซอร์ | บูล | ||
num_access_files | เทนเซอร์ | int32 | ||
num_compromised | เทนเซอร์ | int32 | ||
num_failed_logins | เทนเซอร์ | int32 | ||
num_file_creations | เทนเซอร์ | int32 | ||
num_outbound_cmds | เทนเซอร์ | int32 | ||
num_root | เทนเซอร์ | int32 | ||
num_shells | เทนเซอร์ | int32 | ||
protocol_type | ป้ายกำกับคลาส | int64 | ||
rerror_rate | เทนเซอร์ | ลอย32 | ||
root_shell | เทนเซอร์ | บูล | ||
same_srv_rate | เทนเซอร์ | ลอย32 | ||
serror_rate | เทนเซอร์ | ลอย32 | ||
บริการ | ป้ายกำกับคลาส | int64 | ||
src_bytes | เทนเซอร์ | int32 | ||
srv_count | เทนเซอร์ | int32 | ||
srv_diff_host_rate | เทนเซอร์ | ลอย32 | ||
srv_rerror_rate | เทนเซอร์ | ลอย32 | ||
srv_serror_rate | เทนเซอร์ | ลอย32 | ||
su_attempted | เทนเซอร์ | int32 | ||
ด่วน | เทนเซอร์ | int32 | ||
ผิด_ส่วน | เทนเซอร์ | int32 |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = 2017,
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and
Computer Sciences"
}