- תיאור :
זהו מערך הנתונים המשמש לתחרות ה-Third International Knowledge Discovery and Mining Tools, שהתקיימה בשיתוף עם KDD-99 הכנס הבינלאומי החמישי בנושא גילוי ידע וכריית נתונים. משימת התחרות הייתה לבנות גלאי חדירת רשת, מודל חיזוי המסוגל להבחין בין חיבורים 'רעים', הנקראים פריצות או התקפות, לבין חיבורים רגילים 'טובים'. מסד נתונים זה מכיל סט נתונים סטנדרטי לביקורת, הכולל מגוון רחב של פריצות המדומות בסביבת רשת צבאית.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
קוד מקור :
tfds.datasets.kddcup99.Builder
גרסאות :
-
1.0.0
: שחרור ראשוני. -
1.0.1
(ברירת מחדל): מתקן ניתוח של שדות בוליאנייםland
,logged_in
,root_shell
,is_hot_login
ו-is_guest_login
.
-
גודל הורדה :
18.62 MiB
גודל מערך נתונים :
5.25 GiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 311,029 |
'train' | 4,898,431 |
- מבנה תכונה :
FeaturesDict({
'count': int32,
'diff_srv_rate': float32,
'dst_bytes': int32,
'dst_host_count': int32,
'dst_host_diff_srv_rate': float32,
'dst_host_rerror_rate': float32,
'dst_host_same_src_port_rate': float32,
'dst_host_same_srv_rate': float32,
'dst_host_serror_rate': float32,
'dst_host_srv_count': int32,
'dst_host_srv_diff_host_rate': float32,
'dst_host_srv_rerror_rate': float32,
'dst_host_srv_serror_rate': float32,
'duration': int32,
'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
'hot': int32,
'is_guest_login': bool,
'is_hot_login': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
'land': bool,
'logged_in': bool,
'num_access_files': int32,
'num_compromised': int32,
'num_failed_logins': int32,
'num_file_creations': int32,
'num_outbound_cmds': int32,
'num_root': int32,
'num_shells': int32,
'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
'rerror_rate': float32,
'root_shell': bool,
'same_srv_rate': float32,
'serror_rate': float32,
'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
'src_bytes': int32,
'srv_count': int32,
'srv_diff_host_rate': float32,
'srv_rerror_rate': float32,
'srv_serror_rate': float32,
'su_attempted': int32,
'urgent': int32,
'wrong_fragment': int32,
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
לספור | מוֹתֵחַ | int32 | ||
diff_srv_rate | מוֹתֵחַ | לצוף32 | ||
dst_bytes | מוֹתֵחַ | int32 | ||
dst_host_count | מוֹתֵחַ | int32 | ||
dst_host_diff_srv_rate | מוֹתֵחַ | לצוף32 | ||
dst_host_rerror_rate | מוֹתֵחַ | לצוף32 | ||
dst_host_same_src_port_rate | מוֹתֵחַ | לצוף32 | ||
dst_host_same_srv_rate | מוֹתֵחַ | לצוף32 | ||
dst_host_serror_rate | מוֹתֵחַ | לצוף32 | ||
dst_host_srv_count | מוֹתֵחַ | int32 | ||
dst_host_srv_diff_host_rate | מוֹתֵחַ | לצוף32 | ||
dst_host_srv_rerror_rate | מוֹתֵחַ | לצוף32 | ||
dst_host_srv_serror_rate | מוֹתֵחַ | לצוף32 | ||
מֶשֶׁך | מוֹתֵחַ | int32 | ||
דֶגֶל | ClassLabel | int64 | ||
חַם | מוֹתֵחַ | int32 | ||
הוא_אורח_כניסה | מוֹתֵחַ | bool | ||
is_hot_login | מוֹתֵחַ | bool | ||
תווית | ClassLabel | int64 | ||
ארץ | מוֹתֵחַ | bool | ||
מחובר | מוֹתֵחַ | bool | ||
num_access_files | מוֹתֵחַ | int32 | ||
num_comompromised | מוֹתֵחַ | int32 | ||
num_failed_logins | מוֹתֵחַ | int32 | ||
num_file_creations | מוֹתֵחַ | int32 | ||
num_outbound_cmds | מוֹתֵחַ | int32 | ||
num_root | מוֹתֵחַ | int32 | ||
num_shells | מוֹתֵחַ | int32 | ||
protocol_type | ClassLabel | int64 | ||
rror_rate | מוֹתֵחַ | לצוף32 | ||
root_shell | מוֹתֵחַ | bool | ||
same_srv_rate | מוֹתֵחַ | לצוף32 | ||
serror_rate | מוֹתֵחַ | לצוף32 | ||
שֵׁרוּת | ClassLabel | int64 | ||
src_bytes | מוֹתֵחַ | int32 | ||
srv_count | מוֹתֵחַ | int32 | ||
srv_diff_host_rate | מוֹתֵחַ | לצוף32 | ||
srv_rerror_rate | מוֹתֵחַ | לצוף32 | ||
srv_serror_rate | מוֹתֵחַ | לצוף32 | ||
סו_ניסיון | מוֹתֵחַ | int32 | ||
דחוף | מוֹתֵחַ | int32 | ||
קטע_שגוי | מוֹתֵחַ | int32 |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = 2017,
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and
Computer Sciences"
}