- توضیحات :
این مجموعه دادهای است که برای سومین مسابقه بینالمللی ابزارهای کشف دانش و دادهکاوی استفاده میشود، که همراه با KDD-99 پنجمین کنفرانس بینالمللی کشف دانش و دادهکاوی برگزار شد. وظیفه مسابقه ساخت یک آشکارساز نفوذ شبکه بود، یک مدل پیش بینی که قادر به تمایز بین اتصالات «بد»، به نام نفوذ یا حملات، و اتصالات عادی «خوب» است. این پایگاه داده حاوی مجموعه استانداردی از داده های مورد بازرسی است که شامل طیف گسترده ای از نفوذهای شبیه سازی شده در یک محیط شبکه نظامی است.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
کد منبع :
tfds.datasets.kddcup99.Builder
نسخه ها :
-
1.0.0
: انتشار اولیه. -
1.0.1
(پیشفرض): تجزیه فیلدهای بولیland
،logged_in
،root_shell
،is_hot_login
وis_guest_login
.
-
حجم دانلود :
18.62 MiB
حجم مجموعه داده :
5.25 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 311,029 |
'train' | 4,898,431 |
- ساختار ویژگی :
FeaturesDict({
'count': int32,
'diff_srv_rate': float32,
'dst_bytes': int32,
'dst_host_count': int32,
'dst_host_diff_srv_rate': float32,
'dst_host_rerror_rate': float32,
'dst_host_same_src_port_rate': float32,
'dst_host_same_srv_rate': float32,
'dst_host_serror_rate': float32,
'dst_host_srv_count': int32,
'dst_host_srv_diff_host_rate': float32,
'dst_host_srv_rerror_rate': float32,
'dst_host_srv_serror_rate': float32,
'duration': int32,
'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
'hot': int32,
'is_guest_login': bool,
'is_hot_login': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
'land': bool,
'logged_in': bool,
'num_access_files': int32,
'num_compromised': int32,
'num_failed_logins': int32,
'num_file_creations': int32,
'num_outbound_cmds': int32,
'num_root': int32,
'num_shells': int32,
'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
'rerror_rate': float32,
'root_shell': bool,
'same_srv_rate': float32,
'serror_rate': float32,
'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
'src_bytes': int32,
'srv_count': int32,
'srv_diff_host_rate': float32,
'srv_rerror_rate': float32,
'srv_serror_rate': float32,
'su_attempted': int32,
'urgent': int32,
'wrong_fragment': int32,
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
شمردن | تانسور | int32 | ||
diff_srv_rate | تانسور | float32 | ||
dst_bytes | تانسور | int32 | ||
dst_host_count | تانسور | int32 | ||
dst_host_diff_srv_rate | تانسور | float32 | ||
dst_host_rerror_rate | تانسور | float32 | ||
dst_host_same_src_port_rate | تانسور | float32 | ||
dst_host_same_srv_rate | تانسور | float32 | ||
dst_host_serror_rate | تانسور | float32 | ||
dst_host_srv_count | تانسور | int32 | ||
dst_host_srv_diff_host_rate | تانسور | float32 | ||
dst_host_srv_rerror_rate | تانسور | float32 | ||
dst_host_srv_serror_rate | تانسور | float32 | ||
مدت زمان | تانسور | int32 | ||
پرچم | ClassLabel | int64 | ||
داغ | تانسور | int32 | ||
is_guest_login | تانسور | بوول | ||
is_hot_login | تانسور | بوول | ||
برچسب | ClassLabel | int64 | ||
زمین | تانسور | بوول | ||
وارد شده | تانسور | بوول | ||
num_access_files | تانسور | int32 | ||
num_compromised | تانسور | int32 | ||
num_failed_logins | تانسور | int32 | ||
num_file_creations | تانسور | int32 | ||
num_outbound_cmds | تانسور | int32 | ||
num_root | تانسور | int32 | ||
num_shells | تانسور | int32 | ||
پروتکل_نوع | ClassLabel | int64 | ||
خطا_نرخ | تانسور | float32 | ||
root_shell | تانسور | بوول | ||
same_srv_rate | تانسور | float32 | ||
serror_rate | تانسور | float32 | ||
سرویس | ClassLabel | int64 | ||
src_bytes | تانسور | int32 | ||
srv_count | تانسور | int32 | ||
srv_diff_host_rate | تانسور | float32 | ||
srv_rerror_rate | تانسور | float32 | ||
srv_serror_rate | تانسور | float32 | ||
سو_تلاش کرد | تانسور | int32 | ||
فوری | تانسور | int32 | ||
اشتباه_قطعه | تانسور | int32 |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = 2017,
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and
Computer Sciences"
}