- Descriptif :
Il s'agit de l'ensemble de données utilisé pour le troisième concours international d'outils de découverte de connaissances et d'exploration de données, qui s'est tenu conjointement avec KDD-99, la cinquième conférence internationale sur la découverte de connaissances et l'exploration de données. La tâche du concours était de construire un détecteur d'intrusion réseau, un modèle prédictif capable de faire la distinction entre les « mauvaises » connexions, appelées intrusions ou attaques, et les « bonnes » connexions normales. Cette base de données contient un ensemble standard de données à auditer, qui comprend une grande variété d'intrusions simulées dans un environnement de réseau militaire.
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html
Code source :
tfds.datasets.kddcup99.Builder
Versions :
-
1.0.0
: Version initiale. -
1.0.1
(par défaut) : corrige l'analyse des champs booléensland
, connected_in ,logged_in
,root_shell
etis_hot_login
is_guest_login
-
Taille du téléchargement :
18.62 MiB
Taille du jeu de données :
5.25 GiB
Mise en cache automatique ( documentation ): Non
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 311 029 |
'train' | 4 898 431 |
- Structure des fonctionnalités :
FeaturesDict({
'count': int32,
'diff_srv_rate': float32,
'dst_bytes': int32,
'dst_host_count': int32,
'dst_host_diff_srv_rate': float32,
'dst_host_rerror_rate': float32,
'dst_host_same_src_port_rate': float32,
'dst_host_same_srv_rate': float32,
'dst_host_serror_rate': float32,
'dst_host_srv_count': int32,
'dst_host_srv_diff_host_rate': float32,
'dst_host_srv_rerror_rate': float32,
'dst_host_srv_serror_rate': float32,
'duration': int32,
'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
'hot': int32,
'is_guest_login': bool,
'is_hot_login': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
'land': bool,
'logged_in': bool,
'num_access_files': int32,
'num_compromised': int32,
'num_failed_logins': int32,
'num_file_creations': int32,
'num_outbound_cmds': int32,
'num_root': int32,
'num_shells': int32,
'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
'rerror_rate': float32,
'root_shell': bool,
'same_srv_rate': float32,
'serror_rate': float32,
'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
'src_bytes': int32,
'srv_count': int32,
'srv_diff_host_rate': float32,
'srv_rerror_rate': float32,
'srv_serror_rate': float32,
'su_attempted': int32,
'urgent': int32,
'wrong_fragment': int32,
})
- Documentation des fonctionnalités :
Caractéristique | Classe | Façonner | Dtype | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
compter | Tenseur | int32 | ||
diff_srv_rate | Tenseur | float32 | ||
dst_bytes | Tenseur | int32 | ||
dst_host_count | Tenseur | int32 | ||
dst_host_diff_srv_rate | Tenseur | float32 | ||
dst_host_rerror_rate | Tenseur | float32 | ||
dst_host_same_src_port_rate | Tenseur | float32 | ||
dst_host_same_srv_rate | Tenseur | float32 | ||
dst_host_serror_rate | Tenseur | float32 | ||
dst_host_srv_count | Tenseur | int32 | ||
dst_host_srv_diff_host_rate | Tenseur | float32 | ||
dst_host_srv_rerror_rate | Tenseur | float32 | ||
dst_host_srv_serror_rate | Tenseur | float32 | ||
durée | Tenseur | int32 | ||
drapeau | Étiquette de classe | int64 | ||
chaud | Tenseur | int32 | ||
is_guest_login | Tenseur | bourdonner | ||
is_hot_login | Tenseur | bourdonner | ||
étiquette | Étiquette de classe | int64 | ||
atterrir | Tenseur | bourdonner | ||
connecté | Tenseur | bourdonner | ||
num_access_files | Tenseur | int32 | ||
num_compromised | Tenseur | int32 | ||
num_failed_logins | Tenseur | int32 | ||
num_file_creations | Tenseur | int32 | ||
num_outbound_cmds | Tenseur | int32 | ||
num_root | Tenseur | int32 | ||
num_shells | Tenseur | int32 | ||
type_de_protocole | Étiquette de classe | int64 | ||
rerror_rate | Tenseur | float32 | ||
root_shell | Tenseur | bourdonner | ||
même_srv_rate | Tenseur | float32 | ||
serror_rate | Tenseur | float32 | ||
un service | Étiquette de classe | int64 | ||
src_bytes | Tenseur | int32 | ||
srv_count | Tenseur | int32 | ||
srv_diff_host_rate | Tenseur | float32 | ||
srv_rerror_rate | Tenseur | float32 | ||
srv_serror_rate | Tenseur | float32 | ||
su_attempted | Tenseur | int32 | ||
urgent | Tenseur | int32 | ||
mauvais_fragment | Tenseur | int32 |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@misc{Dua:2019 ,
author = "Dua, Dheeru and Graff, Casey",
year = 2017,
title = "{UCI} Machine Learning Repository",
url = "http://archive.ics.uci.edu/ml",
institution = "University of California, Irvine, School of Information and
Computer Sciences"
}