kddcup99

  • Descriptif :

Il s'agit de l'ensemble de données utilisé pour le troisième concours international d'outils de découverte de connaissances et d'exploration de données, qui s'est tenu conjointement avec KDD-99, la cinquième conférence internationale sur la découverte de connaissances et l'exploration de données. La tâche du concours était de construire un détecteur d'intrusion réseau, un modèle prédictif capable de faire la distinction entre les « mauvaises » connexions, appelées intrusions ou attaques, et les « bonnes » connexions normales. Cette base de données contient un ensemble standard de données à auditer, qui comprend une grande variété d'intrusions simulées dans un environnement de réseau militaire.

Diviser Exemples
'test' 311 029
'train' 4 898 431
  • Structure des fonctionnalités :
FeaturesDict({
    'count': int32,
    'diff_srv_rate': float32,
    'dst_bytes': int32,
    'dst_host_count': int32,
    'dst_host_diff_srv_rate': float32,
    'dst_host_rerror_rate': float32,
    'dst_host_same_src_port_rate': float32,
    'dst_host_same_srv_rate': float32,
    'dst_host_serror_rate': float32,
    'dst_host_srv_count': int32,
    'dst_host_srv_diff_host_rate': float32,
    'dst_host_srv_rerror_rate': float32,
    'dst_host_srv_serror_rate': float32,
    'duration': int32,
    'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
    'hot': int32,
    'is_guest_login': bool,
    'is_hot_login': bool,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'land': bool,
    'logged_in': bool,
    'num_access_files': int32,
    'num_compromised': int32,
    'num_failed_logins': int32,
    'num_file_creations': int32,
    'num_outbound_cmds': int32,
    'num_root': int32,
    'num_shells': int32,
    'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'rerror_rate': float32,
    'root_shell': bool,
    'same_srv_rate': float32,
    'serror_rate': float32,
    'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
    'src_bytes': int32,
    'srv_count': int32,
    'srv_diff_host_rate': float32,
    'srv_rerror_rate': float32,
    'srv_serror_rate': float32,
    'su_attempted': int32,
    'urgent': int32,
    'wrong_fragment': int32,
})
  • Documentation des fonctionnalités :
Caractéristique Classe Façonner Dtype Description
FonctionnalitésDict
compter Tenseur int32
diff_srv_rate Tenseur float32
dst_bytes Tenseur int32
dst_host_count Tenseur int32
dst_host_diff_srv_rate Tenseur float32
dst_host_rerror_rate Tenseur float32
dst_host_same_src_port_rate Tenseur float32
dst_host_same_srv_rate Tenseur float32
dst_host_serror_rate Tenseur float32
dst_host_srv_count Tenseur int32
dst_host_srv_diff_host_rate Tenseur float32
dst_host_srv_rerror_rate Tenseur float32
dst_host_srv_serror_rate Tenseur float32
durée Tenseur int32
drapeau Étiquette de classe int64
chaud Tenseur int32
is_guest_login Tenseur bourdonner
is_hot_login Tenseur bourdonner
étiquette Étiquette de classe int64
atterrir Tenseur bourdonner
connecté Tenseur bourdonner
num_access_files Tenseur int32
num_compromised Tenseur int32
num_failed_logins Tenseur int32
num_file_creations Tenseur int32
num_outbound_cmds Tenseur int32
num_root Tenseur int32
num_shells Tenseur int32
type_de_protocole Étiquette de classe int64
rerror_rate Tenseur float32
root_shell Tenseur bourdonner
même_srv_rate Tenseur float32
serror_rate Tenseur float32
un service Étiquette de classe int64
src_bytes Tenseur int32
srv_count Tenseur int32
srv_diff_host_rate Tenseur float32
srv_rerror_rate Tenseur float32
srv_serror_rate Tenseur float32
su_attempted Tenseur int32
urgent Tenseur int32
mauvais_fragment Tenseur int32
  • Citation :
@misc{Dua:2019 ,
  author = "Dua, Dheeru and Graff, Casey",
  year = 2017,
  title = "{UCI} Machine Learning Repository",
  url = "http://archive.ics.uci.edu/ml",
  institution = "University of California, Irvine, School of Information and
Computer Sciences"
}