kddcup99

  • Descrição :

Este é o conjunto de dados usado para a Terceira Competição Internacional de Ferramentas de Descoberta de Conhecimento e Mineração de Dados, realizada em conjunto com a KDD-99, a Quinta Conferência Internacional sobre Descoberta de Conhecimento e Mineração de Dados. A tarefa da competição era construir um detector de intrusão de rede, um modelo preditivo capaz de distinguir entre conexões 'ruins', chamadas invasões ou ataques, e conexões normais 'boas'. Esta base de dados contém um conjunto padrão de dados a serem auditados, que inclui uma ampla variedade de invasões simuladas em um ambiente de rede militar.

Dividir Exemplos
'test' 311.029
'train' 4.898.431
  • Estrutura de recursos :
FeaturesDict({
    'count': int32,
    'diff_srv_rate': float32,
    'dst_bytes': int32,
    'dst_host_count': int32,
    'dst_host_diff_srv_rate': float32,
    'dst_host_rerror_rate': float32,
    'dst_host_same_src_port_rate': float32,
    'dst_host_same_srv_rate': float32,
    'dst_host_serror_rate': float32,
    'dst_host_srv_count': int32,
    'dst_host_srv_diff_host_rate': float32,
    'dst_host_srv_rerror_rate': float32,
    'dst_host_srv_serror_rate': float32,
    'duration': int32,
    'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
    'hot': int32,
    'is_guest_login': bool,
    'is_hot_login': bool,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'land': bool,
    'logged_in': bool,
    'num_access_files': int32,
    'num_compromised': int32,
    'num_failed_logins': int32,
    'num_file_creations': int32,
    'num_outbound_cmds': int32,
    'num_root': int32,
    'num_shells': int32,
    'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'rerror_rate': float32,
    'root_shell': bool,
    'same_srv_rate': float32,
    'serror_rate': float32,
    'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
    'src_bytes': int32,
    'srv_count': int32,
    'srv_diff_host_rate': float32,
    'srv_rerror_rate': float32,
    'srv_serror_rate': float32,
    'su_attempted': int32,
    'urgent': int32,
    'wrong_fragment': int32,
})
  • Documentação do recurso:
Funcionalidade Aula Forma Tipo D Descrição
RecursosDict
contar tensor int32
diff_srv_rate tensor float32
dst_bytes tensor int32
dst_host_count tensor int32
dst_host_diff_srv_rate tensor float32
dst_host_rerror_rate tensor float32
dst_host_same_src_port_rate tensor float32
dst_host_same_srv_rate tensor float32
dst_host_serror_rate tensor float32
dst_host_srv_count tensor int32
dst_host_srv_diff_host_rate tensor float32
dst_host_srv_rerror_rate tensor float32
dst_host_srv_serror_rate tensor float32
duração tensor int32
bandeira ClassLabel int64
quente tensor int32
is_guest_login tensor bool
is_hot_login tensor bool
rótulo ClassLabel int64
terra tensor bool
logado tensor bool
num_access_files tensor int32
num_compromised tensor int32
num_failed_logins tensor int32
num_file_creations tensor int32
num_outbound_cmds tensor int32
num_root tensor int32
num_shells tensor int32
protocol_type ClassLabel int64
rerror_rate tensor float32
root_shell tensor bool
same_srv_rate tensor float32
serror_rate tensor float32
serviço ClassLabel int64
src_bytes tensor int32
srv_count tensor int32
srv_diff_host_rate tensor float32
srv_rerror_rate tensor float32
srv_serror_rate tensor float32
su_tentativa tensor int32
urgente tensor int32
fragmento_errado tensor int32
  • Citação :
@misc{Dua:2019 ,
  author = "Dua, Dheeru and Graff, Casey",
  year = 2017,
  title = "{UCI} Machine Learning Repository",
  url = "http://archive.ics.uci.edu/ml",
  institution = "University of California, Irvine, School of Information and
Computer Sciences"
}