kddcup99

  • Описание :

Это набор данных, использованный для Третьего международного конкурса средств обнаружения знаний и интеллектуального анализа данных, который проводился совместно с KDD-99 Пятой международной конференцией по обнаружению знаний и интеллектуальному анализу данных. Задачей конкурса было создание детектора сетевых вторжений, прогностической модели, способной различать «плохие» соединения, называемые вторжениями или атаками, и «хорошие» нормальные соединения. Эта база данных содержит стандартный набор данных для аудита, который включает широкий спектр вторжений, смоделированных в военной сетевой среде.

Расколоть Примеры
'test' 311 029
'train' 4 898 431
  • Структура функции :
FeaturesDict({
    'count': int32,
    'diff_srv_rate': float32,
    'dst_bytes': int32,
    'dst_host_count': int32,
    'dst_host_diff_srv_rate': float32,
    'dst_host_rerror_rate': float32,
    'dst_host_same_src_port_rate': float32,
    'dst_host_same_srv_rate': float32,
    'dst_host_serror_rate': float32,
    'dst_host_srv_count': int32,
    'dst_host_srv_diff_host_rate': float32,
    'dst_host_srv_rerror_rate': float32,
    'dst_host_srv_serror_rate': float32,
    'duration': int32,
    'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
    'hot': int32,
    'is_guest_login': bool,
    'is_hot_login': bool,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'land': bool,
    'logged_in': bool,
    'num_access_files': int32,
    'num_compromised': int32,
    'num_failed_logins': int32,
    'num_file_creations': int32,
    'num_outbound_cmds': int32,
    'num_root': int32,
    'num_shells': int32,
    'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'rerror_rate': float32,
    'root_shell': bool,
    'same_srv_rate': float32,
    'serror_rate': float32,
    'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
    'src_bytes': int32,
    'srv_count': int32,
    'srv_diff_host_rate': float32,
    'srv_rerror_rate': float32,
    'srv_serror_rate': float32,
    'su_attempted': int32,
    'urgent': int32,
    'wrong_fragment': int32,
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
считать Тензор int32
diff_srv_rate Тензор поплавок32
dst_bytes Тензор int32
dst_host_count Тензор int32
dst_host_diff_srv_rate Тензор поплавок32
dst_host_rerror_rate Тензор поплавок32
dst_host_same_src_port_rate Тензор поплавок32
dst_host_same_srv_rate Тензор поплавок32
dst_host_serror_rate Тензор поплавок32
dst_host_srv_count Тензор int32
dst_host_srv_diff_host_rate Тензор поплавок32
dst_host_srv_rerror_rate Тензор поплавок32
dst_host_srv_serror_rate Тензор поплавок32
продолжительность Тензор int32
флаг Метка класса int64
горячий Тензор int32
is_guest_login Тензор логический
is_hot_login Тензор логический
этикетка Метка класса int64
земельные участки Тензор логический
logged_in Тензор логический
num_access_files Тензор int32
num_compromised Тензор int32
num_failed_logins Тензор int32
num_file_creations Тензор int32
num_outbound_cmds Тензор int32
num_root Тензор int32
num_shells Тензор int32
протокол_тип Метка класса int64
rerror_rate Тензор поплавок32
root_shell Тензор логический
тот же_srv_rate Тензор поплавок32
serror_rate Тензор поплавок32
оказание услуг Метка класса int64
src_bytes Тензор int32
srv_count Тензор int32
srv_diff_host_rate Тензор поплавок32
srv_rerror_rate Тензор поплавок32
srv_serror_rate Тензор поплавок32
su_attempted Тензор int32
срочный Тензор int32
неправильно_фрагмент Тензор int32
  • Цитата :
@misc{Dua:2019 ,
  author = "Dua, Dheeru and Graff, Casey",
  year = 2017,
  title = "{UCI} Machine Learning Repository",
  url = "http://archive.ics.uci.edu/ml",
  institution = "University of California, Irvine, School of Information and
Computer Sciences"
}