người titanic

  • Mô tả :

Tập dữ liệu mô tả tình trạng sống sót của từng hành khách trên tàu Titanic. Các giá trị bị thiếu trong tập dữ liệu gốc được biểu diễn bằng cách sử dụng?. Giá trị thiếu float và int được thay thế bằng -1, các giá trị thiếu chuỗi được thay thế bằng 'Không xác định'.

  • Trang chủ : https://www.openml.org/d/40945

  • Mã nguồn : tfds.structured.Titanic

  • Các phiên bản :

    • 2.0.0 : API phân tách mới ( https://tensorflow.org/datasets/splits )
    • 3.0.0 : Sử dụng từ điển phẳng tiêu chuẩn về các tính năng cho tập dữ liệu. Sử dụng as_supervised=True để chia tập dữ liệu thành một bộ dữ liệu (features_dict, survived) .
    • 4.0.0 (mặc định): Sửa các nhãn bị đảo ngược trong 3.0.0.
  • Kích thước tải xuống : 114.98 KiB

  • Kích thước tập dữ liệu: 382.58 KiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có

  • Tách :

Tách ra Các ví dụ
'train' 1.309
  • Các tính năng :
FeaturesDict({
    'age': tf.float32,
    'boat': tf.string,
    'body': tf.int32,
    'cabin': tf.string,
    'embarked': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'fare': tf.float32,
    'home.dest': tf.string,
    'name': tf.string,
    'parch': tf.int32,
    'pclass': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'sibsp': tf.int32,
    'survived': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'ticket': tf.string,
})
  • Các khóa được giám sát (Xem as_supervised doc ): ({'age': 'age', 'boat': 'boat', 'body': 'body', 'cabin': 'cabin', 'embarked': 'embarked', 'fare': 'fare', 'home.dest': 'home.dest', 'name': 'name', 'parch': 'parch', 'pclass': 'pclass', 'sex': 'sex', 'sibsp': 'sibsp', 'ticket': 'ticket'}, 'survived')

  • Hình ( tfds.show_examples ): Không được hỗ trợ.

  • Ví dụ ( tfds.as_dataframe ):

  • Trích dẫn :
@ONLINE {titanic,
author = "Frank E. Harrell Jr., Thomas Cason",
title  = "Titanic dataset",
month  = "oct",
year   = "2017",
url    = "https://www.openml.org/d/40945"
}