- Mô tả :
Tập dữ liệu mô tả tình trạng sống sót của từng hành khách trên tàu Titanic. Các giá trị bị thiếu trong tập dữ liệu gốc được biểu diễn bằng cách sử dụng?. Giá trị thiếu float và int được thay thế bằng -1, các giá trị thiếu chuỗi được thay thế bằng 'Không xác định'.
Trang chủ : https://www.openml.org/d/40945
Mã nguồn :
tfds.structured.Titanic
Các phiên bản :
-
2.0.0
: API phân tách mới ( https://tensorflow.org/datasets/splits ) -
3.0.0
: Sử dụng từ điển phẳng tiêu chuẩn về các tính năng cho tập dữ liệu. Sử dụngas_supervised=True
để chia tập dữ liệu thành một bộ dữ liệu(features_dict, survived)
. -
4.0.0
(mặc định): Sửa các nhãn bị đảo ngược trong 3.0.0.
-
Kích thước tải xuống :
114.98 KiB
Kích thước tập dữ liệu:
382.58 KiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có
Tách :
Tách ra | Các ví dụ |
---|---|
'train' | 1.309 |
- Các tính năng :
FeaturesDict({
'age': tf.float32,
'boat': tf.string,
'body': tf.int32,
'cabin': tf.string,
'embarked': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
'fare': tf.float32,
'home.dest': tf.string,
'name': tf.string,
'parch': tf.int32,
'pclass': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'sibsp': tf.int32,
'survived': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'ticket': tf.string,
})
Các khóa được giám sát (Xem
as_supervised
doc ):({'age': 'age', 'boat': 'boat', 'body': 'body', 'cabin': 'cabin', 'embarked': 'embarked', 'fare': 'fare', 'home.dest': 'home.dest', 'name': 'name', 'parch': 'parch', 'pclass': 'pclass', 'sex': 'sex', 'sibsp': 'sibsp', 'ticket': 'ticket'}, 'survived')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- Trích dẫn :
@ONLINE {titanic,
author = "Frank E. Harrell Jr., Thomas Cason",
title = "Titanic dataset",
month = "oct",
year = "2017",
url = "https://www.openml.org/d/40945"
}