- Descriptif :
Ensemble de données décrivant l'état de survie des passagers individuels du Titanic. Les valeurs manquantes dans l'ensemble de données d'origine sont représentées à l'aide de ?. Les valeurs flottantes et int manquantes sont remplacées par -1, les valeurs manquantes de chaîne sont remplacées par 'Inconnu'.
Page d' accueil : https://www.openml.org/d/40945
Code source :
tfds.datasets.titanic.Builder
Versions :
-
2.0.0
: Nouvelle API fractionnée ( https://tensorflow.org/datasets/splits ) -
3.0.0
: Utilisez un dictionnaire plat standard d'entités pour le jeu de données. Utilisezas_supervised=True
pour diviser le jeu de données en un tuple(features_dict, survived)
. -
4.0.0
(par défaut) : Correction des étiquettes inversées qui étaient inversées dans la 3.0.0.
-
Taille du téléchargement :
114.98 KiB
Taille du jeu de données :
382.58 KiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 309 |
- Structure des fonctionnalités :
FeaturesDict({
'age': float32,
'boat': string,
'body': int32,
'cabin': string,
'embarked': ClassLabel(shape=(), dtype=int64, num_classes=4),
'fare': float32,
'home.dest': string,
'name': string,
'parch': int32,
'pclass': ClassLabel(shape=(), dtype=int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=int64, num_classes=2),
'sibsp': int32,
'survived': ClassLabel(shape=(), dtype=int64, num_classes=2),
'ticket': string,
})
- Documentation des fonctionnalités :
Fonctionnalité | Classe | Forme | Dtype | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
âge | Tenseur | float32 | ||
bateau | Tenseur | chaîne | ||
corps | Tenseur | int32 | ||
cabine | Tenseur | chaîne | ||
embarqué | Étiquette de classe | int64 | ||
tarif | Tenseur | float32 | ||
home.dest | Tenseur | chaîne | ||
nom | Tenseur | chaîne | ||
dessécher | Tenseur | int32 | ||
pclasse | Étiquette de classe | int64 | ||
sexe | Étiquette de classe | int64 | ||
sibsp | Tenseur | int32 | ||
Survécu | Étiquette de classe | int64 | ||
billet | Tenseur | chaîne |
Clés supervisées (Voir
as_supervised
doc ):({'age': 'age', 'boat': 'boat', 'body': 'body', 'cabin': 'cabin', 'embarked': 'embarked', 'fare': 'fare', 'home.dest': 'home.dest', 'name': 'name', 'parch': 'parch', 'pclass': 'pclass', 'sex': 'sex', 'sibsp': 'sibsp', 'ticket': 'ticket'}, 'survived')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@ONLINE {titanic,
author = "Frank E. Harrell Jr., Thomas Cason",
title = "Titanic dataset",
month = "oct",
year = "2017",
url = "https://www.openml.org/d/40945"
}
, - Descriptif :
Ensemble de données décrivant l'état de survie des passagers individuels du Titanic. Les valeurs manquantes dans l'ensemble de données d'origine sont représentées à l'aide de ?. Les valeurs flottantes et int manquantes sont remplacées par -1, les valeurs manquantes de chaîne sont remplacées par 'Inconnu'.
Page d' accueil : https://www.openml.org/d/40945
Code source :
tfds.datasets.titanic.Builder
Versions :
-
2.0.0
: Nouvelle API fractionnée ( https://tensorflow.org/datasets/splits ) -
3.0.0
: Utilisez un dictionnaire plat standard d'entités pour le jeu de données. Utilisezas_supervised=True
pour diviser le jeu de données en un tuple(features_dict, survived)
. -
4.0.0
(par défaut) : Correction des étiquettes inversées qui étaient inversées dans la 3.0.0.
-
Taille du téléchargement :
114.98 KiB
Taille du jeu de données :
382.58 KiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 309 |
- Structure des fonctionnalités :
FeaturesDict({
'age': float32,
'boat': string,
'body': int32,
'cabin': string,
'embarked': ClassLabel(shape=(), dtype=int64, num_classes=4),
'fare': float32,
'home.dest': string,
'name': string,
'parch': int32,
'pclass': ClassLabel(shape=(), dtype=int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=int64, num_classes=2),
'sibsp': int32,
'survived': ClassLabel(shape=(), dtype=int64, num_classes=2),
'ticket': string,
})
- Documentation des fonctionnalités :
Fonctionnalité | Classe | Forme | Dtype | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
âge | Tenseur | float32 | ||
bateau | Tenseur | chaîne | ||
corps | Tenseur | int32 | ||
cabine | Tenseur | chaîne | ||
embarqué | Étiquette de classe | int64 | ||
tarif | Tenseur | float32 | ||
home.dest | Tenseur | chaîne | ||
nom | Tenseur | chaîne | ||
dessécher | Tenseur | int32 | ||
pclasse | Étiquette de classe | int64 | ||
sexe | Étiquette de classe | int64 | ||
sibsp | Tenseur | int32 | ||
Survécu | Étiquette de classe | int64 | ||
billet | Tenseur | chaîne |
Clés supervisées (Voir
as_supervised
doc ):({'age': 'age', 'boat': 'boat', 'body': 'body', 'cabin': 'cabin', 'embarked': 'embarked', 'fare': 'fare', 'home.dest': 'home.dest', 'name': 'name', 'parch': 'parch', 'pclass': 'pclass', 'sex': 'sex', 'sibsp': 'sibsp', 'ticket': 'ticket'}, 'survived')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@ONLINE {titanic,
author = "Frank E. Harrell Jr., Thomas Cason",
title = "Titanic dataset",
month = "oct",
year = "2017",
url = "https://www.openml.org/d/40945"
}