titánico

  • Descripción :

Conjunto de datos que describe el estado de supervivencia de pasajeros individuales en el Titanic. Los valores que faltan en el conjunto de datos original se representan mediante ?. Los valores faltantes flotantes e int se reemplazan con -1, los valores faltantes de cadena se reemplazan con 'Desconocido'.

  • Página de inicio: https://www.openml.org/d/40945

  • Código fuente : tfds.datasets.titanic.Builder

  • Versiones :

    • 2.0.0 : nueva API dividida ( https://tensorflow.org/datasets/splits )
    • 3.0.0 : use un diccionario plano estándar de características para el conjunto de datos. Use as_supervised=True para dividir el conjunto de datos en una tupla (features_dict, survived) .
    • 4.0.0 (predeterminado): arregla las etiquetas invertidas que estaban invertidas en la versión 3.0.0.
  • Tamaño de la descarga : 114.98 KiB

  • Tamaño del conjunto de datos : 382.58 KiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Dividir Ejemplos
'train' 1,309
  • Estructura de características :
FeaturesDict({
    'age': float32,
    'boat': string,
    'body': int32,
    'cabin': string,
    'embarked': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'fare': float32,
    'home.dest': string,
    'name': string,
    'parch': int32,
    'pclass': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'sibsp': int32,
    'survived': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'ticket': string,
})
  • Documentación de características :
Característica Clase Forma Tipo D Descripción
CaracterísticasDict
edad Tensor flotar32
bote Tensor cadena
cuerpo Tensor int32
cabina Tensor cadena
embarcado Etiqueta de clase int64
tarifa Tensor flotar32
casa.destino Tensor cadena
nombre Tensor cadena
tostar Tensor int32
pclase Etiqueta de clase int64
sexo Etiqueta de clase int64
sibsp Tensor int32
sobrevivió Etiqueta de clase int64
boleto Tensor cadena
  • Llaves supervisadas (Ver as_supervised ): ({'age': 'age', 'boat': 'boat', 'body': 'body', 'cabin': 'cabin', 'embarked': 'embarked', 'fare': 'fare', 'home.dest': 'home.dest', 'name': 'name', 'parch': 'parch', 'pclass': 'pclass', 'sex': 'sex', 'sibsp': 'sibsp', 'ticket': 'ticket'}, 'survived')

  • Figura ( tfds.show_examples ): no compatible.

  • Ejemplos ( tfds.as_dataframe ):

  • Cita :
@ONLINE {titanic,
author = "Frank E. Harrell Jr., Thomas Cason",
title  = "Titanic dataset",
month  = "oct",
year   = "2017",
url    = "https://www.openml.org/d/40945"
}
,

  • Descripción :

Conjunto de datos que describe el estado de supervivencia de pasajeros individuales en el Titanic. Los valores que faltan en el conjunto de datos original se representan mediante ?. Los valores faltantes flotantes e int se reemplazan con -1, los valores faltantes de cadena se reemplazan con 'Desconocido'.

  • Página de inicio: https://www.openml.org/d/40945

  • Código fuente : tfds.datasets.titanic.Builder

  • Versiones :

    • 2.0.0 : nueva API dividida ( https://tensorflow.org/datasets/splits )
    • 3.0.0 : use un diccionario plano estándar de características para el conjunto de datos. Use as_supervised=True para dividir el conjunto de datos en una tupla (features_dict, survived) .
    • 4.0.0 (predeterminado): arregla las etiquetas invertidas que estaban invertidas en la versión 3.0.0.
  • Tamaño de la descarga : 114.98 KiB

  • Tamaño del conjunto de datos : 382.58 KiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Dividir Ejemplos
'train' 1,309
  • Estructura de características :
FeaturesDict({
    'age': float32,
    'boat': string,
    'body': int32,
    'cabin': string,
    'embarked': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'fare': float32,
    'home.dest': string,
    'name': string,
    'parch': int32,
    'pclass': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'sibsp': int32,
    'survived': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'ticket': string,
})
  • Documentación de características :
Característica Clase Forma Tipo D Descripción
CaracterísticasDict
edad Tensor flotar32
bote Tensor cadena
cuerpo Tensor int32
cabina Tensor cadena
embarcado Etiqueta de clase int64
tarifa Tensor flotar32
casa.destino Tensor cadena
nombre Tensor cadena
tostar Tensor int32
pclase Etiqueta de clase int64
sexo Etiqueta de clase int64
sibsp Tensor int32
sobrevivió Etiqueta de clase int64
boleto Tensor cadena
  • Llaves supervisadas (Ver as_supervised ): ({'age': 'age', 'boat': 'boat', 'body': 'body', 'cabin': 'cabin', 'embarked': 'embarked', 'fare': 'fare', 'home.dest': 'home.dest', 'name': 'name', 'parch': 'parch', 'pclass': 'pclass', 'sex': 'sex', 'sibsp': 'sibsp', 'ticket': 'ticket'}, 'survived')

  • Figura ( tfds.show_examples ): no compatible.

  • Ejemplos ( tfds.as_dataframe ):

  • Cita :
@ONLINE {titanic,
author = "Frank E. Harrell Jr., Thomas Cason",
title  = "Titanic dataset",
month  = "oct",
year   = "2017",
url    = "https://www.openml.org/d/40945"
}