titanico

  • Descrizione :

Set di dati che descrive lo stato di sopravvivenza dei singoli passeggeri del Titanic. I valori mancanti nel set di dati originale sono rappresentati utilizzando ?. I valori mancanti float e int vengono sostituiti con -1, i valori mancanti stringa vengono sostituiti con 'Sconosciuto'.

  • Pagina iniziale : https://www.openml.org/d/40945

  • Codice sorgente : tfds.datasets.titanic.Builder

  • Versioni :

    • 2.0.0 : Nuova API divisa ( https://tensorflow.org/datasets/splits )
    • 3.0.0 : utilizza un dizionario semplice standard di funzionalità per il set di dati. Utilizzare as_supervised=True per suddividere il set di dati in una tupla (features_dict, survived) .
    • 4.0.0 (impostazione predefinita): corregge le etichette invertite che erano invertite nella versione 3.0.0.
  • Dimensione del download : 114.98 KiB

  • Dimensione del set di dati: 382.58 KiB

  • Auto-cache ( documentazione ): Sì

  • Divisioni :

Diviso Esempi
'train' 1.309
  • Struttura delle caratteristiche :
FeaturesDict({
    'age': float32,
    'boat': string,
    'body': int32,
    'cabin': string,
    'embarked': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'fare': float32,
    'home.dest': string,
    'name': string,
    'parch': int32,
    'pclass': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'sibsp': int32,
    'survived': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'ticket': string,
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
età Tensore galleggiante32
barca Tensore corda
corpo Tensore int32
cabina Tensore corda
imbarcato ClassLabel int64
tariffa Tensore galleggiante32
home.dest Tensore corda
nome Tensore corda
seccare Tensore int32
pclass ClassLabel int64
sesso ClassLabel int64
sibsp Tensore int32
sopravvissuto ClassLabel int64
biglietto Tensore corda
  • Chiavi supervisionate (vedi as_supervised doc ): ({'age': 'age', 'boat': 'boat', 'body': 'body', 'cabin': 'cabin', 'embarked': 'embarked', 'fare': 'fare', 'home.dest': 'home.dest', 'name': 'name', 'parch': 'parch', 'pclass': 'pclass', 'sex': 'sex', 'sibsp': 'sibsp', 'ticket': 'ticket'}, 'survived')

  • Figura ( tfds.show_examples ): non supportato.

  • Esempi ( tfds.as_dataframe ):

  • Citazione :
@ONLINE {titanic,
author = "Frank E. Harrell Jr., Thomas Cason",
title  = "Titanic dataset",
month  = "oct",
year   = "2017",
url    = "https://www.openml.org/d/40945"
}
,

  • Descrizione :

Set di dati che descrive lo stato di sopravvivenza dei singoli passeggeri del Titanic. I valori mancanti nel set di dati originale sono rappresentati utilizzando ?. I valori mancanti float e int vengono sostituiti con -1, i valori mancanti stringa vengono sostituiti con 'Sconosciuto'.

  • Pagina iniziale : https://www.openml.org/d/40945

  • Codice sorgente : tfds.datasets.titanic.Builder

  • Versioni :

    • 2.0.0 : Nuova API divisa ( https://tensorflow.org/datasets/splits )
    • 3.0.0 : utilizza un dizionario semplice standard di funzionalità per il set di dati. Utilizzare as_supervised=True per suddividere il set di dati in una tupla (features_dict, survived) .
    • 4.0.0 (impostazione predefinita): corregge le etichette invertite che erano invertite nella versione 3.0.0.
  • Dimensione del download : 114.98 KiB

  • Dimensione del set di dati: 382.58 KiB

  • Auto-cache ( documentazione ): Sì

  • Divisioni :

Diviso Esempi
'train' 1.309
  • Struttura delle caratteristiche :
FeaturesDict({
    'age': float32,
    'boat': string,
    'body': int32,
    'cabin': string,
    'embarked': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'fare': float32,
    'home.dest': string,
    'name': string,
    'parch': int32,
    'pclass': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'sibsp': int32,
    'survived': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'ticket': string,
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
età Tensore galleggiante32
barca Tensore corda
corpo Tensore int32
cabina Tensore corda
imbarcato ClassLabel int64
tariffa Tensore galleggiante32
home.dest Tensore corda
nome Tensore corda
seccare Tensore int32
pclass ClassLabel int64
sesso ClassLabel int64
sibsp Tensore int32
sopravvissuto ClassLabel int64
biglietto Tensore corda
  • Chiavi supervisionate (vedi as_supervised doc ): ({'age': 'age', 'boat': 'boat', 'body': 'body', 'cabin': 'cabin', 'embarked': 'embarked', 'fare': 'fare', 'home.dest': 'home.dest', 'name': 'name', 'parch': 'parch', 'pclass': 'pclass', 'sex': 'sex', 'sibsp': 'sibsp', 'ticket': 'ticket'}, 'survived')

  • Figura ( tfds.show_examples ): non supportato.

  • Esempi ( tfds.as_dataframe ):

  • Citazione :
@ONLINE {titanic,
author = "Frank E. Harrell Jr., Thomas Cason",
title  = "Titanic dataset",
month  = "oct",
year   = "2017",
url    = "https://www.openml.org/d/40945"
}