penguin

  • Deskripsi :

Pengukuran untuk tiga spesies penguin yang diamati di Kepulauan Palmer, Antartika.

Data ini dikumpulkan dari tahun 2007-2009 oleh Dr. Kristen Gorman dengan Program Penelitian Ekologi Jangka Panjang Stasiun Palmer , bagian dari Jaringan Penelitian Ekologi Jangka Panjang AS . Data awalnya diimpor dari Portal Data Inisiatif Data Lingkungan (EDI), dan tersedia untuk digunakan dengan lisensi CC0 ("No Rights Reserved") sesuai dengan Kebijakan Data Palmer Station. Salinan ini diimpor dari repositori GitHub Allison Horst .

@Manual{,
  title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
  author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
  year = {2020},
  note = {R package version 0.1.0},
  doi = {10.5281/zenodo.3960218},
  url = {https://allisonhorst.github.io/palmerpenguins/},
}

penguin/diproses (konfigurasi default)

  • Deskripsi konfigurasi : penguins/processed adalah pengganti drop-in untuk dataset iris . Ini berisi 4 fitur numerik yang dinormalisasi yang disajikan sebagai tensor tunggal, tidak ada nilai yang hilang dan label kelas (spesies) disajikan sebagai bilangan bulat (n = 334).

  • Ukuran unduhan : 25.05 KiB

  • Ukuran dataset : 17.61 KiB

  • Perpecahan :

Membelah Contoh
'train' 334
  • Struktur fitur :
FeaturesDict({
    'features': Tensor(shape=(4,), dtype=float32),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
fitur Tensor (4,) float32
jenis LabelKelas int64

penguin / sederhana

  • Deskripsi konfigurasi : penguins/simple telah diproses dari kumpulan data mentah, dengan label kelas yang disederhanakan yang berasal dari bidang teks, nilai yang hilang ditandai sebagai NaN/NA dan hanya mempertahankan 7 fitur signifikan (n = 344).

  • Ukuran unduhan : 13.20 KiB

  • Ukuran dataset : 56.10 KiB

  • Perpecahan :

Membelah Contoh
'train' 344
  • Struktur fitur :
FeaturesDict({
    'body_mass_g': float32,
    'culmen_depth_mm': float32,
    'culmen_length_mm': float32,
    'flipper_length_mm': float32,
    'island': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
massa_tubuh_g Tensor float32
culmen_depth_mm Tensor float32
culmen_length_mm Tensor float32
sirip_panjang_mm Tensor float32
pulau LabelKelas int64
seks LabelKelas int64
jenis LabelKelas int64
  • Kunci yang diawasi (Lihat as_supervised doc ): ({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')

  • Contoh ( tfds.as_dataframe ):

penguin / mentah

  • Deskripsi konfigurasi : penguins/raw adalah salinan asli yang belum diproses dari @allisonhorst, berisi semua 17 fitur, disajikan baik sebagai tipe numerik atau sebagai teks mentah (n = 344).

  • Ukuran unduhan : 49.72 KiB

  • Ukuran dataset : 164.51 KiB

  • Perpecahan :

Membelah Contoh
'train' 344
  • Struktur fitur :
FeaturesDict({
    'Body Mass (g)': float32,
    'Clutch Completion': Text(shape=(), dtype=string),
    'Comments': Text(shape=(), dtype=string),
    'Culmen Depth (mm)': float32,
    'Culmen Length (mm)': float32,
    'Date Egg': Text(shape=(), dtype=string),
    'Delta 13 C (o/oo)': float32,
    'Delta 15 N (o/oo)': float32,
    'Flipper Length (mm)': float32,
    'Individual ID': Text(shape=(), dtype=string),
    'Island': Text(shape=(), dtype=string),
    'Region': Text(shape=(), dtype=string),
    'Sample Number': int32,
    'Sex': Text(shape=(), dtype=string),
    'Species': Text(shape=(), dtype=string),
    'Stage': Text(shape=(), dtype=string),
    'studyName': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
Massa Tubuh (g) Tensor float32
Penyelesaian Kopling Teks rangkaian
Komentar Teks rangkaian
Kedalaman Culmen (mm) Tensor float32
Panjang Kulmen (mm) Tensor float32
Tanggal Telur Teks rangkaian
Delta 13 C (o/oo) Tensor float32
Delta 15 N (o/oo) Tensor float32
Panjang Sirip (mm) Tensor float32
identitas individu Teks rangkaian
Pulau Teks rangkaian
Wilayah Teks rangkaian
Nomor Sampel Tensor int32
Seks Teks rangkaian
Jenis Teks rangkaian
Panggung Teks rangkaian
namastudi Teks rangkaian