chim cánh cụt

  • Mô tả :

Các phép đo cho ba loài chim cánh cụt quan sát được ở Quần đảo Palmer, Nam Cực.

Những dữ liệu này được thu thập từ năm 2007 - 2009 bởi Tiến sĩ Kristen Gorman với Chương trình Nghiên cứu Sinh thái Dài hạn Trạm Palmer , một phần của Mạng lưới Nghiên cứu Sinh thái Dài hạn Hoa Kỳ . Dữ liệu ban đầu được nhập từ Cổng dữ liệu Sáng kiến ​​Dữ liệu Môi trường (EDI) và có sẵn để sử dụng theo giấy phép CC0 ("Không được Bảo lưu Quyền") theo Chính sách Dữ liệu của Trạm Palmer. Bản sao này được nhập từ kho lưu trữ GitHub của Allison Horst .

@Manual{,
  title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
  author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
  year = {2020},
  note = {R package version 0.1.0},
  doi = {10.5281/zenodo.3960218},
  url = {https://allisonhorst.github.io/palmerpenguins/},
}

chim cánh cụt / đã xử lý (cấu hình mặc định)

  • Mô tả cấu hình : penguins/processed là sự thay thế thả vào cho tập dữ liệu iris . Nó chứa 4 đặc trưng số chuẩn hóa được trình bày dưới dạng một tensor duy nhất, không có giá trị nào bị thiếu và nhãn lớp (loài) được trình bày dưới dạng số nguyên (n = 334).

  • Kích thước tải xuống : 25.05 KiB

  • Kích thước tập dữ liệu : 17.61 KiB

  • Tách :

Tách ra Các ví dụ
'train' 334
  • Các tính năng :
FeaturesDict({
    'features': Tensor(shape=(4,), dtype=tf.float32),
    'species': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
})

chim cánh cụt / đơn giản

  • Mô tả cấu hình : penguins/simple đã được xử lý từ tập dữ liệu thô, với các nhãn lớp đơn giản hóa bắt nguồn từ các trường văn bản, các giá trị bị thiếu được đánh dấu là NaN / NA và chỉ giữ lại 7 đặc điểm quan trọng (n = 344).

  • Kích thước tải xuống : 13.20 KiB

  • Kích thước tập dữ liệu : 56.10 KiB

  • Tách :

Tách ra Các ví dụ
'train' 344
  • Các tính năng :
FeaturesDict({
    'body_mass_g': tf.float32,
    'culmen_depth_mm': tf.float32,
    'culmen_length_mm': tf.float32,
    'flipper_length_mm': tf.float32,
    'island': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'sex': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'species': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
})
  • Các khóa được giám sát (Xem as_supervised doc ): ({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')

  • Ví dụ ( tfds.as_dataframe ):

chim cánh cụt / thô

  • Mô tả cấu hình : penguins/raw là bản sao gốc, chưa qua xử lý từ @allisonhorst, chứa tất cả 17 tính năng, được trình bày dưới dạng số hoặc dưới dạng văn bản thô (n = 344).

  • Kích thước tải xuống : 49.72 KiB

  • Kích thước tập dữ liệu: 164.51 KiB

  • Tách :

Tách ra Các ví dụ
'train' 344
  • Các tính năng :
FeaturesDict({
    'Body Mass (g)': tf.float32,
    'Clutch Completion': Text(shape=(), dtype=tf.string),
    'Comments': Text(shape=(), dtype=tf.string),
    'Culmen Depth (mm)': tf.float32,
    'Culmen Length (mm)': tf.float32,
    'Date Egg': Text(shape=(), dtype=tf.string),
    'Delta 13 C (o/oo)': tf.float32,
    'Delta 15 N (o/oo)': tf.float32,
    'Flipper Length (mm)': tf.float32,
    'Individual ID': Text(shape=(), dtype=tf.string),
    'Island': Text(shape=(), dtype=tf.string),
    'Region': Text(shape=(), dtype=tf.string),
    'Sample Number': tf.int32,
    'Sex': Text(shape=(), dtype=tf.string),
    'Species': Text(shape=(), dtype=tf.string),
    'Stage': Text(shape=(), dtype=tf.string),
    'studyName': Text(shape=(), dtype=tf.string),
})