- Mô tả :
Các phép đo cho ba loài chim cánh cụt quan sát được ở Quần đảo Palmer, Nam Cực.
Những dữ liệu này được thu thập từ năm 2007 - 2009 bởi Tiến sĩ Kristen Gorman với Chương trình Nghiên cứu Sinh thái Dài hạn Trạm Palmer , một phần của Mạng lưới Nghiên cứu Sinh thái Dài hạn Hoa Kỳ . Dữ liệu ban đầu được nhập từ Cổng dữ liệu Sáng kiến Dữ liệu Môi trường (EDI) và có sẵn để sử dụng theo giấy phép CC0 ("Không được Bảo lưu Quyền") theo Chính sách Dữ liệu của Trạm Palmer. Bản sao này được nhập từ kho lưu trữ GitHub của Allison Horst .
Trang chủ : https://allisonhorst.github.io/palmerpenguins/
Mã nguồn :
tfds.structured.penguins.Penguins
Các phiên bản :
-
1.0.0
(mặc định): Bản phát hành ban đầu.
-
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có
Hình ( tfds.show_examples ): Không được hỗ trợ.
Trích dẫn :
@Manual{,
title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
year = {2020},
note = {R package version 0.1.0},
doi = {10.5281/zenodo.3960218},
url = {https://allisonhorst.github.io/palmerpenguins/},
}
chim cánh cụt / đã xử lý (cấu hình mặc định)
Mô tả cấu hình :
penguins/processed
là sự thay thế thả vào cho tập dữ liệuiris
. Nó chứa 4 đặc trưng số chuẩn hóa được trình bày dưới dạng một tensor duy nhất, không có giá trị nào bị thiếu và nhãn lớp (loài) được trình bày dưới dạng số nguyên (n = 334).Kích thước tải xuống :
25.05 KiB
Kích thước tập dữ liệu :
17.61 KiB
Tách :
Tách ra | Các ví dụ |
---|---|
'train' | 334 |
- Các tính năng :
FeaturesDict({
'features': Tensor(shape=(4,), dtype=tf.float32),
'species': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
})
Các khóa được giám sát (Xem
as_supervised
doc ):('features', 'species')
Ví dụ ( tfds.as_dataframe ):
chim cánh cụt / đơn giản
Mô tả cấu hình :
penguins/simple
đã được xử lý từ tập dữ liệu thô, với các nhãn lớp đơn giản hóa bắt nguồn từ các trường văn bản, các giá trị bị thiếu được đánh dấu là NaN / NA và chỉ giữ lại 7 đặc điểm quan trọng (n = 344).Kích thước tải xuống :
13.20 KiB
Kích thước tập dữ liệu :
56.10 KiB
Tách :
Tách ra | Các ví dụ |
---|---|
'train' | 344 |
- Các tính năng :
FeaturesDict({
'body_mass_g': tf.float32,
'culmen_depth_mm': tf.float32,
'culmen_length_mm': tf.float32,
'flipper_length_mm': tf.float32,
'island': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'species': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
})
Các khóa được giám sát (Xem
as_supervised
doc ):({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')
Ví dụ ( tfds.as_dataframe ):
chim cánh cụt / thô
Mô tả cấu hình :
penguins/raw
là bản sao gốc, chưa qua xử lý từ @allisonhorst, chứa tất cả 17 tính năng, được trình bày dưới dạng số hoặc dưới dạng văn bản thô (n = 344).Kích thước tải xuống :
49.72 KiB
Kích thước tập dữ liệu:
164.51 KiB
Tách :
Tách ra | Các ví dụ |
---|---|
'train' | 344 |
- Các tính năng :
FeaturesDict({
'Body Mass (g)': tf.float32,
'Clutch Completion': Text(shape=(), dtype=tf.string),
'Comments': Text(shape=(), dtype=tf.string),
'Culmen Depth (mm)': tf.float32,
'Culmen Length (mm)': tf.float32,
'Date Egg': Text(shape=(), dtype=tf.string),
'Delta 13 C (o/oo)': tf.float32,
'Delta 15 N (o/oo)': tf.float32,
'Flipper Length (mm)': tf.float32,
'Individual ID': Text(shape=(), dtype=tf.string),
'Island': Text(shape=(), dtype=tf.string),
'Region': Text(shape=(), dtype=tf.string),
'Sample Number': tf.int32,
'Sex': Text(shape=(), dtype=tf.string),
'Species': Text(shape=(), dtype=tf.string),
'Stage': Text(shape=(), dtype=tf.string),
'studyName': Text(shape=(), dtype=tf.string),
})
Khóa được giám sát (Xem
as_supervised
doc ):None
Ví dụ ( tfds.as_dataframe ):