- توضیحات :
اندازه گیری سه گونه پنگوئن مشاهده شده در مجمع الجزایر پالمر، قطب جنوب.
این داده ها از سال 2007 تا 2009 توسط دکتر کریستن گورمن با برنامه تحقیقات زیست محیطی بلندمدت ایستگاه پالمر ، بخشی از شبکه تحقیقات زیست محیطی بلند مدت ایالات متحده جمع آوری شده است. دادهها در اصل از پورتال دادههای Environmental Data Initiative (EDI) وارد شدهاند و مطابق با خطمشی دادههای ایستگاه پالمر برای استفاده توسط مجوز CC0 ("بدون حقوق محفوظ") در دسترس هستند. این کپی از مخزن GitHub آلیسون هورست وارد شده است.
صفحه اصلی : https://allisonhorst.github.io/palmerpenguins/
کد منبع :
tfds.datasets.penguins.Builder
نسخه ها :
-
1.0.0
(پیش فرض): انتشار اولیه.
-
ذخیره خودکار ( اسناد ): بله
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :
@Manual{,
title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
year = {2020},
note = {R package version 0.1.0},
doi = {10.5281/zenodo.3960218},
url = {https://allisonhorst.github.io/palmerpenguins/},
}
پنگوئن ها / پردازش شده (پیکربندی پیش فرض)
توضیحات پیکربندی :
penguins/processed
شده جایگزینی برای مجموعه دادهiris
است. این شامل 4 ویژگی عددی نرمال شده ارائه شده به عنوان یک تانسور منفرد، بدون مقادیر گم شده است و برچسب کلاس (گونه) به عنوان یک عدد صحیح (n = 334) ارائه می شود.حجم دانلود :
25.05 KiB
حجم مجموعه داده :
17.61 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 334 |
- ساختار ویژگی :
FeaturesDict({
'features': Tensor(shape=(4,), dtype=float32),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
امکانات | تانسور | (4،) | float32 | |
گونه ها | ClassLabel | int64 |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('features', 'species')
مثالها ( tfds.as_dataframe ):
پنگوئن / ساده
توضیحات پیکربندی :
penguins/simple
از مجموعه داده خام پردازش شده است، با برچسبهای کلاس سادهشده که از فیلدهای متنی مشتق شدهاند، مقادیر گمشده بهعنوان NaN/NA علامتگذاری شدهاند و تنها 7 ویژگی مهم را حفظ میکند (n = 344).حجم دانلود :
13.20 KiB
حجم مجموعه داده :
56.10 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 344 |
- ساختار ویژگی :
FeaturesDict({
'body_mass_g': float32,
'culmen_depth_mm': float32,
'culmen_length_mm': float32,
'flipper_length_mm': float32,
'island': ClassLabel(shape=(), dtype=int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=int64, num_classes=3),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
جرم_بدن_گرم | تانسور | float32 | ||
culmen_depth_mm | تانسور | float32 | ||
culmen_length_mm | تانسور | float32 | ||
باله_طول_میلی متر | تانسور | float32 | ||
جزیره | ClassLabel | int64 | ||
رابطه ی جنسی | ClassLabel | int64 | ||
گونه ها | ClassLabel | int64 |
کلیدهای نظارت شده (به
as_supervised
نظارت شده رجوع کنید):({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')
مثالها ( tfds.as_dataframe ):
پنگوئن / خام
توضیحات پیکربندی :
penguins/raw
کپی اصلی و پردازش نشده از @allisonhorst است که شامل تمام 17 ویژگی است که به صورت انواع عددی یا به صورت متن خام ارائه شده است (n = 344).حجم دانلود :
49.72 KiB
اندازه مجموعه داده :
164.51 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 344 |
- ساختار ویژگی :
FeaturesDict({
'Body Mass (g)': float32,
'Clutch Completion': Text(shape=(), dtype=string),
'Comments': Text(shape=(), dtype=string),
'Culmen Depth (mm)': float32,
'Culmen Length (mm)': float32,
'Date Egg': Text(shape=(), dtype=string),
'Delta 13 C (o/oo)': float32,
'Delta 15 N (o/oo)': float32,
'Flipper Length (mm)': float32,
'Individual ID': Text(shape=(), dtype=string),
'Island': Text(shape=(), dtype=string),
'Region': Text(shape=(), dtype=string),
'Sample Number': int32,
'Sex': Text(shape=(), dtype=string),
'Species': Text(shape=(), dtype=string),
'Stage': Text(shape=(), dtype=string),
'studyName': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
توده بدن (گرم) | تانسور | float32 | ||
تکمیل کلاچ | متن | رشته | ||
نظرات | متن | رشته | ||
عمق کولمن (میلی متر) | تانسور | float32 | ||
طول کولمن (میلی متر) | تانسور | float32 | ||
تخم مرغ خرما | متن | رشته | ||
Delta 13 C (o/oo) | تانسور | float32 | ||
Delta 15 N (o/oo) | تانسور | float32 | ||
طول باله (میلی متر) | تانسور | float32 | ||
شناسنامه فردی | متن | رشته | ||
جزیره | متن | رشته | ||
منطقه | متن | رشته | ||
شماره نمونه | تانسور | int32 | ||
رابطه ی جنسی | متن | رشته | ||
گونه ها | متن | رشته | ||
صحنه | متن | رشته | ||
نام مطالعه | متن | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
مثالها ( tfds.as_dataframe ):